GrokAdamW By AiBard123 August 9, 2024 - 2 min read GrokAdamW 是一种结合 Grokfast 和 AdamW 优化器优势加速深度学习模型训练的新型优化器。 read more
Transformer Explainer By AiBard123 August 8, 2024 - 2 min read Transformer Explainer 是一个互动工具,帮助用户了解Transformer模型如GPT的工作原理。 read more