本仓库记录学习大语言模型(LLM)训练的完整过程。
| 章节 | 主要内容 | 进度 |
|---|---|---|
| 第二章: 预训练 | 从0预训练自己的LLM | Todo |
| 第三章: 微调 | LoRA指令微调Qwen3-4B-Base | Todo |
| 第四章: 强化学习 | GRPO训练模型玩数独 | Todo |
本项目使用 SwanLab 进行实验追踪和可视化。所有训练过程、指标变化都会被完整记录。
import swanlab
# 初始化实验
swanlab.init(
project="llm-training-learning",
experiment_name="chapter2-pretrain"
)特别感谢 SwanLab 为本项目提供支持!
SwanLab 是一个开源、轻量的 AI 模型训练追踪与可视化工具,提供跟踪、记录、比较和协作实验的平台。
本项目采用 MIT License 开源协议。
⭐ 如果这个项目对你有帮助,欢迎 Star ⭐
Made with ❤️ by NeoFii