昌维的博客
返回全部文章

#Fine-Tuning

在当前标签下筛选分类

清除分类筛选

大语言模型微调入门:从 ChatGPT 训练原理到本地 QLoRA 实作

本文是 AI 系列的第三篇。如果你还不了解 AI 的基本概念与 Transformer 发展脉络,建议先阅读《从智慧到人工智能:AI 基本概念与发展史入门》与《机器学习与 MNIST 手写数字识别入门》。 这篇文章会从 ChatGPT 等大语言模型「怎么被训练出来」讲起,解释为什么预训练 alone 不够、为什么需要 SFT 与 RLHF 做对齐,最后带你用...

2026年6月21日 · zh-Hans-CN