#Fine-Tuning 标签文章

大语言模型微调入门：从 ChatGPT 训练原理到本地 QLoRA 实作

本文是 AI 系列的第三篇。如果你还不了解 AI 的基本概念与 Transformer 发展脉络，建议先阅读《从智慧到人工智能：AI 基本概念与发展史入门》与《机器学习与 MNIST 手写数字识别入门》。这篇文章会从 ChatGPT 等大语言模型「怎么被训练出来」讲起，解释为什么预训练 alone 不够、为什么需要 SFT 与 RLHF 做对齐，最后带你用...

LLM Fine-Tuning SFT RLHF LoRA QLoRA Qwen Alignment Prompt-Engineering

2026年6月21日 · zh-Hans-CN

在当前标签下筛选分类

大语言模型微调入门：从 ChatGPT 训练原理到本地 QLoRA 实作