> For the complete documentation index, see [llms.txt](https://yeasy.gitbook.io/ai_beginner_guide/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://yeasy.gitbook.io/ai_beginner_guide/di-er-bu-fen-he-xin-ji-shu-jie-xi/06_llm.md).

# 第六章 大语言模型详解

> 深入理解 ChatGPT、Claude 等大语言模型的技术原理

***

大语言模型（Large Language Models，LLM）是当今 AI 最热门的技术方向。ChatGPT 的发布引爆了全球对 AI 的关注，让 AI 从专业领域走进了普通公众的生活。本章将深入解析大语言模型的技术原理，帮助读者理解这些令人惊叹的系统是如何工作的。

## 本章内容

* **6.1 从 RNN 到 Transformer**：回顾语言模型的技术演进
* **6.2 大语言模型的工作原理**：理解 LLM 如何理解和生成文本
* **6.3 Transformer 与注意力机制**：深入理解 Transformer 架构的核心机制
* **6.4 预训练与微调**：掌握 LLM 的训练范式
* **6.5 主流大语言模型介绍**：了解 GPT、Claude、Gemini 等主流模型
* **6.6 大模型的部署与推理**：让大模型在云端跑起来的基础原理

学完本章后，建议继续阅读第七章（推理模型）和第八章（新架构与创新案例），深入 LLM 技术的前沿方向。
