# 第六章 大语言模型详解

> 深入理解 ChatGPT、Claude 等大语言模型的技术原理

***

大语言模型（Large Language Models，LLM）是当今 AI 最热门的技术方向。ChatGPT 的发布引爆了全球对 AI 的关注，让 AI 从专业领域走进了普通公众的生活。本章将深入解析大语言模型的技术原理，帮助读者理解这些令人惊叹的系统是如何工作的。

## 本章内容

* **6.1 从 RNN 到 Transformer**：回顾语言模型的技术演进
* **6.2 大语言模型的工作原理**：理解 LLM 如何理解和生成文本
* **6.3 Transformer 与注意力机制**：深入理解 Transformer 架构的核心机制
* **6.4 预训练与微调**：掌握 LLM 的训练范式
* **6.5 主流大语言模型介绍**：了解 GPT、Claude、Gemini 等主流模型
* **6.6 大模型的部署与推理**：让大模型在云端跑起来的基础原理

学完本章后，建议继续阅读第七章（推理模型）和第八章（新架构与创新案例），深入 LLM 技术的前沿方向。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://yeasy.gitbook.io/ai_beginner_guide/di-er-bu-fen-he-xin-ji-shu-jie-xi/06_llm.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
