# 6.5 主流大模型

> 这个领域变化太快，不要死记硬背排名，要看懂各家的“独门绝技”。闭源与开源并行，能力、成本、合规三者都要看。以下模型和价格是 2026-05-16 的学习快照，生产选型必须回到官方模型页和价格页重新核验。

## 6.5.1 三大闭源巨头

近年来，OpenAI、Anthropic、Google 仍是闭源大模型的第一梯队。

注意：它们在不同评测和场景（代码、数学、写作、工具调用）里的名次会持续变化，不存在“永久第一”。

1. **OpenAI (GPT 系列)**
   * **特点**：综合能力和产品生态通常都很强，工具链较完整。
   * **学习快照**：截至 2026-05，OpenAI 官方模型页将 gpt-5.5 列为复杂推理与代码任务的旗舰选择之一（gpt-5.5-pro 提供更强推理能力，定价 $30/$180 per M tokens）；具体可用模型、价格和上下文窗口必须回到官方模型页和价格页重新核验。
   * **取舍**：闭源能力强，但企业需要关注数据治理，以及“供应商绑定”风险（例如后续切换平台时成本可能更高）。
2. **Anthropic (Claude 系列)**
   * **特点**：在长文本理解、写作、代码任务上常有突出表现，风格相对稳健。
   * **学习快照**：截至 2026-05，Claude 产品线形成 **Opus / Sonnet / Haiku** 三档分层路线：旗舰、均衡、轻量各有取舍。官方模型页列出 Opus 4.7、Sonnet 4.6、Haiku 4.5，并明确 Opus 4.7 支持 Adaptive Thinking 而不支持手动 Extended Thinking；具体模型能力、上下文窗口和定价应以 Anthropic 官方模型总览为准。
   * **取舍**：产品功能节奏和生态覆盖与其他厂商各有长短。
3. **Google (Gemini 系列)**
   * **特点**：多模态能力强，且与 Google Workspace、搜索等生态整合紧密。
   * **学习快照**：Gemini 官方模型页更新很快，长上下文、多模态输入和推理能力是其重点方向；生产选型时应以 Google AI 官方模型页列出的当前可用版本、弃用状态和限制为准。
   * **取舍**：优势常出现在 Google 生态内，跨生态体验需看具体产品形态。

## 6.5.2 开源之光：LLaMA

如果说闭源模型是 iOS，那 Meta 的 **LLaMA** 更像 Android 阵营里的关键基座之一。

Meta 把高质量权重开放出来后，显著降低了学术界和创业团队做二次创新的门槛。2025 年 4 月发布的 **Llama 4** 系列首次采用 MoE（混合专家）架构，其中 Scout（109B 总参数，16 个专家 / 17B 活跃参数，支持 10M 上下文）和 Maverick（400B 总参数，128 个专家 / 17B 活跃参数，支持 1M 上下文）是当前开源模型的标杆。MoE 架构的关键特性是：每个 token 在推理时只激活部分专家（活跃参数），而非全部参数，从而在保持强能力的同时降低推理成本。

开源生态并不只有 LLaMA，也包括 Qwen、Mistral、Gemma 等多条路线。 **重点不是“谁是唯一图腾”，而是开源让更多人有能力做本地化和垂直化改造。**

## 6.5.3 中国的“百模大战”

中国 AI 在 **应用落地**、**中文能力**、**成本效率** 上竞争非常激烈。

1. **阿里（通义千问 Qwen）**：开源生态活跃，工程化能力强。
2. **百度（文心）**：搜索与知识服务体系结合较深。
3. **DeepSeek（深度求索）**：以高性价比和推理/代码能力出圈。通用的 DeepSeek-V3（2024-12，MoE 架构）和推理专用的 DeepSeek-R1（2025-01，MIT 开源）是其代表作。
4. **Kimi（月之暗面）**：在长文档阅读和信息整合场景表现突出。

## 6.5.4 思考题

如果你是公司的 CTO，现在要引入 AI。

你会为了数据安全选择 **自部署开源模型**（如 LLaMA，需要买昂贵的显卡），还是为了效果选择 **接入闭源 API**（如 GPT/Claude/Gemini，数据要传给服务商）？

这个决策的平衡点在哪里？


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://yeasy.gitbook.io/ai_beginner_guide/di-er-bu-fen-he-xin-ji-shu-jie-xi/06_llm/6.5_major_llms.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
