3.3 开源的盛宴

—— 框架与社区的力量

AI 的繁荣不只靠大公司,更靠全球千万开发者的“用爱发电”。

3.3.1 PyTorch、TensorFlow 与 JAX:主流框架格局

在深度学习框架里,PyTorchTensorFlow 仍是最常见的两大阵营,另外 JAX 在研究和高性能训练场景也越来越活跃。 这有点像手机系统里既有主流双寡头,也有细分强者。

  • TensorFlow:生态成熟,部署工具链完整,在部分传统企业场景仍很常见。

  • PyTorch:在研究和开源社区占比更高,教程和示例丰富,上手门槛相对低。

  • JAX:函数式和并行化能力强,常见于前沿研究和高性能训练实验。

现在的趋势是:PyTorch 在研究和开源社区的使用占比很高。大量最新论文和开源项目会优先给出 PyTorch 版本。 对初学者来说,先学 PyTorch 往往更顺手;但落地到生产时,仍要尊重团队现有栈和部署要求。

3.3.2 Hugging Face:AI 界的 GitHub

如果你问 AI 开发者最常用的模型社区之一,Hugging Face 基本绕不开。

它本来是一家做聊天机器人的公司,后来无心插柳变成了全球最大的 AI 模型集市。 在这里,你可以:

  1. 下载模型:全世界的大神把训练好的模型(LLaMA, BERT, Stable Diffusion)上传上来,你一键就能下载用。

  2. 体验 Demo:不用写代码,直接在网页上点一点,就能体验最新的 AI 功能。

  3. 下载数据:海量的公开数据集供你训练。

可以说,Hugging Face 显著降低了开源 AI 的试错成本。

3.3.3 GitHub Copilot 与 Agentic Coding:当 AI 开始写 AI

这一讲必须提到一个关键方向:AI 编程助手(如 GitHub Copilot、Cursor 等)。 近几年,单纯的代码补全已经不稀奇了,现在更常被讨论的是 Agentic Coding(智能体编程)

以前,程序员写代码要一个字一个字敲。现在,你写注释或需求描述,AI 就能生成初稿,甚至给出重构方案。 但要注意:AI 代码不是免检代码,仍需要测试、代码审查和安全扫描。

这引发了一个现实问题:当越来越多代码由 AI 参与生成时,我们如何保证代码质量、版权合规和可维护性? 这已经是工程团队正在面对的问题。

开源与闭源的博弈仍在继续。对初学者而言,先从 Hugging Face 上找一个感兴趣的模型跑起来,比纠结“选哪个框架”重要得多。

3.3.4 思考题

如果你要在一周内“把一个开源模型跑起来并做出一个小 Demo”,你会怎么选:

  • 你更愿意先学 PyTorch 还是先用 Hugging Face 的现成管线?为什么?

  • 你会如何验证“AI 生成的代码/配置”是可靠的(至少做哪 2 件事)?

最后更新于