8.2 状态空间模型(SSM)入门
8.2.1 什么是状态空间模型?
8.2.2 类比 1:自来水管
传统的"注意力"管道:
所有的水龙头都连接到一个中央枢纽
每个水龙头都需要与所有其他水龙头通信
水龙头数量增加 → 中央枢纽变得极其复杂
缺点:如果有100个水龙头,需要100×100的连接点!
─────────────────────────────────────
SSM管道:
水从上游流下来 → 通过一系列的管道 → 流向下游
每个节点只需要:
• 接收来自上游的水
• 向其中加入一点"处理"
• 把结果传给下游
优点:无论有多少个节点,都是线性的连接!用管道类比 SSM 如何工作
8.2.3 类比 2:河流与河床
8.2.4 与本章其他部分的关系
8.2.5 状态是如何“记忆”的?
类比:棋局的记忆
8.2.6 Mamba:最重要的 SSM 实现
Mamba 为什么重要?
Mamba 的名字含义
8.2.7 SSM vs Transformer:基本对比
8.2.8 实际场景中的应用
SSM 擅长的任务
8.2.9 本节小结
8.2.10 思考题
最后更新于
