7.3 推理计算(Inference-Time Compute)
7.3.1 问题:为什么我们一直只在乎“模型大小”?
7.3.2 一个生活类比:考试的两种方式
学生A:死记硬背所有内容(传统方法)
学生B:掌握原理,考试时推导(推理计算方法)
7.3.3 推理计算的三个维度
1. 计算在何时分配
2. 计算的深度
3. 计算的方式
7.3.4 推理计算的经济学
成本-效益分析
什么时候推理计算是值得的?
7.3.5 推理计算的天花板
7.3.6 推理计算 vs. 参数扩展
7.3.7 本节小结
7.3.8 思考题
最后更新于
