10.4 模型选择与路由策略:Model Routing 与 Cascading
10.4.1 模型分层
Tier
模型家族
擅长
成本
延迟
10.4.2 静态路由
def route_request(task_type, prompt):
if task_type == "coding":
return call_sonnet_family(prompt)
elif task_type == "summarization":
return call_haiku_family(prompt)
elif task_type == "creative_writing":
return call_opus_family(prompt)10.4.3 动态路由
10.4.4 级联降级:Cascading / Fallback
10.4.5 A/B Testing 与 Evals
最后更新于
