13.4 编码器-解码器模型:T5 与 BART 的设计选择
13.4.1 T5:统一的文本到文本框架
输入:"translate English to German: That is good."
输出:"Das ist gut."
输入:"sst2 sentence: This movie is terrible."
输出:"negative"
输入:"summarize: [长文本]"
输出:"[摘要]"13.4.2 BART:序列去噪的灵活性
13.4.3 后续发展:Flan-T5 与 UL2
13.4.4 编码器-解码器 vs 纯解码器的权衡
最后更新于
