5.2 示例的选择与设计策略

少样本学习的效果很大程度上取决于示例的质量。精心设计的示例可以使模型快速理解任务,而不当的示例可能导致误解或偏差。本节将介绍示例选择和设计的关键策略。

5.2.1 优质示例的特征

1. 代表性

示例应该代表任务中常见的典型情况。

任务:客户咨询分类

✓ 代表性示例:
- 物流查询(高频)
- 产品咨询(高频)
- 退换货(中频)

✗ 非代表性示例:
- 投诉 CEO(极罕见)
- 请求定制产品(特殊情况)

2. 多样性

示例应该覆盖任务的不同类型或情况。

任务:情感分析

✓ 多样化示例集:
- 明确正面:"非常满意,五星好评!"
- 明确负面:"太差了,再也不买了。"
- 中性/混合:"还行吧,没什么特别的。"
- 隐含情感:"等了一周才到。"(隐含负面)

✗ 同质化示例:
- "很好"
- "挺好的"
- "非常好"
(都是正面,缺乏多样性)

3. 清晰性

示例本身应该是正确、清晰、无歧义的。

4. 一致性

所有示例应该遵循相同的格式和风格。

5.2.2 示例数量的选择

理想数量

研究和实践表明,3-5 个示例通常是较好的选择:

影响因素

任务复杂度

  • 简单任务(如格式转换):2-3 个示例

  • 中等任务(如分类、提取):3-5 个示例

  • 复杂任务(如多步骤推理):5-6 个示例

类别数量

  • 如果是分类任务,每个类别至少包含一个示例

边界情况

  • 需要额外示例来展示边界情况的处理

5.2.3 示例的组织结构

标准结构

带分隔符的结构

表格结构

对于映射类任务,表格格式清晰简洁:

5.2.4 示例选择策略

策略 1:覆盖边界情况

特别为可能出错的边界情况提供示例:

策略 2:平衡类别分布

分类任务中,尽量平衡各类别的示例数量:

策略 3:从简单到复杂

按复杂度顺序排列示例:

策略 4:包含负面示例

展示“不应该”怎么做可以帮助模型理解边界:

5.2.5 示例设计的注意事项

避免过于简化

示例应该足够真实,接近实际输入的复杂度:

避免示例中的偏见

确保示例不会引导模型产生不当的偏见:

避免泄露测试答案

如果在评估场景使用,确保示例与测试数据无关

5.2.6 动态示例选择

在实际应用中,可以根据待处理输入动态选择最相关的示例:

思考

  1. 在您的领域中,为了防止模型犯某种特定错误,您会如何设计一个 负面示例 (Negative Example)?

  2. 回顾您最近设计的一个提示词,检查其中的示例是否具备足够的代表性和多样性?如果不够,您计划如何改进?

最后更新于