5.5 本章实战练习

本节提供递进式的练习题，帮助读者巩固少样本学习的知识，并应用到实际场景中。

练习一：情感分析对比实验（基础通用）

目标：亲身体验零样本与少样本在处理模糊文本时的效果差异。

任务描述：你需要构建一个简单的提示词，判断用户评论的情感倾向（正面、负面、中性）。

测试数据：

“这东西说实话不错，就是物流慢了点，客服态度也一般。”（混合情感）
“价格是便宜，但质量真不敢恭维。”（转折句，实贬）
“还行吧。”（中性偏弱）

步骤：

零样本测试：直接编写指令，让模型判断上述三条评论的情感。
少样本构建：编写 3 个示例（正面、负面、混合各一个），加入到提示词中。
少样本测试：使用带有示例的提示词再次测试上述三条评论。

思考：

在处理混合情感（如第 1 条）时，加入示例后模型的判断依据是否更明确了？
示例的格式（如 JSON 输出）是否帮助模型更准确地输出了你期望的结构？

练习二：脏数据清洗与提取（进阶技巧）

目标：学习利用少样本示例处理格式混乱的脏数据。

任务描述：从格式不统一的用户地址输入中，提取标准的结构化信息（省、市、区、详细地址）。

输入数据（脏数据）：

“北京朝阳区建国路 88 号 SOHO 现代城”（缺少“市”）
“广东省深圳市南山区深南大道 TX 大厦”（标准）
“杭州余杭区文一西路 (梦想小镇)”（包含括号备注，缺少“省”）

挑战：模型往往容易忽略缺失的行政区划，或者保留括号内的无关备注。

练习要求：

设计 2-3 个示例，专门展示如何处理：
- 省略“省”或“市”的情况（示例中自动补全或留空，取决于你的定义）。
- 去除地址中的噪音（如括号备注）。
验证模型是否能按照你示例中的逻辑正确处理第 1 和第 3 条数据。

练习三：构建动态意图识别器（实战场景）

目标：模拟客服场景，设计一个能够根据少样本准确识别用户意图的系统。

场景背景：你正在为一个电商平台开发智能客服。主要的意图类型包括：

logistics_inquiry（物流查询）
return_request（退换货申请）
product_consultation（商品咨询）
human_agent（转人工）

任务：

为每个意图编写 1-2 个典型示例（ Input -> Intent）。
负面示例设计（重要）：设计一个示例，教模型区分“抱怨物流慢”（属于logistics_inquiry或complaint）与“我要退货”（属于return_request）。很多模型容易混淆这两者。
编写提示词，要求模型输出 JSON 格式，包含 intent 和 confidence（置信度）。

代码实现思路（ Python 伪代码）：

system_prompt = """
你是一个电商客服意图识别助手。请参考以下示例进行分类：

示例 1：
用户：我的快递到哪了？都三天了。
输出：{"intent": "logistics_inquiry", "confidence": "high"}

示例 2：
用户：这衣服质量太差，我要退款！
输出：{"intent": "return_request", "confidence": "high"}

示例 3（区分抱怨与退货）：
用户：你们发货太慢了，下次不买了。
输出：{"intent": "complaint", "confidence": "medium"}  # 注意：这不是退货请求

请处理：
用户：{user_input}
"""

# 调用 API 进行测试...

扩展思考：如果用户说：“我想问问退货的运费是谁出？”，这应该属于 return_request 还是 product_consultation（或 policy_inquiry）？尝试通过添加示例来微调模型的判断边界。

参考实现代码

以下是本章练习的参考 Python 实现。

1. 零样本与少样本对比：Zero-Shot vs Few-Shot

zero_vs_few_shot.py

import os

# 模拟 LLM 调用函数 (在实际使用中请替换为真实的 OpenAI/Anthropic API 调用)

def mock_llm_call(prompt):
    print(f"\n[Sending to LLM]...\n{prompt}\n-------------------")
    # 模拟返回
    if "示例" not in prompt and "不错" in prompt and "慢" in prompt:
        return "中性 (Zero-shot default)"
    elif "示例" in prompt and "不错" in prompt and "慢" in prompt:
        return "混合 (Few-shot learned)"
    return "Positive"

def zero_shot_demo():
    print("=== Zero-Shot Demo ===")
    instruction = "判断以下评论的情感：\n"
    user_input = "这东西说实话不错，就是物流慢了点，客服态度也一般。"
    prompt = instruction + user_input
    response = mock_llm_call(prompt)
    print(f"[LLM Response]: {response}\n")

def few_shot_demo():
    print("=== Few-Shot Demo ===")
    examples = """
示例 1：
输入：今天的饭真好吃。
情感：正面

示例 2：
输入：完全是浪费钱。
情感：负面

示例 3：
输入：虽然有点贵，但质量确实好。
情感：混合
"""
    instruction = "请参考示例判断情感：\n"
    user_input = "这东西说实话不错，就是物流慢了点，客服态度也一般。"
    prompt = instruction + examples + "\n 输入：" + user_input
    response = mock_llm_call(prompt)
    print(f"[LLM Response]: {response}\n")

if __name__ == "__main__":
    zero_shot_demo()
    few_shot_demo()

2. 动态示例选择器（ Dynamic Selector）

dynamic_selector.py

import random

class DynamicSelector:
    def __init__(self):
        self.examples = {
            "logistics": [
                {"input": "我的快递到哪了？", "intent": "logistics_inquiry"},
                {"input": "为什么还不发货？", "intent": "logistics_inquiry"}
            ],
            "return": [
                {"input": "我要退货", "intent": "return_request"},
                {"input": "这衣服尺码不对", "intent": "return_request"}
            ],
            "complaint": [
                {"input": "你们服务太差了", "intent": "complaint"},
                {"input": "我要投诉你们经理", "intent": "complaint"}
            ]
        }

    def get_examples(self, query):
        # 在实际场景中，这里可以使用向量相似度检索 (Vector Search)
        # 这里仅用简单的关键词匹配作为演示
        selected = []
        if "快递" in query or "发货" in query:
            selected.extend(self.examples["logistics"])
        if "退" in query or "尺码" in query:
             selected.extend(self.examples["return"])

        # 如果没有匹配到，随机返回几个作为通用示例 (Fallback)
        if not selected:
             all_ex = [item for sublist in self.examples.values() for item in sublist]
             selected = random.sample(all_ex, 2)

        return selected

    def construct_prompt(self, query):
        examples = self.get_examples(query)
        prompt = "请根据以下示例判断用户意图：\n\n"
        for ex in examples:
            prompt += f"用户：{ex['input']}\n 意图：{ex['intent']}\n\n"

        prompt += f"用户：{query}\n 意图："
        return prompt

# 演示

if __name__ == "__main__":
    selector = DynamicSelector()

    query1 = "帮我查下快递"
    print(f"Query: {query1}")
    print(selector.construct_prompt(query1))
    print("-" * 30)

    query2 = "我想退这件衣服"
    print(f"Query: {query2}")
    print(selector.construct_prompt(query2))

上一页5.4 常见问题与解决方案下一页本章小结

最后更新于 3天前

hashtag5.5 本章实战练习

hashtag练习一：情感分析对比实验（基础通用）

hashtag练习二：脏数据清洗与提取（进阶技巧）

hashtag练习三：构建动态意图识别器（实战场景）

hashtag参考实现代码

hashtag1. 零样本与少样本对比：Zero-Shot vs Few-Shot

hashtag2. 动态示例选择器 （ Dynamic Selector）