10.2 图像理解与视觉提示
10.2.1 图像理解的能力边界
10.2.2 基本图像提示模式
1. 描述任务
2. 问答任务
3. 分析任务
4. 提取任务
10.2.3 高级图像提示技巧
区域指向
多图比较
图表深度解读
文档理解
10.2.4 图像提示的常见陷阱
陷阱一:任务过于宽泛
陷阱二:假设模型能看到你看不到的
陷阱三:要求超出能力边界
10.2.5 实践案例:电商场景
动手试试
最后更新于
