13.3 Google Gemini 提示策略
13.3.1 Gemini 模型系列
模型
上下文窗口
核心特点
适用场景
13.3.2 原生多模态能力
多模态输入示例
import os
import google.generativeai as genai
api_key = os.getenv("GEMINI_API_KEY") or os.getenv("GOOGLE_API_KEY")
genai.configure(api_key=api_key)
model = genai.GenerativeModel("gemini-2.5-pro")
product_image = b"<demo_image_bytes>"
audio_clip = b"<demo_audio_bytes>"
# 混合多种模态
response = model.generate_content([
"请分析这张产品图片和用户反馈音频,给出综合评估:",
product_image, # PIL Image
audio_clip, # 音频文件
"补充信息:这是一款智能手表,目标用户是运动爱好者。"
])
print(response)支持的模态类型
13.3.3 多模态提示词设计
图像理解与分析
视频内容分析
跨模态推理
13.3.4 超长上下文处理策略
长文档处理最佳实践
信息检索模式
13.3.5 Google 生态集成
与 Google Search 结合
与 Google Workspace 协作
13.3.6 结构化输出指定
13.3.7 提示词模板示例
综合分析模板
13.3.8 常见问题与解决方案
问题
解决方案
延伸思考
最后更新于
