10.3 音频与视频处理
10.3.1 音频处理能力现状
模型/系统
音频输入
实时语音
音频输出
10.3.2 音频提示设计
1. 语音转录任务
2. 音频内容分析
3. 实时语音对话
10.3.3 视频处理能力现状
模型/系统
视频长度能力
处理方式
音频支持
10.3.4 视频提示设计
1. 视频内容摘要
2. 视频内容问答
3. 教学视频分析
10.3.5 长视频处理策略
策略一:关键帧提取
策略二:分段处理
策略三:音视频分离
10.3.6 音视频提示的关键原则
延伸思考
最后更新于
