OpenAI发布GPT-Realtime-2:首个GPT-5级推理音频模型
Type: article
Author: unknown
Primary Topic: 行业动态
Ingested: 2026-05-13
Summary
OpenAI发布GPT-Realtime-2,将GPT-5级推理能力引入语音交互,支持可调节推理强度、128K上下文窗口及情感感知。同步推出GPT-Realtime-Translate(支持70+语言实时翻译)和GPT-Realtime-Whisper(流式转写),覆盖多场景语音AI需求。该系列模型具备Agentic能力,可通过语音触发多步骤任务执行,已有Zillow、Priceline、Vimeo等企业接入。
Key Concepts
- 实时语音交互
- GPT-5级推理
- 情感感知
- 流式转写
- 多任务并行工具调用
- Agentic语音能力
- 128K上下文窗口
Entities
- OpenAI
- GPT-Realtime-2
- GPT-Realtime-Translate
- GPT-Realtime-Whisper
- Zillow
- Priceline
- Vimeo
Source
Relations
- (none)
Auto-generated on 2026-05-13