英伟达全模态大模型 Nemotron 3 Nano Omni:吞吐量同类9倍,免费可用
Type: article
Author: 36氪/智东西
Primary Topic: NVIDIA Nemotron 3 Nano Omni 全模态大模型
Ingested: 2026-04-30
Summary
NVIDIA于2026年4月发布Nemotron 3 Nano Omni,一款融合文本、视觉、语音三大模态的全模态推理模型,视频推理吞吐量达同类开放模型的9.2倍,内存效率提升最高4倍。模型采用Mamba层与Transformer层深度融合的混合MoE架构,在视频理解和音频理解基准上超越Qwen3-Omni-30B和Gemini 2.5 Flash。目前通过OpenRouter免费提供,支持本地、数据中心及云环境部署,适用于GUI Agent、文档智能和音视频理解等场景。
Key Concepts
- 全模态推理
- 混合MoE架构
- Mamba层与Transformer层融合
- 改进蒸馏训练
- GUI Agent
- 文档智能
- 吞吐量优化
Entities
- NVIDIA
- Nemotron 3 Nano Omni
- Qwen3-Omni-30B
- Gemini 2.5 Flash
- Aible
- 富士康
- Palantir
- H Company
- 戴尔科技
- DocuSign
- Infosys
- Oracle
- 36氪
- 智东西
Source
Relations
- (none)
Auto-generated on 2026-04-30
相关文章(自动整合)
- 2026-04-29 AI三连发:Nemotron Omni + Meta CWM + AWS上架OpenAI — 文章B详细介绍了文章A提及的Nemotron Omni模型(重叠度: 2,整合于 2026-04-30)