英伟达全模态大模型 Nemotron 3 Nano Omni：吞吐量同类9倍，免费可用

Type: article
Author: 36氪/智东西
Primary Topic: NVIDIA Nemotron 3 Nano Omni 全模态大模型
Ingested: 2026-04-30

Summary

NVIDIA于2026年4月发布Nemotron 3 Nano Omni，一款融合文本、视觉、语音三大模态的全模态推理模型，视频推理吞吐量达同类开放模型的9.2倍，内存效率提升最高4倍。模型采用Mamba层与Transformer层深度融合的混合MoE架构，在视频理解和音频理解基准上超越Qwen3-Omni-30B和Gemini 2.5 Flash。目前通过OpenRouter免费提供，支持本地、数据中心及云环境部署，适用于GUI Agent、文档智能和音视频理解等场景。

Key Concepts

全模态推理
混合MoE架构
Mamba层与Transformer层融合
改进蒸馏训练
GUI Agent
文档智能
吞吐量优化

Entities

NVIDIA
Nemotron 3 Nano Omni
Qwen3-Omni-30B
Gemini 2.5 Flash
Aible
富士康
Palantir
H Company
戴尔科技
DocuSign
Infosys
Oracle
36氪
智东西

Source

Raw: nvidia-nemotron-3-nano-omni-multimodal-model.md

Relations

(none)