阶跃星辰 Step 3.7 Flash:198B-A11B 多模态开源模型,400 token/s,专为 Agent 设计
Type: article
Author: unknown
Primary Topic: AI Agent
Ingested: 2026-06-01
Summary
阶跃星辰发布 Step 3.7 Flash,采用稀疏 MoE 架构,总参数 198B 但仅激活 11B,推理速度达 400 token/s,是目前多模态开源模型最快梯队之一。模型专为 Agent 场景优化,支持长程多轮工作流,同时兼容 OpenAI 和 Anthropic 两套协议,可在消费级显卡上本地部署。在 SWE-Bench Pro 和 ClawEval 等 Agent 基准上均位居开源模型第一,以极低成本实现接近顶级闭源模型的编码性能。
Key Concepts
- 稀疏MoE架构
- Agent工作流优化
- 多模态理解
- 高速推理
- 开源模型
- 本地部署
- 协议兼容性
Entities
- 阶跃星辰
- Step 3.7 Flash
- Claude Code
- OpenClaw
- KiloCode
- RooCode
- vLLM
- SGLang
- llama.cpp
- OPPO
- 荣耀
Source
Relations
- (none)
Auto-generated on 2026-06-01
相关文章(自动整合)
llama.cpp b9553 性能实测:自适应混合推理引擎与IQ4_XXS量化突破 — 同属相关主题(重叠度: 2,整合于 2026-06-15)
Cohere North Mini Code:128专家激活8个,专为Agent编码训练的开源MoE模型 — 同属相关主题(重叠度: 2,整合于 2026-06-14)
Odysseus:一款可部署在自己机器上的AI工作台 — 同属相关主题(重叠度: 2,整合于 2026-06-09)
全模态AI免费时代来了:文字、图片、视频全搞定,OpenClaw可调用 — 同属相关主题(重叠度: 2,整合于 2026-06-06)
国产900M小钢炮GLM-OCR:公式表格识别率94%,边缘设备可跑 — 同属相关主题(重叠度: 2,整合于 2026-06-03)