13人干翻Transformer!新架构SSA算力暴减千倍,成本仅Opus 5%
Type: article
Author: 新智元
Primary Topic: 行业动态
Ingested: 2026-05-06
Summary
迈阿密13人初创公司Subquadratic发布基于SSA(亚二次方稀疏注意力)架构的SubQ模型,支持1200万Token上下文,在100万token场景下比FlashAttention-2快52倍,FLOP减少近1000倍。该架构通过内容依赖路由跳过99%以上无用计算,实现线性而非二次方的复杂度扩展,在多项基准测试中以Claude Opus约5%的成本达到相近甚至更优的性能。
Key Concepts
- 亚二次方稀疏注意力
- Transformer替代架构
- 长上下文推理
- 算力效率
- 内容依赖路由
- 线性复杂度扩展
Entities
- Subquadratic
- SubQ
- SSA
- Bindu Reddy
- Anthropic
- OpenAI
- Claude Opus
- FlashAttention-2
Source
Relations
- (none)
Auto-generated on 2026-05-06