13人干翻Transformer!新架构SSA算力暴减千倍,成本仅Opus 5%

Type: article
Author: 新智元
Primary Topic: 行业动态
Ingested: 2026-05-06

Summary

迈阿密13人初创公司Subquadratic发布基于SSA(亚二次方稀疏注意力)架构的SubQ模型,支持1200万Token上下文,在100万token场景下比FlashAttention-2快52倍,FLOP减少近1000倍。该架构通过内容依赖路由跳过99%以上无用计算,实现线性而非二次方的复杂度扩展,在多项基准测试中以Claude Opus约5%的成本达到相近甚至更优的性能。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-05-06