Redis之父下场,给DeepSeek V4单独造了一台推理引擎
Type: article
Author: antirez(Salvatore Sanfilippo)
Primary Topic: 本地部署
Ingested: 2026-05-09
Summary
Redis创始人antirez于2026年5月发布专为DeepSeek V4 Flash打造的本地推理引擎ds4,仅支持Apple Metal,以单个C文件无外部依赖的极简方式实现。该引擎针对MoE架构进行专项量化优化,支持磁盘持久化KV Cache,128GB内存的Mac即可运行,体现了大模型推理生态从通用兼容向专用优化转变的趋势。
Key Concepts
- 本地推理引擎
- Apple Metal专属优化
- MoE量化策略
- KV Cache磁盘持久化
- 极简主义单文件设计
- 2-bit量化
- 专用推理引擎
Entities
- Salvatore Sanfilippo
- antirez
- Redis
- DeepSeek V4 Flash
- ds4
- Apple Metal
- M3 Max
- M3 Ultra
- GPT-5.5
- llama.cpp
- GGML
- Ollama
- MLX
Source
Relations
- (none)
Auto-generated on 2026-05-09