DeepSeek-OCR-2:开源文档智能识别工具,一键转Markdown
Type: repo
Author: DeepSeek AI
Primary Topic: AI工具
Ingested: 2026-05-06
Summary
DeepSeek-OCR-2是DeepSeek发布的开源文档智能识别工具,通过视觉因果流技术保留文档排版结构,可将复杂文档(含表格、公式、多栏排版)转换为标准Markdown格式。在OmniDocBench v1.5基准测试中优于Gemini等主流大模型,支持Docker一键部署和PDF批量并发处理,但需要CUDA GPU环境。
Key Concepts
- 文档智能识别
- 视觉因果流
- Markdown转换
- PDF批量处理
- 动态分辨率自适应
- 开源OCR
- 结构化输出
Entities
- DeepSeek
- DeepSeek-OCR-2
- vLLM
- OmniDocBench
- Gemini
- PaddleOCR
- Claude Vision
Source
Relations
- (none)
Auto-generated on 2026-05-06