DeepSeek-OCR-2：开源文档智能识别工具，一键转Markdown

Type: repo
Author: DeepSeek AI
Primary Topic: AI工具
Ingested: 2026-05-06

Summary

DeepSeek-OCR-2是DeepSeek发布的开源文档智能识别工具，通过视觉因果流技术保留文档排版结构，可将复杂文档（含表格、公式、多栏排版）转换为标准Markdown格式。在OmniDocBench v1.5基准测试中优于Gemini等主流大模型，支持Docker一键部署和PDF批量并发处理，但需要CUDA GPU环境。

Key Concepts

文档智能识别
视觉因果流
Markdown转换
PDF批量处理
动态分辨率自适应
开源OCR
结构化输出

Entities

DeepSeek
DeepSeek-OCR-2
vLLM
OmniDocBench
Gemini
PaddleOCR
Claude Vision

Source

Raw: deepseek-ocr-2-document-recognition.md

Relations

(none)

Auto-generated on 2026-05-06