DeepSeek-OCR-2:开源文档智能识别工具,一键转Markdown

Type: repo
Author: DeepSeek AI
Primary Topic: AI工具
Ingested: 2026-05-06

Summary

DeepSeek-OCR-2是DeepSeek发布的开源文档智能识别工具,通过视觉因果流技术保留文档排版结构,可将复杂文档(含表格、公式、多栏排版)转换为标准Markdown格式。在OmniDocBench v1.5基准测试中优于Gemini等主流大模型,支持Docker一键部署和PDF批量并发处理,但需要CUDA GPU环境。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-05-06