OpenDataLoader PDF - AI友好型PDF解析器,100页/秒无GPU
Type: repo
Author: opendataloader-project
Primary Topic: AI编程
Ingested: 2026-05-17
Summary
OpenDataLoader PDF是一个开源PDF解析库,支持100页/秒的高速解析,无需GPU即可运行。提供本地确定性模式和Hybrid AI模式,输出Markdown/JSON/HTML格式,内置LangChain集成,适合RAG知识库构建和批量文档处理场景。
Key Concepts
- PDF解析
- RAG集成
- 无GPU推理
- 文档结构化
- OCR识别
- Markdown输出
Entities
- OpenDataLoader
- LangChain
- PyMuPDF
- Docling
- Adobe API
- Marker
Source
Relations
- (none)
Auto-generated on 2026-05-17