LlamaIndex LiteParse — 本地极速文档解析库
Type: repo
Author: LlamaIndex团队
Primary Topic: 本地部署
Ingested: 2026-05-31
Summary
LiteParse 是 LlamaIndex 开源的本地文档解析工具,基于 Rust 和 PDFium 实现亚秒级 PDF 解析,支持 PDF、DOCX、XLSX、PPTX 等格式。提供 Python、Node.js、WASM 多语言绑定,内置 Tesseract OCR,输出带 Bounding Box 的结构化 JSON。适合对数据隐私有要求的 RAG 管道和 AI Agent 本地文档处理场景,是云端 LlamaParse 的轻量替代品。
Key Concepts
- 本地文档解析
- RAG管道
- Rust绑定
- OCR集成
- 结构化JSON输出
- 多格式支持
- 隐私保护
Entities
- LlamaIndex
- LiteParse
- LlamaParse
- Tesseract
- EasyOCR
- PaddleOCR
- PDFium
Source
Relations
- (none)
Auto-generated on 2026-05-31