国产900M小钢炮GLM-OCR:公式表格识别率94%,边缘设备可跑
Type: article
Author: 智谱
Primary Topic: 本地部署
Ingested: 2026-06-03
Summary
GLM-OCR是智谱开源的0.9B轻量级多模态OCR模型,在OmniDocBench V1.5基准测试中以94.62分排名第一,超越Gemini 3 Pro和GPT-5.2等闭源大模型。该模型支持vLLM、SGLang、Ollama等多种部署方式,可在边缘设备甚至CPU上运行,成本约为传统OCR方案的十分之一。其核心优势在于对复杂表格、公式、手写体、多语言及票据等真实业务场景的全面支持,是PaddleOCR等传统方案的有力替代选择。
Key Concepts
- OCR识别
- 轻量级模型
- 边缘部署
- 多模态文档理解
- 0.9B参数
- 复杂表格识别
- 本地推理
Entities
- 智谱
- GLM-OCR
- THUDM
- OmniDocBench
- Gemini 3 Pro
- GPT-5.2
- PaddleOCR
- CogViT
- vLLM
- SGLang
- Ollama
Source
Relations
- (none)
Auto-generated on 2026-06-03