国产900M小钢炮GLM-OCR:公式表格识别率94%,边缘设备可跑

Type: article
Author: 智谱
Primary Topic: 本地部署
Ingested: 2026-06-03

Summary

GLM-OCR是智谱开源的0.9B轻量级多模态OCR模型,在OmniDocBench V1.5基准测试中以94.62分排名第一,超越Gemini 3 Pro和GPT-5.2等闭源大模型。该模型支持vLLM、SGLang、Ollama等多种部署方式,可在边缘设备甚至CPU上运行,成本约为传统OCR方案的十分之一。其核心优势在于对复杂表格、公式、手写体、多语言及票据等真实业务场景的全面支持,是PaddleOCR等传统方案的有力替代选择。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-06-03