马上注册,下载更多AI资源软件
您需要 登录 才可以下载或查看,没有账号?立即注册
×
GLM-OCR - 轻量强大的OCR工具 精准解析复杂文档与表格 文字识别 公式识别 支持50系显卡 一键整合包下载 .. ...
GLM-OCR 是智谱AI一个开源的多模态 OCR(光学字符识别)模型,专门用来处理复杂文档的识别和理解。它的目标是做到 准确 × 快速 × 全面,不仅能识别文字,还能理解文档的结构,比如表格、公式、印章和代码片段。它就是一个“看图识字”的大模型,但比传统OCR厉害很多,尤其擅长对付那些乱七八糟、很复杂的文档。它的定位不仅是“识字”,而是“理解文档”,更像是一个智能的文档助手。
GLM-OCR - 轻量强大的OCR工具 精准解析复杂文档与表格 文字识别 公式识别 支持50系显卡 一键整合包下载 .. ...
包含WebUI和GUI两种模式,UC网盘只支持WebUI,夸克和百度网盘包括WebUI+GUI两种模式。
主要特点
高精度:在国际文档识别评测 OmniDocBench V1.5 上拿到 94.62 的分数,排名第一,尤其擅长公式识别、表格解析和信息抽取。
适合复杂场景:能处理现实中常见的难题,比如复杂表格、带代码的文档、盖章文件等。
高效推理:模型参数只有 0.9B,支持多种部署方式(vLLM、SGLang、Ollama),推理速度快,适合高并发和边缘设备。
易用性强:提供完整 SDK 和工具链,安装简单,可以一行命令调用,支持云端 API 或本地部署。
结构化输出:结果不仅是纯文本,还能输出 JSON 或 Markdown,保留文档的布局信息。
应用领域
财务/行政:发票、合同、报销单、证件批量识别+结构化提取
教育/科研:论文公式、实验记录、手写笔记、板书拍照转文字
程序员/开发者:代码截图 → 可运行的代码块、GitHub issue截图解析
档案/图书数字化:老文献、扫描件、手写稿、印章文件
RAG知识库搭建:把PDF/扫描件批量转成结构化文本喂大模型
低成本/本地化部署需求:不想用云OCR API,又想要比较高的准确率
使用教程:(建议N卡,显存4G起,支持纯CPU运行)
上传需要处理的图像,选择处理类型(text-文本;Formula-公式;Table-表格),点击处理即可。
下载地址:
UC网盘:https://drive.uc.cn/s/1884b248a61f4
夸克网盘:
游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源 立即购买
百度网盘:
游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 50碎银 下载该资源 立即购买
|