Unlimited-OCR：一次解析几十页文档的超强OCR神器一键整合包下载

无言*** · 发表于昨天 11:19

马上注册，下载更多AI资源软件

您需要登录才可以下载或查看，没有账号？立即注册

×

Unlimited-OCR 是百度开源的一个强大 OCR（光学字符识别）模型，简单说就是“能看图识字”的 AI 工具，尤其擅长处理长文档和多页 PDF。传统 OCR 工具通常一次只能处理一页或几页，遇到长文档就得“分页处理”，容易出错、丢上下文。Unlimited-OCR 像人抄书一样，一口气就能把几十页甚至整本书的内容“看完”并准确转成文字（称为 One-shot Long-horizon Parsing，即一次性长距离解析）。

Unlimited-OCR 是一个实用又前沿的开源 OCR 工具，特别适合需要处理大量长文档的场景。

主要特点

超强长文档能力：支持一次性处理多页 PDF 或图片（可达几十页），不用反复分页，上下文连贯，生成速度和内存占用更稳定。
创新注意力机制（R-SWA）：模仿人脑“工作记忆”——始终盯着原始图片（全局参考），但只记住最近一小段自己输出的文字（滑动窗口，默认 128 个 token），避免内存爆炸和文字“模糊”。这让长序列处理效率大幅提升。
高压缩视觉编码：图片信息被高效压缩，节省计算资源。
易用：支持 Hugging Face Transformers 和 SGLang 推理，能处理单张图片、多页图片或 PDF，直接输出结构化结果。
准确率不错：在文档解析基准测试中表现优于基线模型。

应用领域

文档数字化：扫描合同、书籍、报告、学术论文等，转成可编辑文字或结构化数据。
办公自动化：批量处理发票、表格、档案，提升企业效率。
信息提取：从图片/PDF 中快速抓取关键信息（如表格、公式、段落）。
无障碍辅助：帮助视障人士阅读印刷材料。
其他扩展：原理可用于语音识别（ASR）、机器翻译等需要“长序列参考”的场景。

使用教程：（建议N卡，显存8G起，支持50系显卡）

包含主程序压缩包和模型文件（models文件夹），分别下载，解压主程序后，将模型文件移动到主程序目录下即可

上传需要转换的文件（支持图像和pdf文档），点击右上角的 “开始” 按钮即可。
支持原始格式和预览（所见即所得）两种转换结果

下载地址：
迅雷云盘：https://pan.xunlei.com/s/VOwBvZNrtvG6LW--7ojuyt5KA1?pwd=vzmx

夸克网盘：

🔒付费内容

游客， 上上宾会员 可免费下载该资源，点此开通上上宾 免费下载全站99%的付费资源。或单独支付 20碎银 下载该资源

立即购买

百度网盘：

🔒付费内容

游客， 上上宾会员 可免费下载该资源，点此开通上上宾 免费下载全站99%的付费资源。或单独支付 40碎银 下载该资源

立即购买

		自动登录	找回密码
密码			立即注册

Unlimited-OCR：一次解析几十页文档的超强OCR神器一键整合包下载

马上注册，下载更多AI资源软件

宣传达人

灌水之王

突出贡献

荣誉管理

论坛元老

Unlimited-OCR：一次解析几十页文档的超强OCR神器 一键整合包下载

马上注册，下载更多AI资源软件

宣传达人

灌水之王

突出贡献

荣誉管理

论坛元老

Unlimited-OCR：一次解析几十页文档的超强OCR神器一键整合包下载