GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别图片文字识别本地一键整合包下载 - AI软件 - 前沿AI软件资源站

无言以对 发表于 2024-10-18 10:27:10

GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别图片文字识别本地一键整合包下载

GOT-OCR-2.0 是一个基于通用 OCR 理论（General OCR Theory）的统一端到端模型，专注于提升光学字符识别（OCR）的准确性与效率。该项目由 StepFun、旷视科技、中国科学院大学和清华大学的研究团队共同发布，适用于场景文本、文档识别等多种应用场景。它采用了一体化的架构，能够高效处理文本的多样性和复杂性。GOT-OCR 2.0 不仅支持场景文本识别，还能处理多页文档，为 OCR 领域带来更多灵活性。

今天分享的就是GOT-OCR的GUI版本，支持的场景比如文本、文档、乐谱、图表、数学公式等内容识别。项目地址：https://github.com/XJF2332/GOT-OCR-2-GUI

有了这个软件，大家不用再去苦苦寻找免费的ORC识别软件了，很多软件接口不稳定，随时可能失效。有了这个软件，本地一键运行，无需联网，永久免费。

GOT-OCR-2.0 的特点包括：
[*]通用性强：基于通用 OCR 理论，能够处理场景文本和复杂文档结构，如表格、公式等。
[*]端到端模型：统一的端到端架构简化了整个 OCR 流程，从图像输入到文本输出一体化。
[*]高效性能：集成了 Flash-Attention 技术，提升了识别速度和性能。
[*]多平台支持：支持 CUDA 加速，并与 GOT-OCR2.0 平台集成，可加载预训练模型。
[*]应用广泛：适用于多页文档、场景文本等广泛的应用场景。

使用教程：

这里说下几种模式的解释
OCR 模式

[*]ocr: 标准OCR
[*]format: 带格式的OCR

fine-grained 模式

[*]fine-grained-ocr: 在特定框内进行OCR内容识别
[*]fine-grained-format: 在特定框内进行OCR内容及格式识别
[*]fine-grained-color-ocr: 在特定颜色的框内进行OCR内容识别（我还没尝试过，但看起来你需要先画一个红/绿/蓝框，然后在GUI中选择颜色）
[*]fine-grained-color-format: 在特定颜色的框内进行OCR内容及格式识别

multi-crop 模式

[*]适用于更复杂的图像

render 模式

[*]已存在的文件将被覆盖！！！点击按钮前请检查文件路径！！！
[*]渲染OCR内容并将其保存为HTML文件
[*]将保存为UTF8编码和GB2312编码文件
[*]你可以将HTML转换为PDF

下载地址：
夸克网盘：
https://pan.quark.cn/s/5b4576f57a85
百度网盘：
**** 本内容需购买 ****

yipoo 发表于 2024-10-18 13:43:07

楼主辛苦了！谢谢分享！

ffgyooo 发表于 2024-10-19 00:26:20

这个不错，适合整合起来用

479135884 发表于 2024-10-19 08:57:42

楼主辛苦了！谢谢分享！

chenzimu 发表于 2024-10-22 00:55:07

谢谢分享

szk820628 发表于 2024-11-8 09:02:07

希望我也会攒够钱

howe168 发表于 2024-11-28 08:11:52

希望我也会攒够钱

tyy2025 发表于 2024-12-6 21:56:08

大神这个有没有不需要gpu的版本呢？

hongyunfei 发表于 2025-10-21 08:11:54

楼主辛苦了！谢谢分享！

hongyunfei 发表于 2025-10-21 10:58:30

只有AMD的显卡，看来是用不上了

页: [1]

前沿AI软件资源站's Archiver

GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别 图片文字识别 本地一键整合包下载

GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别图片文字识别本地一键整合包下载