无言以对 发表于 3 天前

FireRed-OCR - 论文/发票/公式/手写笔记一键识别转换 支持50系显卡 一键整合包下载


FireRed-OCR 是小红书智能团队(FireRedTeam)开源的一个超强文档识别工具,专门用来把各种乱七八糟的文档图片,变成结构清晰的 Markdown 文本。它不仅能看懂文字,还能理解文档里的表格、公式、层级结构,并且保证结果格式正确。

简单来说: 你拍一张论文、发票、表格、实验记录、手写笔记……只要丢给它,它就能尽量准确地认出文字、保留表格结构、不搞乱行序、公式也能正确输出 LaTeX 格式,而不是像很多AI那样“大概齐”或胡编乱造。



主要特点

结构特别靠谱:普通OCR容易把表格认成乱码、公式认成文字,它用强化学习强制模型遵守“格式规则”,很少出现行列错位、括号不闭合、公式瞎写的情况。
目前最强之一:在2026年最新的文档理解榜单(OmniDocBench v1.5)上拿了92.94分,把一堆大厂模型(包括几百亿参数的)都甩在后面。
体积小速度快:主力模型只有2B参数(FireRed-OCR-2B),普通显卡就能跑,适合本地部署。
端到端:不用像传统OCR那样先检测框、再识别文字、再拼布局,它一步到位,误差更少。
对“野文档”友好:扫描件、歪斜、排版奇葩、多栏、多公式混杂的复杂文档,它表现特别稳。



应用领域

科研人员快速把PDF论文转成可编辑Markdown
财务/行政把发票、合同、报表批量结构化提取
学生/老师把板书、讲义、手写笔记数字化
企业文档自动化录入、知识库构建
电子病历、法律文书、专利文件等需要严格保留结构的场景




使用教程:(建议N卡,显存4G起,支持50系显卡)

上传需要转换的图像,提交识别



下载地址:
UC网盘:https://drive.uc.cn/s/b6703fa8e6414

夸克网盘:
**** 本内容需购买 ****
页: [1]
查看完整版本: FireRed-OCR - 论文/发票/公式/手写笔记一键识别转换 支持50系显卡 一键整合包下载