欢迎访问速发财讯!

金山办公联合华科发布多模态模型MonkeyOCR v1.5 登顶OCR综合性能榜首

智能科技 2025-11-27 erej8986

11月25日下午,金山办公举办AI协同办公大会,旗下WPS 365不仅对智能文档库AI Docs、数字员工两大AI核心产品进行焕新升级,更推出AI中台、团队空间等新产品。与此同时,金山办公联合华科发布的MonkeyOCR v1.5在全球权威文档解析评测榜单OmniDocBench V1.5中拿下93.01分的成绩,获得综合性能全球第一。

MonkeyOCR v1.5再次突破多模态文档解析性能上限

经过多年技术积累,WPS 365的自研算法已具备国内领先的文档解析能力,能够精准识别PDF文档中的图片、表格等信息,大幅提升问答精度。特别是在表格解析方面,该算法的表格结构还原的准确率高达95%,显著领先于业界水平。

在上述国际权威测评榜单中,金山办公与华中科技大学联合发布多模态文档解析模型 MonkeyOCR v1.5在通用文档解析能力上全面超越 PaddleOCR-VL、MinerU2.5、DeepseekOCR 等主流方案,复杂表格解析准确率首次突破90%,标志着我国智能文档处理技术迈入新阶段。

“90%的复杂表格解析率不是终点,而是行业标准的新起点。” 金山办公AI研发总监刘强表示,该模型已实现文本、表格、公式、图像的全类型解析,输出格式支持 Markdown、HTML、Json文本等多种形态,可直接对接企业OA系统与科研工具。在实际应用中,高校科研人员借助其批量解析论文,将20篇文献的数据整理时间从2天压缩至5分钟。

作为协同办公的核心支撑技术,文档解析长期面临复杂表格识别、跨页结构重建、嵌入式图像干扰等行业痛点。传统OCR系统在处理多层嵌套表格、跨页单元格时精度不足,而端到端模型又存在效率瓶颈。MonkeyOCR v1.5通过创新的两阶段架构以及针对嵌入图像、跨页表格的专用模块,成功破解这一难题。

金山词霸VS国内外产品

此外,翻译能力在协同办公中是打破语言壁垒、保障协作效率的关键支撑,直接影响信息传递与团队配合质量。金山办公在“图片翻译”方面迎来新的突破。例如,当用户在金山词霸中使用“拍照翻译”功能,无论是手写文稿、印刷文件,还是异形排版文件,小词都能够快速扫描识别,并精准翻译。

据悉,“图片翻译”功能将在金山办公的各类产品中陆续上线,其底层技术依托于金山办公自主研发的翻译模型。该模型在中英翻译质量方面超越了国内外的头部产品,处于领先地位。此外,金山办公已将翻译模型接入到WPS 365产品中,借助“国际化”战略,金山办公正着力将服务中国组织级用户的产品及定制化能力推向全球市场。

The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。
上一篇: 拼多多百亿补贴!七波辉男童篮球鞋特惠

下一篇: 没有了

Copyright © 2099 速发财讯 版权所有

苏ICP备2023036119号-2 |——:合作/投稿联系微信:nvshen2168

|—— TXT地图 | 网站地图 |