当前位置:首页 > 科技  > 资讯

金山办公联合华科发布多模态模型MonkeyOCR v1.5 登顶OCR综合性能榜首

来源: 责编: 时间:2025-11-28 11:54:55 95观看
导读11月25日下午,金山办公举办AI协同办公大会,旗下WPS 365不仅对智能文档库AI Docs、数字员工两大AI核心产品进行焕新升级,更推出AI中台、团队空间等新产品。与此同时,金山办公联合华科发布的MonkeyOCR v1.5在全球权威文档解

11月25日下午,金山办公举办AI协同办公大会,旗下WPS 365不仅对智能文档库AI Docs、数字员工两大AI核心产品进行焕新升级,更推出AI中台、团队空间等新产品。与此同时,金山办公联合华科发布的MonkeyOCR v1.5在全球权威文档解析评测榜单OmniDocBench V1.5中拿下93.01分的成绩,获得综合性能全球第一。GbH28资讯网——每日最新资讯28at.com

GbH28资讯网——每日最新资讯28at.com

MonkeyOCR v1.5再次突破多模态文档解析性能上限GbH28资讯网——每日最新资讯28at.com

经过多年技术积累,WPS 365的自研算法已具备国内领先的文档解析能力,能够精准识别PDF文档中的图片、表格等信息,大幅提升问答精度。特别是在表格解析方面,该算法的表格结构还原的准确率高达95%,显著领先于业界水平。GbH28资讯网——每日最新资讯28at.com

在上述国际权威测评榜单中,金山办公与华中科技大学联合发布多模态文档解析模型 MonkeyOCR v1.5在通用文档解析能力上全面超越 PaddleOCR-VL、MinerU2.5、DeepseekOCR 等主流方案,复杂表格解析准确率首次突破90%,标志着我国智能文档处理技术迈入新阶段。GbH28资讯网——每日最新资讯28at.com

“90%的复杂表格解析率不是终点,而是行业标准的新起点。” 金山办公AI研发总监刘强表示,该模型已实现文本、表格、公式、图像的全类型解析,输出格式支持 Markdown、HTML、Json文本等多种形态,可直接对接企业OA系统与科研工具。在实际应用中,高校科研人员借助其批量解析论文,将20篇文献的数据整理时间从2天压缩至5分钟。GbH28资讯网——每日最新资讯28at.com

作为协同办公的核心支撑技术,文档解析长期面临复杂表格识别、跨页结构重建、嵌入式图像干扰等行业痛点。传统OCR系统在处理多层嵌套表格、跨页单元格时精度不足,而端到端模型又存在效率瓶颈。MonkeyOCR v1.5通过创新的两阶段架构以及针对嵌入图像、跨页表格的专用模块,成功破解这一难题。GbH28资讯网——每日最新资讯28at.com

GbH28资讯网——每日最新资讯28at.com

金山词霸VS国内外产品GbH28资讯网——每日最新资讯28at.com

此外,翻译能力在协同办公中是打破语言壁垒、保障协作效率的关键支撑,直接影响信息传递与团队配合质量。金山办公在“图片翻译”方面迎来新的突破。例如,当用户在金山词霸中使用“拍照翻译”功能,无论是手写文稿、印刷文件,还是异形排版文件,小词都能够快速扫描识别,并精准翻译。GbH28资讯网——每日最新资讯28at.com

据悉,“图片翻译”功能将在金山办公的各类产品中陆续上线,其底层技术依托于金山办公自主研发的翻译模型。该模型在中英翻译质量方面超越了国内外的头部产品,处于领先地位。此外,金山办公已将翻译模型接入到WPS 365产品中,借助“国际化”战略,金山办公正着力将服务中国组织级用户的产品及定制化能力推向全球市场。GbH28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-190369-0.html金山办公联合华科发布多模态模型MonkeyOCR v1.5 登顶OCR综合性能榜首

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: realme UI 7.0正式版发布:AI全面进化,真我GT8系列首发搭载

下一篇: 阿里吴嘉首谈千问:AI助手比拼的是智力水平

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 6月iOS设备性能榜:M2稳居榜首 A系列只能等一手3nm来救

    没有新品发布,自然iOS设备性能榜的上榜设备就没有什么更替,仅仅只有跑分变化而产生的排名变动,毕竟苹果新品的发布节奏就是这样的,一年下来也就几个移动端新品,不会像安卓厂商,一
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 只需五步,使用start.spring.io快速入门Spring编程

    步骤1打开https://start.spring.io/,按照屏幕截图中的内容创建项目,添加 Spring Web 依赖项,并单击“生成”按钮下载 .zip 文件,为下一步做准备。请在进入步骤2之前进行解压。图
  • 2023年,我眼中的字节跳动

    此时此刻(2023年7月),字节跳动从未上市,也从未公布过任何官方的上市计划;但是这并不妨碍它成为中国最受关注的互联网公司之一。从2016-17年的抖音强势崛起,到2018年的“头腾
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 三星Galaxy Z Fold5今日亮相:厚度缩减但仍略显厚重

    据官方此前宣布,三星将于7月26日也就是今天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
  • 质感不错!OPPO K11渲染图曝光:旗舰IMX890传感器首次下放

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
Top