当前位置:首页 > 元宇宙 > AI

百度发布新一代文字识别 AI 模型 PP-OCRv5:仅 0.07B,部分测试超 GPT-4o

来源: 责编: 时间:2025-09-16 16:49:04 44观看
导读 IT 之家 9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。百度介绍称,PP-OCRv5 是一个为缓解大型视觉语言模型(VLMs)局限性而设计的专用 OCR 模型,它提供了一种高效、准确

IT 之家 9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。q2K28资讯网——每日最新资讯28at.com

百度介绍称,PP-OCRv5 是一个为缓解大型视觉语言模型(VLMs)局限性而设计的专用 OCR 模型,它提供了一种高效、准确且轻量级的解决方案。q2K28资讯网——每日最新资讯28at.com

PP-OCRv5 通过保持模块化、两阶段的流程,专门针对高速、精确的文本检测和识别,解决了大型 VLMs 的精确文本定位和边界框精度局限性问题。q2K28资讯网——每日最新资讯28at.com

PP-OCRv5 的亮点如下:q2K28资讯网——每日最新资讯28at.com

效率:该模型参数量仅为 0.07B,能够在 CPU 和边缘设备上实现更高性能,其移动版本在英特尔 Xeon Gold 6271C CPU 上每秒可处理超过 370 个字符。q2K28资讯网——每日最新资讯28at.com

性能:PP-OCRv5 在 OCR 特定基准测试中优于通用型 VLM 模型,如 Gemini 2.5 Pro、Qwen2.5-VL 和 GPT-4o,包括手写和印刷的中英文以及拼音文本。q2K28资讯网——每日最新资讯28at.com

定位:PP-OCRv5 旨在提供精确的文本行边界框坐标,这对于结构化数据提取和内容分析是关键要求。q2K28资讯网——每日最新资讯28at.com

多语言支持:该模型支持五种文字类型 —— 简体中文、繁体中文、英文、日文和拼音,并能识别超过 40 种语言。q2K28资讯网——每日最新资讯28at.com

q2K28资讯网——每日最新资讯28at.com

PP-OCRv5 由四个核心组件构成:q2K28资讯网——每日最新资讯28at.com

图像预处理:处理图像的旋转和畸变,以标准化输入。q2K28资讯网——每日最新资讯28at.com

文本检测:识别图像中文本行的精确位置。q2K28资讯网——每日最新资讯28at.com

文本行方向:分类检测到的文本方向,以确保其正确对齐以进行识别。q2K28资讯网——每日最新资讯28at.com

文本识别:将每行文本中的字符解码为文本字符串。q2K28资讯网——每日最新资讯28at.com

q2K28资讯网——每日最新资讯28at.com

IT 之家附 PP-OCRv5 下载地址如下:q2K28资讯网——每日最新资讯28at.com

https://huggingface.co/collections/PaddlePaddle/pp-ocrv5-684a5356aef5b4b1d7b85e4bq2K28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-27580-0.html百度发布新一代文字识别 AI 模型 PP-OCRv5:仅 0.07B,部分测试超 GPT-4o

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 北京:1400 多所中小学已开设人工智能通识课,每学年不少于 8 个课时

下一篇: OpenAI 奥尔特曼称 AI 给自己带来重压:ChatGPT 上线后就没睡过一个好觉

标签:
  • 热门焦点
  • 在元宇宙卖酸奶,这波联动燃爆了!

    来源:品牌头版 或许,每个人心中都住着一个小馋孩。可能是童年时百吃不厌,觉得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;还有可能,是某种不知为什么,就是很爱吃的
  • VR/AR迷失元宇宙“硝烟”

    不温不火的VR/AR可穿戴设备因元宇宙崛起火了一阵,又随着元宇宙回归平静。1月份,微软在 Surface 设备、HoloLens 混合现实硬件和 Xbox 等部门裁员,其中负责混合现实硬件(MR)的Holo
  • 汽车元宇宙,是概念还是未来?

    作者|何文 元宇宙是未来趋势已经无需验证。 从概念上来看,元宇宙是两种存在多年的概念的融合:虚拟现实和数字第二人生。这也就意味着,元宇宙所代表的是一种新的数
  • “虚拟人”角斗场,基于“硬实力”下的人性平衡法则?

    在打工人“反内卷”的当下,一众虚拟人却“内卷”了起来。从北京春晚虚拟人苏小妹与刘宇演绎歌舞《星河入梦》,央美毕业的虚拟人夏语冰登上央视节目《对话》,湖南
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • NFT也有黄牛?这家公司专门对付外挂作弊机器人

    澳大利亚前总理马尔科姆·特恩布尔 (Malcolm Turnbull) 是支持萨姆·Crowther (Sam Crowther) 的人之一,Sam是一名出生于纽卡斯尔的黑客,他的职业生涯始于为国防
  • 想进入web3.0?来看看哪些工作适合你

    随着对加密货币需求的增加,加密领域的工作的数量也在增加。以下是一些非技术性加密货币工作简介。加密货币在主流市场获得的可信度提升。导致区块链领域的求职
  • Meta 呼吁行业合作建立元宇宙网络基础设施

    Facebook 的母公司 Meta呼吁,建立必要的全球合作的基础设施,以支持其蓬勃发展的元宇宙野心。“元宇宙”成为 2021 年的主要流行语之一,这在很大程度上是由 Facebo
  • NFT高玩必备:NFT分析工具大盘点

    NFT市场的火热让越来越多的投资者投身其中,但当前的 NFT 生态系统存在几个问题却困扰了大多数人,如难以准确评估 NFT 项目的资产价格、缺乏 NFT 市场动态信息、
Top