当前位置:首页 > 科技  > 通信

让大模型“看懂”专业文档,OpenDataLab将与钉钉打造企业级解析工具DLU

来源: 责编: 时间:2025-09-05 11:42:33 44观看
导读 阿里云优惠券 先领券再下单高质量数据是AI大模型训练与应用的基础,更是企业向AI转型升级的 “燃料”。然而,众多企业在开发AI应用过程中,却因大模型难以读懂非结构化数据而面临困境。能否让更多企业级用户用

 阿里云优惠券 先领券再下单fzU28资讯网——每日最新资讯28at.com

高质量数据是AI大模型训练与应用的基础,更是企业向AI转型升级的 “燃料”。然而,众多企业在开发AI应用过程中,却因大模型难以读懂非结构化数据而面临困境。fzU28资讯网——每日最新资讯28at.com

能否让更多企业级用户用上一款更趁手的数据工具,从而实现AI-Ready数据自由?fzU28资讯网——每日最新资讯28at.com

近日,OpenDataLab和钉钉正基于MinerU,推出一款面向企业用户的文档解析工具——DLU(Document Language Understanding),共同助力企业破解AI-Ready数据难题,从而降低行业大模型训练及AI应用开发门槛,加速AI技术在各行业的规模化落地。fzU28资讯网——每日最新资讯28at.com

MinerU是上海人工智能实验室(上海AI实验室)OpenDataLab推出的智能文档解析引擎,因精准解析能力及广泛兼容性深受用户青睐,在GitHub上已累计获得超4万星标。fzU28资讯网——每日最新资讯28at.com

fzU28资讯网——每日最新资讯28at.com

上海AI实验室作为国际级人工智能新型科研机构,在大模型、数据智能等方向具备深厚的技术积累。其自主研发的OpenDataLab平台为国内领先的人工智能大模型数据平台,拥有7700余个开源精标数据集,迄今已为超10万用户提供了200余万次数据获取服务。近期更新的MinerU2.0实现了解析速度和精度双提升,甚至以0.98B的参数达成性能比肩72B的主流大模型。fzU28资讯网——每日最新资讯28at.com

作为阿里巴巴集团旗下的企业级智能移动办公平台,钉钉拥有丰富的文档产品和广阔的企业用户基础。钉钉文档、AI表格等产品此前已深度集成MinerU能力,并通过开放平台向生态开发者开放文档解析功能,为DLU的联合研发提供了扎实的技术与场景基础。fzU28资讯网——每日最新资讯28at.com

基于MinerU打造的DLU将于近期开源,其具备良好的文件格式兼容性,深层次的内容理解与精准的结构化输出能力。DLU不仅支持主流的Office文档、PDF、Markdown及代码文件,还涵盖钉钉自有的文档、表格与AI表格格式;并支持提取纯文本内容,精准解析图表、公式、插图乃至专业领域的化学分子式等复杂视觉元素,将其有效转换为适合大模型训练的高质量语料。fzU28资讯网——每日最新资讯28at.com

接下来,DLU还将借助钉钉在企业服务场景上优势,深度融入办公协同生态,支持用户在同一平台内完成从文档创建、解析提取、知识库管理、数据标注到定制化模型训练的全流程闭环,提升AI应用开发与日常办公效率。fzU28资讯网——每日最新资讯28at.com

上海人工智能实验室青年科学家、OpenDataLab/MinerU开源项目创始人何聪辉表示:“MinerU拥有广泛的用户基础,我们希望进一步拓展其在企业场景中的应用,并充分发挥OpenDataLab平台的作用,与合作伙伴共同打造‘数据工具中的PyTorch’,助力更多企业级用户实现AI-Ready数据的自由。”fzU28资讯网——每日最新资讯28at.com

钉钉CTO朱鸿表示:“开源DLU,能有效解决企业在AI时代面临的数据准备难题,筑牢智能化转型根基。钉钉正积极构建AI新生态,期待携手更多技术伙伴与行业力量,共同为千行百业的数字化转型与智能化升级提供强劲支撑”。fzU28资讯网——每日最新资讯28at.com

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!fzU28资讯网——每日最新资讯28at.com

相关标签
钉钉

本文链接:http://www.28at.com/showinfo-20-180688-0.html让大模型“看懂”专业文档,OpenDataLab将与钉钉打造企业级解析工具DLU

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 恺英网络董事长金锋:游戏主业稳健增长,AI创新打造第二曲线

下一篇: 与未来《合鸣》!随幻科技MBOX数字影棚系统助力打造上合组织峰会创意短视频

标签:
  • 热门焦点
  • 7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月份的手机市场风平浪静,除了红魔和努比亚带来了两款搭载骁龙8Gen2领先版处理器的新机之外,别的也想不到有什么新品了,这也正常,通常6月7月都是手机厂商修整的时间,进入8月份之
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • 猿辅导与新东方的两种“归途”

    作者|卓心月 出品|零态LT(ID:LingTai_LT)如何成为一家伟大企业?答案一定是对“势”的把握,这其中最关键的当属对企业战略的制定,且能够站在未来看现在,即使这其中的
  • 小米MIX Fold 3配置细节曝光:搭载领先版骁龙8 Gen2+罕见5倍长焦

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都得到了不少爆料,而小米新一代折叠屏旗舰——小米MIX Fold 3此前也屡屡被传
  • 余承东:AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验

    8月4日消息,2023年华为开发者大会(HDC.Together)今天正式开幕,华为发布HarmonyOS 4、全新升级的鸿蒙开发套件、HarmonyOS Next开发者预览版本等一系列
  • 荣耀Magicbook V 14 2021曙光蓝版本正式开售,拥有触摸屏

    荣耀 Magicbook V 14 2021 曙光蓝版本正式开售,搭载 i7-11390H 处理器与 MX450 显卡,配备 16GB 内存与 512GB SSD,重 1.48kg,厚 14.5mm,具有 1.5mm 键盘键程、
Top