当前位置:首页 > 元宇宙 > AI

月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

来源: 责编: 时间:2025-06-24 09:33:26 146观看
导读 6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent

6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。O2e28资讯网——每日最新资讯28at.com

O2e28资讯网——每日最新资讯28at.com

Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。其后,月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。O2e28资讯网——每日最新资讯28at.com

对于每一个问题,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果:O2e28资讯网——每日最新资讯28at.com

澄清问题(clarification):理解问题时主动反问,构建更清晰的问题空间;O2e28资讯网——每日最新资讯28at.com

深入思考:每个任务平均进行 23 步推理,自主梳理并解决需求;O2e28资讯网——每日最新资讯28at.com

主动搜索:每个任务,平均规划 74 个关键词,找到 206 个网址,由模型判断并筛选出信息质量最高的前 3.2% 内容,剔除冗余、低质信息;O2e28资讯网——每日最新资讯28at.com

调用工具,交付结果:自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。O2e28资讯网——每日最新资讯28at.com

为了保证输出的质量和信息覆盖度,Kimi-Researcher 采用异步执行方式,用更多时间逐步推理、检索和撰写内容。O2e28资讯网——每日最新资讯28at.com

O2e28资讯网——每日最新资讯28at.com

用户最终将收到 2 个交付成果。O2e28资讯网——每日最新资讯28at.com

一份信息详实、可溯源的深度研究报告O2e28资讯网——每日最新资讯28at.com

报告的平均长度在万字以上;O2e28资讯网——每日最新资讯28at.com

平均引用约 26 个高质量、可溯源的信源;O2e28资讯网——每日最新资讯28at.com

所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。O2e28资讯网——每日最新资讯28at.com

O2e28资讯网——每日最新资讯28at.com

一个可交互、可分享的动态可视化报告O2e28资讯网——每日最新资讯28at.com

结构化排版、思维导图,让趋势、异常等重要信息一眼可见;O2e28资讯网——每日最新资讯28at.com

无需阅读全文,也能迅速把握整体结构与核心结论;O2e28资讯网——每日最新资讯28at.com

支持在线生成链接并分享,方便展示。O2e28资讯网——每日最新资讯28at.com

O2e28资讯网——每日最新资讯28at.com

官方宣布,在专为 AI 设计的高难度 benchmark“人类最后一次考试(Humanity's Last Exam,HLE)”中,Kimi-Researcher 在完全零结构、无流程设计的设置下,得分如下:O2e28资讯网——每日最新资讯28at.com

Pass@1 准确率:26.9%O2e28资讯网——每日最新资讯28at.com

Pass@4 准确率:40.17%O2e28资讯网——每日最新资讯28at.com

这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜中其他模型。O2e28资讯网——每日最新资讯28at.com

O2e28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13996-0.html月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 杰美特筹划重大资产重组,意在收购英伟达、华为昇腾生态伙伴思腾合力

下一篇: Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

标签:
  • 热门焦点
  • 欧盟人工智能法案:四种AI系统风险类型的划分及监管措施

    作者:赵志东 蔡佳雯来源:区块链日报该法案采用风险分级的规制路径,将人工智能系统的风险划分成不可接受的风险、高风险、有限风险和轻微风险四种类型,并针对不同类型施加了不同
  • VR/AR迷失元宇宙“硝烟”

    不温不火的VR/AR可穿戴设备因元宇宙崛起火了一阵,又随着元宇宙回归平静。1月份,微软在 Surface 设备、HoloLens 混合现实硬件和 Xbox 等部门裁员,其中负责混合现实硬件(MR)的Holo
  • 这场虚拟人争夺战,互联网巨头下场先赢一半?

    撰文/ 孟会缘 近两年间,要论引得无数互联网巨头竞折腰的一大热门产业,莫过于元宇宙领域中的数字人了。 作为继数字藏品之后,开发元宇宙的又一重点落地项目,互联网
  • 过去女性在互联网领域是半边天,在Web3,将会是整片天!

    Web 2.0 是由几家“直男”大公司塑造的。接下来的Web3世界中,如果女性在创造性方面发挥更大的作用,可能会让这个新时代更受欢迎、更安全和公平。当我们谈论 Web3
  • 元宇宙画廊体验报告:有点头疼。

    2 月 10 日,Hrishi Rajasekar 在旧金山铸币厂的沉浸式 NFT 展览 Verse 观看增强现实艺术品。“我们现在在虚拟世界中吗?时间好像变长了” 我问身后排队的人。我
  • 艺术创作者能否永久收取版税?

    NFTs正在改变我们理解互联网所有权的方式,社区管理的所有权有很多好处,但如果创作者想为他/她的创作获得永久的收益(版税),会发生什么?这不是一个容易解决的问题,版税
  • 如何在元宇宙中建立品牌忠诚度

    Snoop Dogg、耐克、苏富比和普华永道都有什么共同点?他们都投资于元宇宙的房地产。除了我们在屏幕上看到的二维世界--手机、笔记本电脑、台式机或iPad--他们决
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
  • TX加入的NFT数字收藏品,元宇宙的破圈之路?

    3月7日,澳大利亚 NFT 初创公司 Immutable 在新加坡淡马锡牵头的R资中以估值 25 亿美元完成2亿美元R资,腾讯参投。想必国人最熟知的应该就是TX,作为国内四大互联网
Top