当前位置:首页 > 元宇宙 > AI

月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

来源: 责编: 时间:2025-06-24 09:33:26 157观看
导读 6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent

6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。8Vj28资讯网——每日最新资讯28at.com

8Vj28资讯网——每日最新资讯28at.com

Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。其后,月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。8Vj28资讯网——每日最新资讯28at.com

对于每一个问题,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果:8Vj28资讯网——每日最新资讯28at.com

澄清问题(clarification):理解问题时主动反问,构建更清晰的问题空间;8Vj28资讯网——每日最新资讯28at.com

深入思考:每个任务平均进行 23 步推理,自主梳理并解决需求;8Vj28资讯网——每日最新资讯28at.com

主动搜索:每个任务,平均规划 74 个关键词,找到 206 个网址,由模型判断并筛选出信息质量最高的前 3.2% 内容,剔除冗余、低质信息;8Vj28资讯网——每日最新资讯28at.com

调用工具,交付结果:自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。8Vj28资讯网——每日最新资讯28at.com

为了保证输出的质量和信息覆盖度,Kimi-Researcher 采用异步执行方式,用更多时间逐步推理、检索和撰写内容。8Vj28资讯网——每日最新资讯28at.com

8Vj28资讯网——每日最新资讯28at.com

用户最终将收到 2 个交付成果。8Vj28资讯网——每日最新资讯28at.com

一份信息详实、可溯源的深度研究报告8Vj28资讯网——每日最新资讯28at.com

报告的平均长度在万字以上;8Vj28资讯网——每日最新资讯28at.com

平均引用约 26 个高质量、可溯源的信源;8Vj28资讯网——每日最新资讯28at.com

所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。8Vj28资讯网——每日最新资讯28at.com

8Vj28资讯网——每日最新资讯28at.com

一个可交互、可分享的动态可视化报告8Vj28资讯网——每日最新资讯28at.com

结构化排版、思维导图,让趋势、异常等重要信息一眼可见;8Vj28资讯网——每日最新资讯28at.com

无需阅读全文,也能迅速把握整体结构与核心结论;8Vj28资讯网——每日最新资讯28at.com

支持在线生成链接并分享,方便展示。8Vj28资讯网——每日最新资讯28at.com

8Vj28资讯网——每日最新资讯28at.com

官方宣布,在专为 AI 设计的高难度 benchmark“人类最后一次考试(Humanity's Last Exam,HLE)”中,Kimi-Researcher 在完全零结构、无流程设计的设置下,得分如下:8Vj28资讯网——每日最新资讯28at.com

Pass@1 准确率:26.9%8Vj28资讯网——每日最新资讯28at.com

Pass@4 准确率:40.17%8Vj28资讯网——每日最新资讯28at.com

这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜中其他模型。8Vj28资讯网——每日最新资讯28at.com

8Vj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13996-0.html月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 杰美特筹划重大资产重组,意在收购英伟达、华为昇腾生态伙伴思腾合力

下一篇: Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

标签:
  • 热门焦点
  • 一份全面清单:Web3行业高薪酬的13种工作

    来源:区块链骑士这可能会让许多人感到震惊,但除了成为开发人员之外,Web3还有其他高薪工作。Web3可能是现代就业市场中跨学科最多的领域,换句话说,它由许多个在不同领域中具有不同
  • 风口已至,多领域平台融入社交元素!

    在众多领域平台中,社交元素都扮演着重要角色,如直播营销带货、线上配对听歌、游戏局内互动等。随着元宇宙时代的来临,社交产品不断升级,社交元素推动流量变现,多平台领域融入社交
  • 25万虚拟er在“元宇宙”追星

    “默叽默叽,我是默默酱,我是在真元宇宙也有头有脸的人。”12月11日晚20:00,虚拟偶像@默默酱的首场个人元宇宙演唱会《以梦为马,抵达繁星》在大有空间APP
  • Niantic与索尼在音频AR领域达成合作;​苹果为Apple Park申请形象化商标

    今日热点:迪士尼任命新高管负责元宇宙业务;iFixit成为Valve Index VR头显和Steam Deck首家零件销售商;Niantic与索尼达成合作,将为AR游戏《Ingress》带来音频体验;V
  • 银保监会:打击以“元宇宙”为名义的违法行为

    今日,银保监会发布《关于防范以“元宇宙”名义进行非法集资的风险提示》,全文如下:近期,一些不法分子蹭热点,以“元宇宙投资项目”“元宇宙链游”等名目吸收资金,涉
  • 摩根大通:元宇宙市场预计每年收入超1万亿美元

    今日《元宇宙新鲜事》有:香港首届元宇宙艺博会将于5月举办;NH-Amundi Asset Management上市其第二支元宇宙ETF;Meta虚拟现实平台Horizon Worlds月活跃用户在三个
  • 本周NFT领域重要资讯回顾

    NFT在苏富比拍卖是一波三折的吗?其实不完全如此,但本周在苏富比拍卖行发生了一系列有趣的事。与此同时,美联社因其最新的NFT销售被推到了风口浪尖,而Opensea正面临
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • Steam 禁止NFT和加密货币原因曝光

    近日,Valve(V社)总裁Gabe Newell接受PC Gamer采访时解释了该平台禁止NFT和加密货币的原因。早在2021年10月18日,PC Gamer就报道Steam推出的新规:使用区块链或允许交
Top