当前位置:首页 > 元宇宙 > AI

月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

来源: 责编: 时间:2025-06-24 09:33:26 185观看
导读 6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent

6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。cfr28资讯网——每日最新资讯28at.com

cfr28资讯网——每日最新资讯28at.com

Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。其后,月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。cfr28资讯网——每日最新资讯28at.com

对于每一个问题,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果:cfr28资讯网——每日最新资讯28at.com

澄清问题(clarification):理解问题时主动反问,构建更清晰的问题空间;cfr28资讯网——每日最新资讯28at.com

深入思考:每个任务平均进行 23 步推理,自主梳理并解决需求;cfr28资讯网——每日最新资讯28at.com

主动搜索:每个任务,平均规划 74 个关键词,找到 206 个网址,由模型判断并筛选出信息质量最高的前 3.2% 内容,剔除冗余、低质信息;cfr28资讯网——每日最新资讯28at.com

调用工具,交付结果:自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。cfr28资讯网——每日最新资讯28at.com

为了保证输出的质量和信息覆盖度,Kimi-Researcher 采用异步执行方式,用更多时间逐步推理、检索和撰写内容。cfr28资讯网——每日最新资讯28at.com

cfr28资讯网——每日最新资讯28at.com

用户最终将收到 2 个交付成果。cfr28资讯网——每日最新资讯28at.com

一份信息详实、可溯源的深度研究报告cfr28资讯网——每日最新资讯28at.com

报告的平均长度在万字以上;cfr28资讯网——每日最新资讯28at.com

平均引用约 26 个高质量、可溯源的信源;cfr28资讯网——每日最新资讯28at.com

所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。cfr28资讯网——每日最新资讯28at.com

cfr28资讯网——每日最新资讯28at.com

一个可交互、可分享的动态可视化报告cfr28资讯网——每日最新资讯28at.com

结构化排版、思维导图,让趋势、异常等重要信息一眼可见;cfr28资讯网——每日最新资讯28at.com

无需阅读全文,也能迅速把握整体结构与核心结论;cfr28资讯网——每日最新资讯28at.com

支持在线生成链接并分享,方便展示。cfr28资讯网——每日最新资讯28at.com

cfr28资讯网——每日最新资讯28at.com

官方宣布,在专为 AI 设计的高难度 benchmark“人类最后一次考试(Humanity's Last Exam,HLE)”中,Kimi-Researcher 在完全零结构、无流程设计的设置下,得分如下:cfr28资讯网——每日最新资讯28at.com

Pass@1 准确率:26.9%cfr28资讯网——每日最新资讯28at.com

Pass@4 准确率:40.17%cfr28资讯网——每日最新资讯28at.com

这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜中其他模型。cfr28资讯网——每日最新资讯28at.com

cfr28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13996-0.html月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 杰美特筹划重大资产重组,意在收购英伟达、华为昇腾生态伙伴思腾合力

下一篇: Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

标签:
  • 热门焦点
  • AI界地震!美国对OpenAI展开调查!监管风暴来袭!

    来源:清元宇宙还记得5月OpenAI在国会山听证会上的自信、坦诚、游刃有余的问答吗?那时的Sam Altman可谓意气风发,在耐心、友好的国会议员面前,就AI立法、大模型安全性问题侃侃而
  • 《从营销AIGC化到AIGC营销化》报告发布

    来源:清元宇宙7月2日上午,清华大学元宇宙文化实验室举办元宇宙在线沙龙“AIGC热潮与应用”。会议中,清华大学新闻与传播学院教授、元宇宙文化实验室主任、新媒体研究
  • 10亿基金,李彦宏呼唤下一个AI独角兽

    ©️深响原创 · 作者|何文 AI太热了。 在海外,OpenAI估值已超270亿美元、英伟达市值破万亿、微软把GPT整合进了全线产品。在国内,百度、阿里、华为、商汤等大公司,以及
  • 企业热、用户冷,元宇宙第一站将是“营销场”?

    如果说2021年底什么最火热,那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语,在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日,有消息传
  • 字节觅《原神》,腾讯元宇宙,游戏新王战旧神?

    文 | 陈桥辉陈奕迅的《红玫瑰》中有一句歌词,“得不到的永远在骚动”,这句话用到如今国内头部游戏平台再合适不过。随着《原神》的异军突起,使得头部游戏大厂感受
  • 重温 1602 年:DAO 是新的企业范式吗?

    作者:Andrew Singer“ 将你的选票委托给行业有能力的专家,将使所有者在这些公司的管理中拥有更强大、更清晰的话语权 。”1602 年,荷兰东印度公司成立,许多人认为
  • 解决NFT流动性问题:一文了解Floor DAO

    流动性是证券市场上的一个术语,流动性是指资产在不影响其市场价格的情况下可以转换为现成现金的效率,流动性最强的资产是现金本身。现在让我们试着从流动性的角
  • 对讽刺无动于衷,Nori将碳市场放在区块链上

    当我们聊气候问题的解决方案时,以太坊区块链应该不是最首想到的,但这正是Nori所选择的方案,它建立了一个引擎,鼓励农民使用负碳耕作方法,将空气中的碳抽出并放回地
  • 元宇宙存在的意义和价值

    科技公司目前都在犹豫,看谁能在元宇宙上押下更大的赌注。然而,除了巨额的资金投入,到底要怎样才能获胜在很大程度上还没有得到证实。它是否仅仅是对当前数字景观
Top