当前位置:首页 > 元宇宙 > AI

微软正努力治疗 AI 幻觉,以技术手段实时屏蔽和重写毫无根据的信息

来源: 责编: 时间:2024-06-24 17:11:34 261观看
导读 6 月 21 日消息,就在 GPT-4 因征服标准化测试而登上头条时,微软研究人员正在对其他 AI 模型进行一种非常另类的测试 —— 一种旨在让模型捏造信息的测试。为了治好这种被称为“AI 幻觉”的症状,他们设定了一个会

6 月 21 日消息,就在 GPT-4 因征服标准化测试而登上头条时,微软研究人员正在对其他 AI 模型进行一种非常另类的测试 —— 一种旨在让模型捏造信息的测试。8S028资讯网——每日最新资讯28at.com

为了治好这种被称为“AI 幻觉”的症状,他们设定了一个会让大多数人头疼的文本检索任务,然后跟踪并改进模型响应,这也是微软在测定、检测和缓解 AI 幻觉方面的一个例子。8S028资讯网——每日最新资讯28at.com

8S028资讯网——每日最新资讯28at.com

微软 AI 负责项目的首席产品官 Sarah Bird 表示,“微软希望其所有 AI 系统都是值得信赖且可以有效使用的”。8S028资讯网——每日最新资讯28at.com

我们可以向这个领域投入许多专家和资源,因此我们认为自己可以帮助阐明“应该如何负责任地使用新型 AI 技术”的方法,并使其他人也能够做到这一点。8S028资讯网——每日最新资讯28at.com

从技术角度来讲,AI 幻觉是一种“缺乏事实依据”的内容,这意味着 AI 模型改变了它所给定的数据或添油加醋描述了原本不存在的信息。8S028资讯网——每日最新资讯28at.com

当然,AI 幻觉这种东西也不是所有时候都毫无用处,例如当用户希望 AI 帮自己写一个科幻故事,或给出一种非传统想法时,就属于是有益的;但在大多数需要 AI 的场景,诸如医学和教育等场景就显得多余了,因为准确性大于一切。8S028资讯网——每日最新资讯28at.com

因此,微软也在努力根据其自有 AI 产品(例如 Copilot)来试图攻克 AI 幻觉,研究一系列工具来帮助机器解决幻觉问题。8S028资讯网——每日最新资讯28at.com

微软表示,其工程师花了数月时间,通过检索增强生成技术(一种无需重新训练模型即可向模型添加额外知识的技术)将必应搜索数据作为 Copilot 的依据,通过必应的答案、索引和排名数据帮助 Copilot 提供更准确、更相关的回复,同时提供引用信息,让用户可以自行查找和验证。8S028资讯网——每日最新资讯28at.com

“该模型非常擅长推理信息,但我们不认为它应该成为答案的来源,”Bird 说,“我们认为数据应该是答案的来源,因此我们解决这个问题的第一步是向模型提供最新、高质量且准确的数据。”8S028资讯网——每日最新资讯28at.com

除此之外,微软还试图通过各种工具帮助客户做到这一点,例如 Azure OpenAI 服务中的“Your Data”功能可帮助企业组织用自己的数据来训练生成式 AI。8S028资讯网——每日最新资讯28at.com

值得一提的是,微软还推出了一种实时工具,可以大规模检测应用中依据企业数据的可靠程度。微软表示,AzureAI Studio可以根据来源文档评估响应的可靠程度。8S028资讯网——每日最新资讯28at.com

据介绍,微软还正在开发一种新的针对措施,可以实时屏蔽和纠正“毫无根据”的信息。当检测到事实依据错误时,该功能将根据数据自动进行重写。8S028资讯网——每日最新资讯28at.com

微软 AI负责项目的首席产品经理 Ken Archer 表示,“处于生成式 AI 的前沿意味着我们有责任和机会让自己的产品更安全、更可靠,并让客户也能放心使用我们的工具”。8S028资讯网——每日最新资讯28at.com

参考资料:8S028资讯网——每日最新资讯28at.com

《Why AI sometimes gets it wrong — and big strides to address it》8S028资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4746-0.html微软正努力治疗 AI 幻觉,以技术手段实时屏蔽和重写毫无根据的信息

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI 首席技术官:GPT-5 将在一年半后发布,部分领域智能达到“博士”级别

下一篇: 乐聚夸父人形机器人亮相 HDC 2024,搭载华为云盘古具身智能大模型

标签:
  • 热门焦点
  • 清华、北大等86所高校布局元宇宙,是风口还是噱头?

    作者:徐赐豪来源:区块链日报据全国高校人工智能与大数据创新联盟元宇宙专委会不完全统计,截至2023年7月,全国共有86所高校战略布局元宇宙领域,其中本科院校73所,高职专科院校13所
  • 完美世界被元宇宙“拒之门外”

    春节期间,游戏是消磨时间最好的方式,完美世界的《幻塔》作为选择的首要目标,倒不是因为它的吸引力有多大,纯粹是广大网友的吐槽。继《原神》之后,进击元宇宙的游戏
  • 智能人机交互技术的春晚大考

    1月初的一个早晨,京东智能客户服务产品部紧急开会,进行关于尚未对外公布的“X项目”的初讨论。1月5日,这个神秘的X项目对外公布,京东成为央视2022年春晚独家互动合
  • 《刀剑神域》VR展开幕;《Puzzling Places》发布第二个付费DLC

    今日热点:《刀剑神域:Ex-Chronicle Online Edition》VR展开幕;虚拟活动平台EventX再获800万美元B轮融资;VR射击游戏《Outlier》确认将于3月17日登陆Steam平台等。
  • 国内涌现70余家数字藏品平台:合规、流量与利润在博弈

    作者:杨郑君2月16日,迅雷链企业数字藏品服务平台正式上线,继阿里、腾讯、京东、百度、网易等之后,又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
  • 这个好莱坞影视制作公司涉足NFT,让持有者在制作中发挥作用

    前米高梅首席执行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一个新的好莱坞工作室,提供 NFT,让持有者在制作中发挥作用Electromagnetic Productions 创始
  • 艺术创作者能否永久收取版税?

    NFTs正在改变我们理解互联网所有权的方式,社区管理的所有权有很多好处,但如果创作者想为他/她的创作获得永久的收益(版税),会发生什么?这不是一个容易解决的问题,版税
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top