当前位置:首页 > 元宇宙 > AI

如何应对 AI“一本正经的胡说八道”?研究人员希望它会承认“我不知道”

来源: 责编: 时间:2025-02-14 12:03:50 158观看
导读 2 月 13 日消息,《华尔街日报》当地时间 11 日发布文章,探讨了当前“AI 幻觉”的现象和潜在解法。该报记者 Ben Fritz 向多款全球最先进的 AI 聊天机器人询问“自己的配偶是谁”,得到的答案却令本人匪夷所思:一位

2 月 13 日消息,《华尔街日报》当地时间 11 日发布文章,探讨了当前“AI 幻觉”的现象和潜在解法。该报记者 Ben Fritz 向多款全球最先进的 AI 聊天机器人询问“自己的配偶是谁”,得到的答案却令本人匪夷所思:一位自己并不认识的作家、一名来自爱荷华州的陌生女性,还有一名网球运动博主。NwD28资讯网——每日最新资讯28at.com

根据报道,尽管 AI 在解决复杂数学问题和模拟人类交流方面表现出色,但在基本事实上却常常出错。它们会捏造法律案件,混淆电影和书籍的情节,甚至“凭空”编造配偶。NwD28资讯网——每日最新资讯28at.com

NwD28资讯网——每日最新资讯28at.com

图源 Pixabay

注:上述错误往往被称作“幻觉”,因为 ChatGPT、Gemini 等 AI 即使在生成错误答案时也会表现得极其自信。NwD28资讯网——每日最新资讯28at.com

曾在 IBM、微软实习的德国 Hasso Plattner 研究所博士生 Roi Cohen 表示,这是当前 AI 研究最热门的方向之一。NwD28资讯网——每日最新资讯28at.com

AI 的工作原理是预测答案中最可能出现的下一个单词。从本质上看,这一过程更像是一种高级猜测。AI 往往会以坚定的语气给出最可能正确的答案,而不会表现出任何不确定性,这就像学生在多项选择题考试中作答,或是社交场合中随口应对问题的人一样。NwD28资讯网——每日最新资讯28at.com

西班牙瓦伦西亚人工智能研究所的教授 José Hernández-Orallo 解释道,“AI 之所以会产生幻觉,根本原因在于,如果它什么都不猜,就完全不可能答对。”NwD28资讯网——每日最新资讯28at.com

为了解决这个问题,研究人员正尝试“检索增强生成”(retrieval augmented generation)技术,让 AI 在回答问题时先从互联网或文档库中查找最新信息,而不是完全依赖已有的训练数据。NwD28资讯网——每日最新资讯28at.com

在去年 12 月的 NeurIPS AI 研究会议上,Cohen 和同校博士生 Konstantin Dobler 提出了一个简单但富有新意的想法:让 AI 也学会承认“我不知道”。NwD28资讯网——每日最新资讯28at.com

报道指出,当前 AI 的训练数据几乎不包含“我不知道”这样的表述,因此它们天生不会谦逊。Cohen 和 Dobler 通过调整 AI 训练过程,使其在可能出错时,至少一部分情况下会选择回答“我不知道”,从而提高整体准确性。NwD28资讯网——每日最新资讯28at.com

不过,如何平衡这一策略仍是个难题。有时候,AI 说“我不知道”,但其实答案就在它的训练数据里。NwD28资讯网——每日最新资讯28at.com

即便如此,对于那些依赖 AI 提供精准信息的领域,适当的“谦虚”可能更有价值。“关键是让 AI 具备实用性,而不是一味追求智能。”Dobler 说道。NwD28资讯网——每日最新资讯28at.com

虽然 AI 变得越来越强大,但美国公众对其的信任感却在下降。皮尤研究中心数据显示,2023 年 52% 的美国人对 AI 感到担忧,而 2021 年这一比例仅为 37%。NwD28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-10737-0.html如何应对 AI“一本正经的胡说八道”?研究人员希望它会承认“我不知道”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 无限延伸你的创意:Adobe Firefly 开放 AI 视频生成,一键搞定 5 秒 1080P 视频

下一篇: 号称“业界首个对知识产权友好、商用安全”的 LLM,Adobe Firefly 文生视频 AI 模型发布

标签:
  • 热门焦点
  • 10亿基金,李彦宏呼唤下一个AI独角兽

    ©️深响原创 · 作者|何文 AI太热了。 在海外,OpenAI估值已超270亿美元、英伟达市值破万亿、微软把GPT整合进了全线产品。在国内,百度、阿里、华为、商汤等大公司,以及
  • 文心一言排名垫底,却成为百度业绩增长杠杆

    文/侯煜编辑/罗卿知识增强大预言模式文心一言发布后,百度公司热度大幅提升,文心一言到底能为百度的业绩带来多大的增益成为业内关注焦点。近日,百度(NASDAQ:BIDU/09888.HK)公布了
  • 纽约街头出现NFT自动贩卖机

    一家初创公司宣布在纽约市开放一台NFT自动售货机,允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon,上个月完成了一轮300万美元的种子募捐
  • 头顶光环无数却估值极低,以太坊这位&——quot;最强杀手&——quot;有望涅槃重生?

    作者:五火球教主提起Dfinity(ICP),你的第一感觉可能与我一样,这是一个让人十分纠结的项目。之所以纠结,一方面他的团队阵容强大,各种来自前英特尔、IBM、coinbase、fa
  • NFT艺术家Hayley Rincon 专访:我的迷幻数字艺术之路

    Hayley Rincon是一位令人印象深刻才华横溢的创作者,她的作品呈现出迷幻的气息。今天就来聊聊她的艺术作品,和她自己的数字艺术之路。Hayley是加利福尼亚湾区的有
  • Web 3如何改变传统HR

    互联网自诞生以来,经历了三次迭代。Web1是第一阶段,包括ISP服务器上的个人网页或免费的虚拟主机服务。然后Web2出现了,它引入了动态的用户生成内容、互操作性、增
  • 王老吉启动元宇宙“吉空间”,HTC发布元宇宙应用VIVERSE

    今日《元宇宙新鲜事》有:王老吉启动元宇宙“吉空间”;HTC发布元宇宙应用VIVERSE;Meta将在马德里构建一个元宇宙创新中心;央视网《新闻+》推出系列视频《聊聊元宇宙
  • GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+Defi(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
  • 3月份值得关注的5个NFT项目

    2021年,我们见证了一个新的创造者经济的诞生。它是在区块链上诞生的。自从NFT成为流行文化的中心舞台以来,有些艺术家们已经成为了NFT的超级明星,在几个月的时间
Top