当前位置:首页 > 元宇宙 > AI

如何应对 AI“一本正经的胡说八道”?研究人员希望它会承认“我不知道”

来源: 责编: 时间:2025-02-14 12:03:50 191观看
导读 2 月 13 日消息,《华尔街日报》当地时间 11 日发布文章,探讨了当前“AI 幻觉”的现象和潜在解法。该报记者 Ben Fritz 向多款全球最先进的 AI 聊天机器人询问“自己的配偶是谁”,得到的答案却令本人匪夷所思:一位

2 月 13 日消息,《华尔街日报》当地时间 11 日发布文章,探讨了当前“AI 幻觉”的现象和潜在解法。该报记者 Ben Fritz 向多款全球最先进的 AI 聊天机器人询问“自己的配偶是谁”,得到的答案却令本人匪夷所思:一位自己并不认识的作家、一名来自爱荷华州的陌生女性,还有一名网球运动博主。9iA28资讯网——每日最新资讯28at.com

根据报道,尽管 AI 在解决复杂数学问题和模拟人类交流方面表现出色,但在基本事实上却常常出错。它们会捏造法律案件,混淆电影和书籍的情节,甚至“凭空”编造配偶。9iA28资讯网——每日最新资讯28at.com

9iA28资讯网——每日最新资讯28at.com

图源 Pixabay

注:上述错误往往被称作“幻觉”,因为 ChatGPT、Gemini 等 AI 即使在生成错误答案时也会表现得极其自信。9iA28资讯网——每日最新资讯28at.com

曾在 IBM、微软实习的德国 Hasso Plattner 研究所博士生 Roi Cohen 表示,这是当前 AI 研究最热门的方向之一。9iA28资讯网——每日最新资讯28at.com

AI 的工作原理是预测答案中最可能出现的下一个单词。从本质上看,这一过程更像是一种高级猜测。AI 往往会以坚定的语气给出最可能正确的答案,而不会表现出任何不确定性,这就像学生在多项选择题考试中作答,或是社交场合中随口应对问题的人一样。9iA28资讯网——每日最新资讯28at.com

西班牙瓦伦西亚人工智能研究所的教授 José Hernández-Orallo 解释道,“AI 之所以会产生幻觉,根本原因在于,如果它什么都不猜,就完全不可能答对。”9iA28资讯网——每日最新资讯28at.com

为了解决这个问题,研究人员正尝试“检索增强生成”(retrieval augmented generation)技术,让 AI 在回答问题时先从互联网或文档库中查找最新信息,而不是完全依赖已有的训练数据。9iA28资讯网——每日最新资讯28at.com

在去年 12 月的 NeurIPS AI 研究会议上,Cohen 和同校博士生 Konstantin Dobler 提出了一个简单但富有新意的想法:让 AI 也学会承认“我不知道”。9iA28资讯网——每日最新资讯28at.com

报道指出,当前 AI 的训练数据几乎不包含“我不知道”这样的表述,因此它们天生不会谦逊。Cohen 和 Dobler 通过调整 AI 训练过程,使其在可能出错时,至少一部分情况下会选择回答“我不知道”,从而提高整体准确性。9iA28资讯网——每日最新资讯28at.com

不过,如何平衡这一策略仍是个难题。有时候,AI 说“我不知道”,但其实答案就在它的训练数据里。9iA28资讯网——每日最新资讯28at.com

即便如此,对于那些依赖 AI 提供精准信息的领域,适当的“谦虚”可能更有价值。“关键是让 AI 具备实用性,而不是一味追求智能。”Dobler 说道。9iA28资讯网——每日最新资讯28at.com

虽然 AI 变得越来越强大,但美国公众对其的信任感却在下降。皮尤研究中心数据显示,2023 年 52% 的美国人对 AI 感到担忧,而 2021 年这一比例仅为 37%。9iA28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-10737-0.html如何应对 AI“一本正经的胡说八道”?研究人员希望它会承认“我不知道”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 无限延伸你的创意:Adobe Firefly 开放 AI 视频生成,一键搞定 5 秒 1080P 视频

下一篇: 号称“业界首个对知识产权友好、商用安全”的 LLM,Adobe Firefly 文生视频 AI 模型发布

标签:
  • 热门焦点
  • 数字人的新革命,BAT的“冲高”战场

    来源:刘旷ChatGPT横空出世,让人们看到了数字人的另一种可能,将ChatGPT与虚拟数字人融合,研发出更加智能化、拟人化的虚拟数字人成为数字人厂商的新命题、新方向。2月份,岭南股份
  • 元宇宙步入暗夜

    撰文 | 文烨豪元宇宙的故事,似乎讲不通了。 当下,刮起元宇宙热潮的Roblox股价已跌去大半,带头大哥Meta也正因元宇宙亏损深陷泥潭。 再看国内,从字节“派对岛&
  • 英特尔首款加密芯片将于今年上市|国际动态

    No.1 英特尔首款加密芯片将于今年上市2月13日消息,英特尔首款名为“区块链加速器”的加密芯片将于今年晚些时候上市。目前,已经有两家公司预订了这项技术,分别是G
  • 上海虹口成立10亿元元宇宙基金,香港首只元宇宙ETF拟上市

    区块链日报17日讯 今日《元宇宙新鲜事》有:上海虹口将成立总额约10亿元的元宇宙产业基金;香港市场首只元宇宙主题ETF拟于2月21日上市;元宇宙平台Roblox出现违禁游
  • 2022年6款最佳的NFT稀有度查询工具

    NFT正在风靡全球,但拥有一个你自认为看起来很酷的 NFT 是不够的,因为它还应该是稀有的,稀有度会影响每个 NFT 的价值。因此,如果您打算投资 NFT,则需要使用 NFT 稀
  • 冰墩墩的NFT暴涨千倍?真相则是价格暴跌、成交遇冷

    《区块链日报》记者查证,近日来冰墩墩数字藏品交易数量出现大幅下滑,而所谓的暴涨千倍更是有价无市的自嗨。昨日,北京冬奥会正式闭幕。在这届冬奥会上,吉祥物“冰
  • 从NFT顶级公链到Web3.0基础设施:带你了解不一样的Flow

    对于大部分年轻人来说,刚刚过去的春节有一个词语突然成为了品牌宣传的流行语,作为从NFT中衍生出来的“数字藏品”一时间获得了不少品牌青睐,他们纷纷推出自己的数
  • 2021年中国元宇宙行业用户行为分析热点报告

    元宇宙网络热度高涨,中国网民对虚拟生态兴趣浓厚。艾媒咨询数据显示,超六成的网民对“元宇宙”了解程度较高,在元宇宙较基础的游戏领域,超九成的人对VR游戏更感兴
  • 想进入web3.0?来看看哪些工作适合你

    随着对加密货币需求的增加,加密领域的工作的数量也在增加。以下是一些非技术性加密货币工作简介。加密货币在主流市场获得的可信度提升。导致区块链领域的求职
Top