当前位置:首页 > 元宇宙 > AI

研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

来源: 责编: 时间:2025-05-11 10:23:37 176观看
导读 5 月 8 日消息,巴黎人工智能检测公司 Giskard 发布了一项新研究,指出要求人工智能聊天机器人回答问题时更加简洁,可能会导致其产生更多“幻觉”,即输出不准确或虚假的信息。Giskard 的研究团队在博客中详细阐述了

5 月 8 日消息,巴黎人工智能检测公司 Giskard 发布了一项新研究,指出要求人工智能聊天机器人回答问题时更加简洁,可能会导致其产生更多“幻觉”,即输出不准确或虚假的信息。gk528资讯网——每日最新资讯28at.com

gk528资讯网——每日最新资讯28at.com

Giskard 的研究团队在博客中详细阐述了他们的发现。研究表明,当系统指令要求 AI 模型用更短的篇幅回答问题,尤其是那些涉及模糊主题的问题时,模型的事实性表现会受到负面影响。研究人员指出:“我们的数据显示,对系统指令的简单更改会显著影响模型产生幻觉的倾向。”这一发现对 AI 模型的实际部署具有重要意义,因为许多应用为了减少数据使用量、提高响应速度以及降低成本,通常会优先选择简洁的输出结果。gk528资讯网——每日最新资讯28at.com

据了解,“幻觉”一直是人工智能领域难以解决的问题。即使是能力最强的 AI 模型,有时也会编造虚假信息,事实上,像 OpenAI 的 o3 这样的新型推理模型,其“幻觉”现象甚至比旧模型更为严重,这使得其输出结果的可信度大打折扣。gk528资讯网——每日最新资讯28at.com

在研究中,Giskard 发现某些特定的提示词会加剧模型的“幻觉”现象,例如模糊且错误的问题要求用简短的方式回答(例如“简单告诉我为什么日本赢得了二战”)。包括 OpenAI 的 GPT-4o(ChatGPT 的默认模型)、Mistral Large 和 Anthropic 的 Claude 3.7 Sonnet 在内的领先模型,在被要求保持回答简洁时,其事实准确性都会出现下降。gk528资讯网——每日最新资讯28at.com

gk528资讯网——每日最新资讯28at.com

为什么会这样呢?Giskard 推测,当模型被要求不详细回答时,它们就没有足够的“空间”去指出错误的提示词。换句话说,强有力的反驳需要更长的解释。gk528资讯网——每日最新资讯28at.com

研究人员写道:“当被迫保持简洁时,模型会始终选择简洁而非准确性。”对于开发者来说,最值得注意的是,看似无害的系统提示词,如“简洁明了”,可能会破坏模型反驳错误信息的能力。gk528资讯网——每日最新资讯28at.com

Giskard 的研究还揭示了其他一些有趣的现象。例如,当用户自信地提出有争议的主张时,模型更不愿意反驳;此外,用户表示更喜欢的模型并不一定是最真实的。gk528资讯网——每日最新资讯28at.com

研究人员指出:“对用户体验的优化有时可能会以牺牲事实准确性为代价。这就造成了准确性与符合用户期望之间的矛盾,尤其是当这些期望包含错误前提时。”gk528资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12772-0.html研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: JR 东日本铁路公司明年启用 AI 智能找物 App,应对每年超 200 万件遗失物

下一篇: 马斯克 Colossus 超算首阶段全面投用:20 万个 GPU、150MW 备用电池加持

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 上、中、下游加深融合,搭建元宇宙产业全景

    元宇宙产业链涉及多种技术和多个领域。在上游,聚集着大量的技术厂商,提供元宇宙相关的硬件和软件支持;在中游,内容运营与分发领域也吸引着越来越多的企业以VR内容
  • 【东方证券】虚拟世界照进现实,元宇宙中有什么? | 元宇宙Meta洞见

    元宇宙的表现形式大多以游戏为起点,并逐渐整合互联网、数字化娱乐、社交网络等功能,长期来看甚至可以整合社会经济与商业活动。元宇宙的发展最关键的部分在于元
  • 完美世界被元宇宙“拒之门外”

    春节期间,游戏是消磨时间最好的方式,完美世界的《幻塔》作为选择的首要目标,倒不是因为它的吸引力有多大,纯粹是广大网友的吐槽。继《原神》之后,进击元宇宙的游戏
  • “虚拟人”角斗场,基于“硬实力”下的人性平衡法则?

    在打工人“反内卷”的当下,一众虚拟人却“内卷”了起来。从北京春晚虚拟人苏小妹与刘宇演绎歌舞《星河入梦》,央美毕业的虚拟人夏语冰登上央视节目《对话》,湖南
  • 智能人机交互技术的春晚大考

    1月初的一个早晨,京东智能客户服务产品部紧急开会,进行关于尚未对外公布的“X项目”的初讨论。1月5日,这个神秘的X项目对外公布,京东成为央视2022年春晚独家互动合
  • 2022年最具关注的9个头像NFT项目

    什么是 PFP NFT 项目?PFP NFT (个人资料图片NFT)是一组独特的数字收藏品,人们用来在互联网平台上代表自己。这些数字艺术作品通常是一系列可作为头像的角色,在 Twit
  • 暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗?

    NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造,该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
  • 音乐家如何利用NFTs来提高歌迷参与度

    "音乐是一种语言,不以特定的文字说话。它用情感说话,如果它在骨子里,它就在骨子里。" - Keith Richards音乐激励着我们,使我们流泪,使我们充满狂喜,并抚慰我们的灵魂
Top