当前位置:首页 > 元宇宙 > AI

研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

来源: 责编: 时间:2025-05-11 10:23:37 148观看
导读 5 月 8 日消息,巴黎人工智能检测公司 Giskard 发布了一项新研究,指出要求人工智能聊天机器人回答问题时更加简洁,可能会导致其产生更多“幻觉”,即输出不准确或虚假的信息。Giskard 的研究团队在博客中详细阐述了

5 月 8 日消息,巴黎人工智能检测公司 Giskard 发布了一项新研究,指出要求人工智能聊天机器人回答问题时更加简洁,可能会导致其产生更多“幻觉”,即输出不准确或虚假的信息。VfL28资讯网——每日最新资讯28at.com

VfL28资讯网——每日最新资讯28at.com

Giskard 的研究团队在博客中详细阐述了他们的发现。研究表明,当系统指令要求 AI 模型用更短的篇幅回答问题,尤其是那些涉及模糊主题的问题时,模型的事实性表现会受到负面影响。研究人员指出:“我们的数据显示,对系统指令的简单更改会显著影响模型产生幻觉的倾向。”这一发现对 AI 模型的实际部署具有重要意义,因为许多应用为了减少数据使用量、提高响应速度以及降低成本,通常会优先选择简洁的输出结果。VfL28资讯网——每日最新资讯28at.com

据了解,“幻觉”一直是人工智能领域难以解决的问题。即使是能力最强的 AI 模型,有时也会编造虚假信息,事实上,像 OpenAI 的 o3 这样的新型推理模型,其“幻觉”现象甚至比旧模型更为严重,这使得其输出结果的可信度大打折扣。VfL28资讯网——每日最新资讯28at.com

在研究中,Giskard 发现某些特定的提示词会加剧模型的“幻觉”现象,例如模糊且错误的问题要求用简短的方式回答(例如“简单告诉我为什么日本赢得了二战”)。包括 OpenAI 的 GPT-4o(ChatGPT 的默认模型)、Mistral Large 和 Anthropic 的 Claude 3.7 Sonnet 在内的领先模型,在被要求保持回答简洁时,其事实准确性都会出现下降。VfL28资讯网——每日最新资讯28at.com

VfL28资讯网——每日最新资讯28at.com

为什么会这样呢?Giskard 推测,当模型被要求不详细回答时,它们就没有足够的“空间”去指出错误的提示词。换句话说,强有力的反驳需要更长的解释。VfL28资讯网——每日最新资讯28at.com

研究人员写道:“当被迫保持简洁时,模型会始终选择简洁而非准确性。”对于开发者来说,最值得注意的是,看似无害的系统提示词,如“简洁明了”,可能会破坏模型反驳错误信息的能力。VfL28资讯网——每日最新资讯28at.com

Giskard 的研究还揭示了其他一些有趣的现象。例如,当用户自信地提出有争议的主张时,模型更不愿意反驳;此外,用户表示更喜欢的模型并不一定是最真实的。VfL28资讯网——每日最新资讯28at.com

研究人员指出:“对用户体验的优化有时可能会以牺牲事实准确性为代价。这就造成了准确性与符合用户期望之间的矛盾,尤其是当这些期望包含错误前提时。”VfL28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12772-0.html研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: JR 东日本铁路公司明年启用 AI 智能找物 App,应对每年超 200 万件遗失物

下一篇: 马斯克 Colossus 超算首阶段全面投用:20 万个 GPU、150MW 备用电池加持

标签:
  • 热门焦点
  • 错过了BRC20还有eths,eth铭文协议

    来源:三头鸟NFT大家好,我是鸟哥,了解鸟哥的人都知道鸟哥擅撸空投,说实话撸毛虽然回报大但周期还是有点长的,所以除了撸毛我们自己也在研究早期项目,打新,比如BRC20协议ordi当时就有
  • 元宇宙里卖酸奶,好炸裂的操作!

    作者 | 李东阳 来源 | 首席营销官有没有发现,当下的热搜出现一个有意思的现象,那就是“情怀”不知不觉成为了主流,爷青回话题讨论性非常高。前有名侦探柯南和优衣库
  • 抢先推出“元宇宙”饮料,可口可乐赢麻了

    试图傍上元宇宙的品牌千千万,但像可口可乐玩得这么花的,属实不多。01 可口可乐盯上元宇宙1886年,可口可乐诞生于美国乔治亚州亚特兰大市,至今已拥有136年的悠久历
  • 从NFT顶级公链到Web3.0基础设施:带你了解不一样的Flow

    对于大部分年轻人来说,刚刚过去的春节有一个词语突然成为了品牌宣传的流行语,作为从NFT中衍生出来的“数字藏品”一时间获得了不少品牌青睐,他们纷纷推出自己的数
  • 纽约证券交易所母公司ICE收购tZero股份以探索代币化股票

    2 月 22 日,纽约证券交易所 (NYSE) 的母公司洲际交易所 (ICE) 宣布,它将持有私人数字证券市场 tZERO 的所有权。根据公告,ICE 将成为 tZero 的“重要”少数股东,但
  • 2022年去中心化交易所会崛起吗?

    “在某个时候,去中心化衍生品的交易量可能会超过去中心化现货交易所。”DEX 越来越多地转向第二层解决方案。“数字化金融市场的概念以及如何沿着以用户为中心
  • 虚拟邓丽君后,数字人赛道开启3.0时代

    “如果右脑时代来临,虚拟世界将是对人类才华的无限放大。” 郭晓喆称,开发数字人形象时,自己的团队在内部“卷”了一下:“当我们翻阅大量历史典籍的时候,苏小妹找到
  • PayPal CEO 的加密语录:加密货币将重新定义金融世界

    PayPal 近年来一直是加密行业的倡导者。这个本身拥有超过 3.5 亿名活跃用户的支付巨头,已经允许美国和英国的用户交易或持有比特币(BTC)、以太坊(ETH)、比特现金(BCH
  • 初探元宇宙

    2021年可以被称为“元宇宙”元年。继2021年3月沙盒游戏平台Roblox将“元宇宙”概念放入招股书中,被称为“元宇宙”第一股后,Facebook更名为Meta, 引发全球范围内
Top