当前位置：首页 > 元宇宙 > AI

AI智慧背后的隐忧：越聪明，越爱“编造”真相？

来源：责编：时间：2024-09-29 16:14:56 200观看

导读**大型语言模型越强大越爱“撒谎”？新研究揭示AI准确性困境**随着大型语言模型（LLM）能力的不断增强，一项新研究却发现了令人担忧的趋势：这些智能聊天机器人在回答问题时，似乎越来越倾向于编造答案，而非谨慎地避免或拒绝回答

**大型语言模型越强大越爱“撒谎”？新研究揭示AI准确性困境**

随着大型语言模型（LLM）能力的不断增强，一项新研究却发现了令人担忧的趋势：这些智能聊天机器人在回答问题时，似乎越来越倾向于编造答案，而非谨慎地避免或拒绝回答它们不确定的问题。这种行为模式表明，尽管AI变得更加“聪明”，但其可靠性却在实际应用中受到了质疑。

该研究由多个知名研究机构联合进行，成果已发表在《自然》杂志上。研究团队对市面上领先的商业LLM进行了深入分析，包括OpenAI的GPT系列、meta的LLaMA，以及开源模型BLOOM。在对比了这些模型在不同主题和问题类型上的表现后，研究人员发现，尽管新一代LLM在某些情况下的确给出了更准确的回答，但从整体来看，它们提供错误答案的频率却比旧模型更高。

瓦伦西亚人工智能研究所的研究员José Hernández-Orallo指出：“现在的LLM几乎能回答任何问题，这既是进步也是隐患。虽然正确回答的数量增加了，但错误回答的数量也同样在上升。”

在测试中，这些LLM被要求处理从数学到地理等多个领域的问题，并执行一些特定的信息排序任务。结果显示，规模更大、能力更强的模型在简单问题上表现最佳，但在面对更复杂的问题时，其准确率却显著下降。

值得注意的是，OpenAI的GPT-4和o1模型在测试中成为了最大的“撒谎者”，但这一趋势并非孤例，其他被研究的LLM也呈现出了类似的倾向。特别是在LLaMA系列模型中，即便是最简单的问题，也没有任何一个模型能够达到60%的准确率。

当被要求评估聊天机器人答案的准确性时，参与测试的人类受试者也表现出了相当程度的不确定性，他们在10%到40%的情况下做出了错误的判断。

这项研究揭示了一个重要的问题：随着AI模型的规模和能力的不断提升，如何确保它们提供的答案是准确且可靠的？研究人员建议，一个可能的解决方案是让LLM在面对不确定的问题时学会保持沉默，而不是盲目地给出答案。Hernández-Orallo表示：“我们可以设定一个阈值，让聊天机器人在遇到具有挑战性的问题时能够说‘不，我不知道’。”然而，这种做法也可能会暴露当前技术的局限性，从而影响用户对AI的信任和接受度。

本文链接：http://www.28at.com/showinfo-45-7915-0.htmlAI智慧背后的隐忧：越聪明，越爱“编造”真相？

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：科大讯飞进军云南，新成立信息科技公司，布局西南市场？

下一篇：字节跳动新推豆包视频生成模型：AI与现实界限模糊，你能分清吗？

标签：

热门焦点

“任何国产元宇宙都是假元宇宙”

上个月，华语乐坛的优质偶像之一，DOTA2资深玩家林俊杰，在国外元宇宙产品分布式大陆(Decentraland)上买了三块虚拟地产，花了12.3万美元（也就是人民币接近80万）。截至目
现在的元宇宙：一款低配版的科幻游戏

在2021年的岁末之际，不禁感叹元宇宙元年之热闹，从元宇宙NFT头像，到元宇宙数字地产，再到元宇宙旅游景区等等，仿佛科幻感十足的元宇宙眨眼间就从人们的概念认知中完全
字节、腾讯、网易鏖战元宇宙背后，大厂究竟在争夺什么？

正当互联网商业踌躇不前，互联网大厂为了在存量中的增长挤破头皮之时，元宇宙的概念被资本点燃。先是Facebook更名Meta正式进军元宇宙，然后字节跳动收购了一家VR硬
“我没搞懂元宇宙，但一天能赚9w块”

作者：郑宇轩最近几个月，“元宇宙”爆火，除了 Facebook 改名为 Meta 高调进军元宇宙外， BAT 为代表的大厂纷纷着手“元宇宙”新业务。刹那之间，元宇宙成为新风口，除了
就业年龄歧视如何解决？来Web3看看

上周，我突然想到我的第一份工作实际上是在为一家失败的航空公司制定破产退出计划，那年我们的协议实习生刚出生。在一阵恐慌后，我又花了一点时间反思我这个拥有近1
FTX 加密货币交易所开始向游戏公司提供加密服务

据媒体报道，业内领先的加密货币交易所FTX宣布将涉足游戏领域。该公司表示，计划推出自己的游戏部门作为中介，专注于为传统游戏公司提供加密相关服务。此举将有助于
技术赋能，国内首家宠物元宇宙平台“Pet Meta”开启虚拟养宠新方式

作者:易明未来，Pet Meta数字宠物藏品将是链接全球数亿爱宠人群与元宇宙世界独一无二的身份象征。首家面向国内的宠物元宇宙平台Pet Meta生长于“宠物经济”快速
多位全国政协委员提交元宇宙提案，国金证券称元宇宙仍处初期投资阶段

财联社|区块链日报2日讯今日《元宇宙新鲜事》有：全国政协委员刘伟建议出台“元宇宙中国”的顶层设计方案；国金证券称元宇宙仍处初期投资庞大获利不易阶段；阿联酋
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

AI智慧背后的隐忧：越聪明，越爱“编造”真相？

“任何国产元宇宙都是假元宇宙”

现在的元宇宙：一款低配版的科幻游戏

字节、腾讯、网易鏖战元宇宙背后，大厂究竟在争夺什么？

“我没搞懂元宇宙，但一天能赚9w块”

就业年龄歧视如何解决？来Web3看看

FTX 加密货币交易所开始向游戏公司提供加密服务

技术赋能，国内首家宠物元宇宙平台“Pet Meta”开启虚拟养宠新方式

多位全国政协委员提交元宇宙提案，国金证券称元宇宙仍处初期投资阶段

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

最新推荐

企业热、用户冷，元宇宙第一站将是“营销场”？

用户可以把自己的医疗健康数据做成NFT出售给医药公司挣钱

在元宇宙开会是什么样一种体验

头像类NFTs的统治能持续多久？

顶级NFT收藏家Gary Vaynerchuk 与百威推出NFT

3月份值得关注的5个NFT项目

猜你喜欢

热门推荐

相关资讯