当前位置：首页 > 元宇宙 > AI

研究发现：AI 越聪明就越有可能“胡编乱造”

来源：责编：时间：2024-10-01 17:06:44 202观看

导读 9 月 29 日消息，一项新研究发现，随着大型语言模型（LLM）变得越来越强大，它们似乎也越来越容易编造事实，而不是避免或拒绝回答它们无法回答的问题。这表明，这些更聪明的 AI 聊天机器人实际上变得不太可靠。图源 Pexels

9 月 29 日消息，一项新研究发现，随着大型语言模型（LLM）变得越来越强大，它们似乎也越来越容易编造事实，而不是避免或拒绝回答它们无法回答的问题。这表明，这些更聪明的 AI 聊天机器人实际上变得不太可靠。

图源 Pexels

注意到，该研究发表在《自然》杂志上，研究人员研究了一些业界领先的商业 LLM：OpenAI 的 GPT 和 Meta 的 LLaMA，以及由研究小组 BigScience 创建的开源模型 BLOOM。

研究发现，虽然这些 LLM 的回答在许多情况下变得更加准确，但总体上可靠性更差，给出错误答案的比例比旧模型更高。

瓦伦西亚人工智能研究所在西班牙的研究员 José Hernández-Orallo 对《自然》杂志表示：“如今，它们几乎可以回答一切。这意味着更多正确的答案，但也意味着更多错误的答案。”

格拉斯哥大学的科学和技术哲学家 Mike Hicks 对此进行了更严厉的评价，Hicks（未参与该研究）告诉《自然》杂志：“在我看来，这就像我们所说的胡说八道，它越来越擅长假装知识渊博。”

测试中，这些模型被问及了从数学到地理等各种主题，并被要求执行诸如按指定顺序列出信息等任务。总体而言，更大、更强大的模型给出了最准确的答案，但在更难的问题上表现不佳，其准确率较低。

研究人员称，一些最大的“撒谎者”是 OpenAI 的 GPT-4 和 o1，但所有被研究的 LLM 似乎都呈这种趋势，对于 LLaMA 系列模型，没有一个能够达到 60% 的准确率，即使是最简单的问题。

而当被要求判断聊天机器人的回答是准确还是不准确时，一小部分参与者有 10% 到 40% 的概率判断错误。

总之研究表明，AI 模型越大（就参数、训练数据和其他因素而言），它们给出错误答案的比例就越高。

研究人员称，解决这些问题最简单的方法是让 LLM 不那么急于回答一切。Hernández-Orallo 称：“可以设置一个阈值，当问题具有挑战性时，让聊天机器人说‘不，我不知道’。”但如果聊天机器人被限制为只回答它们知道的东西，可能会暴露技术的局限性。

本文链接：http://www.28at.com/showinfo-45-8015-0.html研究发现：AI 越聪明就越有可能“胡编乱造”

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：字节跳动发布豆包视频生成模型，这效果让我分不清 AI 与现实

下一篇：国际机器人联合会：2023 年我国新安装工业机器人 27.63 万台，超全球半数

标签：

热门焦点

AI网红能年赚百万，普通人的新机会来了？

来源｜运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁2023 年，数字人成为了当红的“流量话题”和“商业机会"。不管是 AI 孙燕姿走红网络，还是 AI 数字
ChatGPT访问量增速下滑，AI真的是一场泡沫吗？

来源：首席商业评论2023年，最火的莫过于ChatGPT，席卷全球的同时也引发了生成式AI（人工智能）的投资热潮。在美股，ChatGPT相关概念股飙涨，以AI算力龙头英伟达为例，其股价年内一度累计上
城市数字孪生标准化白皮书（2022版）

当前，城市数字孪生已经发展成为支撑智慧城市的重要技术手段。城市数字孪生通过在数字空间对城市物理空间和社会空间进行全要素表达、全过程呈现、全周期可溯，实
国内涌现70余家数字藏品平台：合规、流量与利润在博弈

作者：杨郑君2月16日，迅雷链企业数字藏品服务平台正式上线，继阿里、腾讯、京东、百度、网易等之后，又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
Meta公布AI概念“Builder Bot”；银保监发布元宇宙相关风险提示

概述自从Meta在2月初公布财报后，其负责元宇宙的核心部门Reality Labs表现不佳，净亏损超100亿美元，随后股价断崖式下跌。如今，Meta开始继续发力元宇宙，想要挽回颓势，
以用户为中心，Web3和区块链如何将用户放在首位

竞争优势正在改变竞争优势是每个企业都在努力争取的，由谷歌、Facebook和Netflix等大型科技公司主导的市场中，两大重要类别的竞争优势十分突出。第一个竞争优势来
又一家数字营销公司入局元宇宙，国内首个艺术元宇宙社区“Meta彼岸”上线

作者：董宇佳2月28日，智度股份在北京举办产品发布会，宣布其与国光电器联手打造的国内首个艺术元宇宙社区——“Meta彼岸”在VR端和移动端正式公测。从科技巨头布局
从概念到落地 Web3.0初具雏形

加密资产热潮催生出的链上应用中，除了DeFi、NFT、链游GameFi等场景外，还有一个热词叫「Web3.0」。Web3.0的概念最早出现在2014年，由以太坊联合创始人及波卡创建者
76亿美金估值、2022年最具创新力公司，Dapper Labs如何做到？

“元宇宙的开拓者”是我们针对元宇宙的发展而设立的专栏，主要面向那些深挖元宇宙产业或者在元宇宙进行“淘金”的从业者，分享这些企业或者创业者们的故事，以独特

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

研究发现：AI 越聪明就越有可能“胡编乱造”

AI网红能年赚百万，普通人的新机会来了？

ChatGPT访问量增速下滑，AI真的是一场泡沫吗？

城市数字孪生标准化白皮书（2022版）

国内涌现70余家数字藏品平台：合规、流量与利润在博弈

Meta公布AI概念“Builder Bot”；银保监发布元宇宙相关风险提示

以用户为中心，Web3和区块链如何将用户放在首位

又一家数字营销公司入局元宇宙，国内首个艺术元宇宙社区“Meta彼岸”上线

从概念到落地 Web3.0初具雏形

76亿美金估值、2022年最具创新力公司，Dapper Labs如何做到？

最新推荐

在数字世界再造世界杯，元宇宙体育正变得越来越丰满

“元宇宙”里过大年，《迷你世界》在做一场怎样的实验？

以太坊面临来自Fantom的巨大挑战

Staking 收益翻倍？

售出6930万美元的NFT已经过去一年，NFT如今是否已成为主流？

在互联网考古后，我被豆瓣上这座元宇宙古城征服了

猜你喜欢

热门推荐

相关资讯