当前位置:首页 > 科技  > 芯片

AI系统通过图灵测试:GPT-4.5胜率高达73%

来源:icspec 责编: 时间:2025-04-03 07:41:49 280观看
导读美国加州大学圣地亚哥分校近日发布了一项研究成果,首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。图灵测试由英国数学家阿兰・图灵于1950年提出,被称为“模仿游戏”。测试中,提问者需通过文本交流区分
美国加州大学圣地亚哥分校近日发布了一项研究成果,首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。
图灵测试由英国数学家阿兰・图灵于1950年提出,被称为“模仿游戏”。测试中,提问者需通过文本交流区分对方是机器还是人类。如果提问者无法准确辨别,那么该机器可能被认为具备类似人类的智能。在三方图灵测试中,提问者需与一名人类和一台机器对话,并判断哪一方是人类。
研究测试了三款AI模型,包括OpenAI的GPT-4.5、Meta的Llama 3.1 405B,以及OpenAI的GPT-4o。实验中,人类参与者通过分屏界面与一名人类和一台AI系统进行五分钟的对话,结束后需判断哪一方是人类。
研究人员在两种模式下评估了这些AI模型的表现:基础指令(NO-PERSONA)模式和增强型PERSONA模式。后者引导AI模拟特定的人类行为特征。结果显示,在PERSONA模式下,GPT-4.5的胜率高达73%,表明提问者常将其误认为是人类;Llama 3.1-405B的胜率约为56%;而在NO-PERSONA模式下,GPT-4o的胜率仅为21%。
对话内容主要围绕日常闲聊展开,其中61%的互动涉及日常生活和个人细节,50%的互动则探讨社会和情感层面,如观点、情感、幽默感和个人经历。
研究报告指出:“如果提问者无法可靠地区分人类与机器,那么该机器即被认为通过了图灵测试。”基于这一标准,GPT-4.5和Llama 3.1-405B在启用PERSONA模式时均通过了测试。
研究人员认为,这些AI系统在依赖简短对话的经济角色中,有望补充甚至取代人类劳动力。此外,这些系统可能成为难以区分的替代品,适用于从在线陌生人对话到与朋友、同事乃至浪漫伴侣的交流等场景。

本文链接:http://www.28at.com/showinfo-27-140906-0.htmlAI系统通过图灵测试:GPT-4.5胜率高达73%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 法拉第未来发布FX系列前脸设计,计划2025年底前投产

下一篇: 印度科技初创公司IPO热潮将至,未来两年或迎30家企业上市

标签:
  • 热门焦点
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 一个注解实现接口幂等,这样才优雅!

    场景码猿慢病云管理系统中其实高并发的场景不是很多,没有必要每个接口都去考虑并发高的场景,比如添加住院患者的这个接口,具体的业务代码就不贴了,业务伪代码如下:图片上述代码有
  • 重估百度丨大模型,能撑起百度的“今天”吗?

    自象限原创 作者|程心 罗辑2023年之前,对于自己的“今天”,百度也很迷茫。“新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”这是2022年底,李彦宏
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • iQOO 11S新品发布会

    iQOO将在7月4日19:00举行新品发布会,推出杭州亚运会电竞赛事官方用机iQOO 11S。
  • 北京:科技教育体验基地开始登记

      北京“科技馆之城”科技教育体验基地登记和认证工作日前启动。首批北京科技教育体验基地拟于2023年全国科普日期间挂牌,后续还将开展常态化登记。  北京科技教育体验基
Top