当前位置:首页 > 科技  > 芯片

AI系统通过图灵测试:GPT-4.5胜率高达73%

来源:icspec 责编: 时间:2025-04-03 07:41:49 248观看
导读美国加州大学圣地亚哥分校近日发布了一项研究成果,首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。图灵测试由英国数学家阿兰・图灵于1950年提出,被称为“模仿游戏”。测试中,提问者需通过文本交流区分
美国加州大学圣地亚哥分校近日发布了一项研究成果,首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。
图灵测试由英国数学家阿兰・图灵于1950年提出,被称为“模仿游戏”。测试中,提问者需通过文本交流区分对方是机器还是人类。如果提问者无法准确辨别,那么该机器可能被认为具备类似人类的智能。在三方图灵测试中,提问者需与一名人类和一台机器对话,并判断哪一方是人类。
研究测试了三款AI模型,包括OpenAI的GPT-4.5、Meta的Llama 3.1 405B,以及OpenAI的GPT-4o。实验中,人类参与者通过分屏界面与一名人类和一台AI系统进行五分钟的对话,结束后需判断哪一方是人类。
研究人员在两种模式下评估了这些AI模型的表现:基础指令(NO-PERSONA)模式和增强型PERSONA模式。后者引导AI模拟特定的人类行为特征。结果显示,在PERSONA模式下,GPT-4.5的胜率高达73%,表明提问者常将其误认为是人类;Llama 3.1-405B的胜率约为56%;而在NO-PERSONA模式下,GPT-4o的胜率仅为21%。
对话内容主要围绕日常闲聊展开,其中61%的互动涉及日常生活和个人细节,50%的互动则探讨社会和情感层面,如观点、情感、幽默感和个人经历。
研究报告指出:“如果提问者无法可靠地区分人类与机器,那么该机器即被认为通过了图灵测试。”基于这一标准,GPT-4.5和Llama 3.1-405B在启用PERSONA模式时均通过了测试。
研究人员认为,这些AI系统在依赖简短对话的经济角色中,有望补充甚至取代人类劳动力。此外,这些系统可能成为难以区分的替代品,适用于从在线陌生人对话到与朋友、同事乃至浪漫伴侣的交流等场景。

本文链接:http://www.28at.com/showinfo-27-140906-0.htmlAI系统通过图灵测试:GPT-4.5胜率高达73%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 法拉第未来发布FX系列前脸设计,计划2025年底前投产

下一篇: 印度科技初创公司IPO热潮将至,未来两年或迎30家企业上市

标签:
  • 热门焦点
  • 鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场,官方在发布会之前也已经正式给出了可升级的机型产品,这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 小红书1周涨粉49W+,我总结了小白可以用的N条涨粉笔记

    作者:黄河懂运营一条性教育视频,被54万人“珍藏”是什么体验?最近,情感博主@公主是用鲜花做的,火了!仅仅凭借一条视频,光小红书就有超过128万人,为她疯狂点赞!更疯狂的是,这
  • Temu起诉SHEIN,跨境电商战事升级

    来源 | 伯虎财经(bohuFN)作者 | 陈平安日前据外媒报道,拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼,诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
  • iQOO Neo8 Pro评测:旗舰双芯加持 最强性能游戏旗舰

    【Techweb评测】去年10月,iQOO推出了一款Neo7手机,该机搭载了联发科天玑9000+,配备独显芯片Pro+,带来了同价位段最佳的游戏体验,一经上市便受到了诸多用
  • 世界人工智能大会国际日开幕式活动在世博展览馆开启

    30日上午,世界人工智能大会国际日开幕式活动在世博展览馆开启,聚集国际城市代表、重量级院士专家、国际创新企业代表,共同打造人工智能交流平台。上海市副市
Top