当前位置:首页 > 元宇宙 > AI

苹果最新 AI 研究:使其理解手机系统及 App 各种操作的后果,避免执行未经授权的高风险行为

来源: 责编: 时间:2025-06-30 18:33:09 105观看
导读 6 月 27 日消息,随着 AI 智能体越来越聪明,甚至能够主动帮助用户在手机上完成各种任务(例如修改某项设置、打开导航),但 AI 本身并不理解 UI 结构对应的具体运行机制,仅仅是按照预设程序执行操作。苹果与华盛顿大学

6 月 27 日消息,随着 AI 智能体越来越聪明,甚至能够主动帮助用户在手机上完成各种任务(例如修改某项设置、打开导航),但 AI 本身并不理解 UI 结构对应的具体运行机制,仅仅是按照预设程序执行操作。j4l28资讯网——每日最新资讯28at.com

苹果与华盛顿大学的研究人员现在联合发表了一篇论文,探讨如何让 AI 学会判断各种操作所产生的后果,避免执行用户未批准的高风险动作。j4l28资讯网——每日最新资讯28at.com

j4l28资讯网——每日最新资讯28at.com

AI 智能体的自主行为是 2026 年苹果系统升级的核心功能之一。苹果在 2024 年 WWDC 上就曾展示过 Siri 的未来发展方向 —— 帮用户代做诸如在线购物、订票等任务,但这种自动化看似便捷,却引发了关键问题:如果 AI 误点“删除账户”而非“注销”,会发生什么?j4l28资讯网——每日最新资讯28at.com

手机作为个人设备,存储着银行金融数据、健康记录、照片和私人信息。当 AI 智能体代行任务时,必须区分哪些动作无害、哪些可能造成持久或危险后果,更需知道何时停止并请求用户确认。j4l28资讯网——每日最新资讯28at.com

然而,多数 AI 开发商只是停留在让 AI“会操作”(如识别按钮、找到对应的页面、按指令执行程序),却甚少关注这些操作对用户的后续影响。j4l28资讯网——每日最新资讯28at.com

苹果 AI 研究人员指出,并不是所有动作都安全无风险:点击“刷新”按钮是低风险行为,但点击“转账”则是高风险行为。j4l28资讯网——每日最新资讯28at.com

j4l28资讯网——每日最新资讯28at.com

这项研究从 AI 安全与 UI 设计专家参与的研讨会开始,目标是创建一个“分类法”(结构化列表),用于定义 UI 动作的不同影响类型。团队围绕以下问题展开:j4l28资讯网——每日最新资讯28at.com

动作是否可撤销?j4l28资讯网——每日最新资讯28at.com

影响仅涉及机主还是包括更多人?j4l28资讯网——每日最新资讯28at.com

是否改变隐私设置或产生费用?j4l28资讯网——每日最新资讯28at.com

论文显示,研究人员建立了一种多维度标注手机 App 动作的方法。例如,删除消息可能在 2 分钟内可撤销,但超过时间则无法恢复;转账通常需协助才能撤销。j4l28资讯网——每日最新资讯28at.com

这种分类法的重要性在于,它为 AI 提供了推理人类意图的框架 —— 相当于一份“风险检查”程序,帮助 AI 判断“哪些动作可能出错”或“为何需要额外确认”。j4l28资讯网——每日最新资讯28at.com

为训练 AI 区分动作风险,研究人员让参与者在模拟移动环境中记录高风险动作(注:如修改账户密码、发送消息、更新支付详情),而非浏览、搜索等低风险任务。j4l28资讯网——每日最新资讯28at.com

团队将新数据与现有覆盖安全、常规交互的数据集结合,用分类法标注所有数据,随后测试了包括 OpenAI GPT-4 在内的五大 AI 模型,评估其预测动作影响水平或分类属性的能力。j4l28资讯网——每日最新资讯28at.com

结果显示,在提示中加入分类法有助于提高风险判断准确率,但即使表现最佳的“GPT-4 多模态”模型,正确率也仅约 58%。j4l28资讯网——每日最新资讯28at.com

j4l28资讯网——每日最新资讯28at.com

研究发现,AI 模型常会高估风险 —— 比如将“清除空计算器历史记录”这类无害动作标记为高风险。这种“谨慎偏见”看似更安全,却可能因频繁请求确认而让 AI 助手变得烦人或无用。而更严重的问题在于,模型难以完成判断 —— 无法确定动作是否可撤销,或如何影响他人。j4l28资讯网——每日最新资讯28at.com

苹果研究人员认为,用户需要的是“有用且安全”的自动化功能:误删账户的 AI 是灾难,但要是连调整音量这种操作都要请示用户的话还不如不做。j4l28资讯网——每日最新资讯28at.com

研究人员认为,他们的分类法可帮助设计更好的 AI 政策 —— 例如,用户可自定义何时需要请求批准。这种方法支持透明化与个性化,帮助 AI 设计者识别当前模型的薄弱点(尤其在处理真实世界高风险任务时)。j4l28资讯网——每日最新资讯28at.com

研究表明,教 AI“识别按钮”还不够,它必须理解“点击背后的意义”—— 这对 AI 而言是项艰巨任务。人类可以通过上下文提示和历史经验来进行判断,但机器却很难完美地解决这种复杂性操作。j4l28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14267-0.html苹果最新 AI 研究:使其理解手机系统及 App 各种操作的后果,避免执行未经授权的高风险行为

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

下一篇: 马斯克宣布 7 月 4 日后发布 Grok 4 模型

标签:
  • 热门焦点
  • 雷克萨斯高管,“受贿”5000万?

    来源:毒舌科技作者:潘磊雷克萨斯的高管,好像出事了。五六家日本小媒体,突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元(约合人民币5000
  • 三院士三教授热聊元宇宙&——AIGC,学术界怎么看?

    来源:清元宇宙在近日举办的中国江宁2023元宇宙产业·人才高峰论坛暨AIGC发展大会上,中国工程院院士谭建荣、刘韵洁、郑纬民出席并发表了主旨演讲。除了三大院士,还有清华
  • 25万虚拟er在“元宇宙”追星

    “默叽默叽,我是默默酱,我是在真元宇宙也有头有脸的人。”12月11日晚20:00,虚拟偶像@默默酱的首场个人元宇宙演唱会《以梦为马,抵达繁星》在大有空间APP
  • 2022年最具关注的9个头像NFT项目

    什么是 PFP NFT 项目?PFP NFT (个人资料图片NFT)是一组独特的数字收藏品,人们用来在互联网平台上代表自己。这些数字艺术作品通常是一系列可作为头像的角色,在 Twit
  • 2021年中国元宇宙行业用户行为分析热点报告

    元宇宙网络热度高涨,中国网民对虚拟生态兴趣浓厚。艾媒咨询数据显示,超六成的网民对“元宇宙”了解程度较高,在元宇宙较基础的游戏领域,超九成的人对VR游戏更感兴
  • 元宇宙是数字共识生态的集成逻辑表达

    作者: 李鸣元宇宙是数字共识生态的集成逻辑表达,是以区块链技术为核心的可信数字化价值交互网络,是基于Web3.0技术体系和运作机制支撑下的数字新生态。本体论是
  • 纽约证券交易所母公司ICE收购tZero股份以探索代币化股票

    2 月 22 日,纽约证券交易所 (NYSE) 的母公司洲际交易所 (ICE) 宣布,它将持有私人数字证券市场 tZERO 的所有权。根据公告,ICE 将成为 tZero 的“重要”少数股东,但
  • 元宇宙画廊体验报告:有点头疼。

    2 月 10 日,Hrishi Rajasekar 在旧金山铸币厂的沉浸式 NFT 展览 Verse 观看增强现实艺术品。“我们现在在虚拟世界中吗?时间好像变长了” 我问身后排队的人。我
  • 76亿美金估值、2022年最具创新力公司,Dapper Labs如何做到?

    “元宇宙的开拓者”是我们针对元宇宙的发展而设立的专栏,主要面向那些深挖元宇宙产业或者在元宇宙进行“淘金”的从业者,分享这些企业或者创业者们的故事,以独特
Top