当前位置:首页 > 科技  > 资讯

科企竞逐新技术以防AI“越狱”

来源: 责编: 时间:2025-03-17 11:23:33 109观看
导读  随着人工智能(AI)技术的快速普及,新的安全漏洞和“越狱”方法层出不穷。这让黑客更容易滥用AI系统,实施网络攻击、传播不当信息、制造安全风险,甚至引发重大犯罪行为。鉴于此,全球科技巨头竞相开发新技术,力求在保持AI模

  随着人工智能(AI)技术的快速普及,新的安全漏洞和“越狱”方法层出不穷。这让黑客更容易滥用AI系统,实施网络攻击、传播不当信息、制造安全风险,甚至引发重大犯罪行为。鉴于此,全球科技巨头竞相开发新技术,力求在保持AI模型功能性的同时,有效减少其被滥用的风险。KsN28资讯网——每日最新资讯28at.com

KsN28资讯网——每日最新资讯28at.com

图片来源:IBM网站KsN28资讯网——每日最新资讯28at.com

AI“越狱”日益猖獗KsN28资讯网——每日最新资讯28at.com

  IBM网站对AI“越狱”是这样解释的:当黑客或别有用心之人利用AI系统中的漏洞,绕过道德准则,操纵AI模型生成非法或危险信息时,便视为AI“越狱”。黑客惯常利用的AI“越狱”手段包括提示词植入、角色扮演诱导、现在就做任何事(DAN)、敏感词拆分等。KsN28资讯网——每日最新资讯28at.com

  提示词植入指在输入中植入特定指令或改变输入的语义结构,诱导模型执行非期望操作或生成错误结果;在角色扮演诱导中,黑客会让AI扮演特定角色,绕过内容过滤器生成信息;DAN则是ChatGPT的一种特殊运行模式,在此模式下,ChatGPT获得了超越其原有道德和伦理限制的能力,能回答一些正常模式下无法回答的问题;敏感词拆分则指将敏感词拆分成子字符串以规避检查。KsN28资讯网——每日最新资讯28at.com

  这些技术通过精心设计的提示,引导模型偏离预定的安全防护规则,生成潜在的有害内容,甚至引发数据泄露、系统失控等严重后果。KsN28资讯网——每日最新资讯28at.com

  研究发现,在无保护措施的情境下,生成式AI“越狱”攻击的成功率高达20%。平均而言,攻击者仅需42秒及5次交互便能突破防线。在某些情况下,攻击甚至在短短4秒内就能完成。这些发现凸显了当前生成式AI模型算法中存在重大漏洞,实时防止漏洞的难度很大。KsN28资讯网——每日最新资讯28at.com

  IBM网站指出,AI“越狱”事件愈发普遍,要归因于AI技术的飞速进步、AI工具的可获取性日益提升,以及对未经过滤输出的需求不断增长等。安全专家认为,生成式聊天机器人的易用性,使缺乏相关知识背景的普通人也能尝试获取危险信息。KsN28资讯网——每日最新资讯28at.com

  为AI设立“防护栏”KsN28资讯网——每日最新资讯28at.com

  为更好地推动AI发展,确保其安全可控,增强客户信任,包括微软和元宇宙平台等公司在内的科技巨头,正竭力防止AI“越狱”。KsN28资讯网——每日最新资讯28at.com

  据英国《金融时报》报道,AI初创公司Anthropic推出了一款名为“宪法分类器”的新系统,其可作为大语言模型的保护层,监测输入和输出内容是否存在有害信息,确保用户免受不良信息的侵扰。KsN28资讯网——每日最新资讯28at.com

  这一解决方案基于一套被称为“宪法”规则的体系。这些规则明确界定了信息的允许范围与限制边界,并可根据实际需求灵活调整,以涵盖不同类型的材料。KsN28资讯网——每日最新资讯28at.com

  为验证该系统的实效,Anthropic公司提供了15000美元的“漏洞赏金”。重赏之下,183名测试人员历时3000多个小时,尝试突破防御。在“宪法分类器”的保驾护航下,该公司的“克劳德3.5”模型抵御了超过95%的恶意尝试。而在没有这道防护网的情况下,该模型的拒绝率仅为14%。KsN28资讯网——每日最新资讯28at.com

  无独有偶,微软去年3月推出了“提示词防护盾”。这一创新工具能够实时侦测并有效阻止诱导AI模型“越狱”的“提示词攻击”。微软还攻克了“间接提示词输入”这一难题,即防止黑客将恶意指令悄然插入模型的训练数据中,从而避免模型执行不当操作。KsN28资讯网——每日最新资讯28at.com

  值得一提的是,微软还推出了一项新功能:当AI模型编造内容或产生错误反应时,它会迅速提醒用户。KsN28资讯网——每日最新资讯28at.com

  2024年底,美国加州大学伯克利分校与元宇宙平台公司携手,推出了一种通用防御框架,以有效应对策略性植入的提示词攻击,为AI的安全防护再添一道屏障。KsN28资讯网——每日最新资讯28at.com

  技术成本有待降低KsN28资讯网——每日最新资讯28at.com

  当然,这些旨在防止AI“越狱”的技术也并非尽善尽美。KsN28资讯网——每日最新资讯28at.com

  审核措施的介入可能会让模型变得过于谨慎,而拒绝一些无害的请求。谷歌早期版本的“双子座”AI模型以及元宇宙平台的Llama 2就曾出现过这种情况。不过,Anthropic公司表示,其“宪法分类器”虽然也提高了拒绝率,但绝对值仅增加了0.38%。KsN28资讯网——每日最新资讯28at.com

  《金融时报》的报道指出,“宪法分类器”在运行过程中,会耗费大量计算资源。这对那些已经为训练和运行模型支付巨额费用的公司来说,无疑是“雪上加霜”。Anthropic公司也承认,其分类器将使运行AI模型的成本增加近24%。KsN28资讯网——每日最新资讯28at.com

  由此可见,虽然AI“越狱”防护技术在提升安全性方面发挥了重要作用,但如何在保障安全与降低成本之间找到平衡,仍需进一步探索。(记者 刘 霞)KsN28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-137313-0.html科企竞逐新技术以防AI“越狱”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 宝马携手华为鸿蒙,共创智能车载应用新生态!

下一篇: 给“AI造”加标识,应对AI作假的有效之举

标签:
  • 热门焦点
  • 7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月份的手机市场风平浪静,除了红魔和努比亚带来了两款搭载骁龙8Gen2领先版处理器的新机之外,别的也想不到有什么新品了,这也正常,通常6月7月都是手机厂商修整的时间,进入8月份之
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 破圈是B站头上的紧箍咒

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集,2021年有优酷的《山河令》,2022年有爱奇艺的《苍兰诀》,今年却轮到小破站抓住了追
  • 华为HarmonyOS 4.0将于8月4日发布 或搭载AI大模型技术

    华为宣布HarmonyOS4.0将于8月4日正式发布。此前,华为已经针对开发者公布了HarmonyOS4.0,以便于开发者提前进行适配,也因此被曝光出了一些新系统的特性
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • 自研Exynos回归!三星Galaxy S24系列将提供Exynos和骁龙双版本

    年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,虽同样采用台积电4nm工艺制
  • 三星显示已开始为AR设备研发硅基LED微显示屏

    7月18日消息,据外媒报道,随着苹果首款头显产品Vision Pro在6月份正式推出,AR/VR/MR等头显产品也就将成为各大公司下一个重要的竞争领域,对显示屏这一关
  • 机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

    7月20日消息,据外媒报道,研究机构的报告显示,由于需求下滑,今年二季度全球智能手机的出货量,同比下滑了11%,三星、苹果等主要厂商的销量,较去年同期均有下
Top