当前位置:首页 > 元宇宙 > AI

LLM Attacks:新算法构建针对大型语言模型的对抗攻击

来源: 责编: 时间:2023-08-15 18:47:25 377观看
导读8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种

8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种算法,攻击者可以自动生成一系列提示后缀,绕过LLM的安全机制,并导致LLM输出有害的响应。Ia228资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,与传统的“越狱”攻击不同,CMU团队设计的LLMAttacks算法采用了一个三步过程,自动创建有害提示后缀。首先,攻击者需要创建一个目标令牌序列,类似于“Sure, here is (content ofquery)”,其中“content ofquery”是用户实际的提示,要求有害响应。接下来,算法使用贪婪坐标梯度(GCG)方法,生成能导致LLM输出目标序列的提示后缀,尽管这确实需要访问LLM。Ia228资讯网——每日最新资讯28at.com

该研究还通过基准测试AdvBench评估了LLM Attacks算法的有效性。在这个基准测试上,LLMAttacks对名为Vicuna的LLM的成功率达到了惊人的88%,而基线对抗算法的成功率却仅为25%。这表明新的LLMAttacks算法具有更高的攻击成功率,可能对LLM提供商构成潜在威胁。Ia228资讯网——每日最新资讯28at.com

值得担忧的是,这种对抗攻击是否能被LLM提供商完全修复仍然是一个悬念。类似的对抗攻击在计算机视觉领域已经被证明是一个难以解决的问题,可能与深度学习模型的本质相关。随着ChatGPT和GPT-4等模型的发布,越来越多的针对这些模型的越狱技术也会出现,其中一些技术可以绕过模型的安全措施,并输出有害响应。这对于广泛应用和依赖这些强大AI模型的现代社会来说,无疑是一个需要引起重视的问题。Ia228资讯网——每日最新资讯28at.com

总的来说,卡内基梅隆大学的研究团队提出的LLMAttacks算法为针对大型语言模型的对抗攻击提供了一种新的、更高效的方法。然而,其对LLM安全性带来的挑战也需要得到深入研究和重视。随着技术的不断发展,保障AI模型的安全性将成为AI领域亟待解决的重要问题。Ia228资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-878-0.htmlLLM Attacks:新算法构建针对大型语言模型的对抗攻击

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全球招聘办公室设立数十岗位 苹果投入大语言模型研究

下一篇: 生成式AI助理Aria:Opera重磅推出全新浏览器Opera One

标签:
  • 热门焦点
  • 错过了BRC20还有eths,eth铭文协议

    来源:三头鸟NFT大家好,我是鸟哥,了解鸟哥的人都知道鸟哥擅撸空投,说实话撸毛虽然回报大但周期还是有点长的,所以除了撸毛我们自己也在研究早期项目,打新,比如BRC20协议ordi当时就有
  • 虚拟人再升级,企业可以解放双手了?

    来源:伯虎财经今天想跟大家来唠唠AI,其实聊到这个话题很多人都不陌生了。在ChatGPT和AIGC大热背后,还有一位低调的“大佬”——虚拟人。比如咱们熟知的虚
  • “平均时代”:ChatGPT模仿秀的隐喻

    来源:锦缎如果你问ChatGPT,Instagram上最美的女人是谁?它很可能会给你一个名字,叫卡戴珊。如果你观察过Instagram这个美版小红书:平台上的所有网红,展现的几乎是统一面孔:统一的医
  • 挖来Meta AR高管,难道苹果也要进军元宇宙?

    “被曝光”的才是最吸引人的产品,相信有关注过苹果硬件消息的朋友们都明白这样的道理。往近了说有苹果“即将发布”的iPhone SE 3和M2芯片,往远了说有“折叠屏iP
  • 保时捷推出虚拟超跑,车企元宇宙营销这么香?

    保时捷又出超跑了,不过这次不是在现实世界,而是在虚拟世界。这款Vision Gran Turismo概念车,由保时捷和日本视频游戏开发工作室Polyphony Digital联合打造,将于202
  • 以太坊伦敦升级后,随之生效的以太坊EIP-1559是什么?

    作者:三黎过去的一年里,除了 BTC 一如既往稳坐王位,DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时,也使得其网络日渐拥堵、交易费用增高,成为
  • NFT:新骗局的狩猎场

    骗局的自动化需要更好的防御,从数字身份开始。前几天我在OpenSea上购买了一个NFT,是才华横溢的艺术家海伦·福尔摩斯 (Helen Holmes) 的漫画,来自她的 "原作 "收
  • 利用元宇宙平台10天收入160万,风口还是虎口?

    美国Meta平台有限公司,也就是原来的脸书公司,9日宣布,公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象
  • 虚拟偶像行业的商用价值逐渐凸显,IP生态圈也逐渐成型

    六月的第一个周六,一场虚拟偶像七海Nana7mi的个人3D演唱会在万代南梦宫上海文化中心举行,相较于洛天依、百大UP主泠鸢yousa等,这位虚拟Up主在B站上的粉丝数43.6万
Top