当前位置:首页 > 元宇宙 > AI

LLM Attacks:新算法构建针对大型语言模型的对抗攻击

来源: 责编: 时间:2023-08-15 18:47:25 441观看
导读8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种

8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种算法,攻击者可以自动生成一系列提示后缀,绕过LLM的安全机制,并导致LLM输出有害的响应。E8z28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,与传统的“越狱”攻击不同,CMU团队设计的LLMAttacks算法采用了一个三步过程,自动创建有害提示后缀。首先,攻击者需要创建一个目标令牌序列,类似于“Sure, here is (content ofquery)”,其中“content ofquery”是用户实际的提示,要求有害响应。接下来,算法使用贪婪坐标梯度(GCG)方法,生成能导致LLM输出目标序列的提示后缀,尽管这确实需要访问LLM。E8z28资讯网——每日最新资讯28at.com

该研究还通过基准测试AdvBench评估了LLM Attacks算法的有效性。在这个基准测试上,LLMAttacks对名为Vicuna的LLM的成功率达到了惊人的88%,而基线对抗算法的成功率却仅为25%。这表明新的LLMAttacks算法具有更高的攻击成功率,可能对LLM提供商构成潜在威胁。E8z28资讯网——每日最新资讯28at.com

值得担忧的是,这种对抗攻击是否能被LLM提供商完全修复仍然是一个悬念。类似的对抗攻击在计算机视觉领域已经被证明是一个难以解决的问题,可能与深度学习模型的本质相关。随着ChatGPT和GPT-4等模型的发布,越来越多的针对这些模型的越狱技术也会出现,其中一些技术可以绕过模型的安全措施,并输出有害响应。这对于广泛应用和依赖这些强大AI模型的现代社会来说,无疑是一个需要引起重视的问题。E8z28资讯网——每日最新资讯28at.com

总的来说,卡内基梅隆大学的研究团队提出的LLMAttacks算法为针对大型语言模型的对抗攻击提供了一种新的、更高效的方法。然而,其对LLM安全性带来的挑战也需要得到深入研究和重视。随着技术的不断发展,保障AI模型的安全性将成为AI领域亟待解决的重要问题。E8z28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-878-0.htmlLLM Attacks:新算法构建针对大型语言模型的对抗攻击

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全球招聘办公室设立数十岗位 苹果投入大语言模型研究

下一篇: 生成式AI助理Aria:Opera重磅推出全新浏览器Opera One

标签:
  • 热门焦点
  • 亚马逊AIGC全家桶来袭,巨头AI大乱战都有什么杀手锏

    此前,亚马逊云科技发布多款AIGC产品,其中包括AI大模型服务Amazon Bedrock、人工智能计算实例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型、软件
  • 大厂元宇宙,又菜又爱玩

    撰文 | 吴先之 编辑 | 王 潘当下所有大厂推出的元宇宙产品,所能带来的沉浸式体验并不多,好在国内外科技巨头在bug方面都处在同一水平线。以Meta为例,由于VR头显设
  • 上海虹口成立10亿元元宇宙基金,香港首只元宇宙ETF拟上市

    区块链日报17日讯 今日《元宇宙新鲜事》有:上海虹口将成立总额约10亿元的元宇宙产业基金;香港市场首只元宇宙主题ETF拟于2月21日上市;元宇宙平台Roblox出现违禁游
  • 权限风波过后 X2Y2如何挑战OpenSea?

    继LooksRare之后,又一个OpenSea挑战者X2Y2来了。上周,X2Y2宣布向超过86万个OpenSea交易用户发放X2Y2通证空投,并启动了「挂单挖矿」的奖励机制。这场早期激励活动
  • 扎克伯格演示了一种“造物主”式的元宇宙语音机器人工具

    前身为Facebook的Meta公司今天展示了一个人工智能系统的Demo,该系统使人们能够通过语音命令生成或导入虚拟世界中的事物。该公司认为这个被称为 "Builder Bot "
  • 参加元宇宙里的招聘会是什么样一种体验?

    求职者可以在活动中走动,就像他们在现实生活中一样。长话短说看亮点:招聘公司Hirect为Y-combinator支持的初创公司举办了一场元宇宙招聘会。这里有一个大厅、一
  • 元宇宙需要的5个重要安全功能

    元宇宙的可能用途使其成为一个令人难以置信的概念,但是,就像科技界的任何事物一样,需要做一些事情来控制其使用。元宇宙的安全功能需要仔细考虑和开发,以保护用户
  • 如何在元宇宙中建立品牌忠诚度

    Snoop Dogg、耐克、苏富比和普华永道都有什么共同点?他们都投资于元宇宙的房地产。除了我们在屏幕上看到的二维世界--手机、笔记本电脑、台式机或iPad--他们决
  • 元宇宙存在的意义和价值

    科技公司目前都在犹豫,看谁能在元宇宙上押下更大的赌注。然而,除了巨额的资金投入,到底要怎样才能获胜在很大程度上还没有得到证实。它是否仅仅是对当前数字景观
Top