当前位置:首页 > 元宇宙 > AI

LLM Attacks:新算法构建针对大型语言模型的对抗攻击

来源: 责编: 时间:2023-08-15 18:47:25 166观看
导读8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种

8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种算法,攻击者可以自动生成一系列提示后缀,绕过LLM的安全机制,并导致LLM输出有害的响应。e3Z28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,与传统的“越狱”攻击不同,CMU团队设计的LLMAttacks算法采用了一个三步过程,自动创建有害提示后缀。首先,攻击者需要创建一个目标令牌序列,类似于“Sure, here is (content ofquery)”,其中“content ofquery”是用户实际的提示,要求有害响应。接下来,算法使用贪婪坐标梯度(GCG)方法,生成能导致LLM输出目标序列的提示后缀,尽管这确实需要访问LLM。e3Z28资讯网——每日最新资讯28at.com

该研究还通过基准测试AdvBench评估了LLM Attacks算法的有效性。在这个基准测试上,LLMAttacks对名为Vicuna的LLM的成功率达到了惊人的88%,而基线对抗算法的成功率却仅为25%。这表明新的LLMAttacks算法具有更高的攻击成功率,可能对LLM提供商构成潜在威胁。e3Z28资讯网——每日最新资讯28at.com

值得担忧的是,这种对抗攻击是否能被LLM提供商完全修复仍然是一个悬念。类似的对抗攻击在计算机视觉领域已经被证明是一个难以解决的问题,可能与深度学习模型的本质相关。随着ChatGPT和GPT-4等模型的发布,越来越多的针对这些模型的越狱技术也会出现,其中一些技术可以绕过模型的安全措施,并输出有害响应。这对于广泛应用和依赖这些强大AI模型的现代社会来说,无疑是一个需要引起重视的问题。e3Z28资讯网——每日最新资讯28at.com

总的来说,卡内基梅隆大学的研究团队提出的LLMAttacks算法为针对大型语言模型的对抗攻击提供了一种新的、更高效的方法。然而,其对LLM安全性带来的挑战也需要得到深入研究和重视。随着技术的不断发展,保障AI模型的安全性将成为AI领域亟待解决的重要问题。e3Z28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-878-0.htmlLLM Attacks:新算法构建针对大型语言模型的对抗攻击

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全球招聘办公室设立数十岗位 苹果投入大语言模型研究

下一篇: 生成式AI助理Aria:Opera重磅推出全新浏览器Opera One

标签:
  • 热门焦点
  • 元宇宙里卖酸奶,好炸裂的操作!

    元宇宙里卖酸奶,好炸裂的操作!

    作者 | 李东阳 来源 | 首席营销官有没有发现,当下的热搜出现一个有意思的现象,那就是“情怀”不知不觉成为了主流,爷青回话题讨论性非常高。前有名侦探柯南和优衣库
  • 不同于传统数字经济,元宇宙赋予商业生态更多数字资产价值!

    不同于传统数字经济,元宇宙赋予商业生态更多数字资产价值!

    作者:中科基大数据元宇宙是一个去中心化的开放平台,而为了维护这样的平台,需要建立一个公平的游戏规则,确保每个元宇宙的参与者通过这个规则都可以挣到钱,他们的利益都可以得到保
  • 聚焦虚拟数字人技术,这三大商机要抓住!

    聚焦虚拟数字人技术,这三大商机要抓住!

    关于虚拟数字人,企业可以从三个方面入局,分别是ToG(To Government,面向政府),即为数字政府和数字城市提供支持服务;ToB(To Business,面向企业),即为企业提供虚拟员工解决方案;ToC(To Cons
  • 元宇宙步入暗夜

    元宇宙步入暗夜

    撰文 | 文烨豪元宇宙的故事,似乎讲不通了。 当下,刮起元宇宙热潮的Roblox股价已跌去大半,带头大哥Meta也正因元宇宙亏损深陷泥潭。 再看国内,从字节“派对岛&
  • 区块链产业人才发展报告

    区块链产业人才发展报告

    工业和信息化部作为工业和信息化行业主管部门,正在着力推进“两个强国”建设,加快推动以区块链为代表的新兴技术与实体经济深度融合。我国区块链技术和应用想要
  • 银保监会:打击以“元宇宙”为名义的违法行为

    银保监会:打击以“元宇宙”为名义的违法行为

    今日,银保监会发布《关于防范以“元宇宙”名义进行非法集资的风险提示》,全文如下:近期,一些不法分子蹭热点,以“元宇宙投资项目”“元宇宙链游”等名目吸收资金,涉
  • 「国产良心」NFT嘲讽了谁?

    「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • NFTs正迎来数十亿美元的繁荣--NFT零工经济从业者开始暴赚

    NFTs正迎来数十亿美元的繁荣--NFT零工经济从业者开始暴赚

    当Stefan Prodanovic在13岁时开始尝试平面设计,与一位从事编程工作的学校朋友共同创作数字游戏时,他从未料到这个爱好会在他成年后变成一个相当有利可图的生意。
  • 3月份值得关注的5个NFT项目

    3月份值得关注的5个NFT项目

    2021年,我们见证了一个新的创造者经济的诞生。它是在区块链上诞生的。自从NFT成为流行文化的中心舞台以来,有些艺术家们已经成为了NFT的超级明星,在几个月的时间
Top