Meta公司,最近宣布了一项重要计划——Purple Llama计划,旨在推广大型语言模型(LLM)的安全评测工具。这一计划的推出,无疑将为LLM的安全性和可靠性提供更为全面的保障。
Llama模型在2月发布,有70亿至650亿个参数的四种大小版本,主要供学术研究使用。7月,Meta发布了Llama 2,包含70亿、130亿、700亿个参数的三种大小版本,不仅供学术界使用,还向商业界开放,但使用条款仍施加了一定的限制。自Llama系列模型发布以来,其总下载次数已经突破了1亿次的大关。
Purple Llama计划是一项具有创新性的计划,它借鉴了网络安全的红队和蓝队协作的理念,融合成了紫队。这个计划包括CyberSec Eval,这是一个专门为LLM设计的安全评估基准,以及Llama Guard,一个用于过滤模型输入和输出数据的安全分类器。这些工具可以帮助开发者量化LLM的网络安全风险,评估LLM产出危险程序码建议的频率,并使LLM更难以产生恶意程序码或助长网络攻击。
除了Meta之外,微软和亚马逊等公司也在积极参与到这个计划中来。微软和Meta都派代表参与了数码发展部启动的AI产品与系统评测中心。这个评测中心将以语言模型为评测对象,参考欧美的规范,制定出10项评测项目,包括安全性、可解释性、弹性、公平性、准确性、透明性、当责性、可靠性、隐私及网安等方面。
Meta的Purple Llama计划不仅是对LLM安全性的一种保障,也是对全球人工智能发展的一种贡献。随着人工智能技术的不断发展,我们期待看到更多这样的计划和合作的出现,共同推动人工智能技术的进步和发展。
本文链接:http://www.28at.com/showinfo-27-42132-0.htmlMeta推出Purple Llama计划,推动LLM安全评测工具的普及
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com
上一篇: 「天河星逸」超级电脑:运算能力倍增