当前位置:首页 > 科技  > 数码

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

来源: 责编: 时间:2024-10-01 17:06:37 198观看
导读 快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。AMD-135小模

快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。rIP28资讯网——每日最新资讯28at.com

相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。rIP28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍rIP28资讯网——每日最新资讯28at.com

AMD-135小模型隶属于Llama家族,有两个版本:rIP28资讯网——每日最新资讯28at.com

一是基础型“AMD-Llama-135M”,拥有多达6700亿个token,在八块Instinct MIM250 64GB加速器上训练了六天。rIP28资讯网——每日最新资讯28at.com

二是延伸型“AMD-Llama-135M-code”,额外增加了专门针对编程的200亿个token,同样硬件训练了四天。rIP28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍创建与部署流程rIP28资讯网——每日最新资讯28at.com

它使用了一种名为“推测解码”(speculative decoding)的方法,通过较小的草稿模型,在单次前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型,进行验证或纠正。rIP28资讯网——每日最新资讯28at.com

这种方法可以同时生成多个token,不会影响性能,还可以降低内存占用,但因为数据交易更多,功耗也会增加。rIP28资讯网——每日最新资讯28at.com

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型,测试了推测解码使用与否的性能。rIP28资讯网——每日最新资讯28at.com

比如在MI250加速器上,性能可提升多约2.8倍,锐龙AI CPU上可提升多约3.88倍,锐龙AI NPU上可提升多约2.98倍。rIP28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍推测解码rIP28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍rIP28资讯网——每日最新资讯28at.com

AMD-135M小模型的训练代码、数据集等资源都已经开源,遵循Apache 2.0。rIP28资讯网——每日最新资讯28at.com

按照AMD的说法,它的性能与其他开源小模型基本相当或略有领先,比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。rIP28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍rIP28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-117135-0.htmlAMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 锐龙7 9800X3D缓存不变还是104MB:频率大涨!

下一篇: AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

标签:
  • 热门焦点
  • 石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    科技圈经常能看到一个词叫“缝合怪”,用来形容那些把好多功能或者外观结合在一起的产品,通常这样的词是贬义词,但如果真的是产品缝合的好、缝合的实用的话,那它就成了中性词,今
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 猿辅导与新东方的两种“归途”

    作者|卓心月 出品|零态LT(ID:LingTai_LT)如何成为一家伟大企业?答案一定是对“势”的把握,这其中最关键的当属对企业战略的制定,且能够站在未来看现在,即使这其中的
  • 疑似小米14外观设计图曝光:后置相机模组变化不大

    下半年的大幕已经开启,而谁将成为下半年手机圈的主角就成为了大家关注的焦点,其中被传有望拿下新一代骁龙8 Gen3旗舰芯片的小米14系列更是备受大家瞩
  • DRAM存储器10月价格下跌,NAND闪存本月价格与上月持平

    10月30日,据韩国媒体消息,自今年年初以来一直在上涨的 DRAM 存储器的交易价格仅在本月就下跌了近 10%,此次是全年首次降价,而NAND 闪存本月价格与上月持平。市
  • 亲历马斯克血洗Twitter,硅谷的苦日子在后头

    文/刘哲铭  编辑/李薇  马斯克再次挥下裁员大刀。  美国时间11月14日,Twitter约4400名外包员工遭解雇,此次被解雇的员工的主要工作为内容审核等。此前,T
Top