当前位置:首页 > 科技  > 数码

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

来源: 责编: 时间:2024-10-01 17:06:37 203观看
导读 快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。AMD-135小模

快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。8Kf28资讯网——每日最新资讯28at.com

相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。8Kf28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍8Kf28资讯网——每日最新资讯28at.com

AMD-135小模型隶属于Llama家族,有两个版本:8Kf28资讯网——每日最新资讯28at.com

一是基础型“AMD-Llama-135M”,拥有多达6700亿个token,在八块Instinct MIM250 64GB加速器上训练了六天。8Kf28资讯网——每日最新资讯28at.com

二是延伸型“AMD-Llama-135M-code”,额外增加了专门针对编程的200亿个token,同样硬件训练了四天。8Kf28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍创建与部署流程8Kf28资讯网——每日最新资讯28at.com

它使用了一种名为“推测解码”(speculative decoding)的方法,通过较小的草稿模型,在单次前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型,进行验证或纠正。8Kf28资讯网——每日最新资讯28at.com

这种方法可以同时生成多个token,不会影响性能,还可以降低内存占用,但因为数据交易更多,功耗也会增加。8Kf28资讯网——每日最新资讯28at.com

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型,测试了推测解码使用与否的性能。8Kf28资讯网——每日最新资讯28at.com

比如在MI250加速器上,性能可提升多约2.8倍,锐龙AI CPU上可提升多约3.88倍,锐龙AI NPU上可提升多约2.98倍。8Kf28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍推测解码8Kf28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍8Kf28资讯网——每日最新资讯28at.com

AMD-135M小模型的训练代码、数据集等资源都已经开源,遵循Apache 2.0。8Kf28资讯网——每日最新资讯28at.com

按照AMD的说法,它的性能与其他开源小模型基本相当或略有领先,比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。8Kf28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍8Kf28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-117283-0.htmlAMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 首款真正全白主板!技嘉X870E AORUS PRO ICE电竞冰雕首发评测:性能超上代旗舰

下一篇: 内存优化当下强!微星 MPG X870E CARBON WIFI暗黑板主板评测:游戏性能大幅强于顶级X670E

标签:
  • 热门焦点
  • 天猫精灵Sound Pro体验:智能音箱没有音质?来听听我的

    这几年除了手机作为智能生活终端最主要的核心之外,第二个可以成为中心点的产品是什么?——是智能音箱。 手机在执行命令的时候有两种操作方式,手和智能语音助手,而智能音箱只
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • Raft算法:保障分布式系统共识的稳健之道

    1. 什么是Raft算法?Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”(“可靠、可复制、可冗余、可容错”)的首字母缩写。Raft算法是一种用于在分布式系统
  • 28个SpringBoot项目中常用注解,日常开发、求职面试不再懵圈

    前言在使用SpringBoot开发中或者在求职面试中都会使用到很多注解或者问到注解相关的知识。本文主要对一些常用的注解进行了总结,同时也会举出具体例子,供大家学习和参考。注解
  • 掘力计划第 20 期:Flutter 混合开发的混乱之治

    在掘力计划系列活动第20场,《Flutter 开发实战详解》作者,掘金优秀作者,Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • 认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • 华为Mate 60保护壳曝光:硕大后置相机模组 凸起程度有惊喜

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
Top