当前位置:首页 > 科技  > 手机

安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s

来源: 责编: 时间:2025-02-15 15:50:16 234观看
导读 快科技2月14日消息,安谋科技宣布,搭载新一代“周易”NPU处理器的硬件平台,已经成功在端侧部署并运行DeepSeek-R1系列模型,而且性能卓越、成本优异。新款“周易”NPU采用专为AI大模型特性优

快科技2月14日消息,安谋科技宣布,搭载新一代“周易”NPU处理器的硬件平台,已经成功在端侧部署并运行DeepSeek-R1系列模型,而且性能卓越、成本优异。fLs28资讯网——每日最新资讯28at.com

新款“周易”NPU采用专为AI大模型特性优化的架构设计,Beta测试版本已在2024年底向早期用户开放评估测试,预计今年上半年正式发布亮相。fLs28资讯网——每日最新资讯28at.com

安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/sfLs28资讯网——每日最新资讯28at.com

DeepSeek-R1 1.5B、7B蒸馏版本推出后,安谋科技新一代“周易”NPU在很短的时间内,就在Emulation平台上完成了部署与优化,并在FPGA平台上成功实现了端到端应用的演示。fLs28资讯网——每日最新资讯28at.com

测试显示,在标准单批次输入、上下文长度为1024的测试环境中,新款“周易”NPU在首字计算阶段的算力利用率突破40%,解码阶段的有效带宽利用率超过80%。fLs28资讯网——每日最新资讯28at.com

带宽利用率呈现高线性特性,能够灵活适配16GB/s至256GB/s的系统带宽需求。fLs28资讯网——每日最新资讯28at.com

7B版本、1024上下文长度的场景下,保障模型应用精度的同时,新款“周易”NPU的高处理速度可达每秒40 tokens,并支持动态长度的模型推理输入。fLs28资讯网——每日最新资讯28at.com

安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/sfLs28资讯网——每日最新资讯28at.com

这也展现了安谋科技软件栈对大模型的成熟支持、深度优化,包括动态推理优化和硬件算力潜力的挖掘,从而显著提升推理速度和吞吐量。fLs28资讯网——每日最新资讯28at.com

目前,软件栈已支持Llama、Qwen、DeepSeek、ChatGLM、MiniCPM等多种主流大模型,并提供与Hugging Face模型库的对接工具链,方便直接部署主流模型。fLs28资讯网——每日最新资讯28at.com

硬件层面,新一代“周易”NPU采用7nm工艺制造,单Cluster算力高可达80 TOPS(每秒80万亿次计算),能够轻松应对超过16K上下文长度的大模型部署需求,同时对外带宽提高至256GB/s,解决大模型计算的带宽瓶颈问题。fLs28资讯网——每日最新资讯28at.com

它还全面支持FP16数据精度计算,完整支持INT4软硬量化加速,还支持多核算力扩展,满足端侧模型的低首字延迟需求。fLs28资讯网——每日最新资讯28at.com

它还具备强大的多任务并行处理能力,通过细粒度的任务调度和优先级资源分配,实现多任务灵活切换,确保传统语音、视觉业务、大模型应用的高效协同。fLs28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-130640-0.html安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: iPhone 17 Pro渲染图出炉:神似小米11 Ultra 工业设计焕然一新

下一篇: 女生刷同一视频6小时后手机烧屏:画面超崩溃 再也抹不掉了

标签:
  • 热门焦点
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • 6月安卓手机性能榜:vivo/iQOO霸占旗舰排行榜前三

    2023年上半年已经正式过去了,我们也迎来了安兔兔V10版本,在新的骁龙8Gen3和天玑9300发布之前,性能榜的榜单大体会以骁龙8Gen2和天玑9200+为主,至于那颗3.36GHz的骁龙8Gen2领先
  • 帅气纯真少年!日本最帅初中生选美冠军出炉

    日本第一帅哥初一生选美大赛冠军现已正式出炉,冠军是来自千叶县的宗田悠良。日本一直热衷于各种选美大赛,从“最美JK”起到“最美女星&r
  • 28个SpringBoot项目中常用注解,日常开发、求职面试不再懵圈

    前言在使用SpringBoot开发中或者在求职面试中都会使用到很多注解或者问到注解相关的知识。本文主要对一些常用的注解进行了总结,同时也会举出具体例子,供大家学习和参考。注解
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 自律,给不了Keep自由!

    来源 | 互联网品牌官作者 | 李大为编排 | 又耳 审核 | 谷晓辉自律能不能给用户自由暂时不好说,但大概率不能给Keep自由。近日,全球最大的在线健身平台Keep正式登陆港交所,努力
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
Top