当前位置:首页 > 科技  > 手机

安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s

来源: 责编: 时间:2025-02-15 15:50:16 127观看
导读 快科技2月14日消息,安谋科技宣布,搭载新一代“周易”NPU处理器的硬件平台,已经成功在端侧部署并运行DeepSeek-R1系列模型,而且性能卓越、成本优异。新款“周易”NPU采用专为AI大模型特性优

快科技2月14日消息,安谋科技宣布,搭载新一代“周易”NPU处理器的硬件平台,已经成功在端侧部署并运行DeepSeek-R1系列模型,而且性能卓越、成本优异。8k828资讯网——每日最新资讯28at.com

新款“周易”NPU采用专为AI大模型特性优化的架构设计,Beta测试版本已在2024年底向早期用户开放评估测试,预计今年上半年正式发布亮相。8k828资讯网——每日最新资讯28at.com

安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s8k828资讯网——每日最新资讯28at.com

DeepSeek-R1 1.5B、7B蒸馏版本推出后,安谋科技新一代“周易”NPU在很短的时间内,就在Emulation平台上完成了部署与优化,并在FPGA平台上成功实现了端到端应用的演示。8k828资讯网——每日最新资讯28at.com

测试显示,在标准单批次输入、上下文长度为1024的测试环境中,新款“周易”NPU在首字计算阶段的算力利用率突破40%,解码阶段的有效带宽利用率超过80%。8k828资讯网——每日最新资讯28at.com

带宽利用率呈现高线性特性,能够灵活适配16GB/s至256GB/s的系统带宽需求。8k828资讯网——每日最新资讯28at.com

7B版本、1024上下文长度的场景下,保障模型应用精度的同时,新款“周易”NPU的高处理速度可达每秒40 tokens,并支持动态长度的模型推理输入。8k828资讯网——每日最新资讯28at.com

安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s8k828资讯网——每日最新资讯28at.com

这也展现了安谋科技软件栈对大模型的成熟支持、深度优化,包括动态推理优化和硬件算力潜力的挖掘,从而显著提升推理速度和吞吐量。8k828资讯网——每日最新资讯28at.com

目前,软件栈已支持Llama、Qwen、DeepSeek、ChatGLM、MiniCPM等多种主流大模型,并提供与Hugging Face模型库的对接工具链,方便直接部署主流模型。8k828资讯网——每日最新资讯28at.com

硬件层面,新一代“周易”NPU采用7nm工艺制造,单Cluster算力高可达80 TOPS(每秒80万亿次计算),能够轻松应对超过16K上下文长度的大模型部署需求,同时对外带宽提高至256GB/s,解决大模型计算的带宽瓶颈问题。8k828资讯网——每日最新资讯28at.com

它还全面支持FP16数据精度计算,完整支持INT4软硬量化加速,还支持多核算力扩展,满足端侧模型的低首字延迟需求。8k828资讯网——每日最新资讯28at.com

它还具备强大的多任务并行处理能力,通过细粒度的任务调度和优先级资源分配,实现多任务灵活切换,确保传统语音、视觉业务、大模型应用的高效协同。8k828资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-130640-0.html安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: iPhone 17 Pro渲染图出炉:神似小米11 Ultra 工业设计焕然一新

下一篇: 女生刷同一视频6小时后手机烧屏:画面超崩溃 再也抹不掉了

标签:
  • 热门焦点
  • Redmi Pad评测:红米充满野心的一次尝试

    从Note系列到K系列,从蓝牙耳机到笔记本电脑,红米不知不觉之间也已经形成了自己颇有竞争力的产品体系,在中端和次旗舰市场上甚至要比小米新机的表现来得更好,正所谓“大丈夫生居
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • 企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 深度探索 Elasticsearch 8.X:function_score 参数解读与实战案例分析

    在 Elasticsearch 中,function_score 可以让我们在查询的同时对搜索结果进行自定义评分。function_score 提供了一系列的参数和函数让我们可以根据需求灵活地进行设置。近期
  • 每天一道面试题-CPU伪共享

    前言:了不起:又到了每天一到面试题的时候了!学弟,最近学习的怎么样啊 了不起学弟:最近学习的还不错,每天都在学习,每天都在进步! 了不起:那你最近学习的什么呢? 了不起学弟:最近在学习C
  • 支持aptX Lossless无损传输 iQOO TWS 1赛道版发布限时优惠价369元

    2023年7月4日,“无损音质,声动人心”iQOO TWS 1正式发布,支持aptX Lossless无损传输,限时优惠价369元。iQOO TWS 1耳机率先支持端到端aptX Lossless无
  • iQOO Neo8 Pro抢先上架:首发天玑9200+ 安卓性能之王

    经过了一段时间的密集爆料,昨日iQOO官方如期对外宣布:将于5月23日推出全新的iQOO Neo8系列新品,官方称这是一款拥有旗舰级性能调校的作品。随着发布时
Top