当前位置:首页 > 科技  > 数码

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeek

来源: 责编: 时间:2025-02-08 12:17:34 201观看
导读 快科技2月6日消息,短短两周,DeepSeek成为全球增速快的AI应用,凭借卓越的性能、广泛的应用场景,俨然成为行业标杆,适配和部署也得到了全行业的鼎力支持,昆仑芯现在也加入了这一行列。昆仑芯前身为百度智能芯片及架

快科技2月6日消息,短短两周,DeepSeek成为全球增速快的AI应用,凭借卓越的性能、广泛的应用场景,俨然成为行业标杆,适配和部署也得到了全行业的鼎力支持,昆仑芯现在也加入了这一行列。VLQ28资讯网——每日最新资讯28at.com

昆仑芯前身为百度智能芯片及架构部,2021年4月完成独立融资,首轮估值约130亿元,在国内早布局AI加速领域,在体系结构、芯片实现、软件系统、场景应用上均有深厚积累。VLQ28资讯网——每日最新资讯28at.com

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeekVLQ28资讯网——每日最新资讯28at.com

就在2月5日,也就是蛇年开工当天,昆仑芯新一代产品P800万卡集群点亮,3万卡集群也将于近日点亮。VLQ28资讯网——每日最新资讯28at.com

目前,昆仑芯已完成Deepseek训练推理的全版本适配,而且性能卓越,可一键部署,成本效率极高。VLQ28资讯网——每日最新资讯28at.com

事实上,DeepSeek-V3/R1上线不久,昆仑芯便率先完成了全版本模型适配,包括DeepSeek MoE模型及其蒸馏的Llama/Qwen等小规模dense模型。VLQ28资讯网——每日最新资讯28at.com

同时,昆仑芯也已全面适配文心系列、Llama、Qwen、ChatGLM、Baichuan等各类大模型的推理和训练任务,性能优势明显,并上线运行各类大模型任务。VLQ28资讯网——每日最新资讯28at.com

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeekVLQ28资讯网——每日最新资讯28at.com

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeekVLQ28资讯网——每日最新资讯28at.com

据介绍,昆仑芯P800可以较好底支撑Deepseek系列MoE模型大规模训练任务,全面支持MLA、多专家并行等特性,只需32台即可支持模型全参训练,高效完成模型持续训练和微调。VLQ28资讯网——每日最新资讯28at.com

P800的显存规格优于同类主流GPU 20-50%,对MoE架构更加友好,且率先支持8bit推理,单机8卡即可运行671B模型,因此更易于部署,可显著降低运行成本。VLQ28资讯网——每日最新资讯28at.com

目前,P800已经快速适配支持了Deepseek-V3/R1的持续全参数训练,LoRA等PEFT能力,提供给用户开箱即用的训练体验。VLQ28资讯网——每日最新资讯28at.com

基于昆仑芯完整的软件生态栈,只需两步,就可以轻松实现在昆仑芯P800上进行DeepSeek-V3/R1推理部署。VLQ28资讯网——每日最新资讯28at.com

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeekVLQ28资讯网——每日最新资讯28at.com

1、资源准备VLQ28资讯网——每日最新资讯28at.com

主要是镜像和模型,镜像提供完整的依赖环境开箱即用。VLQ28资讯网——每日最新资讯28at.com

昆仑芯P800支持8bit推理,下载官方权重后使用如下命令进行量化;其他不同尺寸蒸馏模型则通过huggingface下载即可。VLQ28资讯网——每日最新资讯28at.com

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeekVLQ28资讯网——每日最新资讯28at.com

2、启动服务&请求示例VLQ28资讯网——每日最新资讯28at.com

server和client使用方式和vllm社区基本一致,零成本上手。VLQ28资讯网——每日最新资讯28at.com

启动服务可在镜像中一键启动,采样和推理参数可根据实际业务场景在脚本中配置。VLQ28资讯网——每日最新资讯28at.com

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeekVLQ28资讯网——每日最新资讯28at.com

下图为一个简单的请求示例:VLQ28资讯网——每日最新资讯28at.com

3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeekVLQ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-129220-0.html3万卡集群点亮!国产AI加速卡昆仑芯全面适配DeepSeek

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: NVIDIA干嘛呢!玩家入手公版RTX 5080 却打着RTX 5090的标

下一篇: RTX 5080/5090系列显卡玩《绝地求生》崩溃!开发商:建议安装英伟达新驱动

标签:
  • 热门焦点
  • 太卷!Redmi MAX 100英寸电视便宜了:12999元买Redmi史上最大屏

    8月5日消息,从小米商城了解到,Redmi MAX 100英寸巨屏电视日前迎来官方优惠,到手价12999元,比发布价便宜了7000元,在大屏电视市场开卷。据了解,Redmi MAX 100
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 如何使用JavaScript创建一只图像放大镜?

    译者 | 布加迪审校 | 重楼如果您曾经浏览过购物网站,可能遇到过图像放大功能。它可以让您放大图像的特定区域,以便浏览。结合这个小小的重要功能可以大大改善您网站的用户体验
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 东方甄选单飞:有些鸟注定是关不住的

    作者:彭宽鸿来源:华尔街科技眼‍‍‍‍‍‍‍‍‍‍东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
Top