当前位置:首页 > 科技  > 软件

清华开源赤兔大模型推理引擎,国产芯片上DeepSeek推理成本减半性能翻倍

来源: 责编: 时间:2025-03-15 14:54:42 143观看
导读清华大学高性能计算研究所传来重要消息,翟季冬教授团队携手清华系科创先锋清程极智,共同宣布了一项重大开源成果——大模型推理引擎“赤兔 Chitu”。这款引擎开创性地实现了在非英伟达Hopper架构GPU及众多国产芯片上的F

清华大学高性能计算研究所传来重要消息,翟季冬教授团队携手清华系科创先锋清程极智,共同宣布了一项重大开源成果——大模型推理引擎“赤兔 Chitu”。wPq28资讯网——每日最新资讯28at.com

这款引擎开创性地实现了在非英伟达Hopper架构GPU及众多国产芯片上的FP8精度模型原生运行,显著降低了推理成本,性能更是实现了翻倍。据悉,赤兔引擎被精准定位为“生产级大模型推理引擎”,旨在为用户带来多重优势。wPq28资讯网——每日最新资讯28at.com

首先,赤兔引擎具备强大的多元算力适配能力。无论是NVIDIA的最新旗舰产品,还是旧款的多系列产品,亦或是国产芯片,赤兔引擎都能提供优化的支持,确保了广泛的兼容性。wPq28资讯网——每日最新资讯28at.com

其次,赤兔引擎全场景可伸缩的特性使其应用场景更加灵活。无论是纯CPU部署、单GPU部署,还是大规模集群部署,赤兔引擎都能提供可扩展的解决方案,满足不同场景下的需求。wPq28资讯网——每日最新资讯28at.com

赤兔引擎的长期稳定运行能力也是其一大亮点。在实际生产环境中,赤兔引擎的稳定性足以承载高并发的业务流量,确保了业务的连续性和稳定性。wPq28资讯网——每日最新资讯28at.com

在部署DeepSeek-R1-671B满血版时,赤兔引擎在A800集群的测试中展现出了卓越的性能。与部分国外开源框架相比,赤兔引擎在实现GPU使用量减少50%的同时,推理速度还提升了3.15倍,这一成绩无疑令人瞩目。wPq28资讯网——每日最新资讯28at.com

对于广大开发者和用户而言,赤兔引擎的开源无疑是一个巨大的福音。现在,大家可以通过访问GitHub上的开源地址(https://github.com/thu-pacman/chitu),轻松获取并体验这款强大的大模型推理引擎。wPq28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-136913-0.html清华开源赤兔大模型推理引擎,国产芯片上DeepSeek推理成本减半性能翻倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 奇瑞星纪元ET纯电版SUV焕新上市,3月18日见证科技新飞跃!

下一篇: A17 Pro芯片揭秘:存在两版本,新版发热功耗问题得改善?

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • K60至尊版狂暴引擎2.0加持:超177万跑分斩获性能第一

    Redmi的后性能时代战略发布会今天下午如期举办,在本次发布会上,Redmi公布了多项关于和联发科的深度合作,以及新机K60 Ultra在软件和硬件方面的特性,例如:“K60 至尊版,双芯旗舰
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 东方甄选单飞:有些鸟注定是关不住的

    文/彭宽鸿编辑/罗卿东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一年多时间里,东方甄选要脱离抖音自立门户的传闻不绝于耳,“7
  • 疑似小米14外观设计图曝光:后置相机模组变化不大

    下半年的大幕已经开启,而谁将成为下半年手机圈的主角就成为了大家关注的焦点,其中被传有望拿下新一代骁龙8 Gen3旗舰芯片的小米14系列更是备受大家瞩
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
  • DRAM存储器10月价格下跌,NAND闪存本月价格与上月持平

    10月30日,据韩国媒体消息,自今年年初以来一直在上涨的 DRAM 存储器的交易价格仅在本月就下跌了近 10%,此次是全年首次降价,而NAND 闪存本月价格与上月持平。市
Top