当前位置:首页 > 元宇宙 > AI

清华开源“赤兔Chitu”引擎,国产AI芯片迎来FP8精度模型新突破

来源: 责编: 时间:2025-03-15 14:57:04 154观看
导读近日,清华大学高性能计算研究所的翟季冬教授团队携手清华背景的科技创新企业清程极智,共同发布了一款名为“赤兔Chitu”的开源大模型推理引擎。这款引擎实现了在非英伟达Hopper架构GPU以及多种国产芯片上原生运行FP8精

近日,清华大学高性能计算研究所的翟季冬教授团队携手清华背景的科技创新企业清程极智,共同发布了一款名为“赤兔Chitu”的开源大模型推理引擎。这款引擎实现了在非英伟达Hopper架构GPU以及多种国产芯片上原生运行FP8精度模型,为国产AI芯片的广泛应用和生态建设带来了历史性的突破。pqI28资讯网——每日最新资讯28at.com

赤兔引擎通过底层技术的革新,成功打破了特定硬件的限制,使得非H卡设备(包括英伟达Hopper架构之前的GPU卡及多种国产芯片)能够高效部署原生FP8模型。这一突破极大地降低了企业部署AI模型的门槛和成本,为AI技术的普及和应用提供了强有力的支持。pqI28资讯网——每日最新资讯28at.com

翟季冬教授表示,赤兔引擎凝聚了团队多年在并行计算与编译优化领域的深厚积累,旨在消除先进模型与多样化硬件之间的鸿沟,让国产算力真正发挥潜力,为中国大模型产业的落地提供坚实的支撑。清程极智的CEO汤雄超则强调,赤兔引擎的定位是成为连接多元算力与大模型应用的桥梁,不仅支持英伟达全系列GPU,还针对国产芯片进行了深度优化,未来将陆续推出适配不同芯片的开源版本。pqI28资讯网——每日最新资讯28at.com

在首期开源版本中,赤兔引擎在A800集群上部署DeepSeek-R1-671B满血版时,相比部分国外开源框架,在GPU使用量减少50%的情况下,推理速度仍实现了3.15倍的提升。这一显著的性能提升意味着企业能够以更少的硬件资源获得更高的推理性能,从而极大地降低了部署门槛和运营成本。pqI28资讯网——每日最新资讯28at.com

赤兔引擎的目标非常明确,即满足从纯CPU到大规模集群的全场景大模型部署需求,适配英伟达多款GPU及多种国产芯片。同时,针对市场上不同的大模型算力优化需求,赤兔引擎提供了低延迟、高吞吐、小显存三方面的优化方案,确保以最低的成本实现最高的性能。这种设计理念使得集成赤兔引擎的大模型部署服务能够覆盖广泛的客户群体。pqI28资讯网——每日最新资讯28at.com

从底层设计上,赤兔引擎就将“算力效率”作为首要优化目标,力求在资源消耗最低的情况下实现性能的最大化输出。这一理念贯穿于赤兔引擎的每一个细节,确保其在各种应用场景中都能发挥出色的表现。pqI28资讯网——每日最新资讯28at.com

为了进一步简化企业AI落地流程,清程极智还推出了基于赤兔引擎的“推理一体机”。这款一体机提供了开箱即用的部署方案以及专业的运维服务,使得企业能够更加便捷地应用AI技术,提升业务效率。pqI28资讯网——每日最新资讯28at.com

为了加速生态建设,赤兔团队与多家国产芯片厂商展开了紧密的合作,开放了代码贡献通道,缩短了硬件适配周期。汤雄超表示:“开源不仅是技术共享,更是为国产芯片‘抢时间’。当新的模型或数据类型出现时,赤兔引擎能够助力国产芯片迅速跟上国际节奏,缩小与国际先进芯片之间的时间差距。”pqI28资讯网——每日最新资讯28at.com

赤兔引擎的发布标志着中国在AI芯片生态建设方面取得了重要进展,为国产芯片的应用和普及提供了强有力的支持。未来,随着赤兔引擎的不断优化和推广,相信将有更多的企业能够受益于这一先进的技术成果。pqI28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
百度地图首发智驾级车位导航,实现无缝泊车新体验!
百度地图首发智驾级车位导航,实现无缝泊车新体验!
比亚迪超级e平台:油电同速,充电技术再升级?
比亚迪超级e平台:油电同速,充电技术再升级?
南京5G-A低空通信专网领先业界:华为携手电信打造全新通信体验
南京5G-A低空通信专网领先业界:华为携手电信打造全新通信体验
陈小春25年钟情十万丰田小车,背后故事引人深思:何为真正幸福?
陈小春25年钟情十万丰田小车,背后故事引人深思:何为真正幸福?
小鹏G6与G9焕新上市,AI科技引领智能出行新时代!
小鹏G6与G9焕新上市,AI科技引领智能出行新时代!
广汽全球首秀!氢混乘用车天津示范运行万公里里程碑
广汽全球首秀!氢混乘用车天津示范运行万公里里程碑
热门内容
  • 夸克AI搜索升级“深度思考”,纯净浏览器迎来智能新篇章!
  • 浙大发布“浙大先生”,深度融合智能体DeepSeek V3/R1全国高校共享!
  • 00后主播借AI工具DeepSeek,直播单日狂揽3.3亿销售额!
  • 夸克AI搜索升级“深度思考”,阿里自研模型加持,DeepSeek暂缺席
  • 微信生活服务添新成员,元宝App下载入口限时开放
  • 微信接入AI新模型,腾讯股价暴涨近3000亿!
  • 中国AI新突破!全球首款通用Agent产品Manus内测引热议
  • 华为发布DeepSeek超融合一体机,全面适配V3&R1及蒸馏模型,加速AI应用
  • AI大模型时代,文科生将何去何从?
  • 马斯克xAI发布Grok-3,杭州才子吴宇怀领衔创始团队亮相
  • 浙大AI团队开播DeepSeek系列公开课,每周五晚相约云端探秘
  • 百度PC端DeepSeek入口上线,1小时破千万用户尝鲜AI搜索新体验!
  • 悟空浏览器牵手DeepSeek R1,抖音内容生态将迎新变化?
  • 阿里新夸克AI超级框上线,能否撼动腾讯元宝的AI入口地位?
  • 夸克AI搜索新增“深度思考”,纯净浏览器变身智能提效神器!
本栏最新
AI虚拟人时代:Meta与微美全息共绘数字人高效生成新篇章
AI虚拟人时代:Meta与微美全息共绘数字人高效生成新篇章
华硕a豆14 Air悦享版评测:轻薄高颜值,AI加持生产力爆棚
华硕a豆14 Air悦享版评测:轻薄高颜值,AI加持生产力爆棚
AI梦工厂!伯克利一实验室孵化15位创业者,华人力量闪耀大模型机器人搜索领域
AI梦工厂!伯克利一实验室孵化15位创业者,华人力量闪耀大模型机器人搜索领域
优必选联手国家队,天工行者29.9万重塑全尺寸科研人形机器人市场格局
优必选联手国家队,天工行者29.9万重塑全尺寸科研人形机器人市场格局
本周AI大事件:绿洲入口开启,智能体、图像生成突破不断!
本周AI大事件:绿洲入口开启,智能体、图像生成突破不断!
荣耀文档携手DeepSeek,YOYO智能体升级打造一站式AI创作新体验
荣耀文档携手DeepSeek,YOYO智能体升级打造一站式AI创作新体验

本文链接:http://www.28at.com/showinfo-45-11509-0.html清华开源“赤兔Chitu”引擎,国产AI芯片迎来FP8精度模型新突破

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 阿里达摩院技术大牛鄢志杰离职,语音技术领域或将迎来新变局?

下一篇: AI虚拟人时代:Meta与微美全息共绘数字人高效生成新篇章

标签:
  • 热门焦点
  • AI界地震!美国对OpenAI展开调查!监管风暴来袭!

    来源:清元宇宙还记得5月OpenAI在国会山听证会上的自信、坦诚、游刃有余的问答吗?那时的Sam Altman可谓意气风发,在耐心、友好的国会议员面前,就AI立法、大模型安全性问题侃侃而
  • 人间诚实周鸿祎:360 All in 大模型的六个解读

    主笔 / 村口有牛文章架构师 / 毛自聪出品 / 巨头财经5月至今,人间躁动,各路大模型你方唱罢我登场,VC圈互联网圈媒体圈已近癫狂。谁也没想到,今日,360再度刷屏,老牌互联网巨头展现
  • 元宇宙里卖酸奶,好炸裂的操作!

    作者 | 李东阳 来源 | 首席营销官有没有发现,当下的热搜出现一个有意思的现象,那就是“情怀”不知不觉成为了主流,爷青回话题讨论性非常高。前有名侦探柯南和优衣库
  • 亚马逊AIGC全家桶来袭,巨头AI大乱战都有什么杀手锏

    此前,亚马逊云科技发布多款AIGC产品,其中包括AI大模型服务Amazon Bedrock、人工智能计算实例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型、软件
  • Layer1的新以太坊,更好的以太坊?

    以太坊作为区块链基础设施地位看起来已不可动摇,但也面临着费用高、效率低、偏离去中心化初衷等问题。平台上既得利益群体的形成和固化也逐渐让革新变得困难。
  • 元宇宙时代NFT的价值衡量

    有人认为NFT的高昂价格只是炒作的产物,并不具有其对等的价值,但其实NFT并不是空中楼阁,只是区块链数字分类账中的一种形式。诚然,目前的NFT仍处于灰色地带,相关的法
  • 元宇宙是推动NFT发展的初始家园

    现在大家都知道了什么是NFT,但好像离自己的生活还有一定距离。随着我们与NFT 接触增加,该如何将这些数字资产带入我们的日常生活?NFT还是主流吗?如果我们将“主流
  • 百度虚拟人——AI手语主播首次亮相冬奥会!

    除了火遍全国的冰墩墩,虚拟人也成为这届冬奥会的一大亮点元素。以体育明星谷爱凌为原型的数智人Meet Gu最先亮相。在2月5日谷爱凌首秀、2月7日谷爱凌首金的两天
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念

最新推荐

猜你喜欢

热门推荐

相关资讯

Top