当前位置:首页 > 科技  > 数码

NVIDIA护城河20年来大更新!CUDA 13.1正式发布

来源: 责编: 时间:2025-12-11 09:46:46 4观看
导读 快科技12月7日消息,日前NVIDIA正式推出了CUDA 13.1,官方将其定位为“自2006年CUDA平台诞生以来大、全面的升级”。此次更新的核心亮点,是引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈入一个

快科技12月7日消息,日前NVIDIA正式推出了CUDA 13.1,官方将其定位为“自2006年CUDA平台诞生以来大、全面的升级”。nJ228资讯网——每日最新资讯28at.com

此次更新的核心亮点,是引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈入一个新的、更高抽象的阶段。nJ228资讯网——每日最新资讯28at.com

NVIDIA护城河20年来大更新!CUDA 13.1正式发布nJ228资讯网——每日最新资讯28at.com

传统的GPU编程基于SIMT (单指令多线程) 模式,开发者需要关注线程、内存和同步等底层细节。nJ228资讯网——每日最新资讯28at.com

而CUDA Tile是一种基于tile(瓦片、数据块)的模型,开发者现在可以专注于将数据组织成块,并对这些数据块执行计算,而底层的线程调度、内存布局以及硬件资源映射等复杂工作,将由编译器和运行时自动处理。nJ228资讯网——每日最新资讯28at.com

为支持Tile编程,CUDA 13.1引入了虚拟指令集(Tile IR),并配套发布了cuTile工具,允许开发者使用Python来编写基于Tile的GPU Kernel。nJ228资讯网——每日最新资讯28at.com

这极大地降低了GPU编程的门槛,使得不熟悉传统CUDA C/C++或底层SIMT模型的数据科学家和研究者也能编写GPU加速代码。nJ228资讯网——每日最新资讯28at.com

Tile编程并非取代SIMT,而是提供了一个并存的可选路径,开发者可根据具体应用场景,灵活选择合适的编程模型。nJ228资讯网——每日最新资讯28at.com

CUDA 13.1的意义,不仅在于新增功能或优化性能,更在于为构建新一代高层、跨架构的GPU计算库和框架奠定了基础,通过引入Tile IR和高层抽象,NVIDIA在硬件和软件之间增加了一个更厚的中间层。nJ228资讯网——每日最新资讯28at.com

过去,竞争对手(如AMD的ROCm、Intel的OneAPI)主要依赖兼容层进行CUDA代码转译,但对于CUDA Tile这种更高抽象的新模式,单纯的代码转译已远不足够。nJ228资讯网——每日最新资讯28at.com

竞争对手必须构建同样智能的编译器来处理Tile IR,这无疑增加了技术对齐的难度,客观上进一步提升了CUDA生态系统的粘性和用户锁定度。nJ228资讯网——每日最新资讯28at.com

NVIDIA护城河20年来大更新!CUDA 13.1正式发布nJ228资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-187686-0.htmlNVIDIA护城河20年来大更新!CUDA 13.1正式发布

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 22年了!NVIDIA FX 5950原装显卡重出江湖

下一篇: 苹果折叠iPhone首年产量或破千万 书本式设计搭配新技术2026年亮相

标签:
  • 热门焦点
  • 一加Ace2 Pro官宣:普及16G内存 引领24G

    一加官方今天继续为本月发布的新机一加Ace2 Pro带来预热,公布了内存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引领,还有呢?#一加Ace2Pro#,2023 年 8 月,敬请期待。”同时
  • K60至尊版刚预热 一加Ace2 Pro正面硬刚

    Redmi这边刚如火如荼的宣传了K60 Ultra的各种技术和硬件配置,作为竞品的一加也坐不住了。一加中国区总裁李杰发布了两条微博,表示在自家的一加Ace2上早就已经采用了和PixelWo
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 只需五步,使用start.spring.io快速入门Spring编程

    步骤1打开https://start.spring.io/,按照屏幕截图中的内容创建项目,添加 Spring Web 依赖项,并单击“生成”按钮下载 .zip 文件,为下一步做准备。请在进入步骤2之前进行解压。图
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 三星Galaxy Z Fold/Flip 5国行售价曝光 :最低7499元/12999元起

    据官方此前宣布,三星将于7月26日也就是明天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
  • iQOO 11S评测:行业唯一的200W标准版旗舰

    【Techweb评测】去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,该机不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞
  • 英特尔Xe HPG游戏显卡:拥有512EU,单风扇版本

    据10 月 30 日外媒 TheVerge 消息报道,英特尔 Xe HPG Arc Alchemist 的正面实被曝光,不仅拥有 512 EU 版显卡,还拥有 128EU 的单风扇版本。另外,这款显卡 PCB
Top