当前位置:首页 > 元宇宙 > AI

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型,推动 AI 高效部署

来源: 责编: 时间:2025-04-15 07:13:00 175观看
导读 4 月 12 日消息,科技媒体 marktechpost 昨日(4 月 11 日)发布博文,报道称英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1,这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。随着 AI

4 月 12 日消息,科技媒体 marktechpost 昨日(4 月 11 日)发布博文,报道称英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1,这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。hKB28资讯网——每日最新资讯28at.com

hKB28资讯网——每日最新资讯28at.com

随着 AI 在数字基础设施中的普及,企业与开发者需在计算成本、性能与扩展性间寻找平衡。大型语言模型(LLM)的快速发展提升了自然语言理解和对话能力,但其庞大规模常导致效率低下,限制大规模部署。hKB28资讯网——每日最新资讯28at.com

英伟达最新发布的 Llama-3.1-Nemotron-Ultra-253B-v1(简称 Nemotron Ultra)直面这一挑战,该模型基于 Meta 的 Llama-3.1-405B-Instruct 架构,专为商业和企业需求设计,支持从工具使用到多轮复杂指令执行等任务。hKB28资讯网——每日最新资讯28at.com

援引博文介绍,Nemotron Ultra 采用仅解码器的密集 Transformer 结构,通过神经架构搜索(NAS)算法优化,其创新之处在于采用跳跃注意力机制,在部分层中省略注意力模块或替换为简单线性层。hKB28资讯网——每日最新资讯28at.com

hKB28资讯网——每日最新资讯28at.com

此外,前馈网络(FFN)融合技术将多层 FFN 合并为更宽但更少的层,大幅缩短推理时间,同时保持性能。模型支持 128K token 的上下文窗口,可处理长篇文本,适合高级 RAG 系统和多文档分析。hKB28资讯网——每日最新资讯28at.com

在部署效率上,Nemotron Ultra 也实现突破。它能在单 8xH100 节点上运行推理,显著降低数据中心成本,提升企业开发者的可及性。hKB28资讯网——每日最新资讯28at.com

hKB28资讯网——每日最新资讯28at.com

英伟达通过多阶段后训练进一步优化模型,包括在代码生成、数学、对话和工具调用等任务上的监督微调,以及使用群体相对策略优化(GRPO)算法进行强化学习(RL)。这些步骤确保模型在基准测试中表现出色,并与人类交互偏好高度契合。hKB28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12242-0.html英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型,推动 AI 高效部署

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手

下一篇: 因用欧洲用户数据训练 Grok,马斯克的 X 公司遭爱尔兰调查

标签:
  • 热门焦点
  • 这一超级富豪“逆袭”,身价大增4330亿

    来源:侃见财经互联网的突围没有“终点”。在快节奏的商业环境下,不断的试错成了互联网企业的标配,一年一个风口,一个风口造就一个热点,但是回头来看,最终受益的还是身处
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 大厂元宇宙,又菜又爱玩

    撰文 | 吴先之 编辑 | 王 潘当下所有大厂推出的元宇宙产品,所能带来的沉浸式体验并不多,好在国内外科技巨头在bug方面都处在同一水平线。以Meta为例,由于VR头显设
  • 抢先推出“元宇宙”饮料,可口可乐赢麻了

    试图傍上元宇宙的品牌千千万,但像可口可乐玩得这么花的,属实不多。01 可口可乐盯上元宇宙1886年,可口可乐诞生于美国乔治亚州亚特兰大市,至今已拥有136年的悠久历
  • 2022年6款最佳的NFT稀有度查询工具

    NFT正在风靡全球,但拥有一个你自认为看起来很酷的 NFT 是不够的,因为它还应该是稀有的,稀有度会影响每个 NFT 的价值。因此,如果您打算投资 NFT,则需要使用 NFT 稀
  • 2021年中国元宇宙行业用户行为分析热点报告

    元宇宙网络热度高涨,中国网民对虚拟生态兴趣浓厚。艾媒咨询数据显示,超六成的网民对“元宇宙”了解程度较高,在元宇宙较基础的游戏领域,超九成的人对VR游戏更感兴
  • 顶流IP“冰墩墩”带着中国元素NFT进入全球视野

    一场被国际奥委会主席评价堪称独具匠心、非凡卓越的2022年北京冬季奥运会,在这个“双奥之城”经历了16个令人难忘的精彩日夜,最终圆满闭幕。让我们印象深刻的不
  • Meta正在研发元宇宙语音助手;广东省462家企业申请元宇宙商标

    今日《元宇宙新鲜事》有:扎克伯格透露正在为元宇宙研发语音助手;完美世界声明称不会以“元宇宙投资项目”等名义吸收资金。广东省申请元宇宙商标的企业达462家位
  • 以太坊伦敦升级后,随之生效的以太坊EIP-1559是什么?

    作者:三黎过去的一年里,除了 BTC 一如既往稳坐王位,DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时,也使得其网络日渐拥堵、交易费用增高,成为
Top