当前位置:首页 > 元宇宙 > AI

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型,推动 AI 高效部署

来源: 责编: 时间:2025-04-15 07:13:00 206观看
导读 4 月 12 日消息,科技媒体 marktechpost 昨日(4 月 11 日)发布博文,报道称英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1,这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。随着 AI

4 月 12 日消息,科技媒体 marktechpost 昨日(4 月 11 日)发布博文,报道称英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1,这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。SLV28资讯网——每日最新资讯28at.com

SLV28资讯网——每日最新资讯28at.com

随着 AI 在数字基础设施中的普及,企业与开发者需在计算成本、性能与扩展性间寻找平衡。大型语言模型(LLM)的快速发展提升了自然语言理解和对话能力,但其庞大规模常导致效率低下,限制大规模部署。SLV28资讯网——每日最新资讯28at.com

英伟达最新发布的 Llama-3.1-Nemotron-Ultra-253B-v1(简称 Nemotron Ultra)直面这一挑战,该模型基于 Meta 的 Llama-3.1-405B-Instruct 架构,专为商业和企业需求设计,支持从工具使用到多轮复杂指令执行等任务。SLV28资讯网——每日最新资讯28at.com

援引博文介绍,Nemotron Ultra 采用仅解码器的密集 Transformer 结构,通过神经架构搜索(NAS)算法优化,其创新之处在于采用跳跃注意力机制,在部分层中省略注意力模块或替换为简单线性层。SLV28资讯网——每日最新资讯28at.com

SLV28资讯网——每日最新资讯28at.com

此外,前馈网络(FFN)融合技术将多层 FFN 合并为更宽但更少的层,大幅缩短推理时间,同时保持性能。模型支持 128K token 的上下文窗口,可处理长篇文本,适合高级 RAG 系统和多文档分析。SLV28资讯网——每日最新资讯28at.com

在部署效率上,Nemotron Ultra 也实现突破。它能在单 8xH100 节点上运行推理,显著降低数据中心成本,提升企业开发者的可及性。SLV28资讯网——每日最新资讯28at.com

SLV28资讯网——每日最新资讯28at.com

英伟达通过多阶段后训练进一步优化模型,包括在代码生成、数学、对话和工具调用等任务上的监督微调,以及使用群体相对策略优化(GRPO)算法进行强化学习(RL)。这些步骤确保模型在基准测试中表现出色,并与人类交互偏好高度契合。SLV28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12242-0.html英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型,推动 AI 高效部署

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手

下一篇: 因用欧洲用户数据训练 Grok,马斯克的 X 公司遭爱尔兰调查

标签:
  • 热门焦点
  • AI网红能年赚百万,普通人的新机会来了?

    来源|运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁2023 年 ,数字人成为了当红的“流量话题”和“商业机会"。不管是 AI 孙燕姿走红网络,还是 AI 数字
  • 三院士三教授热聊元宇宙&——AIGC,学术界怎么看?

    来源:清元宇宙在近日举办的中国江宁2023元宇宙产业·人才高峰论坛暨AIGC发展大会上,中国工程院院士谭建荣、刘韵洁、郑纬民出席并发表了主旨演讲。除了三大院士,还有清华
  • 数字人的新革命,BAT的“冲高”战场

    来源:刘旷ChatGPT横空出世,让人们看到了数字人的另一种可能,将ChatGPT与虚拟数字人融合,研发出更加智能化、拟人化的虚拟数字人成为数字人厂商的新命题、新方向。2月份,岭南股份
  • 花房集团上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集团在港交所成功上市,首日便受到追捧,当日最高涨幅达28.75%。继360、360数科、鲁大师后,这是“红衣教主”周
  • 有人狂赚千倍,资金盘游戏日进上亿,元宇宙泡沫还能吹多久?

    你还不知道元宇宙?没关系。看看微软、Meta、英伟达的雄心壮志,便可领略元宇宙的辽阔。1月18日,微软宣布将以687亿美元收购动视暴雪,这是有史以来互联网领域最大的
  • 搭上“谷爱凌”,“柳夜熙们”站上风口?

    作者:张琳 曹杨从“永不塌房”的艺人到频频亮相北京冬奥会,作为元宇宙细分赛道之一的虚拟数字人又火了一把。2月7日,即谷爱凌摘得冬奥会自由式滑雪大跳台金牌的
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • 以用户为中心,Web3和区块链如何将用户放在首位

    竞争优势正在改变竞争优势是每个企业都在努力争取的,由谷歌、Facebook和Netflix等大型科技公司主导的市场中,两大重要类别的竞争优势十分突出。第一个竞争优势来
  • 音乐家如何利用NFTs来提高歌迷参与度

    "音乐是一种语言,不以特定的文字说话。它用情感说话,如果它在骨子里,它就在骨子里。" - Keith Richards音乐激励着我们,使我们流泪,使我们充满狂喜,并抚慰我们的灵魂
Top