当前位置:首页 > 元宇宙 > AI

英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型:专为角色扮演设计,9216 MLP、上下文长度 4096 词元

来源: 责编: 时间:2024-09-19 16:25:52 141观看
导读 9 月 15 日消息,科技媒体 marktechpost 昨日(9 月 14 日)发布博文,报道称英伟达开源了 Nemotron-Mini-4B-Instruct AI 模型,标志着该公司在 AI 领域创新又一新篇章。小语言模型的大潜力Nemotron-Mini-4B-Instruct

9 月 15 日消息,科技媒体 marktechpost 昨日(9 月 14 日)发布博文,报道称英伟达开源了 Nemotron-Mini-4B-Instruct AI 模型,标志着该公司在 AI 领域创新又一新篇章。B1N28资讯网——每日最新资讯28at.com

小语言模型的大潜力

Nemotron-Mini-4B-Instruct AI 模型专为角色扮演、检索增强生成(RAG)及函数调用等任务设计,是一个小语言模型(SLM),通过蒸馏(distilled)和优化更大的 Nemotron-4 15B 获得。B1N28资讯网——每日最新资讯28at.com

英伟达使用剪枝(pruning)、量化(quantization)和蒸馏(distillation)等先进 AI 技术,让该模型更小巧高效,尤其适用于设备端部署。B1N28资讯网——每日最新资讯28at.com

这种缩小化并未影响模型在角色扮演和功能调用等特定场景下的性能,让其成为需要快速按需响应的应用的实用选择。B1N28资讯网——每日最新资讯28at.com

该模型在 Minitron-4B-Base 模型上微调,采用了 LLM 压缩技术,最显著的特点之一是其能够处理 4096 个上下文窗口词元(token),能够生成更长且更连贯的回复。B1N28资讯网——每日最新资讯28at.com

架构与技术规格

Nemotron-Mini-4B-Instruct 以其强大的架构著称,确保了高效性与可扩展性。B1N28资讯网——每日最新资讯28at.com

该模型的 Embedding Size(决定了转化后的向量的维度)尺寸为 3072,多头注意力(Multi-Head Attention)为 32 个,MLP 中间维度为 9216,在处理大规模输入数据集时,仍能以高精度和相关性作出响应。B1N28资讯网——每日最新资讯28at.com

此外,模型还采用了组查询注意力(GQA)和旋转位置嵌入(RoPE)技术,进一步提升了其处理与理解文本的能力。B1N28资讯网——每日最新资讯28at.com

该模型基于 Transformer 解码器架构,是一种自回归语言模型。这意味着它根据前面的标记生成每个标记,非常适合对话生成等任务,其中对话的连贯流畅至关重要。B1N28资讯网——每日最新资讯28at.com

B1N28资讯网——每日最新资讯28at.com

角色扮演与功能调用应用

Nemotron-Mini-4B-Instruct 在角色扮演应用领域表现尤为突出。凭借其庞大的标记容量和优化的语言生成能力,它可以嵌入到虚拟助手、视频游戏或任何其他需要 AI 生成关键响应的交互式环境中。B1N28资讯网——每日最新资讯28at.com

英伟达提供了一种特定的提示格式,以确保模型在这些场景中,尤其是在单轮或多轮对话中,输出最佳结果。B1N28资讯网——每日最新资讯28at.com

B1N28资讯网——每日最新资讯28at.com

该模型还针对函数调用进行了优化,在 AI 系统必须与 API 或其他自动化流程交互的环境中变得越来越重要。生成准确、功能性响应的能力使得该模型非常适合 RAG 场景,即模型需要创建文本并从知识库中检索和提供信息。B1N28资讯网——每日最新资讯28at.com

B1N28资讯网——每日最新资讯28at.com

附上参考地址B1N28资讯网——每日最新资讯28at.com

Nvidia Open Sources Nemotron-Mini-4B-Instruct: A 4,096 Token Capacity Small Language Model Designed for Roleplaying, Function Calling, and Efficient On-Device Deployment with 32 Attention Heads and 9,216 MLPB1N28资讯网——每日最新资讯28at.com

Nemotron-Mini-4B-InstructB1N28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-7491-0.html英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型:专为角色扮演设计,9216 MLP、上下文长度 4096 词元

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 日本家电卖场巨头 Nojima 推出“AI 社长”,用于培养公司内部人才

下一篇: 研究显示美国青少年热衷生成式 AI,家长大多不知情

标签:
  • 热门焦点
  • VR/AR迷失元宇宙“硝烟”

    不温不火的VR/AR可穿戴设备因元宇宙崛起火了一阵,又随着元宇宙回归平静。1月份,微软在 Surface 设备、HoloLens 混合现实硬件和 Xbox 等部门裁员,其中负责混合现实硬件(MR)的Holo
  • 大厂元宇宙,又菜又爱玩

    撰文 | 吴先之 编辑 | 王 潘当下所有大厂推出的元宇宙产品,所能带来的沉浸式体验并不多,好在国内外科技巨头在bug方面都处在同一水平线。以Meta为例,由于VR头显设
  • 有人狂赚千倍,资金盘游戏日进上亿,元宇宙泡沫还能吹多久?

    你还不知道元宇宙?没关系。看看微软、Meta、英伟达的雄心壮志,便可领略元宇宙的辽阔。1月18日,微软宣布将以687亿美元收购动视暴雪,这是有史以来互联网领域最大的
  • “啫喱”超越微信登顶:首款“元宇宙社交App”会昙花一现吗?

    作者| 赤木瓶子如何终结“昙花一现”的命运,是潮流社交产品的长期命题,如今,在元宇宙浪潮的洗礼下,这一命题正在迎来新的可能性。近段时间,一款名为“啫喱”的社交A
  • 元宇宙社交啫喱、希壤爆款迭出,腾讯慌了吗?

    文 | 陈桥辉没想到腾讯超级QQ秀的20周年归来首秀,被一款名不见经传的产品抢了风头。1月15日,一款名为“啫喱”的社交App迅速在各个互联网的社交圈内火爆起来,引起
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • 费城艺术家使用区块链,在数字艺术中狠狠捞一笔

    ‍你也想赚钱发财走上人生巅峰吗?老雅痞给你指条路,现在也许是时候创建或购买或出售 NFT的好时机。费城地区的许多企业家都在这样做。但投资需谨慎,入行有风险,在
  • 在元宇宙开会是什么样一种体验

    空间就是一切还记得面对面的会议吗?就在不久前,与会者需要飞到遥远的目的地,并进行鼓舞人心的对话、网络、免费食物,甚至可能会有一两个很好的小组讨论。随之而来
  • 虚拟邓丽君后,数字人赛道开启3.0时代

    “如果右脑时代来临,虚拟世界将是对人类才华的无限放大。” 郭晓喆称,开发数字人形象时,自己的团队在内部“卷”了一下:“当我们翻阅大量历史典籍的时候,苏小妹找到
Top