当前位置：首页 > 元宇宙 > AI

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

来源：责编：时间：2025-04-08 10:04:50 200观看

导读 4 月 6 日消息，Meta现已发布旗下最新Llama 4 系列AI 模型，包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth，Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练，以使它们具备“广泛

4 月 6 日消息，Meta现已发布旗下最新Llama 4 系列AI 模型，包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth，Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练，以使它们具备“广泛的视觉理解能力”。

目前，Meta 已将系列模型中的 Scout 和Maverick 上架到Hugging Face（点此访问），而 Behemoth 模型则还在训练中。其中 Scout 可以在单个英伟达H100 GPU 上运行，而Maverick 则需要英伟达H100 DGX AI 平台或“同等性能的设备”。

Meta 表示，Llama 4 系列模型是该公司旗下首批采用混合专家（MoE）架构的模型，这种架构在训练和回答用户查询时的效率更高，所谓“混合专家架构”基本上是将数据处理任务分解为子任务，然后将它们委派给更小的、专门的“专家”模型。

例如，Maverick 总共有4000 亿个参数，但在128 个“专家”模型中只有170 亿个活跃参数（参数数量大致与模型的问题解决能力相对应）。Scout 有170 亿个活跃参数、16 个“专家”模型以及总计1090 亿个参数。

不过值得注意的是，Llama 4 系列中没有一个模型是像OpenAI 的o1 和o3-mini 那样真正意义上的“推理模型”。作为比较，“推理模型”会对其答案进行事实核查，并且通常能更可靠地回答问题，但因此也比传统的“非推理”模型花费更长的时间来给出答案。

Meta 内部测试显示，Maverick 模型最适合用于“通用AI 助手和聊天”等应用场景，该模型在创意写作、代码生成、翻译、推理、长文本上下文总结和图像基准测试中表现超过了OpenAI 的GPT-4o 和谷歌的Gemini 2.0 等模型。然而 Maverick 与谷歌的 Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet 和OpenAI 的GPT-4.5 等功能更强大的最新模型相比仍有一定进步空间。

而 Scout 的优势则是总结文档、基于大型代码库进行推理。该模型支持 1000 万个词元（“词元”代表原始文本的片段，例如单词“fantastic”可拆分为“fan”、“tas”和“tic”），因此一次可以处理“多达数百万字的文本”。

注意到，Meta 还进一步预告了其 Behemoth 模型，据该公司称，Behemoth 有2880 亿个活跃参数、16 个“专家”模型，总参数数量接近2 万亿个。Meta 的内部基准测试显示，在一些衡量解决数学问题等科学、技术、工程和数学（STEM）技能的评估中，Behemoth 的表现优于GPT-4.5、Claude 3.7 Sonnet 和Gemini 2.0 Pro，但不如Gemini 2.5 Pro。

本文链接：http://www.28at.com/showinfo-45-12016-0.htmlMeta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： OpenAI 遭实锤：研究称其 AI 模型“记住”了受版权保护的内容

下一篇：消息称谷歌 Gemini AI 部门高层调整：掌门人 Sissie Hsiao 下台、原 Google Labs 主管上位

标签：

热门焦点

25万虚拟er在“元宇宙”追星

“默叽默叽，我是默默酱，我是在真元宇宙也有头有脸的人。”12月11日晚20：00，虚拟偶像@默默酱的首场个人元宇宙演唱会《以梦为马，抵达繁星》在大有空间APP
“元宇宙”里过大年，《迷你世界》在做一场怎样的实验？

2021年是游戏行业不确定性急剧上升的一年。一方面游戏正风光无限，腾讯等大厂更加密集地投资动作，让游戏创投市场异常火热，"元宇宙"概念的大放异彩，更是吸引了Netfl
“元宇宙第一股”Roblox首份年报未达预期，摩根大通成为首家进入元宇宙的银行

今日《元宇宙新鲜事》有：“元宇宙第一股”Roblox首份年报未达预期致盘后股价暴跌15.28%；YouTube宣布进军区块链和元宇宙；摩根大通成为首家进入元宇宙的银行。【中
2022年中国元宇宙产业系列研究报告-基础设施篇（5）

传感器是由敏感元件和转换元件构成，能够感受规定的检测量(物理量、化学量、生物量等)，并按照一定规律将检测量转化成可用的输出信号的器件和装置，进而满足信息的
2030年的元宇宙产业将会如何发展？

对互联网巨头传统业务的反垄断政策倒逼互联网企业颠覆创新，寻找新的增长点，移动互联网流量空间见顶之际，元宇宙时代红利已然开启。序章：元宇宙应用场景大猜想元宇
DAO登上了历史舞台，但是主流准备好采用DAO了吗？

Block-807DAO要么是定义虚拟未来、无领导组织的革命性概念，要么是充满存在主义和自我毁灭挑战的反乌托邦结构，取决于你在与谁交谈。近几个月来， DAO已经从Crypto
NFT：新骗局的狩猎场

骗局的自动化需要更好的防御，从数字身份开始。前几天我在OpenSea上购买了一个NFT，是才华横溢的艺术家海伦·福尔摩斯 (Helen Holmes) 的漫画，来自她的 "原作 "收
你连元宇宙都不知道吗？快来看看这四本元宇宙书籍吧

前有腾讯、阿里申请商标注册，后有Facebook宣布改名，若论当前互联网最火最热的概念，当属“元宇宙”。“阿里元宇宙”“淘宝元宇宙”“钉钉元宇宙”“QQ元宇宙”“
浅聊DAO图景和未来

DAO是什么？DAO (Decentralized Autonomous Organizations),去中心化自治组织，是基于区块链技术，由社区通过透明的决策过程运行和管理的组织形态。DAO使得社区成为

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

25万虚拟er在“元宇宙”追星

“元宇宙”里过大年，《迷你世界》在做一场怎样的实验？

“元宇宙第一股”Roblox首份年报未达预期，摩根大通成为首家进入元宇宙的银行

2022年中国元宇宙产业系列研究报告-基础设施篇（5）

2030年的元宇宙产业将会如何发展？

DAO登上了历史舞台，但是主流准备好采用DAO了吗？

NFT：新骗局的狩猎场

你连元宇宙都不知道吗？快来看看这四本元宇宙书籍吧

浅聊DAO图景和未来

最新推荐

《从营销AIGC化到AIGC营销化》报告发布

文心一言排名垫底，却成为百度业绩增长杠杆

VR/AR迷失元宇宙“硝烟”

元宇宙社交时代，华丽归来的超级QQ秀重构虚拟社交场景

参加元宇宙里的招聘会是什么样一种体验？

利用元宇宙平台10天收入160万，风口还是虎口？

猜你喜欢

热门推荐

相关资讯