当前位置:首页 > 元宇宙 > AI

Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率

来源: 责编: 时间:2025-04-08 10:04:50 131观看
导读 4 月 6 日消息,Meta现已发布旗下最新Llama 4 系列AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth,Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练,以使它们具备“广泛

4 月 6 日消息,Meta现已发布旗下最新Llama 4 系列AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth,Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练,以使它们具备“广泛的视觉理解能力”。UqY28资讯网——每日最新资讯28at.com

UqY28资讯网——每日最新资讯28at.com

目前,Meta 已将系列模型中的 Scout 和Maverick 上架到Hugging Face(点此访问),而 Behemoth 模型则还在训练中。其中 Scout 可以在单个英伟达H100 GPU 上运行,而Maverick 则需要英伟达H100 DGX AI 平台或“同等性能的设备”。UqY28资讯网——每日最新资讯28at.com

Meta 表示,Llama 4 系列模型是该公司旗下首批采用混合专家(MoE)架构的模型,这种架构在训练和回答用户查询时的效率更高,所谓“混合专家架构”基本上是将数据处理任务分解为子任务,然后将它们委派给更小的、专门的“专家”模型。UqY28资讯网——每日最新资讯28at.com

UqY28资讯网——每日最新资讯28at.com

例如,Maverick 总共有4000 亿个参数,但在128 个“专家”模型中只有170 亿个活跃参数(参数数量大致与模型的问题解决能力相对应)。Scout 有170 亿个活跃参数、16 个“专家”模型以及总计1090 亿个参数。UqY28资讯网——每日最新资讯28at.com

UqY28资讯网——每日最新资讯28at.com

不过值得注意的是,Llama 4 系列中没有一个模型是像OpenAI 的o1 和o3-mini 那样真正意义上的“推理模型”。作为比较,“推理模型”会对其答案进行事实核查,并且通常能更可靠地回答问题,但因此也比传统的“非推理”模型花费更长的时间来给出答案。UqY28资讯网——每日最新资讯28at.com

Meta 内部测试显示,Maverick 模型最适合用于“通用AI 助手和聊天”等应用场景,该模型在创意写作、代码生成、翻译、推理、长文本上下文总结和图像基准测试中表现超过了OpenAI 的GPT-4o 和谷歌的Gemini 2.0 等模型。然而 Maverick 与谷歌的 Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet 和OpenAI 的GPT-4.5 等功能更强大的最新模型相比仍有一定进步空间。UqY28资讯网——每日最新资讯28at.com

UqY28资讯网——每日最新资讯28at.com

而 Scout 的优势则是总结文档、基于大型代码库进行推理。该模型支持 1000 万个词元(“词元”代表原始文本的片段,例如单词“fantastic”可拆分为“fan”、“tas”和“tic”),因此一次可以处理“多达数百万字的文本”。UqY28资讯网——每日最新资讯28at.com

注意到,Meta 还进一步预告了其 Behemoth 模型,据该公司称,Behemoth 有2880 亿个活跃参数、16 个“专家”模型,总参数数量接近2 万亿个。Meta 的内部基准测试显示,在一些衡量解决数学问题等科学、技术、工程和数学(STEM)技能的评估中,Behemoth 的表现优于GPT-4.5、Claude 3.7 Sonnet 和Gemini 2.0 Pro,但不如Gemini 2.5 Pro。UqY28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12016-0.htmlMeta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容

下一篇: 消息称谷歌 Gemini AI 部门高层调整:掌门人 Sissie Hsiao 下台、原 Google Labs 主管上位

标签:
  • 热门焦点
  • 元宇宙里掀起回忆杀?这波虚拟怀旧营销主打一个极限反差

    来源:首席品牌官从被称为“元宇宙元年”的2021年开始,几乎所有品牌都在迫不及待地“入驻”元宇宙。而一提及品牌们的元宇宙玩法,相信多数人脑海里首先浮现
  • 沉寂3年,大模型激活小度天猫精灵?

    Tech星球(微信ID:tech618)文 | 何煦阳 沉寂了许久的智能音箱,在今年大模型横空出世之后,又再次燃起了新的希望。 2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型&ldq
  • 【东方证券】虚拟世界照进现实,元宇宙中有什么? | 元宇宙Meta洞见

    元宇宙的表现形式大多以游戏为起点,并逐渐整合互联网、数字化娱乐、社交网络等功能,长期来看甚至可以整合社会经济与商业活动。元宇宙的发展最关键的部分在于元
  • 字节跳动,刚刚投了一位虚拟女生

    今年第一笔虚拟人融资出炉了。投资界获悉,杭州李未可科技有限公司显示发生股东变更,新增字节跳动关联公司北京量子跃动科技有限公司。今天公司方面正式确认,本轮
  • 国内涌现70余家数字藏品平台:合规、流量与利润在博弈

    作者:杨郑君2月16日,迅雷链企业数字藏品服务平台正式上线,继阿里、腾讯、京东、百度、网易等之后,又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
  • NFT世界的艺术家名单

    我们汇编了以下艺术家的名单,它包括每个艺术家的简短概述。当然,这份名单肯定不全面,还有很多很多艺术家、哲学家和商业领袖为世界贡献了不可估量的价值。而他们
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • 元宇宙平台会是上世纪末的互联网吗?

    “元宇宙”火了好几个月,互联网大厂忙于布局,资本市场热烈追捧。然而很多人还是看不明白,更多的人觉得这是一场泡沫,一场骗局。一开始接触这个怪里怪气的名词,感觉
  • 百度虚拟人——AI手语主播首次亮相冬奥会!

    除了火遍全国的冰墩墩,虚拟人也成为这届冬奥会的一大亮点元素。以体育明星谷爱凌为原型的数智人Meet Gu最先亮相。在2月5日谷爱凌首秀、2月7日谷爱凌首金的两天
Top