当前位置:首页 > 科技  > 资讯

Meta发布Llama 4系列AI,混合专家架构能否助其效率飙升?

来源: 责编: 时间:2025-04-06 08:34:58 221观看
导读meta近期推出了其最新的Llama 4系列AI模型,这一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。据meta透露,这些模型均经过了庞大的未标注文本、图像和视频数据的训练,旨在赋予它们广泛的视觉理

meta近期推出了其最新的Llama 4系列AI模型,这一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。据meta透露,这些模型均经过了庞大的未标注文本、图像和视频数据的训练,旨在赋予它们广泛的视觉理解能力。Pzc28资讯网——每日最新资讯28at.com

目前,meta已将Scout和Maverick两款模型上架至Hugging Face平台。而Behemoth模型仍在紧锣密鼓的训练中。Scout模型能够在单个英伟达H100 GPU上运行,而Maverick则需要更高配置的英伟达H100 DGX AI平台或性能相当的设备。Pzc28资讯网——每日最新资讯28at.com

值得注意的是,Llama 4系列是meta首次采用混合专家(MoE)架构的模型。这种架构通过将数据处理任务分解为多个子任务,再将这些子任务分配给更小的、专门化的“专家”模型,从而在训练和回答用户查询时展现出更高的效率。例如,Maverick模型拥有4000亿个参数,但在128个“专家”模型中,只有170亿个参数处于活跃状态。Pzc28资讯网——每日最新资讯28at.com

Pzc28资讯网——每日最新资讯28at.com

相比之下,Scout模型拥有170亿个活跃参数,分布在16个“专家”模型中,总参数数为1090亿个。尽管Llama 4系列模型在性能上有所提升,但它们并非像OpenAI的o1和o3-mini那样的“推理模型”。推理模型会对答案进行事实核查,通常能更可靠地回答问题,但响应时间相对较长。Pzc28资讯网——每日最新资讯28at.com

meta内部测试显示,Maverick模型在通用AI助手和聊天等应用场景中表现出色,尤其在创意写作、代码生成、翻译、推理、长文本上下文总结和图像基准测试等方面,其性能超过了OpenAI的GPT-4和谷歌的Gemini 2.0等模型。然而,与谷歌的Gemini 2.5 Pro、Anthropic的Claude 3.7 Sonnet和OpenAI的GPT-4.5等更强大的最新模型相比,Maverick仍有一定的提升空间。Pzc28资讯网——每日最新资讯28at.com

Pzc28资讯网——每日最新资讯28at.com

Scout模型则擅长总结文档和基于大型代码库进行推理。该模型支持处理1000万个词元,这意味着它一次能够处理数百万字的文本。meta还预告了其Behemoth模型。据透露,Behemoth拥有2880亿个活跃参数,分布在16个“专家”模型中,总参数数接近2万亿个。meta内部基准测试显示,在一些衡量解决数学问题等科学、技术、工程和数学(STEM)技能的评估中,Behemoth的表现优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro,但略逊于Gemini 2.5 Pro。Pzc28资讯网——每日最新资讯28at.com

Pzc28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0  更多>同类资讯NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!04-06川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越04-06小米SU7事故警醒,多地高速频现“智驾慎用”警示牌04-06我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”04-06适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?04-06经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产04-05智驾营销迷雾背后:年轻生命逝去的警钟,车企责任何在?04-05中油工程突破!国内首套CCUS-EGR碳捕集装置调试合格04-05《超人》新片超长预览曝光!2025年7月北美震撼来袭04-05清明小长假首日,全国铁路单日旅客发送量突破2000万人次!04-05国产GTC-80ⅡJ探伤车亮相,精准至毫米,铁路检测不再依赖进口!04-05"春日“打鸟”热,京东直播教你如何捕捉飞鸟灵动瞬间!"04-05双登集团转战港股:年收45亿利润3.5亿,估值近50亿能否成功上市?04-05多地高速频现警示:智能辅助驾驶,慎用为妙!04-05Win11 24H2遇sprotect.sys驱动问题,微软暂停部分设备更新04-05点击查看更多 +全站最新小米SU7事件后,燃油车安全性再获关注,你的购车选择会变吗?小米SU7事件后,燃油车安全性再获关注,你的购车选择会变吗?日产2029年全固态电池计划:电动车与混动技术革新在即日产2029年全固态电池计划:电动车与混动技术革新在即本田全新电动SUV量产版谍照出炉,个性外观延续,2026年即将上市!本田全新电动SUV量产版谍照出炉,个性外观延续,2026年即将上市!比亚迪全新跑车内饰抢先看!2025上海车展即将震撼登场比亚迪全新跑车内饰抢先看!2025上海车展即将震撼登场电动车风靡城市,安全隐患与管理难题下,共享电动车何去何从?电动车风靡城市,安全隐患与管理难题下,共享电动车何去何从?2025上海车展前瞻:六款热门SUV,哪款将成新能源市场新宠?2025上海车展前瞻:六款热门SUV,哪款将成新能源市场新宠?热门内容
  • 美团入局AI新赛道,硅基流动完成新一轮融资引关注
  • 刘强东自豪宣布:京东快递小哥退休金超五千,公积金数十万!
  • 字节AI编程神器Trae牵手硅基流动,打造高效编码新体验
  • 无人机滥用致东方白鹳死亡,保护野生动物摄影需有底线!
  • 汉川童车火遍全球!外媒聚焦:中国制造,处处有惊喜
  • 《哪吒之魔童闹海》4月登陆日本,全球票房破147亿紧追《复联》
  • 莲花味精“破产”谣言不攻自破,公司火爆回应:我们挺好的!
  • 《哪吒2》票房高歌猛进,全球动画电影榜直逼《复联3》!
  • 网红滕顺强夫妇遭质疑后宣布退网,商场回应:消杀为常规流程
  • 胖东来于东来打断永辉高管:月赚200万门店为何不先涨工资?
  • 小米SU7事故后,遇难者家属删博引猜测,与小米会面后真相何在?
  • 某车企裁员风波再起,比例高达三成?真相尚待揭晓
  • SpaceX创历史:载人航天器首飞极地轨道,太空种植蘑菇实验引期待
  • 预包装食品禁用“零添加”等宣传语,如何科学选食成新课题!
  • 华为内部通报舞弊案:成都研究所多人被辞,任正非封楼抓人系谣言
本栏最新NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越小米SU7事故警醒,多地高速频现“智驾慎用”警示牌小米SU7事故警醒,多地高速频现“智驾慎用”警示牌我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产

本文链接:http://www.28at.com/showinfo-16-141489-0.htmlMeta发布Llama 4系列AI,混合专家架构能否助其效率飙升?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 超人归来!DC全新电影超前预览曝光,7月北美上映引期待

下一篇: NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • K60至尊版刚预热 一加Ace2 Pro正面硬刚

    Redmi这边刚如火如荼的宣传了K60 Ultra的各种技术和硬件配置,作为竞品的一加也坐不住了。一加中国区总裁李杰发布了两条微博,表示在自家的一加Ace2上早就已经采用了和PixelWo
  • Redmi Pad评测:红米充满野心的一次尝试

    从Note系列到K系列,从蓝牙耳机到笔记本电脑,红米不知不觉之间也已经形成了自己颇有竞争力的产品体系,在中端和次旗舰市场上甚至要比小米新机的表现来得更好,正所谓“大丈夫生居
  • vivo TWS Air开箱体验:真轻 臻好听

    在vivo S15系列新机的发布会上,vivo的最新款真无线蓝牙耳机vivo TWS Air也一同发布,本次就这款耳机新品给大家带来一个简单的分享。外包装盒上,vivo TWS Air保持了vivo自家产
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 三万字盘点 Spring 九大核心基础功能

    大家好,我是三友~~今天来跟大家聊一聊Spring的9大核心基础功能。话不多说,先上目录:图片友情提示,本文过长,建议收藏,嘿嘿嘿!一、资源管理资源管理是Spring的一个核心的基础功能,不
  • 一篇文章带你了解 CSS 属性选择器

    属性选择器对带有指定属性的 HTML 元素设置样式。可以为拥有指定属性的 HTML 元素设置样式,而不仅限于 class 和 id 属性。一、了解属性选择器CSS属性选择器提供了一种简单而
  • 朋友圈可以修改可见范围了 苹果用户可率先体验

    近日,iOS用户迎来微信8.0.27正式版更新,除了可更换二维码背景外,还新增了多项实用功能。在新版微信中,朋友圈终于可以修改可见范围,简单来说就是已发布的朋友圈
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
Top