当前位置:首页 > 科技  > 资讯

Meta发布Llama 4系列AI,混合专家架构能否助其效率飙升?

来源: 责编: 时间:2025-04-06 08:34:58 156观看
导读meta近期推出了其最新的Llama 4系列AI模型,这一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。据meta透露,这些模型均经过了庞大的未标注文本、图像和视频数据的训练,旨在赋予它们广泛的视觉理

meta近期推出了其最新的Llama 4系列AI模型,这一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。据meta透露,这些模型均经过了庞大的未标注文本、图像和视频数据的训练,旨在赋予它们广泛的视觉理解能力。pto28资讯网——每日最新资讯28at.com

目前,meta已将Scout和Maverick两款模型上架至Hugging Face平台。而Behemoth模型仍在紧锣密鼓的训练中。Scout模型能够在单个英伟达H100 GPU上运行,而Maverick则需要更高配置的英伟达H100 DGX AI平台或性能相当的设备。pto28资讯网——每日最新资讯28at.com

值得注意的是,Llama 4系列是meta首次采用混合专家(MoE)架构的模型。这种架构通过将数据处理任务分解为多个子任务,再将这些子任务分配给更小的、专门化的“专家”模型,从而在训练和回答用户查询时展现出更高的效率。例如,Maverick模型拥有4000亿个参数,但在128个“专家”模型中,只有170亿个参数处于活跃状态。pto28资讯网——每日最新资讯28at.com

pto28资讯网——每日最新资讯28at.com

相比之下,Scout模型拥有170亿个活跃参数,分布在16个“专家”模型中,总参数数为1090亿个。尽管Llama 4系列模型在性能上有所提升,但它们并非像OpenAI的o1和o3-mini那样的“推理模型”。推理模型会对答案进行事实核查,通常能更可靠地回答问题,但响应时间相对较长。pto28资讯网——每日最新资讯28at.com

meta内部测试显示,Maverick模型在通用AI助手和聊天等应用场景中表现出色,尤其在创意写作、代码生成、翻译、推理、长文本上下文总结和图像基准测试等方面,其性能超过了OpenAI的GPT-4和谷歌的Gemini 2.0等模型。然而,与谷歌的Gemini 2.5 Pro、Anthropic的Claude 3.7 Sonnet和OpenAI的GPT-4.5等更强大的最新模型相比,Maverick仍有一定的提升空间。pto28资讯网——每日最新资讯28at.com

pto28资讯网——每日最新资讯28at.com

Scout模型则擅长总结文档和基于大型代码库进行推理。该模型支持处理1000万个词元,这意味着它一次能够处理数百万字的文本。meta还预告了其Behemoth模型。据透露,Behemoth拥有2880亿个活跃参数,分布在16个“专家”模型中,总参数数接近2万亿个。meta内部基准测试显示,在一些衡量解决数学问题等科学、技术、工程和数学(STEM)技能的评估中,Behemoth的表现优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro,但略逊于Gemini 2.5 Pro。pto28资讯网——每日最新资讯28at.com

pto28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0  更多>同类资讯NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!04-06川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越04-06小米SU7事故警醒,多地高速频现“智驾慎用”警示牌04-06我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”04-06适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?04-06经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产04-05智驾营销迷雾背后:年轻生命逝去的警钟,车企责任何在?04-05中油工程突破!国内首套CCUS-EGR碳捕集装置调试合格04-05《超人》新片超长预览曝光!2025年7月北美震撼来袭04-05清明小长假首日,全国铁路单日旅客发送量突破2000万人次!04-05国产GTC-80ⅡJ探伤车亮相,精准至毫米,铁路检测不再依赖进口!04-05"春日“打鸟”热,京东直播教你如何捕捉飞鸟灵动瞬间!"04-05双登集团转战港股:年收45亿利润3.5亿,估值近50亿能否成功上市?04-05多地高速频现警示:智能辅助驾驶,慎用为妙!04-05Win11 24H2遇sprotect.sys驱动问题,微软暂停部分设备更新04-05点击查看更多 +全站最新小米SU7事件后,燃油车安全性再获关注,你的购车选择会变吗?小米SU7事件后,燃油车安全性再获关注,你的购车选择会变吗?日产2029年全固态电池计划:电动车与混动技术革新在即日产2029年全固态电池计划:电动车与混动技术革新在即本田全新电动SUV量产版谍照出炉,个性外观延续,2026年即将上市!本田全新电动SUV量产版谍照出炉,个性外观延续,2026年即将上市!比亚迪全新跑车内饰抢先看!2025上海车展即将震撼登场比亚迪全新跑车内饰抢先看!2025上海车展即将震撼登场电动车风靡城市,安全隐患与管理难题下,共享电动车何去何从?电动车风靡城市,安全隐患与管理难题下,共享电动车何去何从?2025上海车展前瞻:六款热门SUV,哪款将成新能源市场新宠?2025上海车展前瞻:六款热门SUV,哪款将成新能源市场新宠?热门内容
  • 美团入局AI新赛道,硅基流动完成新一轮融资引关注
  • 刘强东自豪宣布:京东快递小哥退休金超五千,公积金数十万!
  • 字节AI编程神器Trae牵手硅基流动,打造高效编码新体验
  • 无人机滥用致东方白鹳死亡,保护野生动物摄影需有底线!
  • 汉川童车火遍全球!外媒聚焦:中国制造,处处有惊喜
  • 《哪吒之魔童闹海》4月登陆日本,全球票房破147亿紧追《复联》
  • 莲花味精“破产”谣言不攻自破,公司火爆回应:我们挺好的!
  • 《哪吒2》票房高歌猛进,全球动画电影榜直逼《复联3》!
  • 网红滕顺强夫妇遭质疑后宣布退网,商场回应:消杀为常规流程
  • 胖东来于东来打断永辉高管:月赚200万门店为何不先涨工资?
  • 小米SU7事故后,遇难者家属删博引猜测,与小米会面后真相何在?
  • 某车企裁员风波再起,比例高达三成?真相尚待揭晓
  • SpaceX创历史:载人航天器首飞极地轨道,太空种植蘑菇实验引期待
  • 预包装食品禁用“零添加”等宣传语,如何科学选食成新课题!
  • 华为内部通报舞弊案:成都研究所多人被辞,任正非封楼抓人系谣言
本栏最新NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越小米SU7事故警醒,多地高速频现“智驾慎用”警示牌小米SU7事故警醒,多地高速频现“智驾慎用”警示牌我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产

本文链接:http://www.28at.com/showinfo-16-141489-0.htmlMeta发布Llama 4系列AI,混合专家架构能否助其效率飙升?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 超人归来!DC全新电影超前预览曝光,7月北美上映引期待

下一篇: NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!

标签:
  • 热门焦点
  • Mate60手机壳曝光 致敬自己的经典设计

    8月3日消息,今天下午博主数码闲聊站带来了华为Mate60的第三方手机壳图,可以让我们在真机发布之前看看这款华为全新旗舰的大致轮廓。从曝光的图片看,Mate 60背后摄像头面积依然
  • Redmi Buds 4开箱简评:才199还有降噪 可以无脑入

    在上个月举办的Redmi Note11T Pro系列新机发布会上,除了两款手机新品之外,Redmi还带来了两款TWS真无线蓝牙耳机产品,Redmi Buds 4和Redmi Buds 4 Pro,此前我们在Redmi Note11T
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • 三星获批量产iPhone 15全系屏幕:苹果史上最惊艳直屏

    按照惯例,苹果将继续在今年9月举办一年一度的秋季新品发布会,有传言称发布会将于9月12日举行,届时全新的iPhone 15系列将正式与大家见面,不出意外的话
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
  • 荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    2022年第一季度临近尾声,在该季度内,许多品牌陆续发布自己的最新产品,让大家从全新的角度来了解当今的手机技术。手机是电子设备中,更新迭代十分迅速的一款产品,基
Top