当前位置:首页 > 科技  > 网络

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一

来源: 责编: 时间:2024-04-20 16:50:00 271观看
导读 Llama 3来了!今天,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。并且推出即为开源SOTA:Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。8B模型在MMLU、GPQA、HumanEval等多项基准上均

Llama 3来了!99Y28资讯网——每日最新资讯28at.com

今天,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

并且推出即为开源SOTA:99Y28资讯网——每日最新资讯28at.com

Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。99Y28资讯网——每日最新资讯28at.com

8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过Gemma 7B和Mistral 7B Instruct。99Y28资讯网——每日最新资讯28at.com

70B模型则超越了闭源的当红炸子鸡Claude 3 Sonnet,和谷歌的Gemini Pro 1.5打得有来有回。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

Huggingface链接一出,开源社区再次沸腾。99Y28资讯网——每日最新资讯28at.com

眼尖的盲生们还第一时间发现了华点:99Y28资讯网——每日最新资讯28at.com

Meta更藏了一手4000亿参数+的Llama 3版本,不逊于Claude 3超大杯Opus的那种!99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

AI写作助手创企HyperWriteAI的CEO见此已忍不住感慨:99Y28资讯网——每日最新资讯28at.com

我们正在步入一个新世界,一个GPT-4级别的模型开源并且可以自由访问的世界。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

英伟达科学家Jim Fan则认为,还在训练中的Llama 3 400B将成为开源大模型的分水岭,改变很多学界研究和初创公司的发展方式。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

各大云和芯片厂商,也已第一时间反应。比如百度、亚马逊、英特尔、无问芯穹等,均已上线对Llama 3的支持。99Y28资讯网——每日最新资讯28at.com

全面取得SOTA,但8k窗口99Y28资讯网——每日最新资讯28at.com

更多技术细节,Meta在博客文章中给出。99Y28资讯网——每日最新资讯28at.com

架构层面,Llama 3选择了经典的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。99Y28资讯网——每日最新资讯28at.com

训练方面,Meta上了2.4万块GPU集群,Llama 3的训练数据规模达到了15T tokens,全部来自于公开信息,其中5%为非英文数据,涵盖30多种语言。99Y28资讯网——每日最新资讯28at.com

Llama 3的数据量比Llama 2的训练数据多7倍,其中代码比Llama 2多4倍。99Y28资讯网——每日最新资讯28at.com

此外,为了提高 Llama 3 模型的推理效率,Meta AI还采用了分组查询注意力 (GQA)机制,在8192个tokens的序列上训练模型,并使用掩码确保自注意力不会跨越文档边界。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

结果,无论是8B还是70B版本,Llama 3相较于近似规模的上一代Llama 2,都取得了重大飞跃。99Y28资讯网——每日最新资讯28at.com

在迄今为止的8B和70B参数规模的模型中,Llama 3都成为了新的SOTA模型。99Y28资讯网——每日最新资讯28at.com

在语言(MMLU)、知识(GPQA)、编程(HumanEval)、数学(GSM-8K、MATH)等能力上,Llama 3几乎全面领先于同等规模的其他模型。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

除了这些常规的数据集,Meta AI还评估了Llama 3在现实场景中的性能,并为此研发了一套高质量的测试数据集。99Y28资讯网——每日最新资讯28at.com

这个测试集包含了1800条数据,涵盖代码、推理、写作、总结等12 个关键用例,并针对开发团队保密。99Y28资讯网——每日最新资讯28at.com

结果,Llama 3不仅大幅超越Llama 2,也战胜了Claude 3 Sonnet、Mistral Medium和GPT-3.5这些知名模型。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

而在AGIEval、BIG-Bench、ARC-Challenge这些更高阶、更困难的数据集上,Llama 3的表现同样可圈可点。99Y28资讯网——每日最新资讯28at.com

8B版本在这些任务上超越了Mistral和Gemma,70B版本则战胜了Gemini Pro和MoE架构的Mixtral,分别斩获相应规模的SOTA。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

不过美中不足的是,Llama 3的上下文窗口只有8k,这与现在动辄几十上百万窗口的大模型相比,仿佛还停留在上一代(手动狗头)。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

但也不必过度担忧,Matt Shumer就对此持乐观态度,他表示相信在开源社区的努力下,窗口长度很快就会扩展上去。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

Llama迎来官方网页版99Y28资讯网——每日最新资讯28at.com

目前,Llama 3两种参数量的基础和Instruct版本都已上线Hugging Face可供下载。99Y28资讯网——每日最新资讯28at.com

此外,微软Azure、谷歌云、亚马逊AWS、NVIDIA NIM等云服务平台也将陆续上线Llama 3。99Y28资讯网——每日最新资讯28at.com

同时,Meta还表示Llama 3会得到Intel、NVIDIA、AMD、高通等多家厂商提供的硬件平台支持。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

值得一提的是,此次与基础模型一同发布的,还有基于Llama 3的官方Web版本,名字就叫Meta AI。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

目前该平台有对话和绘画两大功能,只用对话的话无需注册登录、即开即用,使用绘画功能则需要先登录账号。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

不过,目前该平台还不支持中文,也暂未上线文本上传等功能。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

代码方面,该平台也能够运行一些简单的Python程序,但似乎只能输出文本,涉及到绘图这样的任务就无法运行了。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

总得来看,这个网页版本还比较初级,但也不妨期待一波后面的更新。99Y28资讯网——每日最新资讯28at.com

One More Thing99Y28资讯网——每日最新资讯28at.com

一个小插曲是,其实在Meta官宣前几个小时,微软的Azure市场已经偷跑了Llama 3 8B Instruct版本的消息。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

开源模型机器学习在线平台Replicate上的Llama 3价格表也被网友们第一时间扒拉了出来。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com

但很快,这些“小道消息”就都被404了。99Y28资讯网——每日最新资讯28at.com

好在乌龙完了,官方也没拖着,关心开源大模型的小伙伴们,可以造作起来了(doge)。99Y28资讯网——每日最新资讯28at.com

Llama 3 80亿/700亿参数大模型登场:开源强 没有之一99Y28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-84261-0.htmlLlama 3 80亿/700亿参数大模型登场:开源强 没有之一

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 五菱宏光回应被周鸿祎说空间小 贴出车内装了23个人的视频

下一篇: 女子买二手宝马承诺无事故:结果卖车时发现全车换了100多个零件

标签:
  • 热门焦点
  • Redmi Buds 4开箱简评:才199还有降噪 可以无脑入

    在上个月举办的Redmi Note11T Pro系列新机发布会上,除了两款手机新品之外,Redmi还带来了两款TWS真无线蓝牙耳机产品,Redmi Buds 4和Redmi Buds 4 Pro,此前我们在Redmi Note11T
  • 分享六款相见恨晚的PPT模版网站, 祝你做出精美的PPT!

    1、OfficePLUSOfficePLUS网站旨在为全球Office用户提供丰富的高品质原创PPT模板、实用文档、数据图表及个性化定制服务。优点:OfficePLUS是微软官方网站,囊括PPT模板、Word模
  • 一篇文章带你了解 CSS 属性选择器

    属性选择器对带有指定属性的 HTML 元素设置样式。可以为拥有指定属性的 HTML 元素设置样式,而不仅限于 class 和 id 属性。一、了解属性选择器CSS属性选择器提供了一种简单而
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • WebRTC.Net库开发进阶,教你实现屏幕共享和多路复用!

    WebRTC.Net库:让你的应用更亲民友好,实现视频通话无痛接入! 除了基本用法外,还有一些进阶用法可以更好地利用该库。自定义 STUN/TURN 服务器配置WebRTC.Net 默认使用 Google 的
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 本地生活这块肥肉,拼多多也想吃一口

    出品/壹览商业 作者/李彦编辑/木鱼拼多多也看上本地生活这块蛋糕了。近期,拼多多在App首页“充值中心”入口上线了本机生活界面。壹览商业发现,该界面目前主要
  • “又被陈思诚骗了”

    作者|张思齐 出品|众面(ID:ZhongMian_ZM)如今的国产悬疑电影,成了陈思诚的天下。最近大爆电影《消失的她》票房突破30亿断层夺魁暑期档,陈思诚再度风头无两。你可以说陈思诚的
  • 国行版三星Galaxy Z Fold5/Z Flip5发布 售价7499元起

    2023年8月3日,三星电子举行Galaxy新品中国发布会,正式在国内推出了新一代折叠屏智能手机三星Galaxy Z Fold5与Galaxy Z Flip5,以及三星Galaxy Tab S9
Top