当前位置:首页 > 元宇宙 > AI

开源版 OpenAI 再出神作:小模型吊打 Meta Llama 3,Ministral 系列开启边缘 AI 革命

来源: 责编: 时间:2024-10-26 15:13:49 199观看
导读 Mistral 7B 诞生一周年之际,法国 AI 初创公司 Mistral 再次连发两个轻量级模型 Ministral 3B 和 Ministral 8B,性能赶超 Llama 3 8B。Mistral 7B 仅仅发布一周年,法国 AI 初创小模型「les Ministraux」就打败它

Mistral 7B 诞生一周年之际,法国 AI 初创公司 Mistral 再次连发两个轻量级模型 Ministral 3B 和 Ministral 8B,性能赶超 Llama 3 8B。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

Mistral 7B 仅仅发布一周年,法国 AI 初创小模型「les Ministraux」就打败它了。它堪称是,世界上最好的边缘模型。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

Ministral 3B 和 Ministral 8B 这两款轻量级模型,专为边缘设备打造。截至目前,它们正式加入 Mixtral、Pixtral、Codestral、Mathstral 行列,成为 Mistral 一员。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

别看仅有 30 亿参数,在指令跟随基准上,完全超越了 Llama 3 8B,以及前辈模型 Mistral 7B。而且 Ministral 3B 和 Ministral 8B 在大模型竞技场中的测试,均拿下了媲美 Gemma 2、Llama 3.1 开源模型的成绩。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

世界上最好的边缘模型

Ministral 3B 和 Ministral 8B 都支持高达 128k 上下文(目前在 vLLM 上为 32k)。w5D28资讯网——每日最新资讯28at.com

在知识、常识、推理、函数调用、效率等方面,为低于 10B 参数模型设立了新标杆。w5D28资讯网——每日最新资讯28at.com

而且,Ministral 8B 还有配备了滑动窗口注意机制(sliding-window attention),以实现更快和内存高效的推理。w5D28资讯网——每日最新资讯28at.com

不论是管理复杂的 AI 智能体工作流,还是创建专门的任务助手,它们均可以被微调到各种用例中。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

赶超开源模型,击败 Mistral 7B

研究人员在多项基准测试中,评估了 Les Minimrau 的性能。w5D28资讯网——每日最新资讯28at.com

其中包括知识与常识、代码、数学、多语言四大方面。w5D28资讯网——每日最新资讯28at.com

预训练模型

如下图所示,与 Gema 2 2B、Llama 3.2 3B 相比较,Minstral 3B 在以上基准上,取得了最优成绩。w5D28资讯网——每日最新资讯28at.com

在与 Llama 3.1 8B、Mistral 7B 相比较过程中,仅有代码能力,Minstral 8B 还有些差距,其余放方面均是性能最高的模型。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

如下是,更加直观可视化柱状图,Minstral 8B 在各项评测中,占据首位。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

指令模型

再来看微调后的指令模型,性能比较的结果。w5D28资讯网——每日最新资讯28at.com

在大模型竞技场中,Minstral 3B 在不同基准上,实现了最优。Minstral 8B 仅在 Wild bench 上,略逊于 Gema 2 9B。w5D28资讯网——每日最新资讯28at.com

另外,在代码、数学、函数调用方面,两款新模型性能大幅超越其余模型。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

下图,可以直观看出指令微调后的 Minstral 3B 比更大的 Mistral 7B 的改进。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

如下是指令微调后的 Minstral 8B 模型,与其他模型的性能对比直观图。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

边缘计算皆可用,0.1 美金百万 token

如今,大模型在实际落地中,不如小模型来的更切实际。越来越多的用户,希望对关键应用程序能够进行本地优先推理,比如设备上翻译、不用联网智能助理,自动机器人等等。w5D28资讯网——每日最新资讯28at.com

正如官博所述,Les Minimraux 正为这些场景,提供了高计算效率、低延迟的解决方案。w5D28资讯网——每日最新资讯28at.com

当与 Mistral Large 等更大的模型结合使用时,les Ministraux 还可以作为多步智能体工作流中,进行函数调用的高效中介。w5D28资讯网——每日最新资讯28at.com

通过微调,它们能以极低的延迟和成本基于用户意图,跨多个上下文处理输入解析、任务路由和调用 API。w5D28资讯网——每日最新资讯28at.com

价格

根据官方公布的价格所示,Minstral 8B 输入输出价格为百万 token,0.1 美元。Minstral 3B 则为百万 token0.04 美元。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

开源版 OpenAI,不再 Open

自去年成立以来,Mistral 曾以磁力链方式开源了多款媲美 OpenAI 的模型,一路走红得到 AI 社区的认可。w5D28资讯网——每日最新资讯28at.com

这家总部位于巴黎的 Mistral,由 Meta、谷歌 DeepMind 前员工创立。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

几个月前,它以 60 亿美金估值,完成 6.4 亿美元新一轮融资,并随之推出了一款 GPT-4 级别的模型 ——Mistral Large 2。w5D28资讯网——每日最新资讯28at.com

此外,他们在今年,还推出了一个专家混合模型 Mixtral 8x22B。w5D28资讯网——每日最新资讯28at.com

它包含了一个编码模型 Codestral,以及一个数学推理和科学发现的模型。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

不过,今年这家明星公司陷入了巨大争议,因为它变得不再那么 open。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

年初,有消息爆料称,微软宣布将收购 Mistral 一些股份,并对其投资,意味着它的模型将在 Azure AI 进行托管。w5D28资讯网——每日最新资讯28at.com

甚至,还有 Reddit 网友发现,Mistral 已从官网中,移除了致力于开源的承诺。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

在一些模型的调用上,Mistral 也开启了收费模式,包括这次同样如此。w5D28资讯网——每日最新资讯28at.com

有网友就此吐槽,不是开源的。w5D28资讯网——每日最新资讯28at.com

w5D28资讯网——每日最新资讯28at.com

要知道,对于一家初创公司来说,一直坚持开源代码是一个巨大的挑战。就比如反面教材 Stability AI,完全放弃了开源的商业模式,也转向了收费策略。w5D28资讯网——每日最新资讯28at.com

对于 Mistral 也是如此,若要持续打造优秀的模型,只有这一种选择。w5D28资讯网——每日最新资讯28at.com

参考资料:w5D28资讯网——每日最新资讯28at.com

https://x.com/dchaplot/status/1846575384718172448w5D28资讯网——每日最新资讯28at.com

https://x.com/GuillaumeLample/status/1846566817650679966w5D28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-9255-0.html开源版 OpenAI 再出神作:小模型吊打 Meta Llama 3,Ministral 系列开启边缘 AI 革命

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 华为Mate X6蓄势待发,11月前后或将惊艳登场?

下一篇: 华为智驾+座舱,高端MPV市场迎新变局?

标签:
  • 热门焦点
  • 三院士三教授热聊元宇宙&——AIGC,学术界怎么看?

    来源:清元宇宙在近日举办的中国江宁2023元宇宙产业·人才高峰论坛暨AIGC发展大会上,中国工程院院士谭建荣、刘韵洁、郑纬民出席并发表了主旨演讲。除了三
  • 一个视频涨粉百万,柳夜熙们能成为元宇宙的“船票”吗?

    当数字人成为一种生意,我们更关心的是,他们如何赚到钱,以及这意味着什么?01#“柳夜熙”爆火之后不知道大家还记不记得,去年10月31日万圣节,有一位虚拟美妆
  • 元宇宙风口下,视觉中国如何重估?

    要说横跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一个。不仅互联网巨头们纷纷布局,上市公司们趋之若鹜,还被不少地方政府写入了产业规划,大有在2022年
  • 中国区块链产业生态地图报告(2021)

    区块链是技术整合创新、金融创新、组织方式创新、产业应用创新的多维度创新,以服务实体经济、政务民生以及公共服务等领域为落脚点,以期实现整个地区和产业的资
  • “元宇宙第一股”Roblox缘何被资本市场看“低”?

    近期,冬奥会的召开受到广泛关注,而吉祥物冰墩墩也成为新晋“顶流”,“一墩难求”成为普遍心声,为了满足大众需求,nWayPlay平台曾在2月12日发售了一款由国际奥委会官
  • 8个最适合艺术家发行NFT的交易市场

    近年来,加密风靡全球。加密圈最令人兴奋的方面之一是它能够用于创建称为NFT 的数字资产。从 CyberKitties 到 Cyber Galleries,NFT 已成为艺术家和艺术鉴赏家的
  • 2021年中国元宇宙行业用户行为分析热点报告

    元宇宙网络热度高涨,中国网民对虚拟生态兴趣浓厚。艾媒咨询数据显示,超六成的网民对“元宇宙”了解程度较高,在元宇宙较基础的游戏领域,超九成的人对VR游戏更感兴
  • 吸金31亿美元,谁在催火2021年的链游?

    2021年究竟发生了什么,才使得链游领域在这年一飞冲天?作者:廖羽2022年2月16日,Invest Game发布《2021年全球游戏投资报告》,报告显示,游戏行业的投资重点正在向区块
  • NFT世界的艺术家名单

    我们汇编了以下艺术家的名单,它包括每个艺术家的简短概述。当然,这份名单肯定不全面,还有很多很多艺术家、哲学家和商业领袖为世界贡献了不可估量的价值。而他们
Top