当前位置:首页 > 元宇宙 > AI

面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗

来源: 责编: 时间:2024-07-09 06:57:29 78观看
导读 7 月 5 日消息,今天的 2024 世界人工智能大会(WAIC 2024)期间,面壁智能联合创始人、首席科学家刘知远宣布,开源主打高效低能耗的新一代“面壁小钢炮”MiniCPM-S 模型,同时发布助力开发者一键打造大模型 SuperApp 的

7 月 5 日消息,今天的 2024 世界人工智能大会(WAIC 2024)期间,面壁智能联合创始人、首席科学家刘知远宣布,开源主打高效低能耗的新一代“面壁小钢炮”MiniCPM-S 模型,同时发布助力开发者一键打造大模型 SuperApp 的全栈工具集 MobileCPM。G2G28资讯网——每日最新资讯28at.com

据介绍,面壁 2024 年发布了具备 GPT-3 同等性能但参数仅为 24 亿的 MiniCPM-2.4B,知识密度提高了约 86 倍。面壁方面更称,这“并不是极限”—— 其持续优化 Scaling Law 使模型知识密度不断提升,可不断训练出计算更加高效、表现更强(参数规模降低,数值位宽降低,结构更加高效)的基础大模型。G2G28资讯网——每日最新资讯28at.com

G2G28资讯网——每日最新资讯28at.com

而此次开源的 MiniCPM-S 采用“稀疏激活”在同等参数下减少大模型的推理能耗,稀疏度越高,每个词元(token)激活的神经元越少,大模型的推理成本和能耗就越少。G2G28资讯网——每日最新资讯28at.com

MiniCPM-S 1.2B 采用了高度稀疏架构,通过将激活函数替换为 ReLU 及通过带渐进约束的稀疏感知训练,巧妙地解决了此前主流大模型在稀疏激活上面临的困境。G2G28资讯网——每日最新资讯28at.com

G2G28资讯网——每日最新资讯28at.com

官方还表示,和同规模的稠密模型 MiniCPM 1.2B 相比,MiniCPM-S 1.2 具备如下特征:G2G28资讯网——每日最新资讯28at.com

Sparse-高稀疏低能耗:在 FFN 层实现了高达 87.89% 平均稀疏度,推理算力下降 84%;G2G28资讯网——每日最新资讯28at.com

Speed-神仙推理:更少计算,迅疾响应。纯CPU环境下,结合 Powerinfer 推理框架,推理解码速度提升约 2.8 倍;G2G28资讯网——每日最新资讯28at.com

Strong-无损强大性能:更少计算量,无损下游任务性能。G2G28资讯网——每日最新资讯28at.com

G2G28资讯网——每日最新资讯28at.com

MiniCPM-S 1.2B 号称实现知识密度的“空前提升”—— 达到同规模稠密模型 MiniCPM 1.2B 的 2.57 倍,Mistral-7B 的 12.1 倍。G2G28资讯网——每日最新资讯28at.com

附开源链接:G2G28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/pdf/2402.13516.pdfG2G28资讯网——每日最新资讯28at.com

模型地址:https://huggingface.co/openbmb/MiniCPM-S-1B-llama-formatG2G28资讯网——每日最新资讯28at.com

PowerInfer可直接运行格式:https://huggingface.co/openbmb/MiniCPM-S-1B-sft-ggufG2G28资讯网——每日最新资讯28at.com

此外,面壁还开源了号称业内首个端侧大模型工具集 MobileCPM,开发者可以一键集成大模型到 App,且实现“开箱即用”。其包含开源端侧大模型、SDK 开发套件及翻译、摘要等丰富的 intent,可一站式灵活定制满足不同应用场景需求的大模型 App。其为开发者提供了基础模式、精装模式、全包配件模式,默认集成面壁新一代高效稀疏架构模型 MiniCPM-S 1.2B。G2G28资讯网——每日最新资讯28at.com

G2G28资讯网——每日最新资讯28at.com

G2G28资讯网——每日最新资讯28at.com

G2G28资讯网——每日最新资讯28at.com

MobileCPM 已经支持 iOS 系统,安卓版本也即将上线。附:开源地址、TestFlight 外测地址。G2G28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-5022-0.html面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 智谱发布并开源代码生成大模型 CodeGeeX 第四代,号称百亿以下规模性能最强

下一篇: 百度李彦宏:开源模型是智商税,闭源模型更强大、推理成本更低

标签:
  • 热门焦点
  • 大厂元宇宙,又菜又爱玩

    大厂元宇宙,又菜又爱玩

    撰文 | 吴先之 编辑 | 王 潘当下所有大厂推出的元宇宙产品,所能带来的沉浸式体验并不多,好在国内外科技巨头在bug方面都处在同一水平线。以Meta为例,由于VR头显设
  • 元宇宙是投资中国的第五次重大机遇

    元宇宙是投资中国的第五次重大机遇

    作者为凯思博投资董事长导语:投资逻辑要来自于人性在社会发展过程中的普遍规律,由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天,中国总共经历了
  • 保时捷推出虚拟超跑,车企元宇宙营销这么香?

    保时捷推出虚拟超跑,车企元宇宙营销这么香?

    保时捷又出超跑了,不过这次不是在现实世界,而是在虚拟世界。这款Vision Gran Turismo概念车,由保时捷和日本视频游戏开发工作室Polyphony Digital联合打造,将于202
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 百度元宇宙希壤是什么?(附下载)

    百度元宇宙希壤是什么?(附下载)

    百度元宇宙希壤是什么,最近很多人关注。还有很多人问希壤怎么下载、百度希壤怎么进入?今天小编带你来全面了解一下。“希壤”是百度于2021年12月27日于百度AI开
  • 吸金31亿美元,谁在催火2021年的链游?

    吸金31亿美元,谁在催火2021年的链游?

    2021年究竟发生了什么,才使得链游领域在这年一飞冲天?作者:廖羽2022年2月16日,Invest Game发布《2021年全球游戏投资报告》,报告显示,游戏行业的投资重点正在向区块
  • 2030年的元宇宙产业将会如何发展?

    2030年的元宇宙产业将会如何发展?

    对互联网巨头传统业务的反垄断政策倒逼互联网企业颠覆创新,寻找新的增长点,移动互联网流量空间见顶之际,元宇宙时代红利已然开启。序章:元宇宙应用场景大猜想元宇
  • 以用户为中心,Web3和区块链如何将用户放在首位

    以用户为中心,Web3和区块链如何将用户放在首位

    竞争优势正在改变竞争优势是每个企业都在努力争取的,由谷歌、Facebook和Netflix等大型科技公司主导的市场中,两大重要类别的竞争优势十分突出。第一个竞争优势来
  • 就业年龄歧视如何解决?来Web3看看

    就业年龄歧视如何解决?来Web3看看

    上周,我突然想到我的第一份工作实际上是在为一家失败的航空公司制定破产退出计划,那年我们的协议实习生刚出生。在一阵恐慌后,我又花了一点时间反思我这个拥有近1
Top