当前位置:首页 > 元宇宙 > AI

“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

来源: 责编: 时间:2024-09-09 16:33:14 200观看
导读 9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。附上 MiniCPM 3.0开源地址:https://github.com/OpenBMB/MiniCPMhttps://huggingface

9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。JN128资讯网——每日最新资讯28at.com

附上 MiniCPM 3.0开源地址:JN128资讯网——每日最新资讯28at.com

https://github.com/OpenBMB/MiniCPMJN128资讯网——每日最新资讯28at.com

https://huggingface.co/openbmb/MiniCPM3-4BJN128资讯网——每日最新资讯28at.com

MiniCPM3-4B 是 MiniCPM 系列的第三代产品,整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 亿~90 亿参数的 AI 模型。JN128资讯网——每日最新资讯28at.com

JN128资讯网——每日最新资讯28at.com

相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 拥有更强大、更多用途的技能集,可用于更广泛的用途。MiniCPM3-4B 支持函数调用和代码解释器。JN128资讯网——每日最新资讯28at.com

JN128资讯网——每日最新资讯28at.com

下面是 3 个版本的模型结构(1->2->3)的区别:JN128资讯网——每日最新资讯28at.com

词表大小:123K->73K->73KJN128资讯网——每日最新资讯28at.com

模型层数:40->52->62JN128资讯网——每日最新资讯28at.com

隐藏层节点:2304->1536->2560JN128资讯网——每日最新资讯28at.com

最大长度:4k->4K->32kJN128资讯网——每日最新资讯28at.com

系统提示词:不支持->不支持->支持JN128资讯网——每日最新资讯28at.com

工具调用和代码解释器:不支持->不支持->支持JN128资讯网——每日最新资讯28at.com

MiniCPM3-4B 有一个 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的内存,可以处理理论上的无限上下文。JN128资讯网——每日最新资讯28at.com

JN128资讯网——每日最新资讯28at.com

面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。JN128资讯网——每日最新资讯28at.com

JN128资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-6871-0.html“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌 Google Photos 美国获推“询问照片内容”测试功能:基于 Gemini AI 模型、支持自然语言

下一篇: 瑞典支付巨头 Klarna 裁员 1000 人后「广进」10 亿扭亏为盈,AI 接管客服效率提升八成

标签:
  • 热门焦点
  • 一份全面清单:Web3行业高薪酬的13种工作

    来源:区块链骑士这可能会让许多人感到震惊,但除了成为开发人员之外,Web3还有其他高薪工作。Web3可能是现代就业市场中跨学科最多的领域,换句话说,它由许多个在不同领域中具有不同
  • 内容行业大变天,爆款全靠AI?

    出品 | 微果酱(wjam123456)作者 | 陈出木题图 | 文心一格 AI的发展之快出乎所有人的预料,似乎一夜之间便呼啸而来。无论是资本的风向标,抑或是生活工作的辅助、流量口,还是茶余饭
  • 在元宇宙卖酸奶,这波联动燃爆了!

    来源:品牌头版 或许,每个人心中都住着一个小馋孩。可能是童年时百吃不厌,觉得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;还有可能,是某种不知为什么,就是很爱吃的
  • 游戏玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼尔·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一个脱胎于现实世界,又与现实世界平行、相互影响,并且始终在线的虚拟世
  • 中文在线的“元宇宙”故事,资本听腻了?

    被誉为“元宇宙”龙头之一的中文在线,这下尴尬了。2022年1月11日,中国移动通信联合会元宇宙产业委员会揭牌,接纳涉足“元宇宙”的8家上市公司,包括中青宝、天下秀
  • 冰墩墩的NFT暴涨千倍?真相则是价格暴跌、成交遇冷

    《区块链日报》记者查证,近日来冰墩墩数字藏品交易数量出现大幅下滑,而所谓的暴涨千倍更是有价无市的自嗨。昨日,北京冬奥会正式闭幕。在这届冬奥会上,吉祥物“冰
  • 从NFT顶级公链到Web3.0基础设施:带你了解不一样的Flow

    对于大部分年轻人来说,刚刚过去的春节有一个词语突然成为了品牌宣传的流行语,作为从NFT中衍生出来的“数字藏品”一时间获得了不少品牌青睐,他们纷纷推出自己的数
  • Snoop Dogg 计划推出致力于数字媒体NFT的专业公司

    雅痞哥不知道这人是谁还上新闻,问了助理,解释,相当于美版刘欢的地位吧。Snoop Dogg 在 NFT 领域已经有一段时间了,尤其是在最近有消息称人们在元宇宙中购买房地产
  • HTC Vive推出元宇宙平台Viverse;腾讯投资小米生态链AR眼镜厂商

    今日热点:HTC Vive正式推出元宇宙平台Viverse;腾讯投资小米生态链AR眼镜厂商北京蜂巢科技;面部追踪和眼动追踪是Quest下一版本的“重点”;索尼PSVR 2将推迟至2023
Top