当前位置:首页 > 元宇宙 > AI

“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

来源: 责编: 时间:2024-09-09 16:33:14 153观看
导读 9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。附上 MiniCPM 3.0开源地址:https://github.com/OpenBMB/MiniCPMhttps://huggingface

9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。6yT28资讯网——每日最新资讯28at.com

附上 MiniCPM 3.0开源地址:6yT28资讯网——每日最新资讯28at.com

https://github.com/OpenBMB/MiniCPM6yT28资讯网——每日最新资讯28at.com

https://huggingface.co/openbmb/MiniCPM3-4B6yT28资讯网——每日最新资讯28at.com

MiniCPM3-4B 是 MiniCPM 系列的第三代产品,整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 亿~90 亿参数的 AI 模型。6yT28资讯网——每日最新资讯28at.com

6yT28资讯网——每日最新资讯28at.com

相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 拥有更强大、更多用途的技能集,可用于更广泛的用途。MiniCPM3-4B 支持函数调用和代码解释器。6yT28资讯网——每日最新资讯28at.com

6yT28资讯网——每日最新资讯28at.com

下面是 3 个版本的模型结构(1->2->3)的区别:6yT28资讯网——每日最新资讯28at.com

词表大小:123K->73K->73K6yT28资讯网——每日最新资讯28at.com

模型层数:40->52->626yT28资讯网——每日最新资讯28at.com

隐藏层节点:2304->1536->25606yT28资讯网——每日最新资讯28at.com

最大长度:4k->4K->32k6yT28资讯网——每日最新资讯28at.com

系统提示词:不支持->不支持->支持6yT28资讯网——每日最新资讯28at.com

工具调用和代码解释器:不支持->不支持->支持6yT28资讯网——每日最新资讯28at.com

MiniCPM3-4B 有一个 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的内存,可以处理理论上的无限上下文。6yT28资讯网——每日最新资讯28at.com

6yT28资讯网——每日最新资讯28at.com

面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。6yT28资讯网——每日最新资讯28at.com

6yT28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-6871-0.html“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌 Google Photos 美国获推“询问照片内容”测试功能:基于 Gemini AI 模型、支持自然语言

下一篇: 瑞典支付巨头 Klarna 裁员 1000 人后「广进」10 亿扭亏为盈,AI 接管客服效率提升八成

标签:
  • 热门焦点
  • 元宇宙的文旅赛道,还能如何发力?

    来源:X增强现实苹果推出Vision Pro,为XR行业注入一剂强心针。而在苹果开发者大会上迪士尼CEO鲍勃·艾格在宣布迪士尼与苹果达成合作,其Disney+流媒体服务将于Vision Pro
  • AI大模型“战火”烧到了教育领域

    作者:刘旷自2023年开年以来,AI大模型这股风是越吹越猛烈了。随着ChatGPT的出圈爆火,再度掀起了一波AI热浪,无论是在国内还是国外都有不少企业宣布入局或者跟进AI大模型领域。与
  • 上、中、下游加深融合,搭建元宇宙产业全景

    元宇宙产业链涉及多种技术和多个领域。在上游,聚集着大量的技术厂商,提供元宇宙相关的硬件和软件支持;在中游,内容运营与分发领域也吸引着越来越多的企业以VR内容
  • Layer1的新以太坊,更好的以太坊?

    以太坊作为区块链基础设施地位看起来已不可动摇,但也面临着费用高、效率低、偏离去中心化初衷等问题。平台上既得利益群体的形成和固化也逐渐让革新变得困难。
  • 中国银保监管委提示:谨慎投资,勿做接盘侠

    中国银保监管委,发布一则风险提示,内容围绕防范以“元宇宙”名义进行的非法集资风险。原文如下:近期,一些不法分子蹭热点,以“元宇宙投资项目”“元宇宙链游”等名
  • 元宇宙是数字共识生态的集成逻辑表达

    作者: 李鸣元宇宙是数字共识生态的集成逻辑表达,是以区块链技术为核心的可信数字化价值交互网络,是基于Web3.0技术体系和运作机制支撑下的数字新生态。本体论是
  • 2022年去中心化交易所会崛起吗?

    “在某个时候,去中心化衍生品的交易量可能会超过去中心化现货交易所。”DEX 越来越多地转向第二层解决方案。“数字化金融市场的概念以及如何沿着以用户为中心
  • 利用元宇宙平台10天收入160万,风口还是虎口?

    美国Meta平台有限公司,也就是原来的脸书公司,9日宣布,公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象
  • 我们为什么需要Web3,距离Web3的实现还有多远?

    当今技术正在经历着重要的变革,许多公司正在改变他们的经营模式以求变得更加的灵活,其中有很大一部分公司采用了不同的方式来发展自己的业务。其中之一就是Web3,
Top