当前位置:首页 > 元宇宙 > AI

面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参数、高效部署手机

来源: 责编: 时间:2024-05-23 17:06:22 298观看
导读 5 月 21 日消息,面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30+ 种语言,宣称可实现:最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4VOCR 能力 SOTA(注:State-of-the-Art

5 月 21 日消息,面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30+ 种语言,宣称可实现:g7A28资讯网——每日最新资讯28at.com

最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4Vg7A28资讯网——每日最新资讯28at.com

OCR 能力 SOTA(注:State-of-the-Art):9 倍像素更清晰,难图长图长文本精准识别g7A28资讯网——每日最新资讯28at.com

图像编码快 150 倍:首次端侧系统级多模态加速g7A28资讯网——每日最新资讯28at.com

g7A28资讯网——每日最新资讯28at.com

▲OpenCompass 模型量级对比

MiniCPM-Llama3-V 2.5 总参数量为 8B,多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型,OCR 能力及指令跟随能力得到进一步提升,可精准识别难图、长图、长文本,并支持超过 30 种语言的多模态交互。g7A28资讯网——每日最新资讯28at.com

g7A28资讯网——每日最新资讯28at.com

▲官方测试结果

在 OpenCompass 测试中,MiniCPM-Llama3-V 2.5综合性能超越多模态“巨无霸”GPT-4V 和 Gemini Pro;在 OCRBench 上,超越了 GPT-4o、GPT-4V、Claude 3V Opus、Gemini Pro 等标杆模型。g7A28资讯网——每日最新资讯28at.com

g7A28资讯网——每日最新资讯28at.com

▲OpenCompass 测试

g7A28资讯网——每日最新资讯28at.com

▲OCRBench 测试

g7A28资讯网——每日最新资讯28at.com

▲Object HalBench 测试

g7A28资讯网——每日最新资讯28at.com

▲RealWorldQA 测试

此外,在图像编码方面,MiniCPM-Llama3-V 2.5 首次整合 NPU 和 CPU 加速框架,并结合显存管理、编译优化技术,实现了 150 倍加速提升。g7A28资讯网——每日最新资讯28at.com

在语言模型推理方面,经过 CPU、编译优化、显存管理等优化方式,MiniCPM-Llama3-V 2.5 在手机端的语言解码速度由 Llama 3 的 0.5 token / s 上下提升到 3-4 token / s,并可支持 30 多种语言,包括德语、法语、西班牙语、意大利语、俄语等主流语言,基本覆盖一带一路国家。g7A28资讯网——每日最新资讯28at.com

g7A28资讯网——每日最新资讯28at.com

▲LLaVABench 评测结果

OCR 技术方面,MiniCPM-Llama3-V 2.5 实现高效编码及无损识别 180 万高清像素图片,并且支持任意长宽比、甚至 1:9 极限比例图像。g7A28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4381-0.html面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参数、高效部署手机

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌 DeepMind 推出 AI 安全框架 Frontier Safety Framework,可检测优化降低大模型风险性

下一篇: 振兴乡村发展 助力青少年教育 中国三星连续十一年蝉联企业社会责任榜外企第一

标签:
  • 热门焦点
  • AIGC产品测评TOP25丨谁能抢到下个十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦阳策划 | 杨晓鹤封面来源 | 图虫创意 2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google 旗下 Dee
  • 在数字世界再造世界杯,元宇宙体育正变得越来越丰满

    撰文/ 葱鲔鱼本届世界杯可能不是最精彩的一届,却绝对是看点十足的一届:后疫情时代的首届世界杯、耗资2200亿美元打造的“史上最贵”世界杯、足坛黄金
  • 元宇宙是投资中国的第五次重大机遇

    作者为凯思博投资董事长导语:投资逻辑要来自于人性在社会发展过程中的普遍规律,由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天,中国总共经历了
  • 传腾讯已推出全新XR业务;摩托罗拉正打造5GXR颈戴式计算组件

    今日热点:传腾讯已推出全新XR业务;摩托罗拉与Verizon合作打造5G XR颈戴式计算组件;小米AR购物导航专利获授权;VR一体机Simula One放弃众筹并开放直接预订;VR游戏《
  • 2022年6款最佳的NFT稀有度查询工具

    NFT正在风靡全球,但拥有一个你自认为看起来很酷的 NFT 是不够的,因为它还应该是稀有的,稀有度会影响每个 NFT 的价值。因此,如果您打算投资 NFT,则需要使用 NFT 稀
  • 对讽刺无动于衷,Nori将碳市场放在区块链上

    当我们聊气候问题的解决方案时,以太坊区块链应该不是最首想到的,但这正是Nori所选择的方案,它建立了一个引擎,鼓励农民使用负碳耕作方法,将空气中的碳抽出并放回地
  • 元宇宙需要的5个重要安全功能

    元宇宙的可能用途使其成为一个令人难以置信的概念,但是,就像科技界的任何事物一样,需要做一些事情来控制其使用。元宇宙的安全功能需要仔细考虑和开发,以保护用户
  • MR——元宇宙平台的下一代入口

    作为“元宇宙”的领头羊,Meta的一举一动都受到业内的高度关注。华尔街见闻提及,2月17日周四,Facebook母公司Meta在透露,其混合现实技术(MR)将在几年后实现,让人们对元
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top