当前位置:首页 > 元宇宙 > AI

面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参数、高效部署手机

来源: 责编: 时间:2024-05-23 17:06:22 324观看
导读 5 月 21 日消息,面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30+ 种语言,宣称可实现:最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4VOCR 能力 SOTA(注:State-of-the-Art

5 月 21 日消息,面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30+ 种语言,宣称可实现:4jl28资讯网——每日最新资讯28at.com

最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4V4jl28资讯网——每日最新资讯28at.com

OCR 能力 SOTA(注:State-of-the-Art):9 倍像素更清晰,难图长图长文本精准识别4jl28资讯网——每日最新资讯28at.com

图像编码快 150 倍:首次端侧系统级多模态加速4jl28资讯网——每日最新资讯28at.com

4jl28资讯网——每日最新资讯28at.com

▲OpenCompass 模型量级对比

MiniCPM-Llama3-V 2.5 总参数量为 8B,多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型,OCR 能力及指令跟随能力得到进一步提升,可精准识别难图、长图、长文本,并支持超过 30 种语言的多模态交互。4jl28资讯网——每日最新资讯28at.com

4jl28资讯网——每日最新资讯28at.com

▲官方测试结果

在 OpenCompass 测试中,MiniCPM-Llama3-V 2.5综合性能超越多模态“巨无霸”GPT-4V 和 Gemini Pro;在 OCRBench 上,超越了 GPT-4o、GPT-4V、Claude 3V Opus、Gemini Pro 等标杆模型。4jl28资讯网——每日最新资讯28at.com

4jl28资讯网——每日最新资讯28at.com

▲OpenCompass 测试

4jl28资讯网——每日最新资讯28at.com

▲OCRBench 测试

4jl28资讯网——每日最新资讯28at.com

▲Object HalBench 测试

4jl28资讯网——每日最新资讯28at.com

▲RealWorldQA 测试

此外,在图像编码方面,MiniCPM-Llama3-V 2.5 首次整合 NPU 和 CPU 加速框架,并结合显存管理、编译优化技术,实现了 150 倍加速提升。4jl28资讯网——每日最新资讯28at.com

在语言模型推理方面,经过 CPU、编译优化、显存管理等优化方式,MiniCPM-Llama3-V 2.5 在手机端的语言解码速度由 Llama 3 的 0.5 token / s 上下提升到 3-4 token / s,并可支持 30 多种语言,包括德语、法语、西班牙语、意大利语、俄语等主流语言,基本覆盖一带一路国家。4jl28资讯网——每日最新资讯28at.com

4jl28资讯网——每日最新资讯28at.com

▲LLaVABench 评测结果

OCR 技术方面,MiniCPM-Llama3-V 2.5 实现高效编码及无损识别 180 万高清像素图片,并且支持任意长宽比、甚至 1:9 极限比例图像。4jl28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4381-0.html面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参数、高效部署手机

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌 DeepMind 推出 AI 安全框架 Frontier Safety Framework,可检测优化降低大模型风险性

下一篇: 振兴乡村发展 助力青少年教育 中国三星连续十一年蝉联企业社会责任榜外企第一

标签:
  • 热门焦点
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 元宇宙里卖酸奶,好炸裂的操作!

    作者 | 李东阳 来源 | 首席营销官有没有发现,当下的热搜出现一个有意思的现象,那就是“情怀”不知不觉成为了主流,爷青回话题讨论性非常高。前有名侦探柯南和优衣库
  • 元宇宙带来沉浸式智能登录?你学会了吗?

    备受资本市场宠爱的元宇宙概念,正掀起一番番波澜。元宇宙作为虚实相融的互联网应用和社会形态,与沉浸式体验紧密相关。 多重路径,打造无感知沉浸式智能登录《设计
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • “我没搞懂元宇宙,但一天能赚9w块”

    作者:郑宇轩最近几个月,“元宇宙”爆火,除了 Facebook 改名为 Meta 高调进军元宇宙外, BAT 为代表的大厂纷纷着手“元宇宙”新业务。刹那之间,元宇宙成为新风口,除了
  • 借VR产业东风,江西抢滩布局“元宇宙”

    自2016年起就在VR上倾注了大量精力的江西省,迅速搭上了“元宇宙”。VR、AR等技术是通往元宇宙的关键接口,使人们可以在数字空间和物理空间自由穿梭。自2016年起
  • 在元宇宙开会是什么样一种体验

    空间就是一切还记得面对面的会议吗?就在不久前,与会者需要飞到遥远的目的地,并进行鼓舞人心的对话、网络、免费食物,甚至可能会有一两个很好的小组讨论。随之而来
  • 赵长鹏预测SoicalFi为今年主要驱动力,新的机会在哪里?

    作者:五火球教主前不久,赵长鹏在《财富》杂志印度版块刊登评论。他表示:“DeFi 在 2021 年出现了快速创新,我们可能会在 2022 年看到蓬勃发展的兴趣和创新,其中 Soc
  • 76亿美金估值、2022年最具创新力公司,Dapper Labs如何做到?

    “元宇宙的开拓者”是我们针对元宇宙的发展而设立的专栏,主要面向那些深挖元宇宙产业或者在元宇宙进行“淘金”的从业者,分享这些企业或者创业者们的故事,以独特
Top