当前位置：首页 > 科技 > 网络

限时免费！通义千问多模态大模型重磅升级：性能赶超GPT-4V和谷歌Gemini

来源：责编：时间：2024-01-26 17:04:51 349观看

导读快科技1月26日消息，今日，阿里云公布多模态大模型研究进展。据悉，通义千问视觉理解模型Qwen-VL再次升级，继Plus版本之后，再次推出Max版本，升级版模型拥有更强的视觉推理能力和中文理解能力，能够根据图片识人、答题

快科技1月26日消息，今日，阿里云公布多模态大模型研究进展。

据悉，通义千问视觉理解模型Qwen-VL再次升级，继Plus版本之后，再次推出Max版本，升级版模型拥有更强的视觉推理能力和中文理解能力，能够根据图片识人、答题、创作、写代码，并在多个权威测评中获得佳绩，整体性能堪比GPT-4V和Gemini Ultra。

Qwen-VL-Plus和Qwen-VL-Max在MMMU、MathVista等测评中远超业界所有开源模型，在文档分析（DocVQA）、中文图像相关（MM-Bench-CN）等任务上超越GPT-4V，达到世界佳水平。

基础能力方面，升级版模型能够准确描述和识别图片信息，并且根据图片进行信息推理、扩展创作；具备视觉定位能力，还可针对画面指定区域进行问答。

视觉推理方面，Qwen-VL-Plus和Qwen-VL-Max可以理解流程图等复杂形式图片，可以分析复杂图标，看图做题、看图作文、看图写代码也不在话下。

限时免费！通义千问多模态大模型重磅升级：性能赶超GPT-4V和谷歌Gemini Qwen-VL-Max看图做题

图像文本处理方面，升级版Qwen-VL的中英文文本识别能力显著提高，支持百万像素以上的高清分辨率图和极端宽高比的图像，既能完整复现密集文本，也能从表格和文档中提取信息。

限时免费！通义千问多模态大模型重磅升级：性能赶超GPT-4V和谷歌Gemini Qwen-VL-Max复现密集文本

LLM（大语言模型）之后，大模型领域的下一个爆点是什么？多模态是当前具共识的方向。过去半年来，OpenAI、谷歌等争相推出多模态模型，阿里云也在2023年8月发布并开源具备图文理解能力的Qwen-VL模型，Qwen-VL取得了同期远超同等规模通用模型的表现。

视觉是多模态能力中重要的模态，作为人类感知世界、认知世界的第一感官，视觉传递的信息占据了“五感”信息的80%。通义千问视觉语言模型基于通义千问LLM开发，通过将视觉表示学习模型与LLM对齐，赋予AI理解视觉信息的能力，在大语言模型的“心灵”上开了一扇视觉的“窗”。

相比LLM，多模态大模型拥有更大的应用想象力。比如，有研究者在探索将多模态大模型与自动驾驶场景结合，为“完全自动驾驶”找到新的技术路径；将多模态模型部署到手机、机器人、智能音箱等端侧设备，让智能设备自动理解物理世界的信息；或者基于多模态模型开发应用，辅助视力障碍群体的日常生活等等。

目前，Qwen-VL-Plus和Qwen-VL-Max限时免费，用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力，也可以通过阿里云灵积平台（DashScope）调用模型API。

本文链接：http://www.28at.com/showinfo-17-68940-0.html限时免费！通义千问多模态大模型重磅升级：性能赶超GPT-4V和谷歌Gemini

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：微软的2.5倍：苹果公司人均创收达1680万元！

下一篇：销量领跑！vivo夺得2023年中国手机市场国产品牌第一

标签：

热门焦点

之家push系统迭代之路

前言在这个信息爆炸的互联网时代，能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大，传统的靠"主动拉"获取信息的方式已不能满足用
JVM优化：实战OutOfMemoryError异常

一、Java堆溢出堆内存中主要存放对象、数组等，只要不断地创建这些对象，并且保证 GC Roots 到对象之间有可达路径来避免垃圾收集回收机制清除这些对象，当这些对象所占空间超过
破圈是B站头上的紧箍咒

来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集，2021年有优酷的《山河令》，2022年有爱奇艺的《苍兰诀》，今年却轮到小破站抓住了追
东方甄选单飞：有些鸟注定是关不住的

文/彭宽鸿编辑/罗卿东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一年多时间里，东方甄选要脱离抖音自立门户的传闻不绝于耳，“7
信通院：小米、华为等11家应用商店基本完成APP签名及验签工作

中国信通院表示，目前，小米、华为、OPPO、vivo、360手机助手、百度手机助手、应用宝、豌豆荚和努比亚等9家应用商店，以及抖音和快手2家新型应用分发平
余承东:AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验

8月4日消息，2023年华为开发者大会（HDC.Together）今天正式开幕，华为发布HarmonyOS 4、全新升级的鸿蒙开发套件、HarmonyOS Next开发者预览版本等一系列
iQOO Neo8 Pro评测：旗舰双芯加持最强性能游戏旗舰

【Techweb评测】去年10月，iQOO推出了一款Neo7手机，该机搭载了联发科天玑9000+，配备独显芯片Pro+，带来了同价位段最佳的游戏体验，一经上市便受到了诸多用
最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

2022年1月份在国际消费电子展(CES2022)上首次亮相的Alienware新品——Alienware X14现在已经可以购买了，这款笔记本电脑被誉为世界上最薄的 14 英寸游戏笔
中关村论坛11月25日开幕，15位诺奖级大咖将发表演讲

11月18日，记者从2022中关村论坛新闻发布会上获悉，中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务

限时免费！通义千问多模态大模型重磅升级：性能赶超GPT-4V和谷歌Gemini

之家push系统迭代之路

JVM优化：实战OutOfMemoryError异常

破圈是B站头上的紧箍咒

东方甄选单飞：有些鸟注定是关不住的

信通院：小米、华为等11家应用商店基本完成APP签名及验签工作

余承东:AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验

iQOO Neo8 Pro评测：旗舰双芯加持最强性能游戏旗舰

最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

中关村论坛11月25日开幕，15位诺奖级大咖将发表演讲

最新推荐

猜你喜欢

热门推荐

相关资讯