当前位置:首页 > 科技  > 网络

首个图像生成基础模型 阿里通义千问深夜开源Qwen-Image 支持中英双语

来源: 责编: 时间:2025-08-05 09:21:25 175观看
导读 快科技8月5日消息,今天凌晨,阿里通义千问宣布开源Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得显著进展。据了解,该模型专注于提升AI在两大

快科技8月5日消息,今天凌晨,阿里通义千问宣布开源Qwen-Image,一个20B的MMDiT模型。OEv28资讯网——每日最新资讯28at.com

这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得显著进展。OEv28资讯网——每日最新资讯28at.com

据了解,该模型专注于提升AI在两大核心场景的能力:复杂的文本渲染与精准的图像编辑。OEv28资讯网——每日最新资讯28at.com

功能亮点:OEv28资讯网——每日最新资讯28at.com

强大的文字渲染能力(本次开源)OEv28资讯网——每日最新资讯28at.com

效果领先:在多个文本测评榜单中,文字渲染均获得SOTA。OEv28资讯网——每日最新资讯28at.com

原生渲染:文字是图像生成时直出的,而非后期添加,效果更真实。OEv28资讯网——每日最新资讯28at.com

功能全面:支持中英双语,多变字体,超长段落,超小文字,并可实现复杂的多位置图文布局。OEv28资讯网——每日最新资讯28at.com

基础扎实:除了文字,模型在人物情绪、细节刻画和多样的风格渲染上也同样表现出色。OEv28资讯网——每日最新资讯28at.com

精准的图像编辑能力(即将发布)OEv28资讯网——每日最新资讯28at.com

效果稳定:多个图像编辑测评榜单SOTA。OEv28资讯网——每日最新资讯28at.com

链式编辑:在多轮连续修改后,仍能保持主体ID的一致性。OEv28资讯网——每日最新资讯28at.com

文字编辑:可以编辑图像中的文字。OEv28资讯网——每日最新资讯28at.com

复杂编辑:可编辑人物姿势,提取图像纹理等。OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

通义千问在多个公开基准上对Qwen-Image进行全面评估,包括用于通用图像生成的GenEval、DPG和OneIG-Bench,以及用于图像编辑的GEdit、ImgEdit和GSO。OEv28资讯网——每日最新资讯28at.com

Qwen-Image在所有基准测试中均取得了先进的性能,展现出其在图像生成与图像编辑方面的强大能力。OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

此外,在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的结果表明,Qwen-Image在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的先进模型。OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

除了文本处理,Qwen-Image在通用图像生成方面也表现出色,支持多种艺术风格。OEv28资讯网——每日最新资讯28at.com

在图像编辑方面,Qwen-Image支持风格迁移、增删改、细节增强、文字编辑,人物姿态调整等多种操作,让普通用户也能轻松实现专业级图像编辑。OEv28资讯网——每日最新资讯28at.com

首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语OEv28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-175593-0.html首个图像生成基础模型 阿里通义千问深夜开源Qwen-Image 支持中英双语

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 官方提醒警惕AI“数据投毒” 0.01%虚假训练文本可致有害内容增加11.2%

下一篇: 10岁小女孩快递站玩耍 手臂被卷入传送带 整个身体悬空

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 每天一道面试题-CPU伪共享

    前言:了不起:又到了每天一到面试题的时候了!学弟,最近学习的怎么样啊 了不起学弟:最近学习的还不错,每天都在学习,每天都在进步! 了不起:那你最近学习的什么呢? 了不起学弟:最近在学习C
  • 年轻人的“职场羞耻感”,无处不在

    作者:冯晓亭 陶 淘 李 欣 张 琳 马舒叶来源:燃次元“人在职场,应该选择什么样的着装?”近日,在网络上,一个与着装相关的帖子引发关注,在该帖子里,一位在高级写字楼亚洲金
  • 苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

    据 The Elec 报道,苹果已要求其供应商为未来的 iPhone 型号开发「无边框」OLED 显示面板。苹果显然已要求三星和 LG Display 开发新的 OLED 显示面
  • 半导体需求下滑 三星电子DS业务部门今年营业亏损预计超10万亿韩元

    7月17日消息,据外媒报道,去年下半年开始的半导体需求下滑,影响到了三星电子、SK海力士、英特尔等诸多厂商,营收明显下滑,部分厂商甚至出现了亏损。作为
  • iQOO Neo8 Pro真机谍照曝光:天玑9200+和V1+旗舰双芯加持

    去年10月,iQOO推出了iQOO Neo7系列机型,不仅搭载了天玑9000+,而且是同价位唯一一款天玑9000+直屏旗舰,一经上市便受到了用户的广泛关注。在时隔半年后,
Top