当前位置:首页 > 科技  > 网络

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTA

来源: 责编: 时间:2024-05-22 17:07:38 254观看
导读 只需上传一张照片,就能瞬间变换身份,获得高精度个人写真!或是科幻电影中的超级英雄,或是穿越时空的复古角色……李飞飞在家做饭的样子有了,还有让斯嘉丽一键带圣诞帽。除此之外,杨幂+小兰两位人脸融

只需上传一张照片,就能瞬间变换身份,获得高精度个人写真!YIx28资讯网——每日最新资讯28at.com

或是科幻电影中的超级英雄,或是穿越时空的复古角色……YIx28资讯网——每日最新资讯28at.com

李飞飞在家做饭的样子有了,还有让斯嘉丽一键带圣诞帽。YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTAYIx28资讯网——每日最新资讯28at.com

除此之外,杨幂+小兰两位人脸融合在一起会是什么样子?YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTAYIx28资讯网——每日最新资讯28at.com

中山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTAYIx28资讯网——每日最新资讯28at.com

终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持上更具优势YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTAYIx28资讯网——每日最新资讯28at.com

只需单张照片就可快速保留五官细节YIx28资讯网——每日最新资讯28at.com

ConsistentID框架包括两个关键模块:多模态面部 ID 生成器和ID保存网络。YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTAYIx28资讯网——每日最新资讯28at.com

多模态面部提示生成器由两个基本组件组成:细粒度多模态特征提取器,专注于捕获详细的面部信息,以及用来学习面部ID特征的提取器。YIx28资讯网——每日最新资讯28at.com

另一方面,ID保存网络同时利用面部文本和视觉提示,通过面部注意力定位策略防止来自不同面部区域的 ID 信息混合。YIx28资讯网——每日最新资讯28at.com

这种方法确保了面部区域ID一致性的保存。YIx28资讯网——每日最新资讯28at.com

多模态面部提示生成器YIx28资讯网——每日最新资讯28at.com

首先在细粒度多模态特征提取器这一模块中,使用了包括文本嵌入、面部嵌入和面部编码器这三个关键组件。需要独立学习细粒度的面部视觉和文本嵌入,并将它们输入到设计的轻量级面部编码器中,以生成细粒度的多模态面部特征。YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTA△用于生成细粒度多模态面部特征的面部编码器框架。YIx28资讯网——每日最新资讯28at.com

面部ID特征提取器。YIx28资讯网——每日最新资讯28at.com

除了细粒度面部特征的输入条件外,我们还将字符的整体 ID 信息注入到我们的 ConsistentID 中作为视觉提示。具体来说,将完整的人脸图像同时输入到两个编码器中进行视觉特征提取。在这两个编码器之后,使用由 IPA-FaceID-Plus 初始化的参数的轻量级投影模块来生成整个图像的人脸嵌入。YIx28资讯网——每日最新资讯28at.com

ID保存网络。YIx28资讯网——每日最新资讯28at.com

通过引导面部特征的注意力与相应的面部区域对齐来保持局部 ID 特征的一致性。这种优化策略源于观察到传统的交叉注意力图倾向于同时关注整个图像,这对在面部区域生成期间保持 ID 特征提出了挑战。为了解决这个问题,我们在训练期间引入了面部分割掩码,以从面部区域的增强文本交叉注意模块中学习到的注意力分数。YIx28资讯网——每日最新资讯28at.com

除此之外,研究团队还引入了测量细粒度面部生成数据集 FGID,解决了现有数据集中用于捕获不同身份保留面部细节的局限性。YIx28资讯网——每日最新资讯28at.com

该数据集包括面部区域和整个面部的面部特征和描述,辅以一种新颖的细粒度身份一致性度量,建立了细粒度面部生成性能的综合评估框架。YIx28资讯网——每日最新资讯28at.com

具体效果YIx28资讯网——每日最新资讯28at.com

在面部特征比较上,该方法生成的图像在眼睛、鼻子和嘴巴等面部特征中表现出很强的一致性。YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTAYIx28资讯网——每日最新资讯28at.com

在定性评估中,研究团队对目前先进方法,包括Fastcomposer,IP-Adapter、Photomaker和InstantID进行来比较分析,对每种方法使用默认参数,并将推理限制为单个参考图像。YIx28资讯网——每日最新资讯28at.com

除此之外,还与Photomaker方法对齐,使用 Mystyle数据集进行定量评估,并结合超过10个身份数据集进行可视化。YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTAYIx28资讯网——每日最新资讯28at.com

终可以看到,ConsistentID在高质量生成、灵活的可编辑性和强大的身份保真度方面表现出更强大的能力。YIx28资讯网——每日最新资讯28at.com

而在定量评估中,在大多数评估指标中,ConsistentID始终优于其他方法,并且在生成效率方面超过了其他基于IP-Adapter的方法。YIx28资讯网——每日最新资讯28at.com

杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTA△在风格化和动作指令两个特殊任务上的定性比较YIx28资讯网——每日最新资讯28at.com

试玩链接:http://consistentid.natapp1.cc/YIx28资讯网——每日最新资讯28at.com

项目链接:YIx28资讯网——每日最新资讯28at.com

[1]https://github.com/JackAILab/ConsistentIDYIx28资讯网——每日最新资讯28at.com

[2]https://ssugarwh.github.io/consistentid.github.io/YIx28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-89942-0.html杨幂+小兰会是什么样 中山大学新AI成果:人脸个性化SOTA

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 数字化衰退:过去十年有1/4的网页已彻底消失

下一篇: 网红王红权星被各社交平台封禁 网友一致叫好:专家称炫富不得人心

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 太卷!Redmi MAX 100英寸电视便宜了:12999元买Redmi史上最大屏

    8月5日消息,从小米商城了解到,Redmi MAX 100英寸巨屏电视日前迎来官方优惠,到手价12999元,比发布价便宜了7000元,在大屏电视市场开卷。据了解,Redmi MAX 100
  • 掘力计划第 20 期:Flutter 混合开发的混乱之治

    在掘力计划系列活动第20场,《Flutter 开发实战详解》作者,掘金优秀作者,Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 十个简单但很有用的Python装饰器

    装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用
  • 微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 存在16项违法事实开始于2121年7月,历经一年时间,网络安全审查办公室对“滴滴出行”网络安全审查终于有了一个暂时的结束。据“网信
Top