当前位置:首页 > 元宇宙 > AI

李飞飞团队实现“隔空建模”,透过遮挡物还原完整 3D 人体模型

来源: 责编: 时间:2024-01-15 09:18:10 365观看
导读 注意看,这个男人搬着一个长长的柜子,画面中半个人都被遮挡住了。但即使有这样的遮挡,男人的整个身体在 AI 面前依然是无所遁形。哪怕是蹲在椅子背后只露出头,依然可以被模型完整还原。从遮挡物背后把人“揪”出来

注意看,这个男人搬着一个长长的柜子,画面中半个人都被遮挡住了。DZc28资讯网——每日最新资讯28at.com

但即使有这样的遮挡,男人的整个身体在 AI 面前依然是无所遁形。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

哪怕是蹲在椅子背后只露出头,依然可以被模型完整还原。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

从遮挡物背后把人“揪”出来的,是李飞飞团队推出的人体建模新工具 Wild2Avatar(本文简称 W2A)。DZc28资讯网——每日最新资讯28at.com

只要一段 4 秒左右的单角度视频,就能构建出完整的 3D 模型,有遮挡也不怕。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

相比此前的 SOTA 方法,Wild2Avatar 在人体建模上可谓是实现了质的飞跃。DZc28资讯网——每日最新资讯28at.com

建模效果完胜 Vid2Avatar

从下面的对比图中(从左到右依次为带遮挡原图、Vid2Avatar 提取结果和 W2A 提取结果)可以看到,作为 baseline 的 Vid2Avatar 方法只能大概描绘出人的轮廓,遮挡物直接被“拍扁”到了人物身上,而且轮廓看上去也不够准确。DZc28资讯网——每日最新资讯28at.com

而 W2A 提取出的任务不仅轮廓更加精确,看上去也更具立体感,关键是遮挡物被完美地去除,显现出了完整的人物结构。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

对遮挡物的去除,W2A 操作得也更为彻底,没有留下多余的痕迹。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

而 baseline 中部分结构缺失的现象,在 W2A 中也没有发生,人物的结构十分完整。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

而且,W2A 的人物建模是动态的,视频画面中,就算整个人都藏在椅子后面,依然可以输出人物模型。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

和另一 baseline OccNeRF 相比,W2A 只需 100 帧的训练视频就能复原出完整干净的结构,但后者用了 500 帧的系列视频后不仅结构缺陷极大,还存在许多“鬼影”。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

测试数据也表明,对于陌生场景,W2A 的提取质量和完整性(comp.)都比 V2A 有所提升,特别是对遮挡(llm)部分,合成质量得分接近翻番。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

和 OccNeRF 相比,W2A 与 500 帧训练数据的 OccNeRF 整体成绩接近,但遮挡部分仍然是有明显增强。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

那么,Wild2Avatar 是如何实现的呢?DZc28资讯网——每日最新资讯28at.com

人物与遮挡分层处理

工作过程中,W2A 将整个场景分成了遮挡物、人物本体和背景三部分。DZc28资讯网——每日最新资讯28at.com

这三个部分由独立的 NeRF 网络分别预测特征,渲染图像时再将三个部分的输出拼合。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

这种做法的主要目的是为了避免遮挡被误当成人体的一部分,出现 Video2Avatar 那样把遮挡物合成进人物的情况。DZc28资讯网——每日最新资讯28at.com

具体来说,李飞飞团队将图像映射到一个球空间,背景位于球外,人物和遮挡物则分别位于球空间内部的不同位置。DZc28资讯网——每日最新资讯28at.com

遮挡空间是通过内部采样点的坐标和距离来构造的。用于遮挡部分的生成网络与背景共享,可以预测遮挡空间样本点的颜色和密度值。DZc28资讯网——每日最新资讯28at.com

而人体部分的处理则是使用 SMPL 的参数化方式,通过正向和反向皮肤拟合,先将人体变形到一个姿态不变的坐标空间,再输入神经网络进行学习。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

为了增强任务模型的完整性,李飞飞团队还设计了新的损失计算方式。DZc28资讯网——每日最新资讯28at.com

首先利用现成的分割模型输出人体的二值分割掩码,并掩码取反得到“非人体”区域的掩码,即为可能的遮挡区域。DZc28资讯网——每日最新资讯28at.com

同时,从 W2A 渲染的三个部分中遮挡部分的密度图,然后根据提取结果再分离出人体部分。DZc28资讯网——每日最新资讯28at.com

其中人体部分与前面得到的“非人体”掩码进行与非运算,得到的结果再和遮挡部分的密度图做二值交叉熵运算,就得到了遮挡解耦损失 Locc。DZc28资讯网——每日最新资讯28at.com

DZc28资讯网——每日最新资讯28at.com

Locc 会与像素重构损失、场景分解损失等其他损失参数一并纳入到整个网络的端到端训练过程,用于优化更新网络参数。DZc28资讯网——每日最新资讯28at.com

论文地址:DZc28资讯网——每日最新资讯28at.com

https://arxiv.org/abs/2401.00431DZc28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位 (ID:QbitAI),作者:克雷西DZc28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-3196-0.html李飞飞团队实现“隔空建模”,透过遮挡物还原完整 3D 人体模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 更多作家起诉 OpenAI 和微软:“窃取”他们的作品训练 AI 模型

下一篇: 谷歌家务机器人单挑斯坦福炒虾机器人!端茶倒水逗猫,连甩三连弹开打

标签:
  • 热门焦点
  • 元宇宙的文旅赛道,还能如何发力?

    来源:X增强现实苹果推出Vision Pro,为XR行业注入一剂强心针。而在苹果开发者大会上迪士尼CEO鲍勃·艾格在宣布迪士尼与苹果达成合作,其Disney+流媒体服务将于Vision Pro
  • 数字人的AB面:在元宇宙中过气,在AIGC中重生

    来源:光锥智能作者:郝 鑫“29800元一年的虚拟主播,号称24小时不停播,月入十几万,实际上却是关键词都不能回复,播了半个月,直播间还因违规被快手封禁,最终投诉无门、退款无果。&
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 冰墩墩还能火多久?

    作者:田巧云题图源自北京2022年冬奥会官方微博如果要问2022年的开年明星是谁,冰墩墩当仁不让。几乎所有人都被那个抖雪的动作实力圈粉。在社交媒体的助推,以及日
  • 元宇宙时代NFT的价值衡量

    有人认为NFT的高昂价格只是炒作的产物,并不具有其对等的价值,但其实NFT并不是空中楼阁,只是区块链数字分类账中的一种形式。诚然,目前的NFT仍处于灰色地带,相关的法
  • 全面拥抱“虚拟世界”,摩登天空要打造“音乐元宇宙”

    作者:袁佳琦沈黎晖不怎么打游戏,但许多事儿在他眼里都“有意思”。好玩,有意思,是他的口头禅,在接受娱乐独角兽的采访过程中,他多次提到,做虚拟音乐人,“是件挺好玩的
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • 知名艺术家打造去中心化“好莱坞”:一部电影一个DAO

    根据市场追踪网站 DappRadar 的数据,随着 NFT 的“出圈”与加密货币的普及,NFT 市场在 2021 年的销售额达到约 250 亿美元,而 2020 年仅为 9490 万美元,同比增超 2
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
Top