当前位置:首页 > 科技  > 知识百科

只需2张照片就能2D变3D,这个AI能自己脑补蜡烛吹灭过程,一作二作均为华人

来源: 责编: 时间:2023-08-07 16:30:16 352观看
导读 2张废片啪地一合!错过的精彩瞬间立刻重现,还能从2D升到3D效果。看,小男孩可爱的笑容马上跃然浮现:吹灭生日蛋糕蜡烛的瞬间也被还原了出来:咧嘴笑起来的过程看着也太治愈了吧~咱

2张废片啪地一合!gGG28资讯网——每日最新资讯28at.com

错过的精彩瞬间立刻重现,还能从2D升到3D效果。gGG28资讯网——每日最新资讯28at.com

看,小男孩可爱的笑容马上跃然浮现:gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

吹灭生日蛋糕蜡烛的瞬间也被还原了出来:gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

咧嘴笑起来的过程看着也太治愈了吧~gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

咱就是说,这回相机里熊孩子/毛孩子的废片终于有救了!gGG28资讯网——每日最新资讯28at.com

而且完全看不出是后期合成的效果,仿佛是原生拍摄的一般。gGG28资讯网——每日最新资讯28at.com

这就是谷歌、康奈尔大学、华盛顿大学最近联合推出的成果,能只用2张相近的照片还原出3D瞬间,目前已被CVPR 2022收录。gGG28资讯网——每日最新资讯28at.com

论文作者一作、二作均为华人,一作小姐姐本科毕业于浙江大学。gGG28资讯网——每日最新资讯28at.com

用2张照片正反向预测中间场景gGG28资讯网——每日最新资讯28at.com

这种方法适用于两张非常相似的照片,比如连拍时产生的一系列照片。gGG28资讯网——每日最新资讯28at.com

方法的关键在于将2张图片转换为一对基于特征的分层深度图像 (LDI),并通过场景流进行增强。gGG28资讯网——每日最新资讯28at.com

整个过程可以把两张照片分别看做是“起点”和“终点”,然后在这二者之间逐步预测出每一刻的变化。gGG28资讯网——每日最新资讯28at.com

具体来看,过程如下:gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

首先,将两张照片用单应矩阵(homegraphy)对齐,分别预测两张照片的稠密深度图。gGG28资讯网——每日最新资讯28at.com

然后将每个RGBD图像转换为彩色的LDI,通过深度感知修复背景中被遮挡的部分。gGG28资讯网——每日最新资讯28at.com

其中,RGB图像即为普通RGB图像+深度图像。gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

之后用二维特征提取器修复LDI的每个颜色层,以获取特征层,从而生成两份特征图层。gGG28资讯网——每日最新资讯28at.com

下一步就到了模拟场景运动部分。gGG28资讯网——每日最新资讯28at.com

通过预测两个输入图像之间的深度和光流,就能计算出LDI中每个像素的场景流。gGG28资讯网——每日最新资讯28at.com

而如果想要两张图之间渲染出一个新的视图、并提升到3D,在此需要将两组带特征值的LDI提升到一对3D点云中,还要沿着场景流双向移动到中间的时间点。gGG28资讯网——每日最新资讯28at.com

然后再将三维的特征点投影展开,形成正向、反向的二维特征图及对应深度图。gGG28资讯网——每日最新资讯28at.com

最后将这些映射与时间线中对应时间点的权重线性混合,将结果传给图像合成网络,就能得到最后的效果了。gGG28资讯网——每日最新资讯28at.com

实验结果gGG28资讯网——每日最新资讯28at.com

从数据方面来看,该方法在所有误差指标上,均高于基线水平。gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

在UCSD数据集上,这一方法可以保留画面中的更多细节,如(d)所示。gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

在NVIDIA数据集上进行消融实验表明,该方法在提高渲染质量上表现也很nice。gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

不过也存在一些问题:当两张图像之间的改变比较大时,会出现物体错位的现象。gGG28资讯网——每日最新资讯28at.com

比如下图中酒瓶的瓶嘴移动了,不该发生变化的酒杯也摇晃了起来。gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

还有照片如果没有拍全的地方,在合成的时候难免会出现“截肢”的情况,比如下图中喂考拉的手。gGG28资讯网——每日最新资讯28at.com

gGG28资讯网——每日最新资讯28at.com

论文地址:gGG28资讯网——每日最新资讯28at.com

https://3d-moments.github.io/gGG28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2324-0.html只需2张照片就能2D变3D,这个AI能自己脑补蜡烛吹灭过程,一作二作均为华人

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 如何确保有状态 Kubernetes 的稳定性

下一篇: 云计算核心技术Docker教程:注册服务器开放外部访问

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 最“俊美”淘宝卖家,靠直播和短视频圈粉,上架秒光,年销3000万

    来源 | 电商在线文|易琬玉编辑|斯问受访店铺:Ringdoll戒之人形图源:微博@御座的黄山、“Ringdoll戒之人形”淘宝店铺有关外貌的评价,黄山已经听累了。生于1985年的他,哪
  • 三星电子Q2营收60万亿韩元 存储业务营收同比仍下滑超过50%

    7月27日消息,据外媒报道,从三星电子所发布的财报来看,他们主要利润来源的存储芯片业务在今年二季度仍不乐观,营收同比仍在大幅下滑,所在的设备解决方案
  • 半导体需求下滑 三星电子DS业务部门今年营业亏损预计超10万亿韩元

    7月17日消息,据外媒报道,去年下半年开始的半导体需求下滑,影响到了三星电子、SK海力士、英特尔等诸多厂商,营收明显下滑,部分厂商甚至出现了亏损。作为
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
Top