当前位置:首页 > 科技  > 知识百科

只需2张照片就能2D变3D,这个AI能自己脑补蜡烛吹灭过程,一作二作均为华人

来源: 责编: 时间:2023-08-07 16:30:16 312观看
导读 2张废片啪地一合!错过的精彩瞬间立刻重现,还能从2D升到3D效果。看,小男孩可爱的笑容马上跃然浮现:吹灭生日蛋糕蜡烛的瞬间也被还原了出来:咧嘴笑起来的过程看着也太治愈了吧~咱

2张废片啪地一合!L7K28资讯网——每日最新资讯28at.com

错过的精彩瞬间立刻重现,还能从2D升到3D效果。L7K28资讯网——每日最新资讯28at.com

看,小男孩可爱的笑容马上跃然浮现:L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

吹灭生日蛋糕蜡烛的瞬间也被还原了出来:L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

咧嘴笑起来的过程看着也太治愈了吧~L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

咱就是说,这回相机里熊孩子/毛孩子的废片终于有救了!L7K28资讯网——每日最新资讯28at.com

而且完全看不出是后期合成的效果,仿佛是原生拍摄的一般。L7K28资讯网——每日最新资讯28at.com

这就是谷歌、康奈尔大学、华盛顿大学最近联合推出的成果,能只用2张相近的照片还原出3D瞬间,目前已被CVPR 2022收录。L7K28资讯网——每日最新资讯28at.com

论文作者一作、二作均为华人,一作小姐姐本科毕业于浙江大学。L7K28资讯网——每日最新资讯28at.com

用2张照片正反向预测中间场景L7K28资讯网——每日最新资讯28at.com

这种方法适用于两张非常相似的照片,比如连拍时产生的一系列照片。L7K28资讯网——每日最新资讯28at.com

方法的关键在于将2张图片转换为一对基于特征的分层深度图像 (LDI),并通过场景流进行增强。L7K28资讯网——每日最新资讯28at.com

整个过程可以把两张照片分别看做是“起点”和“终点”,然后在这二者之间逐步预测出每一刻的变化。L7K28资讯网——每日最新资讯28at.com

具体来看,过程如下:L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

首先,将两张照片用单应矩阵(homegraphy)对齐,分别预测两张照片的稠密深度图。L7K28资讯网——每日最新资讯28at.com

然后将每个RGBD图像转换为彩色的LDI,通过深度感知修复背景中被遮挡的部分。L7K28资讯网——每日最新资讯28at.com

其中,RGB图像即为普通RGB图像+深度图像。L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

之后用二维特征提取器修复LDI的每个颜色层,以获取特征层,从而生成两份特征图层。L7K28资讯网——每日最新资讯28at.com

下一步就到了模拟场景运动部分。L7K28资讯网——每日最新资讯28at.com

通过预测两个输入图像之间的深度和光流,就能计算出LDI中每个像素的场景流。L7K28资讯网——每日最新资讯28at.com

而如果想要两张图之间渲染出一个新的视图、并提升到3D,在此需要将两组带特征值的LDI提升到一对3D点云中,还要沿着场景流双向移动到中间的时间点。L7K28资讯网——每日最新资讯28at.com

然后再将三维的特征点投影展开,形成正向、反向的二维特征图及对应深度图。L7K28资讯网——每日最新资讯28at.com

最后将这些映射与时间线中对应时间点的权重线性混合,将结果传给图像合成网络,就能得到最后的效果了。L7K28资讯网——每日最新资讯28at.com

实验结果L7K28资讯网——每日最新资讯28at.com

从数据方面来看,该方法在所有误差指标上,均高于基线水平。L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

在UCSD数据集上,这一方法可以保留画面中的更多细节,如(d)所示。L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

在NVIDIA数据集上进行消融实验表明,该方法在提高渲染质量上表现也很nice。L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

不过也存在一些问题:当两张图像之间的改变比较大时,会出现物体错位的现象。L7K28资讯网——每日最新资讯28at.com

比如下图中酒瓶的瓶嘴移动了,不该发生变化的酒杯也摇晃了起来。L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

还有照片如果没有拍全的地方,在合成的时候难免会出现“截肢”的情况,比如下图中喂考拉的手。L7K28资讯网——每日最新资讯28at.com

L7K28资讯网——每日最新资讯28at.com

论文地址:L7K28资讯网——每日最新资讯28at.com

https://3d-moments.github.io/L7K28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2324-0.html只需2张照片就能2D变3D,这个AI能自己脑补蜡烛吹灭过程,一作二作均为华人

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 如何确保有状态 Kubernetes 的稳定性

下一篇: 云计算核心技术Docker教程:注册服务器开放外部访问

标签:
  • 热门焦点
  • 7月安卓手机性价比榜:努比亚+红魔两款新机入榜

    7月登场的新机有努比亚Z50S Pro和红魔8S Pro,除了三星之外目前唯二的两款搭载超频版骁龙8Gen2处理器的产品,而且努比亚和红魔也一贯有着不错的性价比,所以在本次的性价比榜单
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 重估百度丨大模型,能撑起百度的“今天”吗?

    自象限原创 作者|程心 罗辑2023年之前,对于自己的“今天”,百度也很迷茫。“新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”这是2022年底,李彦宏
  • 疑似小米14外观设计图曝光:后置相机模组变化不大

    下半年的大幕已经开启,而谁将成为下半年手机圈的主角就成为了大家关注的焦点,其中被传有望拿下新一代骁龙8 Gen3旗舰芯片的小米14系列更是备受大家瞩
  • Android 14发布:首批适配机型公布

    5月11日消息,谷歌在今天凌晨举行了I/O大会,本次发布会谷歌带来了自家的AI语言模型PaLM 2、谷歌Pixel Fold折叠屏、谷歌Pixel 7a手机,同时发布了Androi
  • 联想YOGA 16s 2022笔记本将要推出,屏幕支持触控功能

    联想此前宣布,将于11月2日19:30召开联想秋季轻薄新品发布会,推出联想 YOGA 16s 2022 笔记本等新品。官方称,YOGA 16s 2022 笔记本将搭载 16 英寸屏幕,并且是一
Top