当前位置:首页 > 科技  > 知识百科

神经辐射场基于点,训练速度提升30倍,渲染质量超过NeRF

来源: 责编: 时间:2023-08-07 16:29:58 372观看
导读 2020 年是立体神经渲染(Volumetric neural rendering)爆发的一年,比如 NeRF 可以生成高质量的视图合成结果,但这种方法需要对每个场景进行优化,导致重建时间过长。另一方面,深度多

2020 年是立体神经渲染(Volumetric neural rendering)爆发的一年,比如 NeRF 可以生成高质量的视图合成结果,但这种方法需要对每个场景进行优化,导致重建时间过长。另一方面,深度多视图立体(multi-view stereo)方法可以通过网络推理快速重建场景几何。oOt28资讯网——每日最新资讯28at.com

来自南加州大学、Adobe Research 的研究者们提出了 Point-NeRF,该方法使用神经 3D 点云及其相关神经特征,将立体神经渲染以及深度多视图立体方法两者的优点进行结合,来建模辐射场。oOt28资讯网——每日最新资讯28at.com

在本文中,从 1000 个点发展出完整的点云:oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

通过逐步优化最初的 COLMAP 点的渲染结果:oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

在基于光线行进的渲染 pipeline 中,通过聚合场景表面附近的神经点特征,Point-NeRF 可以被有效渲染。此外,Point-NeRF 可通过对预训练深度网络的直接推理进行初始化,产生神经点云;该点云可以被微调,比 NeRF 训练时间快 30 倍,且重建视觉质量超过 NeRF。Point-NeRF 可以与其他 3D 重建方法相结合,并通过一种新的剪枝和增长机制处理这些方法中的错误和异常值。在 DTU、NeRF Synthetics、ScanNet 和 Tanks and Temples 数据集上的实验表明,Point-NeRF 可以超越现有方法,取得 SOTA 结果。oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/pdf/2201.08845.pdf论文主页:https://xharlie.github.io/projects/project_sites/pointnerf/Point-NeRFoOt28资讯网——每日最新资讯28at.com

Point-NeRF 是基于点的神经辐射场,这是一种高质量神经场景重建和渲染的新方法,图 2 (b)为架构图:oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

体渲染和辐射场:基于物理的体渲染可以通过可微射线推进(differentiable ray marching)进行数值计算。具体而言,一个像素的辐射可以通过一束光线穿过该像素来计算,在 {x_j | j = 1, ..., M} 中沿射线采样 M 个着色点,并使用体积密度累积辐射,如:oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

这里τ表示体积透光率,σ_j 和 r_j 是 x_j 处每个着色点 j 的体积密度和辐射度,Δ_t 是相邻着色样本之间的距离。NeRF 建议使用多层感知器(MLP)来回归这样的辐射场。本研究提出的 Point-NeRF 利用神经点云来计算体积属性,从而实现更快和更高质量的渲染。oOt28资讯网——每日最新资讯28at.com

基于点的辐射场:该研究用 P = {(p_i, f_i,γ_i)|i = 1,…N}表示神经点云,P_I 处的每个点为 i,与编码局部场景内容的神经特征向量 f_i 相关联。该研究还为每个点分配了一个置信值γ_i∈[0,1],表示该点位于实际场景表面附近的可能性。该研究从这个点云反演辐射场。oOt28资讯网——每日最新资讯28at.com

给定任意 3D 位置 x,在半径为 R 的范围内查询 K 个相邻神经点。基于点的辐射场可以抽象为一个神经模块,它从邻近的神经点对任何阴影位置 x 上的视觉依赖亮度 r(沿任何视觉方向 d)和体积密度σ进行回归,如下所示:oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

该研究使用具有多个子 MLP 的类似 PointNet 的神经网络来进行回归。总体而言,该研究首先对每个神经点进行神经处理,然后聚合多点信息以获得最终估计。oOt28资讯网——每日最新资讯28at.com

Point-NeRF 重建oOt28资讯网——每日最新资讯28at.com

Point-NeRF 重建 pipeline 可用于有效地重建基于点的辐射场。首先利用跨场景训练的深度神经网络,通过直接网络推理生成基于点的初始场。这个初始场通过点增长和剪枝技术进一步优化每个场景,从而实现最终的高质量辐射场重建。图 3 显示了这个工作流程,其中包含用于初始预测和场景优化的相应梯度更新。oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

给定一组已知图像 I_1、...、I_Q 和点云,Point-NeRF 表示可以通过优化随机初始化的每一个点的神经特征和具有渲染损失的 MLP(类似于 NeRF)来重建。然而,这种纯粹的逐场景优化依赖于现有的点云,并且可能非常缓慢。oOt28资讯网——每日最新资讯28at.com

因此,该研究提出了一个神经生成模块,通过前馈神经网络预测所有神经点属性,包括点位置 p_i 、神经特征 f_i 和点置信度 γ_i ,以实现高效重建。在很短的时间内,渲染质量更好或与 NeRF 相当,而后者需要更长的时间来优化(参见表 1 和表 2)。oOt28资讯网——每日最新资讯28at.com

端到端重建:该研究结合多视图点云,得到最终的神经点云。该研究用渲染损失从头到尾训练点生成网络和表示网络(见图 3),这允许生成模块产生合理的初始辐射场。该研究还使用合理的权重在 Point-NeRF 表示中初始化 MLP,从而显着节省了每个场景的拟合时间。oOt28资讯网——每日最新资讯28at.com

此外,除了使用完整的生成模块外,该研究的 pipeline 还支持使用从其他方法(如 COLMAP [44])进行点云重建,其中模型(不包括 MVS 网络)仍然可以为每个点提供有意义的初始神经特征。oOt28资讯网——每日最新资讯28at.com

实验oOt28资讯网——每日最新资讯28at.com

该研究首先在 DTU 测试集上对模型进行评估,比较内容包括 PixelNeRF 、IBRNet 、MVSNeRF 和 NeRF ,并用 10k 迭代微调所有方法以进行比较。此外,该研究仅用 1k 迭代以展示 Point-NeRF 优化效率。具体结果如下:oOt28资讯网——每日最新资讯28at.com

表 1 为不同方法定量比较,比较内容包括 PSNR, SSIM, LPIPS,图 6 为渲染结果。由结果可得,在 10k 次迭代之后,SSIM 和 LPIPS 达到最佳,分别为 0.957 和 0.117,优于 MVSNeRF 和 NeRF 结果。IBRNet 生成的 PSNR 结果稍好一些为 31.35,但 Point-NeRF 可以恢复更精确的纹理细节和高光,如图 6 所示。oOt28资讯网——每日最新资讯28at.com

另一方面,IBRNet 的微调成本也更高,相同的迭代次数,比 Point-NeRF 微调多花 1 小时,也就是 5 倍的时间。这是因为 IBRNet 依赖大型的全局 CNN,而 Point-NeRF 利用局部点特征以及 MLP 更容易优化。更重要的是,基于点的表示位于实际场景表面附近,从而避免了在空场景中采样射线点(ray points),从而实现高效的逐场景优化。oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

虽然 IBRNet 中更复杂的特征提取器可以提高质量,但它会增加内存使用,影响训练效率。更重要的是,Point-NeRF 生成网络已经提供了高质量的初始辐射场,以支持高效优化。该研究发现,即使经过 2 min / 1K 的微调迭代,Point-NeRF 也能获得非常高的视觉质量,可与 MVSNeRF 最终的 10k 次迭代结果相媲美,这也证明了 Point-NeRF 方法重建效率的高效性。oOt28资讯网——每日最新资讯28at.com

虽然 Point-NeRF 是在 DTU 数据集上训练而来,但其可以很好地泛化到新的数据集。该研究展示了在 NeRF synthetic 数据集中,Point-NeRF 与其他 SOTA 方法比较结果,定性结果如图 7 ,定量结果如表 2。oOt28资讯网——每日最新资讯28at.com

实验结果表明,Point-NeRF_20K 明显优于 IBRNet 结果,具有更好的 PSNR、SSIM 和 LIPIPS;该研究还通过更好的几何和纹理细节实现了高质量渲染,如图 7 所示。oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

oOt28资讯网——每日最新资讯28at.com

与不同场景的比较:Point-NeRF 在 20K 迭代后,非常接近 NeRF 在 200K 迭代训练后的结果。从视觉上来讲,Point-NeRF 在 20K 迭代后在某些情况下已经有了更好的渲染效果,例如图 7 中的 Ficus 场景(第四行)。Point-NeRF_20K 只用了 40 分钟进行优化,而 NeRF 需要 20 + 小时,两者相比,Point-NeRF 快了近 30 倍,但 NSVF 的优化效果只比 Point-NeRF 的 40 分钟效果略好。如图 7 所示,Point-NeRF 200K 结果包含最多的几何和纹理细节,而且,该方法是唯一可以完全恢复的方法。oOt28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2187-0.html神经辐射场基于点,训练速度提升30倍,渲染质量超过NeRF

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 阿里云第三财季营收195亿元 非互联网客户占比过半

下一篇: 云计算核心技术Docker教程:Docker Compose 介绍

标签:
  • 热门焦点
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    在今天下午的小米Civi 2新品发布会上,小米还带来了一款新的降噪蓝牙耳机Necklace,我们也在发布结束的第一时间给大家带来这款耳机的简单分享。现在大家能见到最多的蓝牙耳机
  • 小米平板5 Pro 12.4简评:多专多能 兼顾影音娱乐的大屏利器

    疫情带来了网课,网课盘活了安卓平板,安卓平板市场虽然中途停滞了几年,但好的一点就是停滞的这几年行业又有了新的发展方向,例如超窄边框、高刷新率、多摄镜头组合等,这就让安卓
  • 容量越大越不坏?24万块硬盘故障率报告公布 这些产品零故障

    8月5日消息,云存储服务商Backblaze发布了最新的硬盘故障率报告,年故障率有所上升。Backblaze发布的硬盘季度统计数据,其中包括故障率等重要方面。这些结
  • K6:面向开发人员的现代负载测试工具

    K6 是一个开源负载测试工具,可以轻松编写、运行和分析性能测试。它建立在 Go 和 JavaScript 之上,它被设计为功能强大、可扩展且易于使用。k6 可用于测试各种应用程序,包括 Web
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 消费结构调整丨巨头低价博弈,拼多多还卷得动吗?

    来源:征探财经作者:陈香羽随着流量红利的退潮,电商的存量博弈越来越明显。曾经主攻中高端与品质的淘宝天猫、京东重拾“低价”口号。而过去与他们错位竞争的拼多多,靠
  • Windows 11发布,微软一改往常对老机型开放的态度

    距离 Windows 11 发布已经过去一周,在过去一周里,很多数码爱好者围绕其对 Android 应用的支持、对老机型的升级问题展开了激烈讨论。与以往不同的是,在这次大
Top