当前位置:首页 > 科技  > 知识百科

谷歌公布13GB 3D扫描数据集:17大类、1030个家用物品

来源: 责编: 时间:2023-08-07 16:30:17 353观看
导读 近年来,深度学习技术使得计算机视觉和机器人领域的许多进展成为可能,但训练深度模型需要各种各样的输入,以泛化到新的场景。此前,计算机视觉领域已经利用网页抓取技术收集了数百

raS28资讯网——每日最新资讯28at.com

近年来,深度学习技术使得计算机视觉和机器人领域的许多进展成为可能,但训练深度模型需要各种各样的输入,以泛化到新的场景。raS28资讯网——每日最新资讯28at.com

此前,计算机视觉领域已经利用网页抓取技术收集了数百万个主题的数据集,包括 ImageNet、Open Image、Youtube-8M、COCO 等。然而,给这些数据集贴标签仍是一个劳动密集型工作,标签错误可能会影响到对技术进步的感知,而且这种策略也很难推广至 3D 或真实世界的机器人数据上。与图像不同的是,目前网络上并没有大规模、高质量的 3D 场景,而从真实世界收集这类数据又极具挑战性。此外,人工标注员也很难从图像中提取 3D 几何特性。raS28资讯网——每日最新资讯28at.com

一般来说,使用 Gazebo、Bullet、MuJoCo、Unity 等工具对机器人和环境进行仿真可以减轻上述限制。但是,仿真毕竟不完全是真实世界,即使一个场景是直接通过对真实环境的 3D 扫描建立起来的,扫描中的离散对象也会像固定的背景物一样,不会像真实世界的对象那样对输入做出回应。raS28资讯网——每日最新资讯28at.com

因此,关键问题在于提供一个高质量的 3D 对象模型库,这些模型可以整合到物理和视觉建模中,为深度学习提供所需的多样性。raS28资讯网——每日最新资讯28at.com

为了解决这个问题,谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描家用物品组成的精选集,可用于 Ignition Gazebo、Bullet 模拟器和其他可以读取 SDF 模型格式的工具。raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

在一篇论文中,研究者介绍了该数据集的收集、管理、扩展等内容。raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

论文链接:https://arxiv.org/pdf/2204.11918.pdfraS28资讯网——每日最新资讯28at.com

据不完全统计,GSO 数据集已经在计算机视觉、计算机图形学、机器人操作、机器人导航和 3D 形状处理等 10 个项目的 12 篇论文中得到应用:raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

该研究贡献主要有几点:raS28资讯网——每日最新资讯28at.com

提出 Google Scanned Objects 数据集;3D 扫描 pipeline 设计;3D 扫描管理和发布过程;该数据集在研究领域中的影响。数据集的创建raS28资讯网——每日最新资讯28at.com

GSO 数据集起源于 2011 年谷歌的云机器人计划,目的是让机器人基于普通家用物品的高保真 3D 模型,能够在自己的环境中识别和抓取物体。raS28资讯网——每日最新资讯28at.com

然而,除了物体识别和机器人抓取之外,3D 模型还有很多用途,包括用于物理模拟的场景构建和用于终端用户应用的 3D 物体可视化。因此,谷歌研究院发起了一个项目,将 3D 体验大规模引入谷歌,以低于传统商业级产品摄影的成本收集大量家用物品的 3D 扫描图像。raS28资讯网——每日最新资讯28at.com

这是一项端到端的工程,包括物体获取、新颖的 3D 扫描硬件、高效的 3D 扫描软件、快速 3D 渲染的质量保障、网络与移动浏览器,以及人机交互研究。raS28资讯网——每日最新资讯28at.com

在收集数据之后,研究者构建了一个 pipeline,让这些数据能以各种格式使用。raS28资讯网——每日最新资讯28at.com

3D 扫描 pipelineraS28资讯网——每日最新资讯28at.com

即使限于家用物品的领域,3D 扫描也会带来独特的挑战,包括高效的物理扫描设置、目标照明、相机可靠性、扫描仪性能、配色、纹理渲染,以及处理光学上不一致的材料,比如近白色、有光泽或透明的表面。raS28资讯网——每日最新资讯28at.com

专用的 3D 扫描硬件是劳动密集型的,性价比不高。为了进行大规模扫描,还需要一些更具可用性和可靠性的工具。raS28资讯网——每日最新资讯28at.com

因此,研究者设计了自己的专用扫描硬件和软件(图 2),能够在 10 分钟内扫描物体并生成高分辨率模型。控制光线的物理外壳(图 2b)使用两台机器视觉相机和一台投影仪进行结构光扫描,捕捉 3D 几何图形,并使用单独的单反高分辨率相机以产品友好的光线捕捉纹理。raS28资讯网——每日最新资讯28at.com

项目第一年结束的时候能够做到每周超过 400 次扫描,过程中,研究团队共获得了 100K 份 360 度照片旋转和 10k 份完全 3D 扫描的独特对象。raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

图 2。raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

图 3:作为校准过程的扫描。(a) 校正模式使 2D pipeline 能够精确对齐相机。(b) 计算机控制的投影仪为 3D 扫描物体创造了类似的图案。(c) 合适的模式能够以亚像素精度探测位置。(d) 提取扫描物体的完整 3D 形状。raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

图 4:扫描的物品需要通过质量检查。(a) 许多物品被捕获为高质量的封闭流形 mesh。(b) 有的物体很少产生无效的 mesh,但有时会出现变形。raS28资讯网——每日最新资讯28at.com

仿真模型转换raS28资讯网——每日最新资讯28at.com

这些原始的扫描模型使用协议缓冲元数据、非常高分辨率的可视化、不适合模拟的格式。对象的一些物理属性,比如质量,会被捕获,但诸如摩擦之类的表面属性在元数据中则没有表示。raS28资讯网——每日最新资讯28at.com

为了让这些扫描的模型能够在仿真系统中使用,每个模型都通过一个 pipeline 进行下列步骤:raS28资讯网——每日最新资讯28at.com

过滤无效对象。分配对象名称。验证对象 mesh。计算物理属性。构造碰撞体积。减小模型尺寸。创建 SDF 模型。创建缩略图。打包模型。数据集属性组成raS28资讯网——每日最新资讯28at.com

GSO 数据集包含 1030 个扫描对象和相关的元数据,总计 13GB,根据 CCBY 4.0 License 授权。表 III.1 分解了数据集中的模型类别。raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

表 III.1raS28资讯网——每日最新资讯28at.com

优势raS28资讯网——每日最新资讯28at.com

自动化 pipeline 可以快速生成大量模型,而无需手工处理。因为这些模型是扫描的,而不是手工建模的,所以它们是真实的,而不是理想中的,这减少了将学习从模拟转移到真实世界的困难。raS28资讯网——每日最新资讯28at.com

扫描仪的玻璃平台可以从各个方面扫描模型,包括底座,不像其他扫描仪有不透明的平台。类似地,从环境中提取的模型通常缺少像底座这样起到衔接作用的遮挡区域。raS28资讯网——每日最新资讯28at.com

因为该扫描仪根据投影图案而不是深度照相机数据重建表面形状,所以得到的 mesh 具有高保真度。光滑的表面是平滑的,轮廓边缘是准确的 (图 5)。相比之下,RGB-D 数据得到的 mesh,可能出现斑驳和不规则,特别是在轮廓上。raS28资讯网——每日最新资讯28at.com

raS28资讯网——每日最新资讯28at.com

图5raS28资讯网——每日最新资讯28at.com

限制raS28资讯网——每日最新资讯28at.com

同时,这个数据集也有一些限制:扫描仪的捕捉区域不能容纳比面包箱 (约 50 厘米) 大的对象,因此该数据集不包括在其他数据集中较大的对象,如椅子、汽车或飞机。同样,扫描分辨率是有限的,所以非常小的对象不能以合理的保真度建模。此外,生成的纹理是漫反射的:高度镜面或透明的对象不能表征出来,生成结果也不够理想。raS28资讯网——每日最新资讯28at.com

更多细节可参考原论文。raS28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2329-0.html谷歌公布13GB 3D扫描数据集:17大类、1030个家用物品

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 你的AI模型可能有后门!图灵奖得主发53页长文:小心恶意预测

下一篇: 云安全日报220517:IBM MQ消息中间件平台发现执行任意代码漏洞,需要尽快升级

标签:
  • 热门焦点
  • 俄罗斯:将审查iPhone等外国公司设备 保数据安全

    iPhone和特斯拉都属于在各自领域领头羊的品牌,推出的产品也也都是数一数二的,但对于一些国家而言,它们的产品可靠性和安全性还是在限制范围内。近日,俄罗斯联邦通信、信息技术
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 一个注解实现接口幂等,这样才优雅!

    场景码猿慢病云管理系统中其实高并发的场景不是很多,没有必要每个接口都去考虑并发高的场景,比如添加住院患者的这个接口,具体的业务代码就不贴了,业务伪代码如下:图片上述代码有
  • 得物宠物生意「狂飙」,发力“它经济”

    作者|花花小萌主近日,得物宣布正式上线宠物鉴别,通过得物App内的“在线鉴别”,可找到鉴别宠物的选项。通过上传自家宠物的部位细节,就能收获拥有专业资质认证的得物鉴
  • 腾讯VS网易,最卷游戏暑期档,谁能笑到最后?

    作者:无锈钵来源:财经无忌7月16日晚,上海1862时尚艺术中心。伴随着幻象的精准命中,硕大的荧幕之上,比分被定格在了14:12,被寄予厚望的EDG战队以绝对的优势战胜了BLG战队,拿下了总决
  • 一条抖音4亿人围观 ! 这家MCN比无忧传媒还野

    作者:Hiu 来源:互联网品牌官01 擦边少女空降热搜,幕后推手曝光被网友誉为“纯欲天花板”的女网红井川里予,近期因为一组哥特风照片登上热搜,引发了一场互联网世界关于
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • 华为将推出盘古数字人大模型 可帮助用户12小时完成数字人生成

    在今日举行的2023年华为云数字文娱AI创新峰会上,华为云全球Marketing与销售服务总裁石冀琳表示,华为云将在后续推出盘古数字人大模型,可帮助用户12小
Top