当前位置:首页 > 科技  > 知识百科

这个CV数据集生成器火了,支持13类CV任务,DeepMind等打造

来源: 责编: 时间:2023-08-07 16:30:03 346观看
导读 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。这年头,AI玩家们想找到合适的图像数据集,简直是越来越难了。不仅数据质量参差不齐,合适的数据类型也难找(如光流

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。z3f28资讯网——每日最新资讯28at.com

这年头,AI玩家们想找到合适的图像数据集,简直是越来越难了。z3f28资讯网——每日最新资讯28at.com

不仅数据质量参差不齐,合适的数据类型也难找(如光流图、深度图等)。z3f28资讯网——每日最新资讯28at.com

为了解决这些问题,来自谷歌、MIT、DeepMind、MILA和剑桥大学等11家机构的34名研究人员,联手打造了一个名叫Kubric的数据集生成器,不仅能自己渲染,而且图像效果也非常真实。z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

不仅各种图像数据都能做,像语义分割、深度图或光流图这种“特殊数据”都能一键生成:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

还能控制渲染的真实度,渲染出的视频可以达到以假乱真的效果:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

据作者们表示,目前Kubric支持13类CV任务的数据类型生成,效果也不比用已有数据集训练出来的差。z3f28资讯网——每日最新资讯28at.com

这样的一个数据集生成器,到底要怎么上手?z3f28资讯网——每日最新资讯28at.com

可生成13类CV任务所需数据z3f28资讯网——每日最新资讯28at.com

先来看看这个Kubric数据集生成器究竟是个啥。z3f28资讯网——每日最新资讯28at.com

简单来说,它有点像是一个专为图像AI打造的“数据车间”,基于跨平台开源物理引擎PyBullet和3D图像渲染软件Blender打造。z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

其中,PyBullet给用户提供了一个模拟3D物体运动的平台,例如两个球之间的弹性碰撞参数就可以用它来模拟。(当然,除了PyBullet以外,也可以扩展到其他物理引擎如MuJoCo上)z3f28资讯网——每日最新资讯28at.com

Blender则是一个渲染3D动画的平台,但它的优势在于操作方便,而且既可以做出照片级逼真的渲染图像,也可以输出3D动画效果。(例如有设计师拿它设计服装纹理)z3f28资讯网——每日最新资讯28at.com

可能这时候你会问,Kubric相比自己手动渲染视频或图像数据集,方便在哪?z3f28资讯网——每日最新资讯28at.com

一方面,Kubric自带一系列预处理的基础图像数据库。z3f28资讯网——每日最新资讯28at.com

除了11个基础3D模型以外:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

还内置了Google Scanned Objects(GSO)室内家具物品数据集中的一系列模型,以及包含背景、光照、材料纹理等参数的Polyhaven数据集,还有ShapeNet数据集等(包含55种常见的物品类型及51300个3D模型)。z3f28资讯网——每日最新资讯28at.com

也就是说,如果你对渲染不太了解,也能利用内置的数据库快速生成想要的图像。z3f28资讯网——每日最新资讯28at.com

另一方面,Kubric直接提供了从“渲染数据”到输出“AI训练数据”的管道,省去了将渲染图像转成特殊数据(如深度图、光流图)、或是额外收集如视场、相机参数、光照等数据的麻烦。z3f28资讯网——每日最新资讯28at.com

这也使得Kubric支持生成13类CV任务所需的图像数据,具体包括光流、NeRF、姿态估计、3D重建等。z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

没错,即使这些生成的图像中有2D也有3D类型,需要的数据量也从MB到TB级别不等,但Kubric都能满足。z3f28资讯网——每日最新资讯28at.com

嗯,作者们还专门针对各种视觉任务,用Kubric生成的数据集一个个试了试,强调“用他们生成的数据集效果更好”。z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

△Kubric生成的光流图z3f28资讯网——每日最新资讯28at.com

那么,这样的数据集生成器究竟要怎么用呢?z3f28资讯网——每日最新资讯28at.com

自带Python接口z3f28资讯网——每日最新资讯28at.com

作者提供了一些简单的操作流程。z3f28资讯网——每日最新资讯28at.com

在安装之后,第一步就是创建默认场景:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

然后,再通过这两步,分别创建一块地板、和一个球体(也可以换成其他形状):z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

接下来就是在场景中加一个照明,以及渲染摄像头采集图像:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

导出文件后,就能获取一个3D球体的图像了:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

△Blender中的效果z3f28资讯网——每日最新资讯28at.com

如果需要深度图、灰度图等特殊图层的话,也是几行代码就能搞定:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

比自己手动导出要更方便一些:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

当然,如果还是感觉上手较难,作者也直接提供了示例代码,改改参数就能用:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

在原基础上,再加5行代码就能直接运行出动态视频版:z3f28资讯网——每日最新资讯28at.com

z3f28资讯网——每日最新资讯28at.com

看起来,做完数据集后,即使不懂渲染的也能成为半个行家了(doge)z3f28资讯网——每日最新资讯28at.com

目前新的一批内置数据集还在施工中,感兴趣的小伙伴可以先上手试玩~z3f28资讯网——每日最新资讯28at.com

项目地址:z3f28资讯网——每日最新资讯28at.com

https://github.com/google-research/kubricz3f28资讯网——每日最新资讯28at.com

论文地址:z3f28资讯网——每日最新资讯28at.com

https://arxiv.org/abs/2203.03570z3f28资讯网——每日最新资讯28at.com

 z3f28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2224-0.html这个CV数据集生成器火了,支持13类CV任务,DeepMind等打造

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 让图网络更稳健!谷歌提出SR-GNN,无惧数据标记偏差和领域转移

下一篇: 数学悖论证明了人工智能的局限性

标签:
  • 热门焦点
  • 7月安卓手机好评榜:三星S23Ultra好评率第一

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年7月1日至7月31日,仅限国内市场。第一名:三星Galaxy S23 Ultra好评率:95.71%在即将迎来新
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • 网传小米汽车开始筛选交付中心 建筑面积不低于3000平方米

    7月7日消息,近日有微博网友@长三角行健者爆料称,据经销商集团反馈,小米汽车目前已经开始了交付中心的筛选工作,要求候选场地至少有120个车位,建筑不能低
  • iQOO Neo8系列今日官宣:首发天玑9200+ 全球安卓最强芯!

    在昨日举行的的联发科新一代旗舰芯片天玑9200+的发布会上,iQOO官方也正式宣布,全新的iQOO Neo8系列新品将全球首发搭载这款当前性能最强大的移动平台
Top