当前位置:首页 > 元宇宙 > AI

单图直出 CAD 工程文件,新研究解决 AI 生成 3D 模型“不可编辑”痛点

来源: 责编: 时间:2025-04-16 07:18:36 207观看
导读 单张图直接就能生成可编辑的 CAD 工程文件!来自魔芯科技、NTU 等的研究人员提出图生 3D 新框架,名为 CADCrafter。CADCrafter 和过去得到网格(Mesh)或 3D 高斯泼溅(3DGS)的图生 3D 方法大不相同。不管是零件渲染图,

单张图直接就能生成可编辑的 CAD 工程文件!来自魔芯科技、NTU 等的研究人员提出图生 3D 新框架,名为 CADCrafter。YzB28资讯网——每日最新资讯28at.com

CADCrafter 和过去得到网格(Mesh)或 3D 高斯泼溅(3DGS)的图生 3D 方法大不相同。YzB28资讯网——每日最新资讯28at.com

不管是零件渲染图,还是拍摄的 3D 打印零件,甚至是随意拍摄的日常生活中的物体,CADCrafter 均能够生成的对应的原始 CAD 文件(以 CAD 指令的方式表示,包括表征每个几何特征的指令和对应参数)。YzB28资讯网——每日最新资讯28at.com

并且通过 CAD 编译器进行编译,可得到直接生产加工的 3D 文件(如 STP 格式的文件)。用户可以通过编辑 CAD 指令实现对物体的编辑(下图右)。YzB28资讯网——每日最新资讯28at.com

YzB28资讯网——每日最新资讯28at.com

实验中,从落地实用性、表面质量等特点来看,CADCrafter 相较于目前的图生 3D 方法均有显著提升。YzB28资讯网——每日最新资讯28at.com

YzB28资讯网——每日最新资讯28at.com

这项研究的作者来自 KOKONI 3D(魔芯科技)、新加坡南洋理工大学、新加坡 A*STAR、西湖大学、德州大学奥斯汀分校和浙江大学。通讯作者为魔芯科技创始人 Tianrun Chen 和新加坡 A*STAR 研究科学家 Fayao Liu。论文已被 CVPR 2025 接收。YzB28资讯网——每日最新资讯28at.com

YzB28资讯网——每日最新资讯28at.com

以下是更多细节。YzB28资讯网——每日最新资讯28at.com

从图像到高质量 CAD 模型的端到端生成流程

在现实世界中,大多数人造物体最初都是通过计算机辅助设计(CAD)软件以参数化的方式建模的。YzB28资讯网——每日最新资讯28at.com

然而,如今大热的 3D AI 生成内容(3D AIGC)技术,例如 TRELLIS 等方法,大多仍依赖于“网格模型”(Mesh)作为基础。YzB28资讯网——每日最新资讯28at.com

问题也随之而来。YzB28资讯网——每日最新资讯28at.com

相比 CAD 的参数化设计,网格模型不仅难以理解,更难精确编辑。用户想要修改一个小部件的尺寸?在 CAD 中只需调整参数,在网格模型中却可能要大动干戈。YzB28资讯网——每日最新资讯28at.com

而且,这些 AI 生成的网格模型表面常常不够光滑,边缘也不够锐利,尤其是使用像 Marching Cubes 这样的算法从隐式函数转换生成网格时,几何质量更容易受到影响。YzB28资讯网——每日最新资讯28at.com

这种粗糙不清的表面,在需要高质量渲染或动画的应用中,显得格外捉襟见肘。YzB28资讯网——每日最新资讯28at.com

相比之下,CAD 的参数化模型则提供了极高的可控性和精度。它们允许用户直接通过参数调整几何形状,实现快速且精准的修改,大大提升了设计的灵活性与可解释性。YzB28资讯网——每日最新资讯28at.com

CADCrafter 就率先尝试了从 Image-to-Mesh 到 Image-to-CAD 的范式转变。YzB28资讯网——每日最新资讯28at.com

方法概述如下:YzB28资讯网——每日最新资讯28at.com

YzB28资讯网——每日最新资讯28at.com

1. 基于 VAE 与 Diffusion Transformer 的隐空间生成框架

CADCrafter 采用了一种结合 VAE 与扩散模型的两阶段生成架构。YzB28资讯网——每日最新资讯28at.com

首先,团队训练了一个变分自编码器(VAE),将 CAD 指令序列映射到一个结构化的隐空间。YzB28资讯网——每日最新资讯28at.com

接着,在该隐空间中引入条件扩散生成过程:基于 Diffusion Transformer(DiT)架构,训练一个扩散生成大模型,输入条件为用户提供的图像,从而实现图像引导下的 CAD 隐空间采样与生成。YzB28资讯网——每日最新资讯28at.com

2. 蒸馏策略:从多视图到单视图的高效建模转移

考虑到从单张图像重建 CAD 模型的挑战性,团队首先构建了一个多视图输入的 DiT 生成模型,以更稳定地学习图像到 CAD 空间的映射关系。YzB28资讯网——每日最新资讯28at.com

随后,通过引入蒸馏机制(使用 Ldistill 损失),将多视图模型的知识迁移到单视图模型中,从而实现了仅基于单张图像进行高质量 CAD 生成的能力。YzB28资讯网——每日最新资讯28at.com

3. 引入基于 DPO 的可编译性代码检查机制

在 CAD 生成过程中,CAD 指令还需经过 CAD 内核(CAD Kernel)解析,才能生成可视的 3D 模型。YzB28资讯网——每日最新资讯28at.com

然而,若生成指令存在语义错误,例如不闭合曲线等问题,模型构建将直接失败。YzB28资讯网——每日最新资讯28at.com

为解决这一关键挑战,作者设计了一个代码合理性判别模块,用于判断生成的 CAD 代码是否能够被成功编译。YzB28资讯网——每日最新资讯28at.com

作者进一步采用 DPO(Direct Preference Optimization)损失,引导模型倾向于生成更可编译、几何结构完整的 CAD 指令,从而显著提升最终 3D 模型生成的成功率与实用性。YzB28资讯网——每日最新资讯28at.com

渲染零件、拍摄的 3D 打印零件等均能重建

研究团队选取多个标准 CAD 模型,使用 KOKONI SOTA 3D 打印机将其打印成实物,并通过拍照获取图像输入。YzB28资讯网——每日最新资讯28at.com

实验表明,CADCrafter 能够基于单张图像,准确生成结构清晰、符合几何特征的 CAD 建模指令,其生成效果在细节还原度方面优于现有方法。YzB28资讯网——每日最新资讯28at.com

YzB28资讯网——每日最新资讯28at.com

拍摄日常生活中的物体,CADCrafter 也能直接生成其设计制造时可用的工程文件,其表面平面度、棱角等细节均符合物体被生产加工制造时的特点(良好表面、尺寸和几何特征均可编辑)。YzB28资讯网——每日最新资讯28at.com

YzB28资讯网——每日最新资讯28at.com

这一成果不仅展示了 CADCrafter 在建模精度上的突破,也展现了其在实际应用场景中的可行性。YzB28资讯网——每日最新资讯28at.com

例如,在制造与维修领域,工程师可通过拍摄现有零件照片,快速生成可编辑的 CAD 模型,进而加速原型设计或零件重建流程。YzB28资讯网——每日最新资讯28at.com

团队相信,CADCrafter 为 AI 辅助工业设计提供了新的解决方案,其从 Image-to-Mesh 到 Image-to-CAD 的范式转变,有助于推动图像驱动的 AI 3D 建模向真正可落地应用迈出关键一步。YzB28资讯网——每日最新资讯28at.com

论文链接:https://arxiv.org/pdf/2504.04753YzB28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位(ID:QbitAI),作者:CADCrafter 团队,原标题《单图直出 CAD 工程文件!CVPR 2025 新研究解决 AI 生成 3D 模型“不可编辑”痛点|魔芯科技 NTU 等出品》YzB28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12274-0.html单图直出 CAD 工程文件,新研究解决 AI 生成 3D 模型“不可编辑”痛点

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 高德发布 AI 导航智能体:高速驾车场景下可感知车道级交通流变化、事件事故

下一篇: Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌,此前被质疑刷榜作弊

标签:
  • 热门焦点
  • 元宇宙终究没火过两年

    来源:传播体操在ChatGPT快速破圈的同时,元宇宙的热度却一泻千里。虽然互联网大厂们都没有否认元宇宙的长期想象力,但在行动上却都纷纷表示了对元宇宙短期前景的悲观。号称改变
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 虚拟人再升级,企业可以解放双手了?

    来源:伯虎财经今天想跟大家来唠唠AI,其实聊到这个话题很多人都不陌生了。在ChatGPT和AIGC大热背后,还有一位低调的“大佬”——虚拟人。比如咱们熟知的虚
  • 企业热、用户冷,元宇宙第一站将是“营销场”?

    如果说2021年底什么最火热,那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语,在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日,有消息传
  • 江西将探索成立元宇宙联盟,韩国将加强对NFT和元宇宙的监管

    《元宇宙新鲜事》有:江西将探索成立元宇宙联盟,支持南昌规划建设元宇宙试验区;韩国金融监督局将加强对NFT和元宇宙的监管;任天堂社长表示暂时不打算加入元宇宙。【
  • 中国区块链产业生态地图报告(2021)

    区块链是技术整合创新、金融创新、组织方式创新、产业应用创新的多维度创新,以服务实体经济、政务民生以及公共服务等领域为落脚点,以期实现整个地区和产业的资
  • 高通成立欧洲XR实验室;ICICB计划进军元宇宙......

    扩展现实(XR)通过计算机将真实与虚拟相结合,打造了一个可人机交互的虚拟环境,将AR、VR、MR多种技术相融合,为体验者带来了虚拟世界与现实世界之间无缝转换的“沉浸
  • “我没搞懂元宇宙,但一天能赚9w块”

    作者:郑宇轩最近几个月,“元宇宙”爆火,除了 Facebook 改名为 Meta 高调进军元宇宙外, BAT 为代表的大厂纷纷着手“元宇宙”新业务。刹那之间,元宇宙成为新风口,除了
  • 元宇宙专题二:GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+DEFI(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
Top