当前位置:首页 > 科技  > 数码

京东携手多家伙伴,首推具身智能原子技能库,破解数据瓶颈

来源: 责编: 时间:2025-02-21 09:32:39 144观看
导读在迈向通用人工智能(AGI)的征途上,具身智能技术的突破与应用被视为不可或缺的一环。全球科技巨头纷纷加速布局,特斯拉的Optimus、Agility Digit、波士顿动力的Atlas以及Figure AI等机器人项目层出不穷,而在今年的蛇年春晚,

在迈向通用人工智能(AGI)的征途上,具身智能技术的突破与应用被视为不可或缺的一环。全球科技巨头纷纷加速布局,特斯拉的Optimus、Agility Digit、波士顿动力的Atlas以及Figure AI等机器人项目层出不穷,而在今年的蛇年春晚,机器人“扭秧歌”的趣味表演更是成为了街头巷尾的热门话题。随着大模型技术的不断精进,具身智能迎来了前所未有的发展机遇。VXb28资讯网——每日最新资讯28at.com

然而,在国内众多企业与高校推动具身智能技术发展的过程中,一个核心挑战始终如影随形——如何在有限的具身数据下,使机器人能够灵活适应复杂场景,并实现技能的高效迁移。为了攻克这一难题,京东探索研究院的李律松、李东江博士团队携手地瓜机器人秦玉森团队、中科大徐童团队、深圳大学郑琪团队、松灵机器人及睿尔曼智能吴波团队,共同发起了一项创新项目。该项目得到了清华RDT团队在baseline方法上的技术支持,旨在探索一种全新的解决方案。VXb28资讯网——每日最新资讯28at.com

项目团队提出了一种基于三轮数据驱动的原子技能库构建框架,这一创新方法突破了传统端到端具身操作的数据瓶颈。通过该框架,可以动态地自定义和更新原子技能,并结合数据收集与VLA(视觉-语言-动作)少样本学习技术,高效构建技能库。实验结果显示,该方案在数据效率和泛化能力方面均表现出色,为具身智能领域带来了革命性的突破。VXb28资讯网——每日最新资讯28at.com

具身智能,即让机器人具备身体感知与行动能力的人工智能,在生成式AI时代迎来了重要的发展契机。通过跨模态融合技术,将文本、图像、语音等数据映射到统一的语义向量空间,为具身智能技术的发展提供了新的动力。然而,现实环境的复杂性使得具身操作模型在泛化性上面临巨大挑战。端到端的训练方式虽然直观,但依赖海量数据,容易导致“数据爆炸”问题,限制了VLA技术的发展。VXb28资讯网——每日最新资讯28at.com

为了解决这一问题,项目团队提出了基于三轮数据驱动的原子技能库构建方法。该方法能够在仿真或真实环境的模型训练中显著减少数据需求。通过VLP(视觉-语言-规划)模型将任务分解为子任务,并利用高级语义抽象模块将子任务定义为通用原子技能集。随着三轮更新策略的动态扩展,技能库不断扩增,覆盖的任务范围也越来越广。这一方法将重点从端到端技能学习转向了细颗粒度的原子技能构建,有效解决了数据爆炸问题,并提升了机器人对新任务的适应能力。VXb28资讯网——每日最新资讯28at.com

VXb28资讯网——每日最新资讯28at.com

从产业落地角度来看,具身操作是机器人实现智能化的关键模块。然而,现有的端到端VLA模型在进行高频开环控制时,即便中间动作失败,仍会输出下一阶段的控制信号。这导致VLA模型在高频控制机器人或机械臂时,强烈依赖于VLP提供的低频智能控制来指导阶段性动作生成,并协调任务执行节奏。为此,项目团队构建了集成视觉感知、语言理解和空间智能的VLP Agent,以统一训练与推理的任务分解。VXb28资讯网——每日最新资讯28at.com

VXb28资讯网——每日最新资讯28at.com

VLA技术虽然取得了显著进展,但仍存在一些问题。随着技术的发展,VLA模型从专用数据向通用数据演进,机器人轨迹数据已达百万级别;模型参数规模也从千亿级向端侧部署发展。然而,在通用机器人应用中,人为定义端到端任务容易导致任务穷尽问题。物品位置泛化、背景干扰、场景变化等仍是主要挑战。即便强大的预训练模型,也需要大量数据来克服这些问题。项目团队提出的三轮数据驱动的原子技能库方法,结合SOTA VLA模型,通过高级语义抽象模块将复杂子任务映射为结构化原子技能,有效提升了VLA模型的泛化性和可塑性。VXb28资讯网——每日最新资讯28at.com

VXb28资讯网——每日最新资讯28at.com

原子技能库的构建旨在降低数据采集成本,同时增强任务适配能力,提升具身操作的通用性,以满足产业应用需求。通过基于数据驱动的原子技能库构建方法,结合端到端具身操作VLA与具身规划VLP,项目团队成功构建了一个系统化的技能库。这一技能库能够动态扩增,适应的任务范围也不断增加。相比传统的TASK级数据采集,提出的原子技能库所需要的数据采集量显著下降,同时技能适配能力得到了大幅提升。VXb28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-132024-0.html京东携手多家伙伴,首推具身智能原子技能库,破解数据瓶颈

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 中国“天关”卫星揭秘:小麦哲伦云内罕见双星,炽热大恒星伴致密白矮星

下一篇: 周鸿祎真送福利!100部华为手机无条件抽奖回馈粉丝

标签:
  • 热门焦点
  • 轿车从天而降电动车主被撞身亡 超速抢道所致:现场视频让网友吵翻

    近日,上海青浦区法院判决轿车从天而降电动车主被撞身亡案,轿车车主被判有期徒刑一年。案件显示当时男子驾驶轿车在上海某路段行驶,前车忽然转弯提速超车,
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • 一年经验在二线城市面试后端的经验分享

    忠告这篇文章只适合2年内工作经验、甚至没有工作经验的朋友阅读。如果你是2年以上工作经验,请果断划走,对你没啥帮助~主人公这篇文章内容来自 「升职加薪」星球星友 的投稿,坐
  • 三万字盘点 Spring 九大核心基础功能

    大家好,我是三友~~今天来跟大家聊一聊Spring的9大核心基础功能。话不多说,先上目录:图片友情提示,本文过长,建议收藏,嘿嘿嘿!一、资源管理资源管理是Spring的一个核心的基础功能,不
  • 只需五步,使用start.spring.io快速入门Spring编程

    步骤1打开https://start.spring.io/,按照屏幕截图中的内容创建项目,添加 Spring Web 依赖项,并单击“生成”按钮下载 .zip 文件,为下一步做准备。请在进入步骤2之前进行解压。图
  • 自动化在DevOps中的力量:简化软件开发和交付

    自动化在DevOps中扮演着重要角色,它提升了DevOps的效能。通过自动化工具和方法,DevOps团队可以实现以下目标:消除手动和重复性任务。简化流程。在整个软件开发生命周期中实现更
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
  • 荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    2022年第一季度临近尾声,在该季度内,许多品牌陆续发布自己的最新产品,让大家从全新的角度来了解当今的手机技术。手机是电子设备中,更新迭代十分迅速的一款产品,基
Top