当前位置:首页 > 科技  > 芯片

英伟达联合推出超强多模态模型DAM

来源:icspec 责编: 时间:2025-04-28 07:35:34 222观看
导读据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。DAM模型专注于详细局部标注(D
据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。
DAM模型专注于详细局部标注(DLC),即为特定区域生成详细且精确的描述。通过两大创新,研究人员在细节与上下文之间找到了平衡。其一是焦点提示,对目标区域进行高分辨率编码,就像给模型配备了一副“放大镜”,清晰捕捉到局部区域的细微特征。其二是局部视觉骨干网络,将精确定位的特定区域与上下文无缝整合。
在项目主页中,研究团队展示了更多精彩demo。用户通过点、框、涂鸦或掩码的交互,即可一键生成描述。例如,上传一张柯基在草地上奔跑的图片,选中柯基,DAM会生成一段详细的描述:“一只中等体型的狗,拥有浓密的红棕色毛发,腹部和腿部为白色。这只狗尾巴蓬松,耳朵尖立,戴着带有银色吊牌的红色项圈。它张着嘴露出牙齿,舌头伸在外面。狗呈奔跑姿势,前腿向前伸展,后腿向后伸直。”
DAM的技术架构确保了其在生成关键词、短语,甚至是多句式的复杂描述时,都能保持高精度和连贯性。此外,研究团队设计了基于半监督学习的流水线(DLC-SDP),通过两阶段策略构建大规模训练数据。
为了公平评估DLC模型,研究团队提出了全新基准DLC-Bench。通过LLM判断,检查描述的正确细节和错误缺失,而非简单对比文本。在DLC-Bench和其他7个涵盖图像与视频的基准测试中,DAM全面超越现有模型,树立了新的标杆。
DAM的优势主要有三大点:更详细、更准确;更少幻觉;多场景适用。其强大能力为众多应用场景打开了大门,未来诸如数据标注、医疗影像、内容创作等领域,都可以加速落地。
Long (Tony) Lian是UC伯克利电子工程与计算机科学博士研究生,他的研究主要聚焦于通过强化学习开发具备推理能力的大模型与视觉语言模型。此前,他曾在英伟达研究院Deep Imagination Research团队实习。Long (Tony) Lian本科毕业于UC伯克利计算机科学专业。

本文链接:http://www.28at.com/showinfo-27-147931-0.html英伟达联合推出超强多模态模型DAM

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 本田电动化新作:烨GT与P7双车齐发

下一篇: 和辉光电递表港交所,AMOLED面板业务表现亮眼

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • 6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月份有一个618,虽然这是京东周年庆的日子,但别的电商也都不约而同的跟进了,反正促销没坏处,厂商和用户都能满意。618期间一些产品也出现了历史低价,那么各个价位段的产品性价比
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 疑似小米14外观设计图曝光:后置相机模组变化不大

    下半年的大幕已经开启,而谁将成为下半年手机圈的主角就成为了大家关注的焦点,其中被传有望拿下新一代骁龙8 Gen3旗舰芯片的小米14系列更是备受大家瞩
  • 三星Galaxy Z Fold/Flip 5国行售价曝光 :最低7499元/12999元起

    据官方此前宣布,三星将于7月26日也就是明天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
Top