当前位置:首页 > 科技  > 芯片

英伟达联合推出超强多模态模型DAM

来源:icspec 责编: 时间:2025-04-28 07:35:34 229观看
导读据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。DAM模型专注于详细局部标注(D
据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。
DAM模型专注于详细局部标注(DLC),即为特定区域生成详细且精确的描述。通过两大创新,研究人员在细节与上下文之间找到了平衡。其一是焦点提示,对目标区域进行高分辨率编码,就像给模型配备了一副“放大镜”,清晰捕捉到局部区域的细微特征。其二是局部视觉骨干网络,将精确定位的特定区域与上下文无缝整合。
在项目主页中,研究团队展示了更多精彩demo。用户通过点、框、涂鸦或掩码的交互,即可一键生成描述。例如,上传一张柯基在草地上奔跑的图片,选中柯基,DAM会生成一段详细的描述:“一只中等体型的狗,拥有浓密的红棕色毛发,腹部和腿部为白色。这只狗尾巴蓬松,耳朵尖立,戴着带有银色吊牌的红色项圈。它张着嘴露出牙齿,舌头伸在外面。狗呈奔跑姿势,前腿向前伸展,后腿向后伸直。”
DAM的技术架构确保了其在生成关键词、短语,甚至是多句式的复杂描述时,都能保持高精度和连贯性。此外,研究团队设计了基于半监督学习的流水线(DLC-SDP),通过两阶段策略构建大规模训练数据。
为了公平评估DLC模型,研究团队提出了全新基准DLC-Bench。通过LLM判断,检查描述的正确细节和错误缺失,而非简单对比文本。在DLC-Bench和其他7个涵盖图像与视频的基准测试中,DAM全面超越现有模型,树立了新的标杆。
DAM的优势主要有三大点:更详细、更准确;更少幻觉;多场景适用。其强大能力为众多应用场景打开了大门,未来诸如数据标注、医疗影像、内容创作等领域,都可以加速落地。
Long (Tony) Lian是UC伯克利电子工程与计算机科学博士研究生,他的研究主要聚焦于通过强化学习开发具备推理能力的大模型与视觉语言模型。此前,他曾在英伟达研究院Deep Imagination Research团队实习。Long (Tony) Lian本科毕业于UC伯克利计算机科学专业。

本文链接:http://www.28at.com/showinfo-27-147931-0.html英伟达联合推出超强多模态模型DAM

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 本田电动化新作:烨GT与P7双车齐发

下一篇: 和辉光电递表港交所,AMOLED面板业务表现亮眼

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • Redmi Pad评测:红米充满野心的一次尝试

    从Note系列到K系列,从蓝牙耳机到笔记本电脑,红米不知不觉之间也已经形成了自己颇有竞争力的产品体系,在中端和次旗舰市场上甚至要比小米新机的表现来得更好,正所谓“大丈夫生居
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 10天营收超1亿美元,《星铁》比《原神》差在哪?

    来源:伯虎财经作者:陈平安即便你没玩过《原神》,你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天,有粉丝因为索尼在PS平台上线《原神》,怒而
  • 网传小米汽车开始筛选交付中心 建筑面积不低于3000平方米

    7月7日消息,近日有微博网友@长三角行健者爆料称,据经销商集团反馈,小米汽车目前已经开始了交付中心的筛选工作,要求候选场地至少有120个车位,建筑不能低
  • iQOO 11S屏幕细节公布:首发三星2K E6全感屏 安卓最好的直屏手机

    日前iQOO手机官方宣布,新一代电竞旗舰iQOO 11S将会在7月4日19:00正式与大家见面。随着发布时间的日益临近,官方关于该机的预热也更加密集,截至目前已
  • 滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 存在16项违法事实开始于2121年7月,历经一年时间,网络安全审查办公室对“滴滴出行”网络安全审查终于有了一个暂时的结束。据“网信
Top