当前位置:首页 > 科技  > 芯片

英伟达联合推出超强多模态模型DAM

来源:icspec 责编: 时间:2025-04-28 07:35:34 260观看
导读据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。DAM模型专注于详细局部标注(D
据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。
DAM模型专注于详细局部标注(DLC),即为特定区域生成详细且精确的描述。通过两大创新,研究人员在细节与上下文之间找到了平衡。其一是焦点提示,对目标区域进行高分辨率编码,就像给模型配备了一副“放大镜”,清晰捕捉到局部区域的细微特征。其二是局部视觉骨干网络,将精确定位的特定区域与上下文无缝整合。
在项目主页中,研究团队展示了更多精彩demo。用户通过点、框、涂鸦或掩码的交互,即可一键生成描述。例如,上传一张柯基在草地上奔跑的图片,选中柯基,DAM会生成一段详细的描述:“一只中等体型的狗,拥有浓密的红棕色毛发,腹部和腿部为白色。这只狗尾巴蓬松,耳朵尖立,戴着带有银色吊牌的红色项圈。它张着嘴露出牙齿,舌头伸在外面。狗呈奔跑姿势,前腿向前伸展,后腿向后伸直。”
DAM的技术架构确保了其在生成关键词、短语,甚至是多句式的复杂描述时,都能保持高精度和连贯性。此外,研究团队设计了基于半监督学习的流水线(DLC-SDP),通过两阶段策略构建大规模训练数据。
为了公平评估DLC模型,研究团队提出了全新基准DLC-Bench。通过LLM判断,检查描述的正确细节和错误缺失,而非简单对比文本。在DLC-Bench和其他7个涵盖图像与视频的基准测试中,DAM全面超越现有模型,树立了新的标杆。
DAM的优势主要有三大点:更详细、更准确;更少幻觉;多场景适用。其强大能力为众多应用场景打开了大门,未来诸如数据标注、医疗影像、内容创作等领域,都可以加速落地。
Long (Tony) Lian是UC伯克利电子工程与计算机科学博士研究生,他的研究主要聚焦于通过强化学习开发具备推理能力的大模型与视觉语言模型。此前,他曾在英伟达研究院Deep Imagination Research团队实习。Long (Tony) Lian本科毕业于UC伯克利计算机科学专业。

本文链接:http://www.28at.com/showinfo-27-147931-0.html英伟达联合推出超强多模态模型DAM

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 本田电动化新作:烨GT与P7双车齐发

下一篇: 和辉光电递表港交所,AMOLED面板业务表现亮眼

标签:
  • 热门焦点
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • 微软邀请 Microsoft 365 商业用户,测试视频编辑器 Clipchamp

    8 月 1 日消息,微软近日宣布即将面向 Microsoft 365 商业用户,开放 Clipchamp 应用,邀请用户通过该应用来编辑视频。微软于 2021 年收购 Clipchamp,随后开始逐步整合到 Microsof
  • 本地生活这块肥肉,拼多多也想吃一口

    出品/壹览商业 作者/李彦编辑/木鱼拼多多也看上本地生活这块蛋糕了。近期,拼多多在App首页“充值中心”入口上线了本机生活界面。壹览商业发现,该界面目前主要
  • 腾讯VS网易,最卷游戏暑期档,谁能笑到最后?

    作者:无锈钵来源:财经无忌7月16日晚,上海1862时尚艺术中心。伴随着幻象的精准命中,硕大的荧幕之上,比分被定格在了14:12,被寄予厚望的EDG战队以绝对的优势战胜了BLG战队,拿下了总决
  • 微博大门常打开,迎接海外画师漂洋东渡

    作者:互联网那些事“起猛了,我能看得懂日语了”。“为什么日本人说话我能听懂?”“中文不像中文,日语不像日语,但是我竟然看懂了”…&hell
  • 苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
  • 与兆芯合作 联想推出全新旗舰版笔记本电脑开天N7系列

    联想与兆芯合作推出全新联想旗舰版笔记本电脑开天 N7系列。这个系列采用兆芯KX-6640MA处理器平台,KX-6640MA 处理器是采用了陆家嘴架构,16nm 工艺,4 核 4 线
Top