当前位置:首页 > 科技  > 资讯

谷歌 DeepMind 新研究:利用 AI 模型为无声视频配音

来源: 责编: 时间:2024-06-20 08:55:10 306观看
导读来源:IT之家 据谷歌 DeepMind 新闻稿,DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的 "video-to-audio" 技术。IT 之家获悉,当前 DeepMind 这款 AI 模型依然存在局限性,需要开发者使用提示词为模型预先 " 介绍

来源:IT之家 q4V28资讯网——每日最新资讯28at.com

据谷歌 DeepMind 新闻稿,DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的 "video-to-audio" 技术。q4V28资讯网——每日最新资讯28at.com

IT 之家获悉,当前 DeepMind 这款 AI 模型依然存在局限性,需要开发者使用提示词为模型预先 " 介绍 " 视频可能的声音,暂时不能直接根据视频画面添加具体音效q4V28资讯网——每日最新资讯28at.com

据悉,该模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条 " 在黑暗中行走 " 的无声视频,再添加 " 电影、恐怖片、音乐、紧张、混凝土上的脚步声 " 等文字提示,相关模型就能生成恐怖风格的背景音效。q4V28资讯网——每日最新资讯28at.com

q4V28资讯网——每日最新资讯28at.com

DeepMind 同时表示,该 "video-to-audio" 模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频 " 正向性 " 或 " 反向性 ",从而令生成的声音更贴近某些特定场景q4V28资讯网——每日最新资讯28at.com

展望未来,DeepMind 表示研究人员正进一步优化这款 "video-to-audio" 模型,计划未来能够让模型直接根据视频内容,无须通过提示词即可生成视频背景音,同时还将改善视频中人物对白的口型同步能力。q4V28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-94985-0.html谷歌 DeepMind 新研究:利用 AI 模型为无声视频配音

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 再次亮相欧洲杯,容声冰箱硬核诠释中国制造“新模样”

下一篇: 微软承认 4 月 /5 月更新导致 Win10 开始菜单 / 任务栏应用交互 BUG

标签:
  • 热门焦点
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 如何使用JavaScript创建一只图像放大镜?

    译者 | 布加迪审校 | 重楼如果您曾经浏览过购物网站,可能遇到过图像放大功能。它可以让您放大图像的特定区域,以便浏览。结合这个小小的重要功能可以大大改善您网站的用户体验
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 华为和江淮汽车合作开发百万元问界MPV?双方回应来了

    8月1日消息,郭明錤今天在社交平台发文称,华为正在和江淮汽车合作,开发售价在100万元的问界MPV,预计在2024年第2季度量产,销量目标为上市首年交付5万辆。
  • 2299元起!iQOO Pad明晚首销:性能最强天玑平板

    5月23日,iQOO如期举行了新品发布会,除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外,还在发布会上推出了旗下首款平板电脑——iQOO Pad,其最大的卖点
  • SN570 NVMe SSD固态硬盘 价格与性能兼具

    SN570 NVMe SSD固态硬盘是西部数据发布的最新一代WD Blue系列的固态硬盘,不仅闪存技术更为精进,性能也得到了进一步的跃升。WD Blue SN570 NVMe SSD的包装外
Top