当前位置:首页 > 元宇宙 > AI

谷歌 DeepMind 新研究:利用 AI 模型为无声视频配音

来源: 责编: 时间:2024-06-21 08:32:51 99观看
导读 6 月 18 日消息,据谷歌DeepMind新闻稿,DeepMind 近日公布了一项利用AI为无声视频生成背景音乐的“video-to-audio”技术。获悉,当前 DeepMind 这款AI模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”

6 月 18 日消息,据谷歌DeepMind新闻稿,DeepMind 近日公布了一项利用AI为无声视频生成背景音乐的“video-to-audio”技术。UVD28资讯网——每日最新资讯28at.com

获悉,当前 DeepMind 这款AI模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。UVD28资讯网——每日最新资讯28at.com

据悉,该模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。UVD28资讯网——每日最新资讯28at.com

UVD28资讯网——每日最新资讯28at.com

DeepMind同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。UVD28资讯网——每日最新资讯28at.com

展望未来,DeepMind表示研究人员正进一步优化这款“video-to-audio”模型,计划未来能够让模型直接根据视频内容,无须通过提示词即可生成视频背景音,同时还将改善视频中人物对白的口型同步能力。UVD28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4701-0.html谷歌 DeepMind 新研究:利用 AI 模型为无声视频配音

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 风清、风雷、风顺,中国气象局发布三个 AI 气象大模型系统

下一篇: 金山办公 WPS AI 海外版发布,海外月活设备数已超两亿

标签:
  • 热门焦点
Top