当前位置：首页 > 元宇宙 > AI

谷歌 DeepMind 新研究：利用 AI 模型为无声视频配音

来源：责编：时间：2024-06-21 08:32:51 296观看

导读 6 月 18 日消息，据谷歌DeepMind新闻稿，DeepMind 近日公布了一项利用AI为无声视频生成背景音乐的“video-to-audio”技术。获悉，当前 DeepMind 这款AI模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”

6 月 18 日消息，据谷歌DeepMind新闻稿，DeepMind 近日公布了一项利用AI为无声视频生成背景音乐的“video-to-audio”技术。

获悉，当前 DeepMind 这款AI模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”视频可能的声音，暂时不能直接根据视频画面添加具体音效。

据悉，该模型首先会将用户输入的视频进行拆解，此后结合用户的用户文字提示，利用扩散模型反复运算，最终以生成与视频画面协调的背景声音，例如输入一条“在黑暗中行走”的无声视频，再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示，相关模型就能生成恐怖风格的背景音效。

DeepMind同时表示，该“video-to-audio”模型可以为任何视频生成无限数量的音轨，还能够通过提示词内容判断生成的音频“正向性”或“反向性”，从而令生成的声音更贴近某些特定场景。

展望未来，DeepMind表示研究人员正进一步优化这款“video-to-audio”模型，计划未来能够让模型直接根据视频内容，无须通过提示词即可生成视频背景音，同时还将改善视频中人物对白的口型同步能力。

本文链接：http://www.28at.com/showinfo-45-4701-0.html谷歌 DeepMind 新研究：利用 AI 模型为无声视频配音

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：风清、风雷、风顺，中国气象局发布三个 AI 气象大模型系统

下一篇：金山办公 WPS AI 海外版发布，海外月活设备数已超两亿

标签：

热门焦点

风口已至，多领域平台融入社交元素！

在众多领域平台中，社交元素都扮演着重要角色，如直播营销带货、线上配对听歌、游戏局内互动等。随着元宇宙时代的来临，社交产品不断升级，社交元素推动流量变现，多平台领域融入社交
刷完一场元宇宙世界杯音乐盛典，我爽了

作者|刘小土编辑|李春晖你有多久没完整追过一场音乐盛典了？三刷都不嫌多的那种。按照惯例，每逢年底，直播、长短视频、音乐平台便会抢着端上来几场音乐盛典。搁以
超跑与NFT的首次结合，兰博基尼能否破局？

兰博基尼公司近日称即将推出它的首款NFT，并且将加速进军区块链领域。这家闻名遐迩的意大利汽车厂商野心勃勃地将目光投向混合动力和电动跑车，并宣布将拍卖与瑞士
传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

今日热点：传腾讯已推出全新XR业务；摩托罗拉与Verizon合作打造5G XR颈戴式计算组件；小米AR购物导航专利获授权；VR一体机Simula One放弃众筹并开放直接预订；VR游戏《
纽约街头出现NFT自动贩卖机

一家初创公司宣布在纽约市开放一台NFT自动售货机，允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon，上个月完成了一轮300万美元的种子募捐
韩国国民银行将推出韩国首个加密货币 ETF

韩国国民银行(Kookmin Bank)计划发行该国首个以散户投资者为主要关注点的加密货币投资基金。根据公告，该银行正在等待政府批准，并已建立一个准备就绪的数字资产
从NFT数字收藏，洞察数字音乐版权市场发展趋势

去年8月9日，腾讯音乐布局NFT数字收藏，在腾讯应用宝发布幻核app，腾讯音乐的提前布局示意着未来区块链技术将对数字音乐版权市场进行改造升级。作者从深层测分析为
Ceramic：为Web3.0社交应用打造的中间件

大家关注老雅痞公众号这么久，对Web3的概念不陌生吧？让我们做一个简短的回顾，Web3主要被描述为去中心化的网络，旨在实现无服务器、去中心化的互联网，即用户掌握自己
在互联网考古后，我被豆瓣上这座元宇宙古城征服了

最近一段时间，豆瓣可谓命途多舛：APP屡次下架，平台也被相关部门约谈、处罚，国家网信办甚至派人入驻豆瓣以督促整改。有爆料称豆瓣将陆续关闭“小组”功能：这个曾经小

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

谷歌 DeepMind 新研究：利用 AI 模型为无声视频配音

风口已至，多领域平台融入社交元素！

刷完一场元宇宙世界杯音乐盛典，我爽了

超跑与NFT的首次结合，兰博基尼能否破局？

传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

纽约街头出现NFT自动贩卖机

韩国国民银行将推出韩国首个加密货币 ETF

从NFT数字收藏，洞察数字音乐版权市场发展趋势

Ceramic：为Web3.0社交应用打造的中间件

在互联网考古后，我被豆瓣上这座元宇宙古城征服了

最新推荐

刷完一场元宇宙世界杯音乐盛典，我爽了

林俊杰、余文乐等明星相继入局，元宇宙虚拟土地究竟有何魔力？

完美世界被元宇宙“拒之门外”

全面拥抱“虚拟世界”，摩登天空要打造“音乐元宇宙”

传统互联网与区块链场景下数据权利法律分析

超级账本Julian Gordon：联盟链与公链的竞争不是非此即彼

猜你喜欢

热门推荐

相关资讯