当前位置：首页 > 元宇宙 > AI

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频音效等

来源：责编：时间：2024-06-11 08:34:53 314观看

导读 6 月 6 日消息，Stability AI 立足 Stable Diffusion 文生图模型，进一步向音频领域拓展，推出了 Stable Audio Open，可以基于用户输入的提示词，生成高质量音频样本。Stable Audio Open 最长可以创建 47 秒的音乐，非常

6 月 6 日消息，Stability AI 立足 Stable Diffusion 文生图模型，进一步向音频领域拓展，推出了 Stable Audio Open，可以基于用户输入的提示词，生成高质量音频样本。

Stable Audio Open 最长可以创建 47 秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于 transforms 扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。

Stable Audio Open 目前已经开源，附上相关链接，感兴趣的用户可以在 HuggingFace 上试用。据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。

Stability AI 公司表示：“虽然它可以生成简短的音乐片段，但并不适合完整的歌曲、旋律或人声”。

Stable Audio Open 和 Stable Audio 2.0 不同是，前者为开源模型，专注于短音频片段和音效，而后者能够生成最长 3 分钟的完整音频。

相关阅读：

《Stable Audio 2.0 发布：生成最长 3 分钟音频，能帮音乐家补全创意作品》

《Stability AI 推出 Stable Audio，基于文本生成最长 90 秒音频》

本文链接：http://www.28at.com/showinfo-45-4537-0.htmlStable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频音效等

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：五粮液浓香酒：劳动节送礼的精致艺术

下一篇：腾讯混元文生图开源大模型加速库发布：生图时间缩短 75%

标签：

热门焦点

B端难做：留给魔珐科技的时间不多了

来源：零态LT元宇宙泡沫正在碎裂，进入2023年后这一赛道热度一直在递减。今年2月，微软解散了成立仅四个月的工业元宇宙部门；今年3月，该公司2017年收购的虚拟现实社交平台AltspaceVR
不同于传统数字经济，元宇宙赋予商业生态更多数字资产价值！

作者：中科基大数据元宇宙是一个去中心化的开放平台，而为了维护这样的平台，需要建立一个公平的游戏规则，确保每个元宇宙的参与者通过这个规则都可以挣到钱，他们的利益都可以得到保
元宇宙这一年：技术加速落地，助传统行业走向新阶段

美国当地时间1月8日，2023年CES（消费电子展览会）完美落幕。而在这项一年一度的科技圈盛事中，元宇宙仍是主角和焦点之一。索尼在1月6日发布了备受关注的PS VR 2头显
企业热、用户冷，元宇宙第一站将是“营销场”？

如果说2021年底什么最火热，那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语，在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日，有消息传
8个最适合艺术家发行NFT的交易市场

近年来，加密风靡全球。加密圈最令人兴奋的方面之一是它能够用于创建称为NFT 的数字资产。从 CyberKitties 到 Cyber Galleries，NFT 已成为艺术家和艺术鉴赏家的
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念
在元宇宙开会是什么样一种体验

空间就是一切还记得面对面的会议吗？就在不久前，与会者需要飞到遥远的目的地，并进行鼓舞人心的对话、网络、免费食物，甚至可能会有一两个很好的小组讨论。随之而来
Staking 收益翻倍？

以太坊质押可能很快就会有两倍的利润。Coinbase 估计，在 1 月份以太坊网络合并后，持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
PayPal CEO 的加密语录：加密货币将重新定义金融世界

PayPal 近年来一直是加密行业的倡导者。这个本身拥有超过 3.5 亿名活跃用户的支付巨头，已经允许美国和英国的用户交易或持有比特币（BTC）、以太坊（ETH）、比特现金（BCH

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频音效等

B端难做：留给魔珐科技的时间不多了

不同于传统数字经济，元宇宙赋予商业生态更多数字资产价值！

元宇宙这一年：技术加速落地，助传统行业走向新阶段

企业热、用户冷，元宇宙第一站将是“营销场”？

8个最适合艺术家发行NFT的交易市场

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

在元宇宙开会是什么样一种体验

Staking 收益翻倍？

PayPal CEO 的加密语录：加密货币将重新定义金融世界

最新推荐

茅台的元宇宙App火了，也被骂惨了

中国银保监管委提示：谨慎投资，勿做接盘侠

好莱坞：一股新的电影制作加密浪潮将颠覆这个行业

以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

NFT 技术将传世之作带入博物馆

暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗？

猜你喜欢

热门推荐

相关资讯

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 音效等

最新推荐

猜你喜欢

热门推荐

相关资讯

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频音效等