当前位置:首页 > 元宇宙 > AI

Stable Audio Open 开源 AI 模型发布:48.6 万个样本训练,可创建 47 秒短音频 音效等

来源: 责编: 时间:2024-06-11 08:34:53 71观看
导读 6 月 6 日消息,Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 Stable Audio Open,可以基于用户输入的提示词,生成高质量音频样本。Stable Audio Open 最长可以创建 47 秒的音乐,非常

6 月 6 日消息,Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 Stable Audio Open,可以基于用户输入的提示词,生成高质量音频样本。3kI28资讯网——每日最新资讯28at.com

3kI28资讯网——每日最新资讯28at.com

Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。3kI28资讯网——每日最新资讯28at.com

Stable Audio Open 目前已经开源,附上相关链接,感兴趣的用户可以在 HuggingFace 上试用。据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。3kI28资讯网——每日最新资讯28at.com

Stability AI 公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。3kI28资讯网——每日最新资讯28at.com

Stable Audio Open 和 Stable Audio 2.0 不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长 3 分钟的完整音频。3kI28资讯网——每日最新资讯28at.com

相关阅读:3kI28资讯网——每日最新资讯28at.com

《Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品》3kI28资讯网——每日最新资讯28at.com

《Stability AI 推出 Stable Audio,基于文本生成最长 90 秒音频》3kI28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4537-0.htmlStable Audio Open 开源 AI 模型发布:48.6 万个样本训练,可创建 47 秒短音频 音效等

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 五粮液浓香酒:劳动节送礼的精致艺术

下一篇: 腾讯混元文生图开源大模型加速库发布:生图时间缩短 75%

标签:
  • 热门焦点
Top