当前位置:首页 > 元宇宙 > AI

智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行

来源: 责编: 时间:2024-08-30 08:09:04 46观看
导读 8 月 28 日消息,智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早

8 月 28 日消息,智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。jeK28资讯网——每日最新资讯28at.com

官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行CogVideoX-2B,在 RTX 3060 等桌面端“甜品卡”运行CogVideoX-5B模型。jeK28资讯网——每日最新资讯28at.com

CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务,主要采用了以下技术:jeK28资讯网——每日最新资讯28at.com

3D causal VAE:通过压缩视频数据到 latent space,并在时间维度上进行解码来实现高效的视频重建。jeK28资讯网——每日最新资讯28at.com

专家 Transformer:将文本 embedding 和视频 embedding 相结合,使用 3D-RoPE 作为位置编码,采用专家自适应层归一化处理两个模态的数据,以及使用 3D 全注意力机制来进行时空联合建模。jeK28资讯网——每日最新资讯28at.com

CogVideoX-5B 与 CogVideoX-2B 详细参数比较如下:jeK28资讯网——每日最新资讯28at.com

jeK28资讯网——每日最新资讯28at.com

附相关链接:jeK28资讯网——每日最新资讯28at.com

代码仓库:https://github.com/THUDM/CogVideojeK28资讯网——每日最新资讯28at.com

模型下载:https://huggingface.co/THUDM/CogVideoX-5bjeK28资讯网——每日最新资讯28at.com

论文链接:https://arxiv.org/pdf/2408.06072jeK28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-6519-0.html智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 字节火山引擎总裁谭待:现在大模型价格回归正常水平,原来太贵了

下一篇: 国航首架C919国产大飞机来了!国产航空新篇章?

标签:
  • 热门焦点
Top