当前位置:首页 > 元宇宙 > 元宇宙

AI绘画的下一站:“AI拍电影” 问世

来源: 责编: 时间:2023-08-11 16:53:39 526观看
导读 当大家还在惊叹和沉浸于AI文本转图像产出的精妙画作的时候,一些闷声做大事的团队已经在人工智能研究上迈向了一个新的领域—文本转视频 9月29日,扎克伯格在facebook上发布了一条关于Make-A-Video人工

当大家还在惊叹和沉浸于AI文本转图像产出的精妙画作的时候,一些闷声做大事的团队已经在人工智能研究上迈向了一个新的领域—文本转视频Ucj28资讯网——每日最新资讯28at.com

 Ucj28资讯网——每日最新资讯28at.com

9月29日,扎克伯格在facebook上发布了一条关于Make-A-Video人工智能系统的帖子,并附上了一段20s的视频,视频中汇总了Make-A-Video系统通过文本生成视频的一些片段。给Make-A-Video一个文本描述,它就可以为您创建一段视频。Ucj28资讯网——每日最新资讯28at.com

 Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

自文本转图像AI技术发布以来,也才过了几个月,人工智能技术就发展成将静态图直接飞升成动态视频了,一句话就能生成视频,不得不说近两年AI发展的速度有点近乎疯狂。Ucj28资讯网——每日最新资讯28at.com

不过在Meta发布之后仅一周,谷歌就紧随其后发布了他们在人工智能领域的最新成果Imagen Video和Phenaki两种模型,前者可以生成1280*768分辨率,24帧/秒的高清视频,后者可以将一系列的文本提示生成连贯的长视频。这么看Meta的Make-A-Video还是逊色一点。Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

其实文本生成视频技术并不是什么新鲜事儿,早在今年的6月份,清华&智源研究院就自研了“一句话生成视频”的模型CogVideo,并且将这一模型在gitub上开源了(刚发布不久立马就出圈了)Ucj28资讯网——每日最新资讯28at.com

下面我们就一起来了解下这三个团队各自的模型到底如何吧。Ucj28资讯网——每日最新资讯28at.com

01

CogVideoUcj28资讯网——每日最新资讯28at.com

CogVideo可以生成分辨率为480*480(画质有点渣),4秒(帧数32张)左右的视频,而且在生成真实的对象,以及内容一致性和运动真实性方面的表现相较于当时的其他视频生成AI模型来说都要更好,从下图的我们不难看出这一点,生成的实际人物相关的视频看上去都比较自然和流畅。Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

但是有些地方还是值得再探究下,比如这个狮子正在喝水的视频,CogVideo是直接给狮子加上了一双手,这和我们的常规认知是背道而驰的,仿佛只是把人的手拿水喝这个动作和狮子做了一个拼接。不过在Meta的Make-A-Video生成的视频中也存在类似的情况。Ucj28资讯网——每日最新资讯28at.com

那接下来我们就看看Make-A-Video的表现吧!Ucj28资讯网——每日最新资讯28at.com

02

Make-A-VideoUcj28资讯网——每日最新资讯28at.com

Make-A-Video目前已经实现了下面三个功能Ucj28资讯网——每日最新资讯28at.com

  • 文字转视频Ucj28资讯网——每日最新资讯28at.com

  • 图片转视频(将一张图片变为动态视频或者将两张图片合成为一个视频)Ucj28资讯网——每日最新资讯28at.com

  • 通过原始视频生成视频的变体Ucj28资讯网——每日最新资讯28at.com

Meta的官网上也给出了一些的案例。Ucj28资讯网——每日最新资讯28at.com

03

Imagen Video & PhenakiUcj28资讯网——每日最新资讯28at.com

首先值得一提的是Imagen Video的清晰度,相比前两个系统生成的视频有了非常大的提升,目前支持生成1280*768分辨率,24帧/秒的视频,下面是官网放出的视频案例效果片段。Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

甚至还能理解3D结构Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

最重要的是 Imagen Video 能够生成各种不同风格的文本动画Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

不过目前谷歌方面表示不会发布 Imagen Video 模型或其源代码,以避免存在模型可能被滥用于制造虚假、仇恨、露骨或有害的内容。Ucj28资讯网——每日最新资讯28at.com

通过官网和论文公布的信息可以了解到Phenaki目前可以做到Ucj28资讯网——每日最新资讯28at.com

1. 通过不同的描述切换生成的视频风格或切换场景,生成连贯多样化的视频Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

2. 给一个静态的图像作为第一帧+一段文本描述就可以生成一个视频Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

3. 通过一连串的文字描述描述生成2分钟以上的长视频(视频案例请移步Phenaki官网查看:https://phenaki.github.io/#interactive)Ucj28资讯网——每日最新资讯28at.com

Ucj28资讯网——每日最新资讯28at.com

而且生成的视频还具备故事情节。这样的话,那未来是不是人人都可以通过文本创建视频,就不需要拍摄和剪辑了(惊讶!!!)如果真的能实现,那可能会给视频行业带来翻天覆地的变化。目前Meta和Google团队都暂未提供线上试用入口,有感兴趣的朋友可以去尝试用下CogVideo在线网页看看文字转视频的效果(可点击原文链接跳转):Ucj28资讯网——每日最新资讯28at.com

网址:https://huggingface.co/spaces/THUDM/CogVideoUcj28资讯网——每日最新资讯28at.com

文字转视频的AI技术在短短的几个月内就已经取得了巨大的进展,似乎每天都有新的突破,难以想象再过几个月这个技术是不是又会迈向了一个新的阶层,一起拭目以待吧!Ucj28资讯网——每日最新资讯28at.com

更多最新资讯和业内领先方案分析关注九日论道哟。也欢迎大家加入我们的知识星球,星球也正在做第二年的续费哈。Ucj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-40-498-0.htmlAI绘画的下一站:“AI拍电影” 问世

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 中美科技巨头死磕元宇宙

下一篇: 中青宝推出元宇宙婚礼,这么好的题材又玩砸了

标签:
  • 热门焦点
  • 这一超级富豪“逆袭”,身价大增4330亿

    来源:侃见财经互联网的突围没有“终点”。在快节奏的商业环境下,不断的试错成了互联网企业的标配,一年一个风口,一个风口造就一个热点,但是回头来看,最终受益的还是身处
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 上、中、下游加深融合,搭建元宇宙产业全景

    元宇宙产业链涉及多种技术和多个领域。在上游,聚集着大量的技术厂商,提供元宇宙相关的硬件和软件支持;在中游,内容运营与分发领域也吸引着越来越多的企业以VR内容
  • 数字经济、数据要素与数字治理

    深入理解数字经济与数据要素,有利于更准确理解和把握数字治理的基本规律,构建面向未来的健康的数字治理体系,也才能更好地理解元宇宙的治理框架。 一、数字经济
  • 美国单曲排行榜Billboard和World of Women合作推出NFT杂志封面

    今天,Billboard宣布与流行的NFT头像集World of Women(WoW)建立新的伙伴关系,向NFT生态系统又迈进了一步。在这次合作中,WoW的创建者Yam Karkai将帮助这个音乐行业巨
  • 知名艺术家打造去中心化“好莱坞”:一部电影一个DAO

    根据市场追踪网站 DappRadar 的数据,随着 NFT 的“出圈”与加密货币的普及,NFT 市场在 2021 年的销售额达到约 250 亿美元,而 2020 年仅为 9490 万美元,同比增超 2
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
  • Ceramic:为Web3.0社交应用打造的中间件

    大家关注老雅痞公众号这么久,对Web3的概念不陌生吧?让我们做一个简短的回顾,Web3主要被描述为去中心化的网络,旨在实现无服务器、去中心化的互联网,即用户掌握自己
Top