当前位置:首页 > 科技  > 资讯

全球首个大一统多模态视频模型​可灵O1发布 让P视频像P图一样简单

来源: 责编: 时间:2025-12-05 09:22:47 107观看
导读近日,全球首个大一统的多模态视频、图片创作工具"可灵O1"正式上线。可灵O1基于全新的视频和图像模型,以自然语言作为语义骨架,配合视频、图片、主体等多模态描述,将所有生成和编辑任务融合于一个全能引擎之中,为用户搭建全

近日,全球首个大一统的多模态视频、图片创作工具"可灵O1"正式上线。可灵O1基于全新的视频和图像模型,以自然语言作为语义骨架,配合视频、图片、主体等多模态描述,将所有生成和编辑任务融合于一个全能引擎之中,为用户搭建全新的多模态创作流,实现从灵感到成品的一站式闭环。Yya28资讯网——每日最新资讯28at.com

Yya28资讯网——每日最新资讯28at.com

大一统模型,解决视频创作的所有难题Yya28资讯网——每日最新资讯28at.com

作为首个大一统多模态视频模型,可灵O1基于MVL(Multi-modal Visual Language,多模态视觉语言)理念,打破了传统单一视频生成任务的模型边界,将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务,融合于同一个全能引擎之中,使得用户无需在多个模型及工具间跳转,即可一站式完成从生成到修改的全部创作流程。Yya28资讯网——每日最新资讯28at.com

依托可灵视频O1模型的深层语义理解力,用户上传的图片、视频、主体、文字——在可灵O1眼中,皆是指令。模型打破了模态限制,能够综合理解一张照片、一段视频或一个主体,甚至一个角色的不同视角,精准生成各种细节。Yya28资讯网——每日最新资讯28at.com

Yya28资讯网——每日最新资讯28at.com

可灵O1的多模态指令输入区,让繁琐的剪辑后期变成了简单的对话。用户无需手动遮罩或关键帧,只需输入「移除路人」、「将白天改为黄昏」或「替换主角服装」,模型即可读懂影像逻辑,从局部的主体替换,到整体的视频风格重绘,自动完成像素级的语义重构。此外,如图片/主体参考;指令变换(视频增加、删除内容、切换景别/视角、视频修改任务等)、视频参考、首尾帧、文生视频等能力也一并支持。Yya28资讯网——每日最新资讯28at.com

针对AI视频难以落地的痛点——角色与场景的一致性,可灵O1底层强化了对输入图像及视频的理解。 它能像人类导演一样,“记住”主角、道具和场景。无论镜头如何流转,主体特征始终稳定如一。 此外,该模型展现了强大的多主体融合能力。用户可以自由组合多个不同主体,或将主体与参考图混搭。即便是在复杂的群像戏或互动场景中,模型也能独立锁定并保持每一位角色或道具的特征,确保“主角”在不同镜头中实现工业级的特征统一。Yya28资讯网——每日最新资讯28at.com

Yya28资讯网——每日最新资讯28at.com

不再局限于单点任务,而是支持“技能组合”。 用户可以要求可灵O1“在视频中增加主体的同时修改背景”,或者“在图片参考生成时,同步修改风格”。这种一次生成多种创意变化的能力,极大地拓展了创作的自由度,让创意的化学反应成为可能。Yya28资讯网——每日最新资讯28at.com

Yya28资讯网——每日最新资讯28at.com

叙事时长自由定义,让每一段故事都有其独特的呼吸感。可灵O1将定义时间的权力交还给创作者,支持3-10秒自由生成。无论是短促的视觉冲击,还是悠长的故事铺陈,都由用户自由掌控。 值得注意的是,作为统一模型的一部分,可灵O1的首尾帧能力也将支持3-10秒的生成时长选择(即将发布),这将进一步增强叙事的张弛度。Yya28资讯网——每日最新资讯28at.com

Yya28资讯网——每日最新资讯28at.com

一同登场的还有可灵图像O1模型,可实现从基础图像生成到高阶细节编辑全链路无缝衔接,用户既可通过纯文本生成图像,也可上传最多10张参考图进行融合再创作。 该模型具备四大核心优势:特征高度保持,让主体元素稳定不偏差;细节修改精准响应,让每一处调整都符合预期;风格调性准确把控,让画面氛围始终统一;超丰富想象力,让创意呈现更具张力,真正实现“所想即所得”。Yya28资讯网——每日最新资讯28at.com

一个模型,搞定影视、自媒体、广告电商等多视频创作场景Yya28资讯网——每日最新资讯28at.com

全新的可灵O1集生成与编辑于一体,可广泛适用于影视、自媒体、广告电商等多种场景。无论是从零构建的叙事生成,还是对既有素材的深度重塑,可灵O1都能根据不同需求,灵活调用其参考、编辑的能力,轻松完成创作。Yya28资讯网——每日最新资讯28at.com

在影视创作领域,凭借可灵O1的超强一致性的图片(主体)参考,配合主体库功能,可以精准锁定每个分镜的角色及服化道,轻松创作生成多个连贯的影视镜头;而对于视频后期、自媒体创作者来说,可通过简单对话式的提示词,如输入“删除背景中的路人”、“让天空变蓝”,就能让可灵O1自动完成像素级的智能修补与重构。Yya28资讯网——每日最新资讯28at.com

Yya28资讯网——每日最新资讯28at.com

针对传统线下广告实拍成本高,制作周期长的问题。如今用户只需上传商品图、模特图和场景图,配合简单指令描述,即可快速生成多个酷炫的商品展示广告,大幅降低实拍成本。针对模特约拍麻烦、更换背景/服装需要重复拍摄等问题,使用可灵O1,能搭建你的永不落幕的虚拟T台:上传模特 + 服装实拍图,输入指令,完美还原服饰的质感和细节,批量生产高质量的 Lookbook 视频。Yya28资讯网——每日最新资讯28at.com

Yya28资讯网——每日最新资讯28at.com

据悉,可灵O1能实现上述强大而全面的功能,源于在技术底座上的深层创新。全新的可灵视频O1模型打破视频模型在生成、编辑与理解上的功能割裂,构建了全新的生成式底座。融合多模态理解的Multimodal Transformer和多模态长上下文,实现了多任务的深度融合与统一。Yya28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-190377-0.html全球首个大一统多模态视频模型​可灵O1发布 让P视频像P图一样简单

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 快手重新定义“好的品牌营销”,助力品牌走向经营

下一篇: 快手加大低俗诱导打赏治理力度,超3.7万名主播被处罚

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • 微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 三万字盘点 Spring 九大核心基础功能

    大家好,我是三友~~今天来跟大家聊一聊Spring的9大核心基础功能。话不多说,先上目录:图片友情提示,本文过长,建议收藏,嘿嘿嘿!一、资源管理资源管理是Spring的一个核心的基础功能,不
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 消费结构调整丨巨头低价博弈,拼多多还卷得动吗?

    来源:征探财经作者:陈香羽随着流量红利的退潮,电商的存量博弈越来越明显。曾经主攻中高端与品质的淘宝天猫、京东重拾“低价”口号。而过去与他们错位竞争的拼多多,靠
  • 华为Mate 60保护壳曝光:硕大后置相机模组 凸起程度有惊喜

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • iQOO Neo8 Pro真机谍照曝光:天玑9200+和V1+旗舰双芯加持

    去年10月,iQOO推出了iQOO Neo7系列机型,不仅搭载了天玑9000+,而且是同价位唯一一款天玑9000+直屏旗舰,一经上市便受到了用户的广泛关注。在时隔半年后,
Top