当前位置:首页 > 科技  > 资讯

可灵AI数字人来了 支持情绪与动作控制、轻松打造“有灵魂”的数字角色

来源: 责编: 时间:2025-09-20 09:16:12 103观看
导读近日,可灵AI数字人正式亮相,凭借领先的口型精准度、情绪动作演绎和跨风格泛化能力,重新定义了数字人技术的行业标杆。用户仅需上传一张角色图片、输入角色表达内容或一段音频,就能生成最长1分钟、极具表现力的数字人视频,

近日,可灵AI数字人正式亮相,凭借领先的口型精准度、情绪动作演绎和跨风格泛化能力,重新定义了数字人技术的行业标杆。用户仅需上传一张角色图片、输入角色表达内容或一段音频,就能生成最长1分钟、极具表现力的数字人视频,而且支持多类角色及中英日韩多语种,最低价格仅0.12元每秒,广泛适用于广告、电商、娱乐、媒体、教育等众多场景。目前产品公测陆续开放中。bYG28资讯网——每日最新资讯28at.com

bYG28资讯网——每日最新资讯28at.com

极简输入、高质输出:一张图实现分钟级数字人生成bYG28资讯网——每日最新资讯28at.com

可灵AI数字人极大降低了行业的制作门槛,用户只需提供一张角色图(支持写实人物、动漫、动物等多种角色),输入一段文字或音频,即可一键生成最高达1080p分辨率、48FPS高帧率的高质量数字人视频。bYG28资讯网——每日最新资讯28at.com

该功能可支持生成最长达1分钟的数字人视频,可轻松满足产品讲解、新闻播报、在线教育等多种场景需求,结合会员优惠最低价仅0.12元/秒(标准价格:高品质模式8灵感值/秒,标准模式4灵感值/秒),让高品质数字人技术不再是少数专业机构的专利,真正赋能广大内容创作者与中小企业。bYG28资讯网——每日最新资讯28at.com

此外,为了实现“开箱即用”的便捷体验,可灵AI还提供了一站式解决方案。既支持用户上传自有素材,也可以使用内置的官方形象库、AI生图功能以及近百种TTS音色,轻松完成从角色创建到配音的全流程。bYG28资讯网——每日最新资讯28at.com

角色演绎“神形兼备”  bYG28资讯网——每日最新资讯28at.com

在数字人的核心能力——“表现力”上,可灵AI展示了其深厚的技术功底,不再满足于同类产品简单的音画同步,而是追求角色“神形兼备”的生动演绎。bYG28资讯网——每日最新资讯28at.com

bYG28资讯网——每日最新资讯28at.com

(可灵AI数字人视频截图)bYG28资讯网——每日最新资讯28at.com

在对口型这一基础指标上,可灵AI数字人展现出了业界领先的精准度。实测案例中,一位女歌手正演唱英文歌曲,其唇形与快速变化的歌词音节完美贴合,复杂口型也表现出色。而根据提示词“眼神专注自信地唱歌”,数字角色更呈现出自信的眼神、持麦的自然姿态,以及与观众互动的微笑,生动还原了歌手在舞台上的表演状态。bYG28资讯网——每日最新资讯28at.com

同时,凭借可灵视频模型的强大能力,可灵AI数字人展现出优秀的泛化性能,无论是写实人物、动漫卡通、动物形象,皆可生成高质量数字人视频。在卡通猫咪唱英文Rap的案例中,可灵AI精准地捕捉音频节奏,生成了一只一边说唱、一边随节奏自然摇摆身体的“Rapper猫”,跨越不同角色风格界限,赋予角色生命力。bYG28资讯网——每日最新资讯28at.com

提示词驱动角色表演 情绪与动作精细可控  bYG28资讯网——每日最新资讯28at.com

区别于仅“动嘴皮”的数字人,可灵AI数字人还带来了对情绪的深刻理解与表达,而且可通过提示词精细化控制角色情绪与肢体语言,实现“有灵魂的表演”。bYG28资讯网——每日最新资讯28at.com

bYG28资讯网——每日最新资讯28at.com

(可灵AI数字人视频截图)bYG28资讯网——每日最新资讯28at.com

在这个表现“愤怒”情绪的案例中,根据音频内容和提示词“内心全是气愤,非常生气”。模型精准地将这种抽象情绪转化为具体的面部微表情——紧锁的眉头、紧抿的嘴唇和充满压迫感的眼神,将角色的内心怒火展现得淋漓尽致。bYG28资讯网——每日最新资讯28at.com

基于可灵AI视频模型,依托多模态理解大模型与视频生成模型的深度融合,可灵AI数字人突破传统音画同步的表浅拟合,首次实现从「听声音」到「懂意图」的跨越。在口型准确度已达行业领先的基础上,可精准解析输入的语音、图像和提示词,对长视频中数字人情绪、动作与运镜作出精准规划,确保生成内容紧密呼应叙事意图与情感脉络,真正完成从对口型到情节演绎的升级。bYG28资讯网——每日最新资讯28at.com

技术驱动 打造数字人行业标杆bYG28资讯网——每日最新资讯28at.com

可灵AI数字人的卓越表现,得益于其背后多模态理解大模型与视频生成模型的深度融合。通过音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理,实现了语音与唇形的精准同步,即使面对多语种、歌唱或极快语速的台词,仍能保证唇形与发音严丝合缝。而采用关键帧控制的架构,模型先构建高层次叙事骨架,再并行生成多个片段的数字人视频,可在保持身份一致的前提下,实现无限长度视频生成。bYG28资讯网——每日最新资讯28at.com

专业测试中,可灵AI数字人与行业知名产品Heygen及即梦数字人(Omnihuman-1方案)进行了效果对比。结果显示,可灵 AI 数字人在整体效果及多个细分维度上均表现优异,与即梦数字人(Omnihuman-1 方案)对比的整体 GSB 得分达到 2.39,与 Heygen 对比的整体 GSB 得分达到 1.37,位居行业领先。bYG28资讯网——每日最新资讯28at.com

bYG28资讯网——每日最新资讯28at.com

* GSB 指标用于衡量群体意见的一致性和正负倾向,GSB 值越大,说明模型优势越大bYG28资讯网——每日最新资讯28at.com

* 评测时间:Heygen于2025.08.25评测;即梦于2025.07.22评测。bYG28资讯网——每日最新资讯28at.com

可灵AI作为全球领先的视频生成大模型,自2024年6月发布以来已完成超30次迭代,用户规模突破4500万,生成视频数量超2亿,为超过2万家企业提供API服务,覆盖广告、影视、游戏等多个领域。随着可灵AI数字人的推出,将进一步降低行业创作门槛、提升制作标准,推动其在短视频、电商直播、在线教育、企业服务等领域的规模化应用。bYG28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-183020-0.html可灵AI数字人来了 支持情绪与动作控制、轻松打造“有灵魂”的数字角色

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全域突破,赢战双11,磁力引擎双11营销作战大图发布

下一篇: 快手电商举办超级双选会,近3000位商家达人参会选品

标签:
  • 热门焦点
  • K60至尊版刚预热 一加Ace2 Pro正面硬刚

    Redmi这边刚如火如荼的宣传了K60 Ultra的各种技术和硬件配置,作为竞品的一加也坐不住了。一加中国区总裁李杰发布了两条微博,表示在自家的一加Ace2上早就已经采用了和PixelWo
  • 7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月份的手机市场风平浪静,除了红魔和努比亚带来了两款搭载骁龙8Gen2领先版处理器的新机之外,别的也想不到有什么新品了,这也正常,通常6月7月都是手机厂商修整的时间,进入8月份之
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 重估百度丨大模型,能撑起百度的“今天”吗?

    自象限原创 作者|程心 罗辑2023年之前,对于自己的“今天”,百度也很迷茫。“新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”这是2022年底,李彦宏
  • 小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    8月2日消息,今日小米科技创始人雷军在其微博上发布消息称,小米公益基金会宣布捐赠2500万元驰援北京、河北暴雨救灾。携手抗灾,京冀安康!以下为公告原文
  • OPPO K11样张首曝:千元机影像“卷”得真不错!

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • 联想YOGA 16s 2022笔记本将要推出,屏幕支持触控功能

    联想此前宣布,将于11月2日19:30召开联想秋季轻薄新品发布会,推出联想 YOGA 16s 2022 笔记本等新品。官方称,YOGA 16s 2022 笔记本将搭载 16 英寸屏幕,并且是一
  • 三翼鸟智能家居亮相电博会,让用户体验更真实

    2021电博会在青岛国际会展中心开幕中,三翼鸟直接把“家”搬到了现场,成为了展会的一大看点。这也是三翼鸟继9月9日发布了行业首个一站式定制智慧家平台后的
Top