当前位置:首页 > 科技  > 资讯

高拟真数字人直播带货有多强

来源: 责编: 时间:2025-11-11 09:20:44 61观看
导读  当直播时长逼近6个小时、大多数电商主播显露疲态时,直播间里的主播仍然可以情绪饱满地回答观众提问,时不时还能讲两句“段子”,吸引观众下单。  随着人工智能技术快速发展,大模型向多模态加速演进,数字人成为融合大

  当直播时长逼近6个小时、大多数电商主播显露疲态时,直播间里的主播仍然可以情绪饱满地回答观众提问,时不时还能讲两句“段子”,吸引观众下单。kYQ28资讯网——每日最新资讯28at.com

  随着人工智能技术快速发展,大模型向多模态加速演进,数字人成为融合大语言模型与多模态技术的创新应用,电商直播是数字人落地的极佳场景。数字人技术使商家无需投入大量人力、物力进行现场直播,能显著降低场地租赁、设备采购、人员培训等费用。同时,数字人可以24小时不间断直播,进一步增加商品曝光时间和销售机会,提升经济效益。kYQ28资讯网——每日最新资讯28at.com

  但传统数字人生成技术常面临语音、语言、视觉多模态割裂的问题,表现为台词生硬、语音语调与台词情感匹配不佳、表情手势单一等。百度首席技术官王海峰说,针对数字人应用痛点,百度创新研发了剧本驱动多模协同的高拟真数字人技术。kYQ28资讯网——每日最新资讯28at.com

  剧本的基础是台词。台词生成不仅是内容输出,还要贴合主播人设与语言风格,确保语言表达的个性化与一致性;在多主播场景中,还需实现语义逻辑、语调节奏和情感风格的整体协调。同时,为提升台词的内容深度,还要引入内容规划、知识增强与事实校验机制,以降低人工智能幻觉风险。基于台词,大模型可以直接生成一份数字人直播剧本。剧本自带“视觉标签”和“语音标签”,它能够告诉系统,对应台词人物要做出哪些动作。kYQ28资讯网——每日最新资讯28at.com

  互动性强是电商直播场景的一大特点。在与观众互动过程中,语音合成的自然度是决定用户沉浸感的关键因素。观众希望听到主播有情绪、有起伏的声音,而不是生硬机械的朗读。王海峰介绍,针对这一需求,百度提出了“文本自控的语音合成”方案。文本自控的语音合成大模型不仅具备高复原的语音合成能力,还能够结合直播台词及主播个人特征,把这些文本内容转化为自然、有感染力的声音,让数字人不仅能发出声音,更能精准传递出调侃、得意、强调等细微情绪。kYQ28资讯网——每日最新资讯28at.com

  除了要和用户交互,数字人主播在直播时还要与商品和所在空间进行符合物理逻辑的互动。如何做到这一点?高一致性超拟真数字人长视频生成技术,能对输入的历史视频数据、剧本脚本、语音信息以及骨骼驱动等多模态信号进行分析与理解,并基于此分别生成高表现力片段、复杂“人—物—场”交互片段以及大动作大表情片段。系统能够对这些片段在较长时间跨度上进行统一调度,确保语音、口型、表情与动作始终保持高度一致且同步。kYQ28资讯网——每日最新资讯28at.com

  如今,数字人正逐渐从实验室走向各类应用场景,商业化进程显著加快。可以预见,随着深度思考、多模态交互等关键能力的跃升,还将有越来越多数字人出现在屏幕上,走进人们的生活中。同时,业内专家提醒,《直播电商监督管理办法(征求意见稿)》提出,使用人工智能等技术生成的人物图像、视频从事直播营销活动的,直播间运营者应当在直播页面进行显著标识,持续向消费者提示该人物图像、视频属于人工智能等技术生成,以与自然人名义或者形象进行明显区分。kYQ28资讯网——每日最新资讯28at.com

  中国科学院信息工程研究所正高级工程师韩冀中说,人们在拥抱数字人技术的同时,也需设立清晰的边界,必须防止利用高拟真技术以假乱真进行欺诈或虚假宣传。技术的发展必须与法律、伦理的约束并行,确保创新在正确的轨道上行稳致远。(记者 都 芃)kYQ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-186241-0.html高拟真数字人直播带货有多强

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 超10万亿Tokens数据集炼成记:中国电信天翼AI如何构建AI发展基石

下一篇: 财经聚焦·第八届进博会丨在进博会上感受人形机器人发展前沿脉动

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    在今天下午的小米Civi 2新品发布会上,小米还带来了一款新的降噪蓝牙耳机Necklace,我们也在发布结束的第一时间给大家带来这款耳机的简单分享。现在大家能见到最多的蓝牙耳机
  • 5月iOS设备性能榜:M1 M2依旧是榜单前五

    和上个月一样,没有新品发布的iOS设备性能榜的上榜设备并没有什么更替,仅仅只有跑分变化而产生的排名变动,刚刚开始的苹果WWDC2023,推出的产品也依旧是新款Mac Pro、新款Mac Stu
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    日前OPPO官方宣布,全新的OPPO K11将于7月25日正式发布,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼IMX890主摄,堪称是2000档位影像表
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
  • 联想小新Pad Pro 12.6将要推出,搭载高通骁龙 870 处理器

    联想小新Pad Pro 12.6将于秋季新品会上推出,官方按照惯例直接在发布会前给出了机型的所有参数。联想小新 Pad Pro 12.6 将搭载高通骁龙 870 处理器,重量为 5
Top