当前位置:首页 > 元宇宙 > AI

豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力

来源: 责编: 时间:2025-05-27 12:24:55 133观看
导读 5 月 23 日消息,从豆包公众号获悉,豆包今日宣布在 App 端上线实时视频通话功能,用户在“打电话”界面点击视频按钮即可开启视频通话,支持基于真实场景与用户进行实时问答互动。譬如,用户可在旅行过程中通过该工具

5 月 23 日消息,从豆包公众号获悉,豆包今日宣布在 App 端上线实时视频通话功能,用户在“打电话”界面点击视频按钮即可开启视频通话,支持基于真实场景与用户进行实时问答互动。VxV28资讯网——每日最新资讯28at.com

譬如,用户可在旅行过程中通过该工具询问自身所处景点的历史背景、特色内容或路线规划等,其背后由豆包最新的视觉理解模型支持,可融合视觉与语言输入进行综合的深度思考、创作。VxV28资讯网——每日最新资讯28at.com

豆包视频通话功能还接入了联网搜索能力,实时获取互联网最新信息,以进一步提升对话的准确性与时效性。根据图像信息,豆包视觉理解模型还能完成多种复杂逻辑计算任务,包括解微积分题、分析论文图表、诊断真实代码问题等“挑战性”任务。VxV28资讯网——每日最新资讯28at.com

VxV28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13190-0.html豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: “车展实拍”视频走红,场景、人物、对话声音全由谷歌 Veo 模型生成

下一篇: QQ 浏览器推出首个高考 Agent“AI 高考通”:一键生成或调整个性化志愿方案

标签:
  • 热门焦点
  • 大厂元宇宙,又菜又爱玩

    撰文 | 吴先之 编辑 | 王 潘当下所有大厂推出的元宇宙产品,所能带来的沉浸式体验并不多,好在国内外科技巨头在bug方面都处在同一水平线。以Meta为例,由于VR头显设
  • 【申万宏源】必然的碎片化AI落地,哪种路径可能胜出? | 元宇宙Meta洞见

    大规模预训GPT(Generative PreTraining)是OpenAI在2018年提出的模型,大规模预训练模型(大模型)渐渐成为了AI算法领域的热点。AI产业链:从算力到应用工作流程视角•
  • 元宇宙将会如何塑造未来的工作方式?

    科幻小说家尼尔·斯蒂芬森 (Neal Stephenson) 在1992年就创造了“元宇宙”一词,但事实上,在Facebook将其更名为Meta以反映其将这一科幻愿景变为现实的战略重点之
  • 2022年的Web3:定义概念并开创新范式

    Web3 是关于加密和区块链应该如何使用的概念,因为它是加密圈的一个离散子领域。社区机会将呈指数级增长,扩大这些子行业的人口统计范围。追求 Web3 项目的组织仍
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • 以用户为中心,Web3和区块链如何将用户放在首位

    竞争优势正在改变竞争优势是每个企业都在努力争取的,由谷歌、Facebook和Netflix等大型科技公司主导的市场中,两大重要类别的竞争优势十分突出。第一个竞争优势来
  • NFT领域,我们是否应该遵守版权法

    NFTs中最有争议的因素之一是你是否真的 "拥有 "你所购买的艺术品。除此之外,围绕着NFT行业内的版权和知识产权盗窃的问题也同样重要,因为人们很容易误解这些事情
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • 虚拟邓丽君后,数字人赛道开启3.0时代

    “如果右脑时代来临,虚拟世界将是对人类才华的无限放大。” 郭晓喆称,开发数字人形象时,自己的团队在内部“卷”了一下:“当我们翻阅大量历史典籍的时候,苏小妹找到
Top