当前位置:首页 > 元宇宙 > AI

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

来源: 责编: 时间:2023-11-20 17:10:26 429观看
导读 11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的

11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。tBz28资讯网——每日最新资讯28at.com

谷歌和谷歌 Deepmind 的研究人员提出了新的方法,将多模态理解扩展到长视频领域。tBz28资讯网——每日最新资讯28at.com

借助 Mirasol AI 模型,该团队试图解决两个关键挑战:tBz28资讯网——每日最新资讯28at.com

需要以高频采样同步视频和音频,但要异步处理标题和视频描述。tBz28资讯网——每日最新资讯28at.com

视频和音频会生成大量数据,这会让模型的容量紧张。tBz28资讯网——每日最新资讯28at.com

谷歌在 Mirasol 中使用合路器(combiners)和自回归转换器(autoregressive transformer)模型。tBz28资讯网——每日最新资讯28at.com

该模型组件会处理时间同步的视频和音频信号,然后再将视频拆分为单独的片段。tBz28资讯网——每日最新资讯28at.com

转换器处理每个片段,并学习每个片段之间的联系,然后使用另一个转换器处理上下文文本,这两个组件交换有关其各自输入的信息。tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

名为 Combiner 的新颖转换模块从每个片段中提取通用表示,并通过降维来压缩数据。每个段包含 4 到 64 帧,该模型当前共有 30 亿个参数,可以处理 128 到 512 帧的视频。tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

在测试中,Mirasol3B 在视频问题分析方面达到了新的基准,体积明显更小,并且可以处理更长的视频。使用包含内存的组合器变体,该团队可以将所需的计算能力进一步降低 18%。tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

tBz28资讯网——每日最新资讯28at.com

在此附上 Mirasol 的官方新闻稿,感兴趣的用户可以深入阅读。tBz28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-2592-0.html谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 浙江卫健委推出可陪诊数字健康人“安诊儿”:基于支付宝技术,可提供全流程陪伴

下一篇: TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 三院士三教授热聊元宇宙&——AIGC,学术界怎么看?

    来源:清元宇宙在近日举办的中国江宁2023元宇宙产业·人才高峰论坛暨AIGC发展大会上,中国工程院院士谭建荣、刘韵洁、郑纬民出席并发表了主旨演讲。除了三大院士,还有清华
  • 2021年中国元宇宙行业用户行为分析热点报告

    元宇宙网络热度高涨,中国网民对虚拟生态兴趣浓厚。艾媒咨询数据显示,超六成的网民对“元宇宙”了解程度较高,在元宇宙较基础的游戏领域,超九成的人对VR游戏更感兴
  • Meta公布AI概念“Builder Bot”;银保监发布元宇宙相关风险提示

    概述自从Meta在2月初公布财报后,其负责元宇宙的核心部门Reality Labs表现不佳,净亏损超100亿美元,随后股价断崖式下跌。如今,Meta开始继续发力元宇宙,想要挽回颓势,
  • Snoop Dogg 计划推出致力于数字媒体NFT的专业公司

    雅痞哥不知道这人是谁还上新闻,问了助理,解释,相当于美版刘欢的地位吧。Snoop Dogg 在 NFT 领域已经有一段时间了,尤其是在最近有消息称人们在元宇宙中购买房地产
  • 想进入web3.0?来看看哪些工作适合你

    随着对加密货币需求的增加,加密领域的工作的数量也在增加。以下是一些非技术性加密货币工作简介。加密货币在主流市场获得的可信度提升。导致区块链领域的求职
  • 新闻业在元宇宙的现状和未来

    “美联社有毛病吧,这真的过分了!”,一位媒体编辑在推特中愤怒地表示。这是针对一款视频NFT的批评言论之一,之后取消了此次销售,因为该视频呈现了移民穿越地中海的苦
  • 从NFT数字收藏,洞察数字音乐版权市场发展趋势

    去年8月9日,腾讯音乐布局NFT数字收藏,在腾讯应用宝发布幻核app,腾讯音乐的提前布局示意着未来区块链技术将对数字音乐版权市场进行改造升级。作者从深层测分析为
  • NFT行业周报:NBA巨星勒布朗·詹姆斯申请NFT相关商标

    1. “无聊猿”BAYC交易总额突破14亿美元3月10日,据DappRader最新数据显示,“无聊猿”Bored Ape Yacht Club(BAYC)交易总额已突破14亿美元,创下历史新高,本文撰写时为
Top