当前位置：首页 > 元宇宙 > AI

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1 47

来源：责编：时间：2024-10-16 15:25:09 677观看

导读 10 月 9 日消息，科技媒体 marktechpost 昨日（10 月 8 日）发布博文，报道称谷歌公司推出了选择性注意力（Selective Attention）方法，可以提高 Transformer 架构模型的性能。Transformer 架构简介Transformer 是一种革命

10 月 9 日消息，科技媒体 marktechpost 昨日（10 月 8 日）发布博文，报道称谷歌公司推出了选择性注意力（Selective Attention）方法，可以提高 Transformer 架构模型的性能。

Transformer 架构简介

Transformer 是一种革命性的神经网络架构，由谷歌在 2017 年提出，主要用于处理序列数据，特别是在自然语言处理（NLP）领域。

Transformer 的核心是自注意力机制，允许模型在处理输入序列时捕捉词与词之间的关系，让模型能够关注输入序列中的所有部分，而不仅仅是局部信息。

Transformer 由多个编码器和解码器组成。编码器负责理解输入数据，而解码器则生成输出。多头自注意力机制使模型能够并行处理信息，提高了效率和准确性。

Transformer 架构模型挑战

Transformer 架构的一大挑战是它们在处理长文本序列时效率低下，由于每个标记与序列中的每个其他标记都相互作用导致二次复杂度，这就导致随着上下文长度的增加，计算和内存需求呈指数增长。

现在解决这一问题的方法包括稀疏注意力机制（sparse attention mechanisms），它限制了标记之间的交互数量，以及通过总结过去信息来减少序列长度的上下文压缩技术。

不过这种方法是通过减少在注意力机制中考虑的标记数量达成的，因此通常以性能为代价，可能会导致上下文关键信息丢失。

谷歌新方法

谷歌研究的研究人员提出了一种名为选择性注意的新方法，可以动态忽略不再相关的标记，从而提高 Transformer 模型的效率。

选择性注意力使用软掩码矩阵来确定每个标记对未来标记的重要性，减少对不重要标记的关注。

研究表明，配备选择性注意的 Transformer 架构模型在多个自然语言处理任务中表现出色，同时显著降低了内存使用和计算成本。

例如，在拥有 1 亿参数的 Transformer 模型中，注意力模块的内存需求在上下文大小为 512、1024 和 2048 个 tokens 时分别减少至 1/16、1/25 和 1/47。所提方法在 HellaSwag 基准测试中也优于传统 Transformer，对于较大的模型规模实现了高达 5% 的准确率提升。

选择性注意力允许构建更小、更高效的模型，在不损害准确性的情况下，显著减少内存需求。

附上参考地址

Selective Attention Improves Transformer

This AI Paper from Google Introduces Selective Attention: A Novel AI Approach to Improving the Efficiency of Transformer Models

本文链接：http://www.28at.com/showinfo-45-8626-0.htmlAI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1 47

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：仅靠微软无法满足激增的 AI 计算需求，OpenAI 被曝和甲骨文合作

下一篇：消息称 Kimi AI 助手内测深度推理功能，月之暗面有团队国庆加班 7 天 3 倍工资

标签：

热门焦点

聚焦虚拟数字人技术，这三大商机要抓住！

关于虚拟数字人，企业可以从三个方面入局，分别是ToG（To Government，面向政府），即为数字政府和数字城市提供支持服务；ToB（To Business，面向企业），即为企业提供虚拟员工解决方案；ToC（To Cons
完美世界被元宇宙“拒之门外”

春节期间，游戏是消磨时间最好的方式，完美世界的《幻塔》作为选择的首要目标，倒不是因为它的吸引力有多大，纯粹是广大网友的吐槽。继《原神》之后，进击元宇宙的游戏
Meta展示AI系统Builder Bot；《Pistol Whip》增加派对模式

今日热点：Meta展示AI系统Builder Bot；招聘信息显示Meta正在探索具有蜂窝连接功能的VR/AR头显；英国VR工作室Coatsink Games正在为PSVR 2开发新游戏；VR节奏射击游戏
本周NFT领域重要资讯回顾

NFT在苏富比拍卖是一波三折的吗？其实不完全如此，但本周在苏富比拍卖行发生了一系列有趣的事。与此同时，美联社因其最新的NFT销售被推到了风口浪尖，而Opensea正面临
暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗？

NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造，该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
Meta 在衰落吗？

扎克伯格已经很久没有出现在公众视野里了，近日，他罕见的接受播客采访，在两个小时的时间里畅谈了Meta、Facebook、Instagram、元宇宙的未来。正方观点：是的阿伦·达
Snoop Dogg 计划推出致力于数字媒体NFT的专业公司

雅痞哥不知道这人是谁还上新闻，问了助理，解释，相当于美版刘欢的地位吧。Snoop Dogg 在 NFT 领域已经有一段时间了，尤其是在最近有消息称人们在元宇宙中购买房地产
百度虚拟人——AI手语主播首次亮相冬奥会！

除了火遍全国的冰墩墩，虚拟人也成为这届冬奥会的一大亮点元素。以体育明星谷爱凌为原型的数智人Meet Gu最先亮相。在2月5日谷爱凌首秀、2月7日谷爱凌首金的两天
冬奥会数字收藏品升温，市场再现“一墩难求”

根据公开信息显示，国际奥委会官方授权的冰墩墩数字盲盒于北京时间2月12日凌晨在nWayPlay平台发售，总数为500个，每个99美元，每人限购5个。此外，不同的奥运徽章数字藏

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1 47

聚焦虚拟数字人技术，这三大商机要抓住！

完美世界被元宇宙“拒之门外”

Meta展示AI系统Builder Bot；《Pistol Whip》增加派对模式

本周NFT领域重要资讯回顾

暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗？

Meta 在衰落吗？

Snoop Dogg 计划推出致力于数字媒体NFT的专业公司

百度虚拟人——AI手语主播首次亮相冬奥会！

冬奥会数字收藏品升温，市场再现“一墩难求”

最新推荐

2022年的Web3：定义概念并开创新范式

虚拟数字人：元宇宙的主角破圈而来

Meta 呼吁行业合作建立元宇宙网络基础设施

元宇宙专题二：GameFi 深度解析，元宇宙内容雏形显现

在互联网考古后，我被豆瓣上这座元宇宙古城征服了

我们离元宇宙的实现只差一副眼镜？

猜你喜欢

热门推荐

相关资讯