当前位置：首页 > 元宇宙 > AI

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1 47

来源：责编：时间：2024-10-11 16:31:21 185观看

导读 10 月 9 日消息，科技媒体 marktechpost 昨日（10 月 8 日）发布博文，报道称谷歌公司推出了选择性注意力（Selective Attention）方法，可以提高 Transformer 架构模型的性能。Transformer 架构简介Transformer 是一种革命

10 月 9 日消息，科技媒体 marktechpost 昨日（10 月 8 日）发布博文，报道称谷歌公司推出了选择性注意力（Selective Attention）方法，可以提高 Transformer 架构模型的性能。

Transformer 架构简介

Transformer 是一种革命性的神经网络架构，由谷歌在 2017 年提出，主要用于处理序列数据，特别是在自然语言处理（NLP）领域。

Transformer 的核心是自注意力机制，允许模型在处理输入序列时捕捉词与词之间的关系，让模型能够关注输入序列中的所有部分，而不仅仅是局部信息。

Transformer 由多个编码器和解码器组成。编码器负责理解输入数据，而解码器则生成输出。多头自注意力机制使模型能够并行处理信息，提高了效率和准确性。

Transformer 架构模型挑战

Transformer 架构的一大挑战是它们在处理长文本序列时效率低下，由于每个标记与序列中的每个其他标记都相互作用导致二次复杂度，这就导致随着上下文长度的增加，计算和内存需求呈指数增长。

现在解决这一问题的方法包括稀疏注意力机制（sparse attention mechanisms），它限制了标记之间的交互数量，以及通过总结过去信息来减少序列长度的上下文压缩技术。

不过这种方法是通过减少在注意力机制中考虑的标记数量达成的，因此通常以性能为代价，可能会导致上下文关键信息丢失。

谷歌新方法

谷歌研究的研究人员提出了一种名为选择性注意的新方法，可以动态忽略不再相关的标记，从而提高 Transformer 模型的效率。

选择性注意力使用软掩码矩阵来确定每个标记对未来标记的重要性，减少对不重要标记的关注。

研究表明，配备选择性注意的 Transformer 架构模型在多个自然语言处理任务中表现出色，同时显著降低了内存使用和计算成本。

例如，在拥有 1 亿参数的 Transformer 模型中，注意力模块的内存需求在上下文大小为 512、1024 和 2048 个 tokens 时分别减少至 1/16、1/25 和 1/47。所提方法在 HellaSwag 基准测试中也优于传统 Transformer，对于较大的模型规模实现了高达 5% 的准确率提升。

选择性注意力允许构建更小、更高效的模型，在不损害准确性的情况下，显著减少内存需求。

附上参考地址

Selective Attention Improves Transformer

This AI Paper from Google Introduces Selective Attention: A Novel AI Approach to Improving the Efficiency of Transformer Models

本文链接：http://www.28at.com/showinfo-45-8788-0.htmlAI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1 47

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：仅靠微软无法满足激增的 AI 计算需求，OpenAI 被曝和甲骨文合作

下一篇：消息称 Kimi AI 助手内测深度推理功能，月之暗面有团队国庆加班 7 天 3 倍工资

标签：

热门焦点

AI网红能年赚百万，普通人的新机会来了？

来源｜运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁2023 年，数字人成为了当红的“流量话题”和“商业机会"。不管是 AI 孙燕姿走红网络，还是 AI 数字
错过了BRC20还有eths,eth铭文协议

来源：三头鸟NFT大家好，我是鸟哥，了解鸟哥的人都知道鸟哥擅撸空投，说实话撸毛虽然回报大但周期还是有点长的，所以除了撸毛我们自己也在研究早期项目，打新，比如BRC20协议ordi当时就有
字节、腾讯、网易鏖战元宇宙背后，大厂究竟在争夺什么？

正当互联网商业踌躇不前，互联网大厂为了在存量中的增长挤破头皮之时，元宇宙的概念被资本点燃。先是Facebook更名Meta正式进军元宇宙，然后字节跳动收购了一家VR硬
万字专访Vitalik Buterin：以太坊将成为主流和最安全的基础层

Vitalik Buterin 在 19 岁时撰写了以太坊白皮书。他的目标简单而全面，即创建一个“世界计算机”，旨在成为所有在线应用程序的灵活基础层，无需任何第三方。自 2015
《刀剑神域》VR展开幕；《Puzzling Places》发布第二个付费DLC

今日热点：《刀剑神域：Ex-Chronicle Online Edition》VR展开幕；虚拟活动平台EventX再获800万美元B轮融资；VR射击游戏《Outlier》确认将于3月17日登陆Steam平台等。
虚拟数字人：元宇宙的主角破圈而来

虚拟数字人市场逐步进入成熟期，商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生，虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破，制
小众有趣NFT艺术作品欣赏（1）

随着NFT发展火热，越来越多领域与NFT融合，NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处，也有完全不同的地方。NFT艺术与传统艺术一样，表现了
盘点9个主流元宇宙平台，你都知道哪些？

随着NFT的持续升温，它也加入了现在的元宇宙浪潮。本文介绍元宇宙的基本概念以及九个最流行的元宇宙NFT平台，如Decentraland、sandbox等。用熟悉的语言学习以太
利用元宇宙平台10天收入160万，风口还是虎口？

美国Meta平台有限公司，也就是原来的脸书公司，9日宣布，公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1 47

AI网红能年赚百万，普通人的新机会来了？

错过了BRC20还有eths,eth铭文协议

字节、腾讯、网易鏖战元宇宙背后，大厂究竟在争夺什么？

万字专访Vitalik Buterin：以太坊将成为主流和最安全的基础层

《刀剑神域》VR展开幕；《Puzzling Places》发布第二个付费DLC

虚拟数字人：元宇宙的主角破圈而来

小众有趣NFT艺术作品欣赏（1）

盘点9个主流元宇宙平台，你都知道哪些？

利用元宇宙平台10天收入160万，风口还是虎口？

最新推荐

这一超级富豪“逆袭”，身价大增4330亿

Meta证实Quest 2无法实现全身追踪，未来将为虚拟化身配备“假腿”

中国银保监管委提示：谨慎投资，勿做接盘侠

元宇宙“概念股”集体崩塌，背后究竟发生了什么？

纽约街头出现NFT自动贩卖机

过去女性在互联网领域是半边天，在Web3，将会是整片天！

猜你喜欢

热门推荐

相关资讯