当前位置:首页 > 元宇宙 > AI

GPT-4:突破巨大参数规模的下一步之旅

来源: 责编: 时间:2023-08-15 18:48:15 420观看
导读07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。据悉,GPT-4采用了混合

07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。bu428资讯网——每日最新资讯28at.com

据悉,GPT-4采用了混合专家模型,这种模型利用数据进行训练,将多个模型分别训练后,将它们的输出整合为一个单独的任务。为了保持合理的成本,OpenAI选择了这种方式进行构建。GPT-4总共有120层,包含了1.8万亿个参数,相比之下,GPT-3只有约1750亿个参数,可见其在规模上的巨大提升。bu428资讯网——每日最新资讯28at.com

bu428资讯网——每日最新资讯28at.com

GPT-4使用了16个混合专家模型,每个模型拥有1110亿个参数,并且每次前向传递路由都会经过两个专家模型。此外,它还拥有550亿个共享注意力参数。为了进行训练,OpenAI使用了一个包含13万亿个tokens的数据集,这些tokens并非唯一,而是根据迭代次数计算出更多的tokens。bu428资讯网——每日最新资讯28at.com

bu428资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,GPT-4在预训练阶段的上下文长度为8k,32k版本则是对8k版本的微调结果。然而,GPT-4的训练成本非常高昂。根据外媒报道,即使使用了8倍H100物理机,也无法以每秒33.33个token的速度提供所需的密集参数模型。据估算,一次GPT-4的训练成本高达6300万美元(约4.51亿元人民币)。bu428资讯网——每日最新资讯28at.com

为了降低训练成本,OpenAI选择在云端使用A100GPU进行模型训练,最终将训练成本降低至大约2150万美元(约1.54亿元人民币),尽管需要更长的时间来完成训练过程。这一举措在一定程度上减轻了训练成本的压力。bu428资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-999-0.htmlGPT-4:突破巨大参数规模的下一步之旅

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 前沿技术、机器人和集成电路成为人工智能领域热门融资领域

下一篇: 新一代AI笔记应用Notebook LM亮相:优化信息整理与解答需求

标签:
  • 热门焦点
  • 茅台的元宇宙App火了,也被骂惨了

    元宇宙从概念走向大众生活,并不是一件简单的事情。技术、世界观、填充内容、载体形式,每一个环节都需要层层叠叠的逻辑。但正如赛博朋克奠基人威廉·吉布
  • Layer1的新以太坊,更好的以太坊?

    以太坊作为区块链基础设施地位看起来已不可动摇,但也面临着费用高、效率低、偏离去中心化初衷等问题。平台上既得利益群体的形成和固化也逐渐让革新变得困难。
  • 元宇宙时代NFT的价值衡量

    有人认为NFT的高昂价格只是炒作的产物,并不具有其对等的价值,但其实NFT并不是空中楼阁,只是区块链数字分类账中的一种形式。诚然,目前的NFT仍处于灰色地带,相关的法
  • 百度元宇宙希壤是什么?(附下载)

    百度元宇宙希壤是什么,最近很多人关注。还有很多人问希壤怎么下载、百度希壤怎么进入?今天小编带你来全面了解一下。“希壤”是百度于2021年12月27日于百度AI开
  • 好莱坞:一股新的电影制作加密浪潮将颠覆这个行业

    在Moviecoin.com平台上,有一部电影设定了一个前所未有的目标,即通过预售NFT获得100%的全额融资,这部电影就是马克·奥康纳(Mark O’connor)执导的《Oui Cannes》,
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • DAO登上了历史舞台,但是主流准备好采用DAO了吗?

    Block-807DAO要么是定义虚拟未来、无领导组织的革命性概念,要么是充满存在主义和自我毁灭挑战的反乌托邦结构,取决于你在与谁交谈。近几个月来, DAO已经从Crypto
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
Top