当前位置:首页 > 元宇宙 > AI

GPT-4:突破巨大参数规模的下一步之旅

来源: 责编: 时间:2023-08-15 18:48:15 175观看
导读07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。据悉,GPT-4采用了混合

07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。hni28资讯网——每日最新资讯28at.com

据悉,GPT-4采用了混合专家模型,这种模型利用数据进行训练,将多个模型分别训练后,将它们的输出整合为一个单独的任务。为了保持合理的成本,OpenAI选择了这种方式进行构建。GPT-4总共有120层,包含了1.8万亿个参数,相比之下,GPT-3只有约1750亿个参数,可见其在规模上的巨大提升。hni28资讯网——每日最新资讯28at.com

hni28资讯网——每日最新资讯28at.com

GPT-4使用了16个混合专家模型,每个模型拥有1110亿个参数,并且每次前向传递路由都会经过两个专家模型。此外,它还拥有550亿个共享注意力参数。为了进行训练,OpenAI使用了一个包含13万亿个tokens的数据集,这些tokens并非唯一,而是根据迭代次数计算出更多的tokens。hni28资讯网——每日最新资讯28at.com

hni28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,GPT-4在预训练阶段的上下文长度为8k,32k版本则是对8k版本的微调结果。然而,GPT-4的训练成本非常高昂。根据外媒报道,即使使用了8倍H100物理机,也无法以每秒33.33个token的速度提供所需的密集参数模型。据估算,一次GPT-4的训练成本高达6300万美元(约4.51亿元人民币)。hni28资讯网——每日最新资讯28at.com

为了降低训练成本,OpenAI选择在云端使用A100GPU进行模型训练,最终将训练成本降低至大约2150万美元(约1.54亿元人民币),尽管需要更长的时间来完成训练过程。这一举措在一定程度上减轻了训练成本的压力。hni28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-999-0.htmlGPT-4:突破巨大参数规模的下一步之旅

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 前沿技术、机器人和集成电路成为人工智能领域热门融资领域

下一篇: 新一代AI笔记应用Notebook LM亮相:优化信息整理与解答需求

标签:
  • 热门焦点
  • 清华、北大等86所高校布局元宇宙,是风口还是噱头?

    清华、北大等86所高校布局元宇宙,是风口还是噱头?

    作者:徐赐豪来源:区块链日报据全国高校人工智能与大数据创新联盟元宇宙专委会不完全统计,截至2023年7月,全国共有86所高校战略布局元宇宙领域,其中本科院校73所,高职专科院校13所
  • 《从营销AIGC化到AIGC营销化》报告发布

    《从营销AIGC化到AIGC营销化》报告发布

    来源:清元宇宙7月2日上午,清华大学元宇宙文化实验室举办元宇宙在线沙龙“AIGC热潮与应用”。会议中,清华大学新闻与传播学院教授、元宇宙文化实验室主任、新媒体研究
  • 内容行业大变天,爆款全靠AI?

    内容行业大变天,爆款全靠AI?

    出品 | 微果酱(wjam123456)作者 | 陈出木题图 | 文心一格 AI的发展之快出乎所有人的预料,似乎一夜之间便呼啸而来。无论是资本的风向标,抑或是生活工作的辅助、流量口,还是茶余饭
  • 元宇宙将会如何塑造未来的工作方式?

    元宇宙将会如何塑造未来的工作方式?

    科幻小说家尼尔·斯蒂芬森 (Neal Stephenson) 在1992年就创造了“元宇宙”一词,但事实上,在Facebook将其更名为Meta以反映其将这一科幻愿景变为现实的战略重点之
  • 元宇宙风口下,视觉中国如何重估?

    元宇宙风口下,视觉中国如何重估?

    要说横跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一个。不仅互联网巨头们纷纷布局,上市公司们趋之若鹜,还被不少地方政府写入了产业规划,大有在2022年
  • “啫喱”超越微信登顶:首款“元宇宙社交App”会昙花一现吗?

    “啫喱”超越微信登顶:首款“元宇宙社交App”会昙花一现吗?

    作者| 赤木瓶子如何终结“昙花一现”的命运,是潮流社交产品的长期命题,如今,在元宇宙浪潮的洗礼下,这一命题正在迎来新的可能性。近段时间,一款名为“啫喱”的社交A
  • 区块链产业人才发展报告

    区块链产业人才发展报告

    工业和信息化部作为工业和信息化行业主管部门,正在着力推进“两个强国”建设,加快推动以区块链为代表的新兴技术与实体经济深度融合。我国区块链技术和应用想要
  • 索尼公布PSVR 2头显渲染图;社区开发者发布Quest版《我的世界》

    索尼公布PSVR 2头显渲染图;社区开发者发布Quest版《我的世界》

    近日热点:索尼正式公布PSVR 2头显及控制器官方渲染图;入局元宇宙,鸿海科技与XRSPACE签订合作备忘录;研究人员表示面部追踪可增强VR操控体验;社区开发者QuestCraft发
  • MR——元宇宙平台的下一代入口

    MR——元宇宙平台的下一代入口

    作为“元宇宙”的领头羊,Meta的一举一动都受到业内的高度关注。华尔街见闻提及,2月17日周四,Facebook母公司Meta在透露,其混合现实技术(MR)将在几年后实现,让人们对元
Top