当前位置:首页 > 科技  > 资讯

谷歌新研究冲击缩放定律!模型规模真的关键吗?

来源: 责编: 时间:2024-04-09 17:17:23 276观看
导读4月9日消息,近年来,模型规模不断扩大,一种普遍的信念是“力大砖飞”。尽管OpenAI没有公布Sora的训练细节,但在其技术报告中提到了:最大的模型Sora能够生成一分钟高保真视频,这表明扩大视频生成模型是构建通用世界模拟器的有

4月9日消息,近年来,模型规模不断扩大,一种普遍的信念是“力大砖飞”。Gwn28资讯网——每日最新资讯28at.com

Gwn28资讯网——每日最新资讯28at.com

尽管OpenAI没有公布Sora的训练细节,但在其技术报告中提到了:最大的模型Sora能够生成一分钟高保真视频,这表明扩大视频生成模型是构建通用世界模拟器的有前景途径。Gwn28资讯网——每日最新资讯28at.com

然而,谷歌最新的研究发现:并非如此!谷歌研究院和约翰霍普金斯大学在最新论文中指出:对于潜在扩散模型,模型不一定是越大越好。Gwn28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,关于缩放定律的争议一直存在。OpenAI在2020年发表的论文提出,模型效果与规模大小、数据集大小、计算量强相关,而与具体结构弱相关。Gwn28资讯网——每日最新资讯28at.com

缩放定律不仅适用于语言模型,还适用于其他模态及跨模态场景。这一概念的提出使研究人员和开发者能够更有效地设计模型架构,选择合适的模型大小和数据集规模,以实现最佳性能。Gwn28资讯网——每日最新资讯28at.com

谷歌最新研究集中在图像生成模型上,提出对于潜在扩散模型,在计算资源有限时,增加计算量应该增加数据集大小,而不是模型参数量。Gwn28资讯网——每日最新资讯28at.com

这是否意味着缩放定律失效了?作者的研究表明,在有限的计算资源下,较小的模型可以优于较大的模型;模型大小和训练步骤的选择需与计算资源相匹配。Gwn28资讯网——每日最新资讯28at.com

然而,在训练步骤恒定的情况下,大模型仍然具有优势,尤其在处理图像细节方面。Gwn28资讯网——每日最新资讯28at.com

研究者还发现,不同大小的模型在CFG(Classifier-Free Guidance)技术下受影响基本相同,这一发现令人意外。Gwn28资讯网——每日最新资讯28at.com

这项研究探索了模型效率与品质之间的最佳平衡,为开发更高效的图像生成AI系统提供了指导。这与当前AI领域的趋势相契合,即小型语言模型在多项任务中超越大型对手,旨在推动AI技术的民主化。Gwn28资讯网——每日最新资讯28at.com

标签:OpenAI
举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
Nothing Ear /(a)蓝牙耳机渲染图大曝光,4 月 18 日发布
Nothing Ear /(a)蓝牙耳机渲染图大曝光,4 月 18 日发布
超越GPT-3.5?联发科推出450亿参数AI模型!
超越GPT-3.5?联发科推出450亿参数AI模型!
英伟达大佬最爱的AI聊天机,你知道是谁吗?
英伟达大佬最爱的AI聊天机,你知道是谁吗?
带给更多用户移动AI体验 三星Galaxy S23系列现已支持Galaxy AI
带给更多用户移动AI体验 三星Galaxy S23系列现已支持Galaxy AI
努比亚小牛5G百元神机问世:搭载展锐T760,双面玻璃设计,799元起步
努比亚小牛5G百元神机问世:搭载展锐T760,双面玻璃设计,799元起步
谷歌Nest Secure安防系统今日起正式停用
谷歌Nest Secure安防系统今日起正式停用
热门内容
  • 华为云携手乐聚机器人,共探“盘古大模型+夸父人形机器人”新应用场景
  • 谷歌借助AI突破:提前7天预测洪灾,全球80国将受益
  • 华为云携手贵安新区,共筑全球领先智算高地
  • 谷歌DeepMind推出SIMA模型:打造更贴近人类的游戏智能队友
  • Cerebras发布第三代芯片WSE-3:性能翻倍,助力大模型训练
  • 微软或与OpenAI联手,斥资千亿美元打造“星际之门”AI超算
  • 音乐界的ChatGPT?天工SkyMusic邀您体验AI音乐创作
  • 京东推出全新“AI全能服务包”,助力商家降低50%运营成本
  • 英美联手打造AI安全新标杆,科学合作伙伴关系正式建立
  • 微软Copilot全面升级至GPT-4 Turbo模型,提升编码体验
  • 百度文心一言推出新功能,秒速定制你的专属AI声音
  • WPS推出AI会员服务,月费25元起,开启AI办公新纪元
  • OpenAI疑似泄露GPT-4.5 Turbo模型信息
  • 特斯拉加速推进人形机器人项目,招聘技术撰写员预示Optimus即将面世
  • 马斯克再谈AI风险:利大于弊仍值得冒险
本栏最新
超越GPT-3.5?联发科推出450亿参数AI模型!
超越GPT-3.5?联发科推出450亿参数AI模型!
英伟达大佬最爱的AI聊天机,你知道是谁吗?
英伟达大佬最爱的AI聊天机,你知道是谁吗?
OpenAI人工智能市值突破270亿,投资者眼中下一个独角兽?
OpenAI人工智能市值突破270亿,投资者眼中下一个独角兽?
微软震撼伦敦!全新人工智能中心来袭,领军专家曝光!
微软震撼伦敦!全新人工智能中心来袭,领军专家曝光!
AI革命,手机将被AI Pin取代?
AI革命,手机将被AI Pin取代?
AI训练耗电量惊人?未来谁来买单?
AI训练耗电量惊人?未来谁来买单?

本文链接:http://www.28at.com/showinfo-16-82333-0.html谷歌新研究冲击缩放定律!模型规模真的关键吗?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谁在偷懒?OpenAI的ChatGPT竟然变得越来越懒散?

下一篇: 联发科重磅推出“达哥”AI服务平台,支持顶尖繁体中文大模型MR BreeXe

标签:
  • 热门焦点
  • 十个可以手动编写的 JavaScript 数组 API

    JavaScript 中有很多API,使用得当,会很方便,省力不少。 你知道它的原理吗? 今天这篇文章,我们将对它们进行一次小总结。现在开始吧。1.forEach()forEach()用于遍历数组接收一参
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 十个简单但很有用的Python装饰器

    装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • OPPO K11评测:旗舰级IMX890加持 2000元档最强影像手机

    【Techweb评测】中端机型用户群体巨大,占了中国目前手机市场的大头,一直以来都是各手机品牌的“必争之地”,其中OPPO K系列机型一直以来都以高品质、
  • 亲历马斯克血洗Twitter,硅谷的苦日子在后头

    文/刘哲铭  编辑/李薇  马斯克再次挥下裁员大刀。  美国时间11月14日,Twitter约4400名外包员工遭解雇,此次被解雇的员工的主要工作为内容审核等。此前,T

最新推荐

猜你喜欢

热门推荐

相关资讯

Top