当前位置:首页 > 科技  > 互联网

Token-Shuffle突破!自回归模型也能高效生成高清图像

来源: 责编: 时间:2025-04-27 07:05:24 165观看
导读近日,科技新闻界传来一则关于meta AI创新进展的报道。据报道,meta AI研发了一种名为Token-Shuffle的新方法,旨在解决自回归(AR)模型在生成高分辨率图像时所面临的挑战。自回归模型是一种在时间序列分析中广泛应用的统计方

近日,科技新闻界传来一则关于meta AI创新进展的报道。据报道,meta AI研发了一种名为Token-Shuffle的新方法,旨在解决自回归(AR)模型在生成高分辨率图像时所面临的挑战。wZh28资讯网——每日最新资讯28at.com

自回归模型是一种在时间序列分析中广泛应用的统计方法,它基于历史数据预测未来值。近年来,这种方法在语言生成领域取得了显著成就,并逐渐应用于图像合成。然而,在处理高分辨率图像时,AR模型遇到了瓶颈。与文本生成相比,图像合成需要处理数千个token,导致计算成本急剧增加,限制了AR模型在精细图像生成中的应用。wZh28资讯网——每日最新资讯28at.com

尽管扩散模型在高分辨率图像生成方面表现出色,但其复杂的采样过程和较慢的推理速度也成为其应用的局限。因此,meta AI推出的Token-Shuffle方法显得尤为重要。wZh28资讯网——每日最新资讯28at.com

Token-Shuffle的核心机制在于解决token效率问题。该方法通过识别多模态大语言模型(MLLMs)中视觉词汇的维度冗余,提出了一种创新策略:在Transformer处理前,将空间上相邻的视觉token沿通道维度合并,推理后再恢复原始空间结构。这种token融合机制不仅降低了计算成本,还保持了视觉质量,使自回归模型能够高效处理最高达2048×2048分辨率的图像。wZh28资讯网——每日最新资讯28at.com

具体来说,Token-Shuffle包括两个关键步骤:token-shuffle和token-unshuffle。在输入准备阶段,通过多层感知机(MLP)将空间相邻的token压缩为单个token,从而减少token数量。以窗口大小s为例,token数量可减少到原来的s²分之一,显著降低了Transformer的计算量。wZh28资讯网——每日最新资讯28at.com

Token-Shuffle还引入了针对自回归生成的classifier-free guidance(CFG)调度器,动态调整引导强度,优化文本-图像对齐效果。这一创新不仅提升了图像生成的质量,还为AR模型在高分辨率图像生成领域树立了新的标杆。wZh28资讯网——每日最新资讯28at.com

在实验中,Token-Shuffle展现了强大的实力。在GenAI-Bench基准测试中,基于2.7B参数的LLaMA模型,Token-Shuffle在“困难”提示下取得了VQAScore 0.77,超越了其他AR模型如LlamaGen和扩散模型LDM。同时,在Geneval基准测试中,Token-Shuffle的综合得分为0.62,为AR模型树立了新的标准。wZh28资讯网——每日最新资讯28at.com

wZh28资讯网——每日最新资讯28at.com

用户评估也显示,尽管在逻辑一致性方面略逊于扩散模型,但Token-Shuffle在文本对齐和图像质量上优于LlamaGen和Lumina-mGPT。这一成果不仅为图像合成领域带来了新的突破,也为未来AR模型在更高分辨率图像生成中的应用提供了可能。wZh28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-21-147624-0.htmlToken-Shuffle突破!自回归模型也能高效生成高清图像

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 《逆转裁判》险成遗珠?前卡普空开发者谈新IP生存难

下一篇: AI伪造“非遗传承”骗局,“苗古金贴”高价售低质品被查!

标签:
  • 热门焦点
  • Mate60手机壳曝光 致敬自己的经典设计

    8月3日消息,今天下午博主数码闲聊站带来了华为Mate60的第三方手机壳图,可以让我们在真机发布之前看看这款华为全新旗舰的大致轮廓。从曝光的图片看,Mate 60背后摄像头面积依然
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 消息称迪士尼要拍真人版《魔发奇缘》:女主可能也找黑人演员

    8月5日消息,迪士尼确实有点忙,忙着将不少动画改成真人版,继《美人鱼》后,真人版《白雪公主》、《魔发奇缘》也在路上了。据外媒消息称,迪士尼将打造真人版
  • 掘力计划第 20 期:Flutter 混合开发的混乱之治

    在掘力计划系列活动第20场,《Flutter 开发实战详解》作者,掘金优秀作者,Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
  • 服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • 上海举办人工智能大会活动,建设人工智能新高地

    人工智能大会在上海浦江两岸隆重拉开帷幕,人工智能新技术、新产品、新应用、新理念集中亮相。8月30日晚,作为大会的特色活动之一的上海人工智能发展盛典人工
Top