当前位置:首页 > 元宇宙 > AI

OpenAI 直播狙击谷歌:奥尔特曼 AGI 梗图现场直出,GPT-4o 超强原生生图来袭

来源: 责编: 时间:2025-03-31 11:07:20 221观看
导读 刚刚,OpenAI 深夜直播,GPT-4o 的原生图像生成大升级!奥尔特曼亲自上阵组队,演示了自拍变梗图、相对论漫画等功能,不过相对隔壁谷歌发布的新模型,OpenAI 的这波动作着实有点不够看。就在谷歌刚刚扔出地表最强模型 Ge

刚刚,OpenAI 深夜直播,GPT-4o 的原生图像生成大升级!奥尔特曼亲自上阵组队,演示了自拍变梗图、相对论漫画等功能,不过相对隔壁谷歌发布的新模型,OpenAI 的这波动作着实有点不够看。YxJ28资讯网——每日最新资讯28at.com

就在谷歌刚刚扔出地表最强模型 Gemini 2.5 Pro 不久,OpenAI 也有动作了。YxJ28资讯网——每日最新资讯28at.com

奥尔特曼亲自带队,展示了 GPT-4o 图像生成技术的各种大升级,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

整个直播中最亮的演示,莫过于这张官方玩梗的表情包了。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

目前,这项功能已经在 ChatGPT 和 Sora 中,向所有 Plus、Pro、Team 和免费用户推出。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

当然,新版 Sora 生图的时间,也比以往更长了。但 OpenAI 看来,生图的质量和其具备的世界知识,让用户值得等待那多出的几秒。YxJ28资讯网——每日最新资讯28at.com

GPT-4o 原生图像生成来了!

在直播中,奥尔特曼介绍道,从今天起,ChatGPT 中的原生图像生成功能正式推出!YxJ28资讯网——每日最新资讯28at.com

GPT-4o 的全模态能力,从此也融合进了 Sora 中。YxJ28资讯网——每日最新资讯28at.com

OpenAI 多模态研究的负责人 Gabe 介绍说,两年前刚开始这个项目时,他对于 GPT-4 这个强大的模型会怎样原生支持图像模型非常好奇。YxJ28资讯网——每日最新资讯28at.com

一年后,当模型完成训练时,他看到了令人兴奋的迹象。从 GPT-2 以来,他已经很久没有这种感觉 —— 这是一个疯狂时刻。YxJ28资讯网——每日最新资讯28at.com

给出以下 prompt,GPT-4o 就生成了符合要求的图像,完全还原了要求。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

接下来,三个人用手机来了张自拍,GPT-4o 立刻把三人自拍转换成了动漫风格的版本。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

甚至他们开始官方玩梗,让模型添加一段「Feel The AGI」在图片上,一张表情包就此诞生。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

这个过程,就体现了 4o 作为全能模型的强大能力。YxJ28资讯网——每日最新资讯28at.com

因为它不仅仅是一个语言模型,还包括图像、音频,所有输入和输出的模态。它可以理解、生成这些模态,并且无缝地在它们之间工作。YxJ28资讯网——每日最新资讯28at.com

用 OpenAI 的话说,「我们终于迈向了这种真正集成的多模态模型」。YxJ28资讯网——每日最新资讯28at.com

接下来,他们让模型画出一幅描述相对论的漫画,要求通俗易懂,还要加入一些幽默元素。YxJ28资讯网——每日最新资讯28at.com

这个提示词非常模糊,因此看看模型会生成什么样的图,就格外令人期待了。果然,生成效果令人惊喜。YxJ28资讯网——每日最新资讯28at.com

注意,这个过程中,模型很可能利用了自己的世界知识,对提示词进行了扩展。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

然后,他们给了模型一张卡片,希望生成同样风格的图像,但要求主角不再是卡片中的巨猫国王,而是某位研究者的狗狗。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

另外,卡片上还需要出现一些细节,比如模型的名字和年份,以及狗狗的体重和身高。YxJ28资讯网——每日最新资讯28at.com

可以看到,生成图像在文本渲染方面非常惊艳,所有数据都准确无误。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

最后一个演示,是基于此前几人生成的内容,制作一个纪念币。YxJ28资讯网——每日最新资讯28at.com

而且,还要求图使用了一个特殊的十六进制代码,且加上生成图像的文本和日期。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

可以看到,生成结果非常惊艳!此前曾出现的艺术熊、收音机、爱因斯坦漫画、研究者的狗狗以及模型名称和日期,全部都出现在了纪念币上。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

模型之所以精准完成这样复杂的要求,是因为它是用非自回归的方式训练的,因此它能够理解上下文中的文本和多张图片,以非常和谐的方式在纪念币上呈现出来。YxJ28资讯网——每日最新资讯28at.com

和 GPT-4o 聊天,定制各种图像

总之,现在使用这个功能,我们可以创建各种图像,或将其转换为各种风格。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

从此,用 GPT-4o 创建和定制图像,就像聊天一样简单。YxJ28资讯网——每日最新资讯28at.com

只需描述所需,就能得到想要的任何细节,比如纵横比、使用十六进制代码的精确颜色或透明背景。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

我们可以让它设计一个信息图,解释牛顿的棱镜宽高比,背景为深蓝色。YxJ28资讯网——每日最新资讯28at.com

一张画质高级的教学级图片,立马生成。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

这个图像生成功能的特点就是,能遵循非常复杂的提示,极其注重细节。YxJ28资讯网——每日最新资讯28at.com

15 个非常细化的要求,它都在一张图里完美实现了。YxJ28资讯网——每日最新资讯28at.com

要知道,大多数生图模型被要求渲染多个项目时,往往就会混淆颜色和形状,但新模型却能正确绑定 15 到 20 个对象的属性,还能成功理解各自的复杂需求。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

在你和它的聊天上下文中,GPT-4o 就能为你构建图像和文本,还能确保一致性。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

主打一个实用

从最早的洞穴壁画到现代信息图表,人类一直使用视觉图像来交流、说服和分析。YxJ28资讯网——每日最新资讯28at.com

如今的生成式 AI 模型可以创造出超现实的场景,但在处理人们用于分享和创建信息的实用图像方面仍然存在困难。YxJ28资讯网——每日最新资讯28at.com

GPT‑4o 的图像生成功能擅长准确渲染文本,精确遵循提示词,并利用 GPT-4o 固有的知识库和聊天上下文 —— 包括转换上传的图像或将其用作视觉灵感。YxJ28资讯网——每日最新资讯28at.com

这些能力让用户可以更加容易地创建想象中的画面,帮助通过视觉更有效地沟通,并将图像生成发展成为一种具有精确性和强大功能的实用工具。YxJ28资讯网——每日最新资讯28at.com

毕竟,只有当图像配上指代共享语言和经验的符号时,才能传达精确的含义。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

能力大幅增强

通过线上图像和文本的联合分布训练,模型不仅能学会图像如何与语言相关联,还能知道它们之间的相互关系。YxJ28资讯网——每日最新资讯28at.com

结合积极的后训练优化,最终的模型展现出惊人的视觉表现力,能够生成实用、一致且具有上下文感知能力的图像。YxJ28资讯网——每日最新资讯28at.com

文本渲染

一张图片胜过千言万语,但有时在正确的位置添加几个词能够大大提升图像的含义。YxJ28资讯网——每日最新资讯28at.com

GPT-4o 将精确的符号与图像融合的能力使图像生成成为视觉交流的有力工具。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

多轮交互生成

由于图像生成现在是 GPT‑4o 的原生功能,用户可以通过自然对话来完善图像。YxJ28资讯网——每日最新资讯28at.com

GPT‑4o 能够基于聊天上下文中的图像和文本进行构建,确保始终保持一致性。YxJ28资讯网——每日最新资讯28at.com

比如,一个正在设计中的游戏角色,它的外观就能在多次迭代和调整中保持连贯一致。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

指令遵循

GPT‑4o 的图像生成功能不仅可以遵循详细的提示词,而且还十分注重细节。YxJ28资讯网——每日最新资讯28at.com

相比起其他只能处理 5-8 个物体的模型,GPT‑4o 可以轻松搞定多达 10-20 个不同的物体。YxJ28资讯网——每日最新资讯28at.com

并且,物体与其特征和关系的更紧密绑定使得控制更加精准。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

上下文内学习

GPT‑4o 能够分析并学习用户上传的图像,将图像细节无缝整合到上下文中,用于辅助图像生成。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

世界知识

内置的图像生成功能使 GPT‑4o 能够连接文本和图像之间的知识,使模型表现得更智能、更高效。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

真实照片风格

通过对反映多种多样图像风格的图像进行训练,模型能够以令人信服的方式创建或转换图像。YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

YxJ28资讯网——每日最新资讯28at.com

参考资料:YxJ28资讯网——每日最新资讯28at.com

https://openai.com/index/introducing-4o-image-generation/YxJ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11767-0.htmlOpenAI 直播狙击谷歌:奥尔特曼 AGI 梗图现场直出,GPT-4o 超强原生生图来袭

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌最强模型 Gemini 2.5 Pro 发布即屠榜,创下史上最大分数飞跃纪录

下一篇: DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶

标签:
  • 热门焦点
  • 一份全面清单:Web3行业高薪酬的13种工作

    来源:区块链骑士这可能会让许多人感到震惊,但除了成为开发人员之外,Web3还有其他高薪工作。Web3可能是现代就业市场中跨学科最多的领域,换句话说,它由许多个在不同领域中具有不同
  • 数字虚拟人23年最新变化!

    作者:小资来源:米塔之家自2021年元宇宙“爆炸”后,作为现实世界连接元宇宙的媒介之一,大批虚拟人跑步入场。到了2022年底,据天眼查数据显示,我国目前企业名称或经营范围
  • 元宇宙里掀起回忆杀?这波虚拟怀旧营销主打一个极限反差

    来源:首席品牌官从被称为“元宇宙元年”的2021年开始,几乎所有品牌都在迫不及待地“入驻”元宇宙。而一提及品牌们的元宇宙玩法,相信多数人脑海里首先浮现
  • 亚马逊AIGC全家桶来袭,巨头AI大乱战都有什么杀手锏

    此前,亚马逊云科技发布多款AIGC产品,其中包括AI大模型服务Amazon Bedrock、人工智能计算实例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型、软件
  • 2022年6款最佳的NFT稀有度查询工具

    NFT正在风靡全球,但拥有一个你自认为看起来很酷的 NFT 是不够的,因为它还应该是稀有的,稀有度会影响每个 NFT 的价值。因此,如果您打算投资 NFT,则需要使用 NFT 稀
  • 2030年的元宇宙产业将会如何发展?

    对互联网巨头传统业务的反垄断政策倒逼互联网企业颠覆创新,寻找新的增长点,移动互联网流量空间见顶之际,元宇宙时代红利已然开启。序章:元宇宙应用场景大猜想元宇
  • NFT Insider #47:YGG发布2021Q4社区报告,GameFi领域1月份获超10亿美元融资

    引言:NFT Insider由WHALE社区、BeepCrypto联合出品,浓缩每周NFT新闻,为大家带来关于NFT最全面、最新鲜、最有价值的讯息。每期周报将从NFT市场数据,艺术新闻类,游戏
  • NFT高玩必备:NFT分析工具大盘点

    NFT市场的火热让越来越多的投资者投身其中,但当前的 NFT 生态系统存在几个问题却困扰了大多数人,如难以准确评估 NFT 项目的资产价格、缺乏 NFT 市场动态信息、
  • 虚拟邓丽君后,数字人赛道开启3.0时代

    “如果右脑时代来临,虚拟世界将是对人类才华的无限放大。” 郭晓喆称,开发数字人形象时,自己的团队在内部“卷”了一下:“当我们翻阅大量历史典籍的时候,苏小妹找到
Top