当前位置:首页 > 元宇宙 > AI

前端程序员请注意:首个截图就能生成现代前端代码的 AI 开源

来源: 责编: 时间:2025-02-28 12:37:57 180观看
导读 现在截图生成代码,已经来到了一个新高度 —— ⾸个⾯向现代前端代码⽣成的多模态⼤模型解决⽅案,来了!而且是开源的那种。(注:现代前端代码开发具有组件化、状态管理和数据驱动渲染、开发规范严格以及动态交互性强

现在截图生成代码,已经来到了一个新高度 —— ⾸个⾯向现代前端代码⽣成的多模态⼤模型解决⽅案,来了!而且是开源的那种。6qj28资讯网——每日最新资讯28at.com

6qj28资讯网——每日最新资讯28at.com

(注:现代前端代码开发具有组件化、状态管理和数据驱动渲染、开发规范严格以及动态交互性强等特点。这些特点相互关联,共同构成了现代前端开发的复杂体系,对代码生成提出了更高要求。如基于 React、Vue 等框架的开发。)6qj28资讯网——每日最新资讯28at.com

这个模型叫做 Flame,话不多说,直接来看效果。6qj28资讯网——每日最新资讯28at.com

例如截图让 AI 生成下面这个界面:6qj28资讯网——每日最新资讯28at.com

6qj28资讯网——每日最新资讯28at.com

Flame 模型在“看”完图片之后,给出来的代码是这样:6qj28资讯网——每日最新资讯28at.com

6qj28资讯网——每日最新资讯28at.com

不难看出,Flame ⽣成代码明显是符合现代前端开发规范的,包括⽐较清晰的外联样式以及模块化组件结构。6qj28资讯网——每日最新资讯28at.com

同时在组件的实现中正确定义了组件的各个状态、事件响应、以及基于数据的组件动态渲染。6qj28资讯网——每日最新资讯28at.com

然而,诚如 GPT-4o 这样顶尖的 SOTA 模型,可能也与现代前端开发的核⼼需求背道⽽驰,因为局限在于端到端复刻设计图的过程中只能产出静态组件。6qj28资讯网——每日最新资讯28at.com

例如同样的界面,GPT-4o 的解法是这样的:6qj28资讯网——每日最新资讯28at.com

6qj28资讯网——每日最新资讯28at.com

问题根源在于这类静态代码既⽆法⽀撑模块化架构,也难以⽀撑动态交互。6qj28资讯网——每日最新资讯28at.com

每个组件都是“⼀次性产物”,任何细微的需求开发和迭代,可能都要开发者开发⼤量定制化代码,甚⾄是推倒重来。6qj28资讯网——每日最新资讯28at.com

6qj28资讯网——每日最新资讯28at.com

那么 Flame 模型又是如何解决这个问题的呢?6qj28资讯网——每日最新资讯28at.com

核心问题:数据稀缺

⼤型视觉语⾔模型(LVLM)在⽣成专业前端代码上表现不尽⼈意的根本原因在于数据稀缺。6qj28资讯网——每日最新资讯28at.com

现代前端开发流程⾮常复杂,⽐如像 React 这样的前端框架,强调组件化、状态管理和数据驱动的渲染⽅式。6qj28资讯网——每日最新资讯28at.com

这就要求⽣成的代码不仅要能⽤,还要符合开发规范,具备动态性和响应性。6qj28资讯网——每日最新资讯28at.com

然⽽,开源社区中⽀持前端开发的⾼质量图像-⽂本(代码)数据集极度稀缺。6qj28资讯网——每日最新资讯28at.com

像 websight 这样的数据集只涉及静态 HTML,不适⽤于现代前端开发。6qj28资讯网——每日最新资讯28at.com

收集并构建⾼质量的训练数据⾯临许多挑战:6qj28资讯网——每日最新资讯28at.com

如何从公共代码库中提取有效代码片段?6qj28资讯网——每日最新资讯28at.com

如何在保持原有代码效果的情况下进行渲染?6qj28资讯网——每日最新资讯28at.com

如何⽣成符合⼯程师习惯的⼤量、多样化数据?6qj28资讯网——每日最新资讯28at.com

针对这些问题,Flame 模型的团队给出了解法就是数据合成。6qj28资讯网——每日最新资讯28at.com

为提升 LVLM 在前端代码⽣成能⼒,我们设计了⼀整套⾃反思的智能体⼯作流,⽤于⽣成前端开发场景下的⾼质量数据。6qj28资讯网——每日最新资讯28at.com

该⼯作流不仅能⾃动从公共代码库中提取真实数据,还能够⾃主合成数据,⽣成专业、多样化的前端代码。6qj28资讯网——每日最新资讯28at.com

团队设计并实现了 3 种合成⽅法:6qj28资讯网——每日最新资讯28at.com

6qj28资讯网——每日最新资讯28at.com

基于进化的数据合成(Evolution-Based Synthesis)

借鉴 WizardLM 的 Evol-Instruct ⽅法,通过随机进化⽣成多样化的代码。它采⽤两种策略:⼴度进化和深度进化。6qj28资讯网——每日最新资讯28at.com

⼴度进化通过改变代码的功能和视觉⻛格,⽣成新变体;深度进化则通过增加代码的技术复杂度,优化组件处理、状态管理和性能,提升代码的可靠性和可维护性。6qj28资讯网——每日最新资讯28at.com

通过不断进化,可以得到⼤量覆盖不同需求的前端代码。6qj28资讯网——每日最新资讯28at.com

基于瀑布模型的数据合成(Waterfall-Model-Based Synthesis)

模拟传统软件开发的瀑布流模型,确保⽣成的代码结构清晰、逻辑⼀致。从需求分析开始,推导出系统功能需求,设计 UI 布局和架构,保证代码符合现代前端开发的模块化和可扩展性要求。6qj28资讯网——每日最新资讯28at.com

接着,通过多轮迭代,将需求转化为具体的、可复⽤的前端组件和⻚⾯。这种⽅法⽣成的代码逻辑清晰,适合复杂功能的开发任务。6qj28资讯网——每日最新资讯28at.com

基于增量开发的数据合成(Additive Development Synthesis)

在现有代码基础上,逐步增加功能和复杂性。通过逐步集成状态管理、交互逻辑或 API 等功能模块,⽣成的代码能更好地满⾜实际开发需求。6qj28资讯网——每日最新资讯28at.com

这种⽅法强调逐步提升代码的功能和复杂度,确保每次扩展都最⼤可能符合最佳实践。6qj28资讯网——每日最新资讯28at.com

上述的三种⽅法不仅丰富了数据集的规模和多样性,还确保了数据质量与实际应⽤价值。6qj28资讯网——每日最新资讯28at.com

这些⽅法能够低成本⼤规模合成特定前端框架的图⽂数据,借助上述⽅法,Flame 团队针对 React 框架构建了超过 400k 的多模态数据集。6qj28资讯网——每日最新资讯28at.com

同时,基于瀑布模型和增量开发的⽅法还⽀持多图场景下的数据合成、视觉思维链的合成,为更复杂场景下的前端代码⽣成提供了更多可能。6qj28资讯网——每日最新资讯28at.com

Flame:针对前端开发场景的 VLM

Flame 团队⼈⼯构建了⼀套包含 80 道测试题⽬的⾼质量测试集并通过改进后的 Pass@k 来评测多模态模型的前端代码⽣成能⼒。6qj28资讯网——每日最新资讯28at.com

如果⽣成的代码能够通过编译验证、符合编码规范,并且所渲染出的⻚⾯与输⼊的设计图⾜够相似,则认为该代码符合要求。6qj28资讯网——每日最新资讯28at.com

评测结果显⽰,当前顶级模型如 GPT-4o,Gemini 1.5 Flash 因其⽣成代码主要为静态代码,严重偏离代码规范,使其最⾼ Pass@1 仅为 11%,⽽ Flame 在相同条件下达到了 52%+,展现出了极⼤的潜⼒。6qj28资讯网——每日最新资讯28at.com

同时,Flame 仅⽤ 20w 左右的数据量级即取得以上成果,进⼀步验证了上述数据合成⽅法的价值以及⾼质量数据集在多模态模型能⼒提升中的关键作⽤。6qj28资讯网——每日最新资讯28at.com

6qj28资讯网——每日最新资讯28at.com

△ 左:测试图;右:Flame 效果图6qj28资讯网——每日最新资讯28at.com

值得一提的是,将训练数据、数据合成流程、模型及测试集已经全⾯开源,感兴趣的小伙伴赶紧去看看吧。6qj28资讯网——每日最新资讯28at.com

GitHub 地址:6qj28资讯网——每日最新资讯28at.com

https://github.com/Flame-Code-VLM/Flame-Code-VLM/blob/main/README.md6qj28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位(ID:QbitAI),作者:关注前沿科技6qj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11193-0.html前端程序员请注意:首个截图就能生成现代前端代码的 AI 开源

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌发布最强「科研辅助神器」:能帮你提新 idea,三大真实场景实证

下一篇: OPPO ColorOS 正式接入满血 DeepSeek-R1:支持语音唤醒交互,40+机型可体验

标签:
  • 热门焦点
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 沉寂3年,大模型激活小度天猫精灵?

    Tech星球(微信ID:tech618)文 | 何煦阳 沉寂了许久的智能音箱,在今年大模型横空出世之后,又再次燃起了新的希望。 2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型&ldq
  • 亚马逊AIGC全家桶来袭,巨头AI大乱战都有什么杀手锏

    此前,亚马逊云科技发布多款AIGC产品,其中包括AI大模型服务Amazon Bedrock、人工智能计算实例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型、软件
  • Meta、谷歌、微软竞相涌入元宇宙,小型企业该如何伺机而动?

    目前来看元宇宙不会影响到小型企业的发展,但在接下来的十年内可能会发生很多变化。很多有商业头脑的企业家都在密切关注着元宇宙的发展。元宇宙这个词,你一定或
  • 纽约街头出现NFT自动贩卖机

    一家初创公司宣布在纽约市开放一台NFT自动售货机,允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon,上个月完成了一轮300万美元的种子募捐
  • NFT艺术家Hayley Rincon 专访:我的迷幻数字艺术之路

    Hayley Rincon是一位令人印象深刻才华横溢的创作者,她的作品呈现出迷幻的气息。今天就来聊聊她的艺术作品,和她自己的数字艺术之路。Hayley是加利福尼亚湾区的有
  • 从4个方面解析2022年加密行业趋势

    作者:去月球基础设施瓶颈仍然存在尽管2021年公链基础设施之间的竞争显著升温,但关键瓶颈仍需解决。例如,以太坊作为DApp开发的顶级公链,仍然遭受网络拥塞和高额交
  • 虚拟邓丽君后,数字人赛道开启3.0时代

    “如果右脑时代来临,虚拟世界将是对人类才华的无限放大。” 郭晓喆称,开发数字人形象时,自己的团队在内部“卷”了一下:“当我们翻阅大量历史典籍的时候,苏小妹找到
  • 从NFT数字收藏,洞察数字音乐版权市场发展趋势

    去年8月9日,腾讯音乐布局NFT数字收藏,在腾讯应用宝发布幻核app,腾讯音乐的提前布局示意着未来区块链技术将对数字音乐版权市场进行改造升级。作者从深层测分析为
Top