文章预览
在前端开发中,「 图生代码 」--即根据设计图生产可执行代码--是一个常见且关键的环节,然而,即使像 GPT-4o 这样的顶尖 SOTA 模型,也很难满足专业或特定框架的开发需求。 这些模型的局限在于端到端复刻设计图的过程中只能产出静态组件,这与现代前端开发的核心需求背道而驰。 如下图所示,GPT-4o 生成的代码就是还原度很高的效果展示,但在真实的开发场景中几乎无法直接使用。问题根源在于这类静态代码即无法支撑模块化架构,也难以支撑动态交互。每个组件都是「一次性产物」,任何细微的需求开发和迭代,可能都要开发者开发大量定制化代码,甚至是推倒重来。 核心问题:数据稀缺 大型视觉语言模型(LVLM)在生成专业前端代码上表现不尽人意的根本原因在于 数据稀缺。 现代前端开发流程非常复杂,比如像React这样的前端框架,强
………………………………