ScreenCoder采用模块化多智能体框架,通过三个关键步骤实现转换:
- visuelles Verständnis:使用视觉-语言模型(VLM)分析UI截图,识别并标记界面元素(如按钮、导航栏等)
- 布局规划:根据前端工程原理自动组织组件,形成层次化结构(如顶部导航栏/左侧边栏)
- Codegenerierung:通过自适应提示生成符合Web标准的HTML/CSS代码,输出包含语义化标签和样式的可编辑文件
整个过程支持多模型驱动(如Doubao、Qwen等),用户可上传PNG/JPG格式的清晰设计图获得最佳效果。
Diese Antwort stammt aus dem ArtikelScreenCoder: Ein Tool zur Umwandlung von UI-Screenshots in editierbaren HTML/CSS-CodeDie