综合介绍
GLIGEN GUI是一种用于文本到图像模型的直观界面,它使用ComfyUI作为后端。用户可以直接通过绘制盒子的方法在画布上精确指定图像中物体的位置,并通过文本输入表达他们的创造构想。该项目的GitHub仓库提供了安装指南和使用教程。
功能列表
- 使用直观的界面绘制定位盒子
- 输入文本以标记画布上绘制的盒子
- 支持Stable Diffusion 1.5检查点
- 提供标签输入用于描述图片风格和质量
- LORAs功能支持,可自定义LORAs名称和强度
- 集成到ComfyUI,可直接提交提示信息并生成图片
使用帮助
- 确保已经安装并运行ComfyUI
- 下载对应的GLIGEN模型文件到ComfyUI的模型目录中
- 确保安装了Flask
- 克隆GLIGEN GUI的GitHub仓库并运行
- 访问本地服务器使用界面
克隆面部到一张静态图片中的discord机器人