写在前面:认识真正的开源图像编辑利器 FLUX.1 Kontext [dev]
在众多AI图像工具中,由德国 Black Forest Labs
团队开发的 FLUX.1 Kontext [dev]
模型正凭借其出色的图像编辑能力,成为当下最受关注的焦点之一。
不同于许多需要积分、按次付费的云端服务,FLUX.1 Kontext [dev]
是一个官方发布的、拥有120亿参数的开源权重模型。这意味着什么?它意味着任何拥有合适硬件的用户,都可以通过本地部署,实现永久免费、无限制的图像编辑,彻底摆脱对第三方网站的依赖。
FLUX
模型家族分为几个版本,其中 FLUX.1 [dev]
主要负责文本到图像的生成,而我们今天的主角 FLUX.1 Kontext [dev]
则是一个专门为图像编辑而设计的强大工具。它能够深刻理解图像的“上下文”(Kontext),进行精准的风格迁移、元素修改,甚至融合多张图片的内容。
这篇教程将手把手指导你完成从零到一的本地部署和实操,让你也能在自己的电脑上驾驭这一强大的AI工具。
第一章:基础环境搭建 (ComfyUI)
要运行 FLUX.1 Kontext [dev]
,我们需要一个强大的图形化界面——ComfyUI
。它是一个基于节点的平台,你可以把它想象成一个可视化的流程图,通过连接不同的功能模块(节点)来控制AI的每一步工作。
1.1 下载并安装 ComfyUI
首先,访问 ComfyUI
的官方网站:https://www.comfy.org/
,直接点击“下载”按钮。
根据你的操作系统选择相应的版本,本文以 Windows
为例。
下载完成后,双击 .exe
文件开始安装。
1.2 安装依赖项:Git
在安装过程中,ComfyUI
需要 Git
来管理和更新组件。如果你的电脑尚未安装,程序会弹出提示。点击“Open git downloads page”跳转到下载页面。
同样,选择适合你电脑的版本进行下载。
Git
的安装过程非常简单,保持默认设置,一路点击“Next”即可。
最后点击“Finish”完成安装。
1.3 完成 ComfyUI 安装
Git
安装完毕后,回到 ComfyUI
的安装向导,点击“开始使用”。
建议选择一个空间充裕的非系统盘(如D盘或E盘)作为安装路径,因为后续下载的模型文件会占用较大空间。
确认路径后,点击“安装”。
此时,程序会自动下载并配置所需的 Python
环境和依赖包。这个过程需要下载数GB的文件,请确保网络连接稳定并耐心等待。
当看到如下所示的节点界面时,恭喜你,ComfyUI
已成功安装并启动!
第二章:部署并实操 FLUX.1 Kontext [dev]
环境就绪,现在开始部署模型并进行实战演练。
2.1 下载模型权重
在 ComfyUI
界面中,选择或加载预设的 Flux
工作流,然后选择 Basic
版本。
此时,系统会自动检测到缺失的模型文件,并提示下载。这里面就包含了 FLUX.1 Kontext [dev]
的核心权重。点击全部下载。
注意:即使进入了节点操作界面,模型可能仍在后台下载。
可以通过观察左侧模型加载节点的进度条来确认所有文件是否下载完毕。当所有模型都显示为绿色,代表一切就绪。
2.2 实操案例一:单图编辑(风格与元素修改)
这是 FLUX.1 Kontext [dev]
最基础也最常用的功能:理解文本指令,对单张图片进行修改。
- 在
Load Image
节点中,点击“选择文件上传”,导入一张你想要编辑的图片。这里我们上传一张人像照片。
- 在
Prompt
输入框中,用英文填写你的修改指令。模型的训练数据以英文为主,使用英文可以获得最精确的执行效果。 - 测试1:风格转换。我们尝试将其变为“吉卜力”动画风格,输入:
Change the style of the image to Ghibli style
- 点击右侧的“运行”按钮。
可以看到
KSampler
节点(采样器)正在工作,并显示进度。很快,一张全新风格的图片就生成了。
在生成的图片上右键,选择“Save Image”即可保存。
- 测试2:元素修改。我们再来尝试修改画面中的局部元素,比如将衣服变为红色,输入:
Turn clothes red
模型精准地识别并修改了指定对象。
2.3 实操案例二:多图融合(上下文理解与创作)
这部分将展示 Kontext
一词的精髓——模型如何理解并融合多个独立的“上下文”(即多张图片和文本)。
- 激活第二个图像输入节点。在工作流中,找到第二个
Load Image
节点(即原文提到的第一个“紫色区域”),它默认处于Bypass
(绕过)状态。右键点击它,选择Enable Node
(或使用快捷键Ctrl+B
)来激活它。 - 在激活的节点中,上传你的第二张图片,我们用一张沐浴露的产品图作为示例。
- 激活并连接融合节点。找到名为
FLUXCombiner
的节点(即原文提到的第二个“紫色区域”),同样激活它。 - 建立数据流。从第二个
Load Image
节点的IMAGE
输出端口,按住鼠标左键拖拽出一条连接线,将其连接到FLUXCombiner
节点的image_2
输入端口。连接完成后,数据流看起来是这样的。这代表两张图片的视觉信息都将输入到融合器中。
- 下达融合指令。现在,给出一个能够描述两张图片关系的文本指令:
This girl is holding this bottle of shower gel
- 点击“运行”。模型会理解文本指令,并从两张输入图片中提取“女孩”和“沐浴露”的视觉概念,最终生成一个逻辑自洽的全新场景。
至此,你已经掌握了在本地免费使用 FLUX.1 Kontext [dev]
进行基础和高级图像编辑的方法。这仅仅是一个开始,其强大的能力和开源的特性,为每一位创作者提供了无尽的想象空间。