GPT-Image-Edit：使用文本指令编辑和生成图像的工具

2025-07-30

1.7 K 16

https://github.com/wyhlovecpp/GPT-Image-Edit

复制

GPT-Image-Edit 是一个开源工具，托管在 GitHub 上，由用户 wyhlovecpp（Yuhan Wang）开发。它基于 OpenAI 的图像生成技术，允许用户通过简单的文本指令生成或编辑图像。这个工具适合开发者、设计师或对 AI 图像处理感兴趣的用户。项目提供了一个直观的接口，用户可以上传图片并通过描述性文字实现图像修改，比如改变背景、添加物体或调整风格。它的核心优势在于结合了 AI 的强大图像处理能力和简洁的操作流程，适合快速上手。项目仍在开发中，代码和文档公开，鼓励社区贡献和反馈。

功能列表

通过文本指令生成全新图像。
支持上传图像并根据文本描述进行编辑。
提供图像风格转换功能，如将图像转为卡通或艺术风格。
支持批量处理图像，适合大规模编辑任务。
开源代码，用户可自定义功能或集成到其他项目。
提供简单的 API 接口，方便开发者调用。

使用帮助

安装流程

要使用 GPT-Image-Edit，需要先克隆项目并设置开发环境。以下是详细的安装步骤：

克隆仓库
在终端或命令行中运行以下命令，将项目克隆到本地：
```
git clone https://github.com/wyhlovecpp/GPT-Image-Edit.git
cd GPT-Image-Edit
```
安装依赖
项目依赖 Python 环境和一些第三方库。确保已安装 Python 3.7 或以上版本。然后运行：
```
pip install -r requirements.txt
```
这个命令会安装必要的库，例如 openai、pillow 等。如果遇到依赖问题，可以检查 requirements.txt 文件，确保所有库版本匹配。
配置 API 密钥
GPT-Image-Edit 使用 OpenAI 的 API，需要配置 API 密钥。用户需在 OpenAI 平台注册并获取密钥。将密钥添加到环境变量或配置文件中：
- 创建一个 .env 文件，写入：
```
OPENAI_API_KEY=your_openai_api_key_here
```
- 或者直接在代码中设置：
```
client = OpenAI(api_key="your_openai_api_key_here")
```
运行项目
完成配置后，运行主程序文件（例如 main.py）：
```
python main.py
```
项目会启动一个简单的本地接口，具体运行方式可能因代码更新而变化，建议参考项目的 README.md 文件。

主要功能操作

1. 生成图像

用户可以通过文本描述生成全新图像。例如，想生成一幅“夜晚星空下的城堡”图像，只需输入：

prompt = "A castle under a starry night sky, in a fantasy style"
result = client.images.generate(model="gpt-image-1", prompt=prompt, size="1024x1024")

生成的图像会以 base64 编码返回，代码会自动保存为本地文件（如 output.png）。用户可以调整 size 参数（如 512x512 或 1024x1536）控制分辨率。

2. 编辑现有图像

用户可以上传一张图片并通过文本指令修改。例如，要在一张猫的图片上添加帽子：

上传图片：将图片文件（如 cat.png）放入项目指定的文件夹（通常是 imgs/）。

输入编辑指令：

img_input = open("imgs/cat.png", "rb")
prompt_edit = "Add a red hat on the cat, in a cartoon style"
result_edit = client.images.edit(model="gpt-image-1", image=img_input, prompt=prompt_edit)

保存结果：编辑后的图像会保存到指定路径（如 imgs/edited_cat.png）。

3. 使用掩码编辑

掩码功能允许用户指定图像的特定区域进行编辑，保护其他部分不被修改。操作步骤：

准备掩码图像：使用图像编辑软件（如 Photoshop）创建一个黑白掩码，黑色的部分表示需要编辑的区域，白色部分保持不变。确保掩码包含 alpha 通道。

代码示例：

img_input = open("imgs/cat.png", "rb")
mask_input = open("imgs/mask.png", "rb")
prompt_mask = "Change the background to a forest scene"
result_mask = client.images.edit(model="gpt-image-1", image=img_input, mask=mask_input, prompt=prompt_mask)

注意：掩码编辑可能不够精确，模型有时会影响掩码区域内的内容，建议用户测试并优化提示词。

4. 风格转换

用户可以通过提示词改变图像风格。例如，将照片转为油画风格：

prompt_style = "Convert this image to an oil painting style"
result_style = client.images.edit(model="gpt-image-1", image=open("imgs/photo.png", "rb"), prompt=prompt_style)

生成的图像会保留原始内容，但呈现指定的艺术风格。

使用技巧

提示词优化：提示词越具体，生成效果越好。例如，“一只坐在木桌上戴红色帽子的黑猫，背景是日落”比“猫戴帽子”效果更好。
批量处理：项目支持同时处理多张图片，适合需要快速编辑大量图像的用户。
调试与日志：运行时检查控制台输出，确保 API 调用成功。如果遇到错误，检查 API 密钥或网络连接。

注意事项

项目需要稳定的网络连接调用 OpenAI API。
确保 OpenAI 账户已验证，否则可能无法使用 gpt-image-1 模型。
项目代码可能因更新而变化，建议定期查看 GitHub 仓库的最新提交。

应用场景

内容创作
设计师可以利用 GPT-Image-Edit 快速生成或修改图片素材。例如，创建社交媒体海报或调整产品图片的背景。
教育与研究
学生和研究者可以用它探索 AI 图像生成技术，测试不同提示词的效果，或在学术项目中集成图像处理功能。
游戏开发
游戏开发者可以快速生成概念艺术或编辑角色图片，调整风格以适配游戏主题。
自动化工作流
企业用户可以将工具集成到自动化工作流中，批量处理产品图片或生成定制化营销素材。

QA

需要付费才能使用吗？
GPT-Image-Edit 本身是免费的开源项目，但需要 OpenAI API 密钥，使用 API 会产生费用，具体取决于 OpenAI 的计费标准。
支持哪些图像格式？
支持常见格式如 PNG、JPEG。掩码文件需包含 alpha 通道，通常保存为 PNG 格式。
如何提高生成图像的质量？
使用详细的提示词，指定风格、颜色和场景。调整分辨率参数（如 1024x1024）可提高图像清晰度。
可以离线使用吗？
不支持离线使用，图像生成和编辑依赖 OpenAI 的云端 API。

AI图像编辑 AI开源项目

AI生产力工具 » GPT-Image-Edit：使用文本指令编辑和生成图像的工具发布于 2025-07-30，如发现网址过期，或无法访问，请联系我们。

0已收藏

0已赞

GPT-Image-Edit：使用文本指令编辑和生成图像的工具

功能列表

使用帮助

安装流程

主要功能操作

1. 生成图像

2. 编辑现有图像

3. 使用掩码编辑

4. 风格转换

使用技巧

注意事项

应用场景

QA

相关推荐

找不到AI工具？在这试试！

热门AI工具

最新发布

最新AI工具

GPT-Image-Edit：使用文本指令编辑和生成图像的工具

功能列表

使用帮助

安装流程

主要功能操作

1. 生成图像

2. 编辑现有图像

3. 使用掩码编辑

4. 风格转换

使用技巧

注意事项

应用场景

QA

相关推荐

找不到AI工具？在这试试！

热门AI工具

最新发布

最新AI工具

快速查询站内AI工具