[ PROMPT_NODE_23284 ]
imagegen
[ SKILL_DOCUMENTATION ]
# 图像生成技能
为当前项目生成或编辑图像(例如:网站素材、游戏资产、UI 模型、产品模型、线框图、Logo 设计、照片级真实图像、信息图表)。默认使用 `gpt-image-1.5` 和 OpenAI 图像 API,并优先使用捆绑的 CLI 以实现确定性、可重复的运行。
## 何时使用
- 生成新图像(概念艺术、产品拍摄、封面、网站首屏大图)
- 编辑现有图像(重绘、遮罩编辑、光照或天气转换、背景替换、对象移除、合成、透明背景)
- 批量运行(多个提示词,或跨提示词的多个变体)
## 决策树(生成 vs 编辑 vs 批量)
- 如果用户提供了输入图像(或说“编辑/修图/重绘/遮罩/翻译/本地化/仅更改 X”)→ **编辑**
- 否则,如果用户需要许多不同的提示词/资产 → **批量生成**
- 否则 → **生成**
## 工作流
1. 确定意图:生成、编辑还是批量(见上方的决策树)。
2. 预先收集输入:提示词、确切文本(逐字)、约束/避免列表,以及任何输入图像/遮罩。对于多图像编辑,按索引和角色标记每个输入;对于编辑,明确列出不变项。
3. 如果是批量:在 tmp/ 下编写一个临时 JSONL(每行一个任务),运行一次,然后删除该 JSONL。
4. 将提示词扩充为简短的标记化规范(结构 + 约束),不要凭空捏造新的创意需求。
5. 使用合理的默认设置运行捆绑的 CLI (`scripts/image_gen.py`)(参考 references/cli.md)。
6. 对于复杂的编辑/生成,检查输出(打开/查看图像)并验证:主体、风格、构图、文本准确性以及不变项/避免项。
7. 迭代:进行单次针对性修改(提示词或遮罩),重新运行,重新检查。
8. 保存/返回最终输出,并记录所使用的最终提示词 + 标志。
## 临时文件与输出约定
- 使用 `tmp/imagegen/` 存放中间文件(例如 JSONL 批处理);完成后删除。
- 在此仓库工作时,将最终产物写入 `output/imagegen/`。
- 使用 `--out` 或 `--out-dir` 控制输出路径;保持文件名稳定且具有描述性。
## 依赖(如果缺失请安装)
推荐使用 `uv` 进行依赖管理。
Python 包:
uv pip install openai pillow
如果 `uv` 不可用:
python3 -m pip install openai pillow
## 环境
- 必须设置 `OPENAI_API_KEY` 才能进行实时 API 调用。
如果缺少密钥,请向用户提供以下步骤:
1. 在 OpenAI 平台 UI 中创建 API 密钥:https://platform.openai