OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  nano-banana-pro:利用 Nano Banana Pro 引擎生成/编辑图像的技能

nano-banana-pro:利用 Nano Banana Pro 引擎生成/编辑图像的技能

 
  opt ·  2026-02-24 11:58:51 · 2 次点击  · 0 条评论  

名称: nano-banana-pro
描述: 使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。适用于包含编辑请求的图像创建/修改。支持文生图与图生图;1K/2K/4K分辨率;使用 --input-image 参数。


Nano Banana Pro 图像生成与编辑

使用 Google 的 Nano Banana Pro API (Gemini 3 Pro Image) 生成新图像或编辑现有图像。

使用方法

请使用绝对路径运行脚本(不要先切换到技能目录):

生成新图像:

uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "你的图像描述" --filename "输出文件名.png" [--resolution 1K|2K|4K] [--api-key 密钥]

编辑现有图像:

uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "编辑指令" --filename "输出文件名.png" --input-image "输入图片路径.png" [--resolution 1K|2K|4K] [--api-key 密钥]

重要提示: 始终从用户的当前工作目录运行,以确保图像保存在用户的工作位置,而非技能目录中。

默认工作流(草稿 → 迭代 → 终稿)

目标:在提示词确定前快速迭代,避免在 4K 分辨率上浪费时间。

  • 草稿 (1K):快速反馈循环
  • uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "<草稿提示词>" --filename "yyyy-mm-dd-hh-mm-ss-draft.png" --resolution 1K
  • 迭代:微调提示词;每次运行使用新文件名
  • 如果是编辑:在满意之前,每次迭代使用相同的 --input-image
  • 终稿 (4K):仅在提示词确定后使用
  • uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "<最终提示词>" --filename "yyyy-mm-dd-hh-mm-ss-final.png" --resolution 4K

分辨率选项

Gemini 3 Pro Image API 支持三种分辨率(必须使用大写 K):

  • 1K (默认) - 约 1024 像素分辨率
  • 2K - 约 2048 像素分辨率
  • 4K - 约 4096 像素分辨率

将用户请求映射到 API 参数:
- 未提及分辨率 → 1K
- "低分辨率"、"1080"、"1080p"、"1K" → 1K
- "2K"、"2048"、"正常"、"中等分辨率" → 2K
- "高分辨率"、"高清"、"4K"、"超清" → 4K

API 密钥

脚本按以下顺序检查 API 密钥:
1. --api-key 参数(如果用户在聊天中提供了密钥则使用)
2. GEMINI_API_KEY 环境变量

如果两者均未提供,脚本将退出并报错。

预检与常见故障(快速修复)

  • 预检步骤:
  • command -v uv (必须存在)
  • test -n \"$GEMINI_API_KEY\" (或传递 --api-key)
  • 如果是编辑:test -f \"输入图片路径.png\"

  • 常见故障:

  • Error: No API key provided. → 设置 GEMINI_API_KEY 环境变量或传递 --api-key
  • Error loading input image: → 路径错误或文件不可读;请检查 --input-image 指向真实的图像文件
  • “配额/权限/403”类 API 错误 → 密钥错误、无访问权限或配额超限;尝试更换密钥或账户

文件名生成

按以下模式生成文件名:yyyy-mm-dd-hh-mm-ss-描述性名称.png

格式: {时间戳}-{描述性名称}.png
- 时间戳:当前日期/时间,格式为 yyyy-mm-dd-hh-mm-ss (24小时制)
- 名称:描述性的小写文本,用连字符连接
- 描述部分应简洁(通常 1-5 个词)
- 根据用户的提示词或对话上下文命名
- 如果上下文不明确,使用随机标识符(如 x9k2a7b3

示例:
- 提示词 "A serene Japanese garden" → 2025-11-23-14-23-05-japanese-garden.png
- 提示词 "sunset over mountains" → 2025-11-23-15-30-12-sunset-mountains.png
- 提示词 "create an image of a robot" → 2025-11-23-16-45-33-robot.png
- 上下文不明确 → 2025-11-23-17-12-48-x9k2.png

图像编辑

当用户想要修改现有图像时:
1. 检查用户是否提供了图像路径或引用了当前目录中的图像
2. 使用 --input-image 参数指定图像路径
3. 提示词应包含编辑指令(例如:"让天空更戏剧化"、"移除人物"、"改为卡通风格")
4. 常见编辑任务:添加/移除元素、改变风格、调整颜色、模糊背景等

提示词处理

对于生成: 将用户的图像描述原样传递给 --prompt。仅在明显不足时进行改写。

对于编辑: 将编辑指令传递给 --prompt(例如:"在天空中添加彩虹"、"使其看起来像水彩画")

在这两种情况下,都应保留用户的创作意图。

提示词模板(高成功率)

当用户描述模糊或需要精确编辑时,可使用模板。

  • 生成模板:
  • “创建一张图像:<主题>。风格:<风格>。构图:<相机/镜头>。光照:<光照>。背景:<背景>。配色方案:<调色板>。避免:<列表>。”

  • 编辑模板(保留其他所有内容):

  • “仅更改:<单一更改>。保持完全相同:主体、构图/裁剪、姿势、光照、配色方案、背景、文字和整体风格。不要添加新对象。如果存在文字,请保持原样。”

输出

  • 将 PNG 图像保存到当前目录(如果文件名包含路径,则保存到指定路径)
  • 脚本输出生成图像的完整路径
  • 不要读取图像内容 - 只需告知用户保存的路径

示例

生成新图像:

uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "一个宁静的日式花园,樱花盛开" --filename "2025-11-23-14-23-05-japanese-garden.png" --resolution 4K

编辑现有图像:

uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "让天空更戏剧化,布满暴风云" --filename "2025-11-23-14-25-30-dramatic-sky.png" --input-image "original-photo.jpg" --resolution 2K
2 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor