OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  morfeo-pro:使用 Google Nano Banana 模型生成并编辑图像的高级工具

morfeo-pro:使用 Google Nano Banana 模型生成并编辑图像的高级工具

 
  merge ·  2026-02-24 11:32:02 · 2 次点击  · 0 条评论  

名称: nano-banana-pro
描述: 使用 Google 的 Nano Banana Pro (Gemini 3 Pro Image) API 生成和编辑图像。当用户要求生成、创建、编辑、修改、更改或更新图像时使用。当用户引用现有图像文件并要求以任何方式修改它时(例如,“修改此图像”、“更改背景”、“将 X 替换为 Y”)也使用。支持文本到图像生成和图像到图像编辑,并可配置分辨率(默认 1K,或 2K、4K 用于高分辨率)。请勿先读取图像文件 - 直接使用此技能并配合 --input-image 参数。


Nano Banana Pro 图像生成与编辑

使用 Google 的 Nano Banana Pro API (Gemini 3 Pro Image) 生成新图像或编辑现有图像。

API 技术规范

端点与认证

Google AI Studio (公开预览版):

POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent?key=${API_KEY}

Vertex AI (企业版):

POST https://${REGION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${REGION}/publishers/google/models/gemini-3-pro-image-preview:predict

模型 ID

  • API: gemini-3-pro-image-preview
  • 内部 SDK: nanobanana-pro-001

参数

参数 描述
aspect_ratio 1:1, 4:3, 3:4, 16:9, 9:16 输出宽高比
output_mime_type image/png, image/jpeg 输出格式
reference_images 数组 (最多 14 张) 用于保持一致性的参考图像
reference_type CHARACTER, STYLE, SUBJECT 参考图像的使用方式
person_generation ALLOW_ADULT, DONT_ALLOW, FILTER_SENSITIVE 人物生成策略
image_size 1K, 2K, 4K 输出分辨率

参考类型

  • STYLE: 从参考图像转移视觉风格、色彩搭配、氛围。
  • CHARACTER: 在不同图像间保持面部特征、特质的一致性。
  • SUBJECT: 保持主体/产品的一致性(用于产品摄影!)。

高级功能

  • 文本渲染: 原生文本渲染,无拼写错误。
  • 上下文编辑: 发送现有图像 + 修改提示(自动修复/填充)。
  • 高分辨率: 通过 upscale: true 原生放大至 4K。

使用方法

使用绝对路径运行脚本(请勿先切换到技能目录):

生成新图像:

uv run ~/.clawdbot/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "你的图像描述" \
  --filename "输出文件名.png" \
  [--resolution 1K|2K|4K] \
  [--api-key 密钥]

编辑现有图像:

uv run ~/.clawdbot/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "编辑指令" \
  --filename "输出文件名.png" \
  --input-image "输入图像路径.png" \
  [--resolution 1K|2K|4K]

使用参考图像(产品/风格/角色一致性):

uv run ~/.clawdbot/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "你的描述" \
  --filename "输出文件名.png" \
  --reference-image "参考图像路径.jpg" \
  --reference-type SUBJECT|STYLE|CHARACTER \
  [--resolution 1K|2K|4K]

重要提示: 始终从用户的当前工作目录运行,以便图像保存在用户的工作位置,而不是技能目录中。

分辨率选项

  • 1K (默认) - 约 1024 像素分辨率
  • 2K - 约 2048 像素分辨率(推荐用于大多数场景)
  • 4K - 约 4096 像素分辨率(高质量)

用户请求映射:
- 未提及 → 1K
- "低分辨率"、"1080"、"1080p"、"1K" → 1K
- "2K"、"2048"、"普通"、"中等分辨率" → 2K
- "高分辨率"、"高画质"、"hi-res"、"4K"、"超高清" → 4K

API 密钥

脚本按以下顺序检查 API 密钥:
1. --api-key 参数
2. GEMINI_API_KEY 环境变量

文件名生成

格式:{时间戳}-{描述性名称}.png
- 时间戳:yyyy-mm-dd-hh-mm-ss (24 小时制)
- 名称:描述性小写字母,用连字符连接

示例:
- 2025-11-23-14-23-05-japanese-garden.png
- 2025-11-23-15-30-12-sunset-mountains.png


提示词工程框架

你是一位专门研究 Nano Banana Pro 的专家级提示词工程师。将用户的基本想法和参考图像转化为高保真、描述性的提示词。

1. 输入分析

当提供用户想法和参考图像时,评估:

  • 主题内容: 识别主要角色、对象或焦点。
  • 参考效用: 确定图像是提供构图(布局)、风格(美学/纹理)还是角色(特定特征)。
  • 文本要求: 注意需要在图像内渲染的任何特定文本。

2. 提示词构建框架

使用以下层次结构构建优化提示词:

核心主体与动作

清晰描述“谁”或“什么”正在做“什么”。

风格与媒介

指定艺术媒介:
- 超写实摄影
- 油画
- 3D 渲染
- 极简矢量图
- 商业食品摄影
- 社论风格

参考图像整合

明确指示如何使用上传的图像:

"保留参考图像中的产品包装作为核心元素"
"应用参考图像 A 中的温暖灯光美学"

技术细节

灯光:
- 电影感轮廓光
- 柔和的漫射阳光
- 强烈的闪光灯
- 温暖的钨丝灯光
- 黄金时段的温暖光线

构图:
- 广角镜头
- 微距细节
- 鸟瞰视角
- 浅景深
- 产品作为核心元素

色彩理论:
- 单色蓝色调
- 高对比度的互补色
- 温暖的琥珀色调
- 暗色调色板

文本渲染:
对特定文本使用双引号:

"单词 'FUTURE' 以粗体、拉丝金属 3D 字体书写在中央"

3. 优化规则

应该做:

  • 使用描述性的积极语言
  • 扩展模糊术语("酷" → "虹彩","漂亮" → "空灵","逼真" → "照片级真实感 8K 纹理")
  • 与参考图像保持一致
  • 使用有力的形容词表达情绪("粗犷"、"宁静"、"工业风"、"异想天开")
  • 指定 "8k 纹理细节" 或 "8k 照片级真实感细节" 以提高质量

不要做:

  • 使用负面提示(说出你想要什么,而不是不想要什么)
  • 与参考图像中的视觉数据相矛盾
  • 使用未经扩展的模糊术语

4. 产品摄影最佳实践

当生成以产品为主角的图像时:

  1. 始终使用 --reference-type SUBJECT 以保持产品一致性。
  2. 在提示词中突出描述产品

    "Milkaut Crematto 容器,带有蓝色标签和红色盖子,突出展示"

  3. 将产品定位为核心元素

    "产品容器作为联合主演的产品植入"
    "产品容器处于清晰焦点"

  4. 将产品自然地融入场景

    "放置在...旁边"、"紧邻"、"突出排列"

产品摄影提示词示例:

超写实商业食品摄影,[产品名称] 容器突出展示在 [食品项目] 旁边,
[食品描述],[场景/背景],[灯光风格],[产品] 作为核心元素,
8k 照片级真实感细节

5. 输出格式

以英文提供优化后的提示词,无需额外评论。


示例

产品 + 食品场景

uv run ~/.clawdbot/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "Hyper-realistic commercial food photography with a Milkaut Crematto container prominently displayed next to a gourmet double smash burger with perfectly melted cheddar cheese cascading down juicy beef patties, artisan brioche bun, wisps of steam rising, dark moody background with dramatic rim lighting, the cream cheese container as hero product placement, 8k texture detail" \
  --filename "2026-01-28-product-burger.png" \
  --reference-image "product-photo.jpg" \
  --reference-type SUBJECT \
  --resolution 2K

风格迁移

uv run ~/.clawdbot/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "Using the warm golden hour aesthetic from the reference, create a serene Japanese garden with cherry blossoms, koi pond reflecting soft pink petals, traditional wooden bridge, ethereal morning mist, 8k photorealistic detail" \
  --filename "2026-01-28-japanese-garden.png" \
  --reference-image "style-reference.jpg" \
  --reference-type STYLE \
  --resolution 2K

图像编辑

uv run ~/.clawdbot/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "Change the background to a dramatic sunset over mountains, maintain the subject in sharp focus" \
  --filename "2026-01-28-edited-sunset.png" \
  --input-image "original.jpg" \
  --resolution 2K
2 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor