OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

OA0 › 技能包 › fal-text-to-image：利用 fal.ai 的模型进行图像生成、重混与编辑

fal-text-to-image：利用 fal.ai 的模型进行图像生成、重混与编辑

chisel · 2026-02-09 05:52:48 · 56 次点击 · 0 条评论

名称： fal-text-to-image
描述： 使用 fal.ai 的 AI 模型生成、混搭和编辑图像。支持文生图、图生图混搭以及目标区域修复/编辑。

fal.ai 图像生成与编辑技能

使用 fal.ai 的尖端模型（包括 FLUX、Recraft V3、Imagen4 等）实现专业的 AI 图像工作流。

三种操作模式

1. 文生图 (fal-text-to-image)

根据文本提示从头生成图像

2. 图像混搭 (fal-image-remix)

在保留构图的基础上转换现有图像风格

3. 图像编辑 (fal-image-edit)

目标区域修复与蒙版编辑

使用场景

当用户有以下需求时触发：
- 请求根据文本描述生成图像
- 希望用 AI 转换/混搭现有图像
- 需要编辑图像的特定区域（修复）
- 希望创建特定风格（矢量、写实、排版）的图像
- 需要高分辨率专业图像（最高 2K）
- 想使用参考图像进行风格迁移
- 提及特定模型如 FLUX、Recraft 或 Imagen
- 要求生成徽标、海报或品牌风格图像
- 需要移除对象或进行针对性修改

快速开始

文生图：从头生成

# 基础生成
uv run python fal-text-to-image "日落时分的赛博朋克城市，霓虹闪烁"

# 指定模型
uv run python fal-text-to-image -m flux-pro/v1.1-ultra "专业头像"

# 带风格参考
uv run python fal-text-to-image -i reference.jpg "山景" -m flux-2/lora/edit

图像混搭：转换现有图像

# 转换风格同时保留构图
uv run python fal-image-remix input.jpg "转换为油画风格"

# 控制转换强度 (0.0=原图, 1.0=完全转换)
uv run python fal-image-remix photo.jpg "动漫风格角色" --strength 0.6

# 高品质混搭
uv run python fal-image-remix -m flux-1.1-pro image.jpg "专业肖像"

图像编辑：针对性修改

# 使用蒙版图像编辑 (白色=编辑区域, 黑色=保留)
uv run python fal-image-edit input.jpg mask.png "替换为花朵"

# 根据文本自动生成蒙版
uv run python fal-image-edit input.jpg --mask-prompt "天空" "改为日落景色"

# 移除对象
uv run python fal-image-edit photo.jpg mask.png "移除物体" --strength 1.0

# 通用编辑（无蒙版）
uv run python fal-image-edit photo.jpg "增强光照和色彩"

模型选择指南

脚本会根据任务上下文智能选择最佳模型：

flux-pro/v1.1-ultra (高分辨率默认)

最适合：专业摄影、高分辨率输出（最高 2K）
优势：照片级真实感、专业品质
使用时机：需要出版物级别的图像
端点：fal-ai/flux-pro/v1.1-ultra

recraft/v3/text-to-image (SOTA 品质)

最适合：排版、矢量艺术、品牌风格图像、长文本
优势：行业领先的基准分数、精确的文本渲染
使用时机：创建徽标、海报或文本密集型设计
端点：fal-ai/recraft/v3/text-to-image

flux-2 (最佳平衡)

最适合：通用图像生成
优势：增强的真实感、清晰的文本、原生编辑能力
使用时机：标准图像生成需求
端点：fal-ai/flux-2

flux-2/lora (自定义风格)

最适合：特定领域风格、微调变体
优势：自定义风格适配
使用时机：用户想要特定的艺术风格
端点：fal-ai/flux-2/lora

flux-2/lora/edit (风格迁移)

最适合：带风格参考的图生图编辑
优势：专业的风格迁移
使用时机：用户提供参考图像（使用 -i 标志）
端点：fal-ai/flux-2/lora/edit

imagen4/preview (谷歌品质)

最适合：高品质通用图像
优势：谷歌最高品质模型
使用时机：用户明确请求 Imagen 或谷歌模型
端点：fal-ai/imagen4/preview

stable-diffusion-v35-large (排版与风格)

最适合：复杂提示、排版、风格控制
优势：高级提示理解、资源效率高
使用时机：复杂的多元素构图
端点：fal-ai/stable-diffusion-v35-large

ideogram/v2 (排版专家)

最适合：海报、徽标、文本密集型设计
优势：卓越的排版能力、写实输出
使用时机：文本准确性至关重要
端点：fal-ai/ideogram/v2

bria/text-to-image/3.2 (商业安全)

最适合：需要授权训练数据的商业项目
优势：商业使用安全、优秀的文本渲染
使用时机：法律/授权问题重要时
端点：fal-ai/bria/text-to-image/3.2

命令行界面

uv run python fal-text-to-image [选项] 提示词

参数：
  提示词                    要生成的图像的文本描述

选项：
  -m, --model TEXT         使用的模型（见上方模型列表）
  -i, --image TEXT         用于风格迁移的参考图像路径或 URL
  -o, --output TEXT        输出文件名（默认：generated_image.png）
  -s, --size TEXT          图像尺寸（例如："1024x1024", "landscape_16_9"）
  --seed INTEGER           用于可重复性的随机种子
  --steps INTEGER          推理步数（取决于模型）
  --guidance FLOAT         引导尺度（越高越遵循提示词）
  --help                   显示此帮助信息并退出

认证设置

首次使用前，请设置您的 fal.ai API 密钥：

export FAL_KEY="您的-api-密钥"

或在技能目录下创建 .env 文件：

FAL_KEY=您的-api-密钥

从以下网址获取 API 密钥：https://fal.ai/dashboard/keys

高级示例

高分辨率专业照片

uv run python fal-text-to-image \
  -m flux-pro/v1.1-ultra \
  "现代办公室中商业高管的专业头像" \
  -s 2048x2048

徽标/排版设计

uv run python fal-text-to-image \
  -m recraft/v3/text-to-image \
  "极简风格的现代科技初创公司徽标，包含文字 'AI Labs'"

从参考图像迁移风格

uv run python fal-text-to-image \
  -m flux-2/lora/edit \
  -i artistic_style.jpg \
  "花园中的女性肖像"

可重复生成

uv run python fal-text-to-image \
  -m flux-2 \
  --seed 42 \
  "带有飞行汽车的未来主义城市景观"

模型选择逻辑

当未指定 -m 时，脚本会自动选择最佳模型：

如果提供了 -i：使用 flux-2/lora/edit 进行风格迁移
如果提示词包含排版关键词（徽标、文本、海报、标志）：使用 recraft/v3/text-to-image
如果提示词暗示高分辨率需求（专业、肖像、头像）：使用 flux-pro/v1.1-ultra
如果提示词提及矢量/品牌：使用 recraft/v3/text-to-image
默认：使用 flux-2 进行通用生成

输出格式

生成的图像会保存元数据：
- 文件名包含时间戳和模型名称
- EXIF 数据存储提示词、模型和参数
- 控制台显示生成时间和成本估算

故障排除

问题	解决方案
`FAL_KEY 未设置`	导出 FAL_KEY 环境变量或创建 .env 文件
`模型未找到`	对照支持的模型列表检查模型名称
`图像参考失败`	确保图像路径/URL 可访问
`生成超时`	某些模型耗时较长；等待或尝试更快的模型
`速率限制错误`	检查 fal.ai 仪表板的使用限制

成本优化

免费层级：FLUX.2 提供 100 次免费请求（有效期至 2025年12月25日）
按使用付费：FLUX Pro 按每百万像素计费
预算选项：通用用途使用 flux-2 或 stable-diffusion-v35-large
高级选项：仅在需要高分辨率时使用 flux-pro/v1.1-ultra

图像混搭：模型选择指南

可用于图生图混搭的模型：

flux-2/dev (默认，免费)

最适合：通用混搭、风格迁移、快速迭代
优势：质量/速度平衡、100 次免费请求
使用时机：标准混搭需求
端点：fal-ai/flux/dev/image-to-image

flux-pro (高级品质)

最适合：专业混搭、高品质输出
优势：卓越品质、写实转换
使用时机：专业或出版物级别的混搭
端点：fal-ai/flux-pro

flux-1.1-pro (超高级)

最适合：最高品质混搭，细节最大化
优势：超高品质、出色的细节保留
使用时机：需要最佳输出的高级项目
端点：fal-ai/flux-pro/v1.1

recraft/v3 (矢量/插画)

最适合：矢量风格、品牌图像、插画混搭
优势：干净的矢量输出、品牌风格转换
使用时机：转换为插画或矢量风格
端点：fal-ai/recraft/v3/text-to-image

stable-diffusion-v35 (艺术风格)

最适合：艺术风格、绘画效果、创意混搭
优势：强大的艺术风格应用
使用时机：艺术化或风格化转换
端点：fal-ai/stable-diffusion-v35-large

图像混搭：命令行界面

uv run python fal-image-remix [选项] 输入图像 提示词

参数：
  输入图像                  源图像的路径或 URL
  提示词                    如何转换图像

选项：
  -m, --model TEXT         使用的模型（未指定则自动选择）
  -o, --output TEXT        输出文件名（默认：remixed_时间戳.png）
  -s, --strength FLOAT     转换强度 0.0-1.0（默认：0.75）
                           0.0 = 保留原图，1.0 = 完全转换
  --guidance FLOAT         引导尺度（默认：7.5）
  --seed INTEGER           用于可重复性的随机种子
  --steps INTEGER          推理步数
  --help                   显示帮助

混搭强度指南

--strength 参数控制转换强度：

强度	效果	使用场景
0.3-0.5	细微变化	轻微色彩调整、光照微调
0.5-0.7	中等变化	风格提示，同时保留细节
0.7-0.85	强烈变化	清晰的风格迁移、显著转换
0.85-1.0	最大变化	完全的风格重塑、戏剧性转换

混搭示例

# 微妙的艺术风格（低强度）
uv run python fal-image-remix photo.jpg "油画风格" --strength 0.4

# 平衡转换（默认）
uv run python fal-image-remix input.jpg "赛博朋克霓虹美学"

# 强烈转换（高强度）
uv run python fal-image-remix portrait.jpg "动漫角色" --strength 0.9

# 矢量转换
uv run python fal-image-remix -m recraft/v3 logo.png "干净的矢量插画"

# 高级品质混搭
uv run python fal-image-remix -m flux-1.1-pro photo.jpg "专业影棚肖像"

图像编辑：模型选择指南

可用于针对性编辑和修复的模型：

flux-2/redux (通用编辑)

最适合：无需蒙版的通用图像编辑
优势：快速、平衡、适合整体调整
使用时机：无需针对特定区域
端点：fal-ai/flux-2/redux

flux-2/fill (修复，默认)

最适合：蒙版区域编辑、对象移除、填充
优势：无缝修复、自然融合
使用时机：编辑特定的蒙版区域
端点：fal-ai/flux-2/fill

flux-pro-v11/fill (高级修复)

最适合：最高品质的专业修复
优势：卓越品质、专业效果
使用时机：需要高级品质修复
端点：fal-ai/flux-pro-v11/fill

stable-diffusion-v35/inpainting (艺术修复)

最适合：艺术编辑、创意修复
优势：强大的艺术控制、细节生成
使用时机：艺术化或风格化编辑
端点：fal-ai/stable-diffusion-v35-large/inpainting

ideogram/v2/edit (写实编辑)

最适合：写实修改、精确编辑
优势：高写实度、精确控制
使用时机：需要写实编辑
端点：fal-ai/ideogram/v2/edit

recraft/v3/svg (矢量编辑)

最适合：矢量风格编辑、干净插画
优势：干净的矢量输出、插画风格
使用时机：矢量或插画编辑
端点：fal-ai/recraft/v3/svg

图像编辑：命令行界面

uv run python fal-image-edit [选项] 输入图像 [蒙版图像] 提示词

参数：
  输入图像                  源图像的路径或 URL
  蒙版图像                  蒙版的路径或 URL（白色=编辑，黑色=保留）[可选]
  提示词                    如何编辑蒙版区域

选项：
  -m, --model TEXT         使用的模型（未指定则自动选择）
  -o, --output TEXT        输出文件名（默认：edited_时间戳.png）
  --mask-prompt TEXT       根据文本生成蒙版（无需蒙版图像）
  -s, --strength FLOAT     编辑强度 0.0-1.0（默认：0.95）
  --guidance FLOAT         引导尺度（默认：7.5）
  --seed INTEGER           用于可重复性的随机种子
  --steps INTEGER          推理步数
  --help                   显示帮助

编辑强度指南

--strength 参数控制编辑强度：

强度	效果	使用场景
0.5-0.7	细微编辑	轻微润色、色彩调整
0.7-0.9	中等编辑	清晰的修改，同时自然融合
0.9-1.0	强烈编辑	完全替换、对象移除

创建蒙版图像

蒙版图像定义编辑区域：
- 白色 (255)：要编辑/修改的区域
- 黑色 (0)：要保留不变的区域
- 灰色：部分融合（与亮度成比例）

创建蒙版的方法：
- 图像编辑器（GIMP、Photoshop、Krita）
- 绘图工具（选择并用白色/黑色填充）
- 基于文本的提示（--mask-prompt 标志）

编辑示例

# 使用蒙版图像编辑
uv run python fal-image-edit photo.jpg mask.png "替换为美丽的花园"

# 根据文本自动生成蒙版
uv run python fal-image-edit landscape.jpg --mask-prompt "天空" "改为带有云彩的日落"

# 移除对象
uv run python fal-image-edit photo.jpg object_mask.png "完全移除" --strength 1.0

# 无缝对象插入
uv run python fal-image-edit room.jpg region_mask.png "添加现代沙发" --strength 0.85

# 通用编辑（无蒙版）
uv run python fal-image-edit -m flux-2/redux photo.jpg "增强光照和饱和度"

# 高级品质修复
uv run python fal-image-edit -m flux-pro-v11/fill image.jpg mask.png "专业肖像背景"

# 艺术化修改
uv run python fal-image-edit -m stable-diffusion-v35/inpainting photo.jpg mask.png "梵高风格"

文件结构

fal-text-to-image/
├── SKILL.md                    # 本文档
├── README.md                   # 快速参考
├── pyproject.toml              # 依赖项 (uv)
├── fal-text-to-image           # 文生图脚本
├── fal-image-remix             # 图生图混搭脚本
├── fal-image-edit              # 图像编辑/修复脚本
├── references/
│   └── model-comparison.md     # 详细的模型基准测试
└── outputs/                    # 生成的图像（首次运行时创建）

依赖项

通过 `

技能包地址：https://github.com/openclaw/skills/tree/main/skills/delorenj/fal-text-to-image/SKILL.md

56 次点击 ∙ 0 人收藏

登录后收藏

0 条回复