OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  fal-text-to-image:利用 fal.ai 的模型进行图像生成、重混与编辑

fal-text-to-image:利用 fal.ai 的模型进行图像生成、重混与编辑

 
  platform ·  2026-02-16 21:17:34 · 3 次点击  · 0 条评论  

名称: fal-text-to-image
描述: 使用 fal.ai 的 AI 模型生成、混搭和编辑图像。支持文生图、图生图混搭以及目标区域修复/编辑。


fal.ai 图像生成与编辑技能

使用 fal.ai 的尖端模型(包括 FLUX、Recraft V3、Imagen4 等)实现专业的 AI 图像工作流。

三种操作模式

1. 文生图 (fal-text-to-image)

根据文本提示从头生成图像

2. 图像混搭 (fal-image-remix)

在保留构图的基础上转换现有图像风格

3. 图像编辑 (fal-image-edit)

目标区域修复与蒙版编辑

使用场景

当用户有以下需求时触发:
- 请求根据文本描述生成图像
- 希望用 AI 转换/混搭现有图像
- 需要编辑图像的特定区域(修复)
- 希望创建特定风格(矢量、写实、排版)的图像
- 需要高分辨率专业图像(最高 2K)
- 想使用参考图像进行风格迁移
- 提及特定模型如 FLUX、Recraft 或 Imagen
- 要求生成徽标、海报或品牌风格图像
- 需要移除对象或进行针对性修改

快速开始

文生图:从头生成

# 基础生成
uv run python fal-text-to-image "日落时分的赛博朋克城市,霓虹闪烁"

# 指定模型
uv run python fal-text-to-image -m flux-pro/v1.1-ultra "专业头像"

# 带风格参考
uv run python fal-text-to-image -i reference.jpg "山景" -m flux-2/lora/edit

图像混搭:转换现有图像

# 转换风格同时保留构图
uv run python fal-image-remix input.jpg "转换为油画风格"

# 控制转换强度 (0.0=原图, 1.0=完全转换)
uv run python fal-image-remix photo.jpg "动漫风格角色" --strength 0.6

# 高品质混搭
uv run python fal-image-remix -m flux-1.1-pro image.jpg "专业肖像"

图像编辑:针对性修改

# 使用蒙版图像编辑 (白色=编辑区域, 黑色=保留)
uv run python fal-image-edit input.jpg mask.png "替换为花朵"

# 根据文本自动生成蒙版
uv run python fal-image-edit input.jpg --mask-prompt "天空" "改为日落景色"

# 移除对象
uv run python fal-image-edit photo.jpg mask.png "移除物体" --strength 1.0

# 通用编辑(无蒙版)
uv run python fal-image-edit photo.jpg "增强光照和色彩"

模型选择指南

脚本会根据任务上下文智能选择最佳模型:

flux-pro/v1.1-ultra (高分辨率默认)

  • 最适合:专业摄影、高分辨率输出(最高 2K)
  • 优势:照片级真实感、专业品质
  • 使用时机:需要出版物级别的图像
  • 端点fal-ai/flux-pro/v1.1-ultra

recraft/v3/text-to-image (SOTA 品质)

  • 最适合:排版、矢量艺术、品牌风格图像、长文本
  • 优势:行业领先的基准分数、精确的文本渲染
  • 使用时机:创建徽标、海报或文本密集型设计
  • 端点fal-ai/recraft/v3/text-to-image

flux-2 (最佳平衡)

  • 最适合:通用图像生成
  • 优势:增强的真实感、清晰的文本、原生编辑能力
  • 使用时机:标准图像生成需求
  • 端点fal-ai/flux-2

flux-2/lora (自定义风格)

  • 最适合:特定领域风格、微调变体
  • 优势:自定义风格适配
  • 使用时机:用户想要特定的艺术风格
  • 端点fal-ai/flux-2/lora

flux-2/lora/edit (风格迁移)

  • 最适合:带风格参考的图生图编辑
  • 优势:专业的风格迁移
  • 使用时机:用户提供参考图像(使用 -i 标志)
  • 端点fal-ai/flux-2/lora/edit

imagen4/preview (谷歌品质)

  • 最适合:高品质通用图像
  • 优势:谷歌最高品质模型
  • 使用时机:用户明确请求 Imagen 或谷歌模型
  • 端点fal-ai/imagen4/preview

stable-diffusion-v35-large (排版与风格)

  • 最适合:复杂提示、排版、风格控制
  • 优势:高级提示理解、资源效率高
  • 使用时机:复杂的多元素构图
  • 端点fal-ai/stable-diffusion-v35-large

ideogram/v2 (排版专家)

  • 最适合:海报、徽标、文本密集型设计
  • 优势:卓越的排版能力、写实输出
  • 使用时机:文本准确性至关重要
  • 端点fal-ai/ideogram/v2

bria/text-to-image/3.2 (商业安全)

  • 最适合:需要授权训练数据的商业项目
  • 优势:商业使用安全、优秀的文本渲染
  • 使用时机:法律/授权问题重要时
  • 端点fal-ai/bria/text-to-image/3.2

命令行界面

uv run python fal-text-to-image [选项] 提示词

参数:
  提示词                    要生成的图像的文本描述

选项:
  -m, --model TEXT         使用的模型(见上方模型列表)
  -i, --image TEXT         用于风格迁移的参考图像路径或 URL
  -o, --output TEXT        输出文件名(默认:generated_image.png)
  -s, --size TEXT          图像尺寸(例如:"1024x1024", "landscape_16_9")
  --seed INTEGER           用于可重复性的随机种子
  --steps INTEGER          推理步数(取决于模型)
  --guidance FLOAT         引导尺度(越高越遵循提示词)
  --help                   显示此帮助信息并退出

认证设置

首次使用前,请设置您的 fal.ai API 密钥:

export FAL_KEY="您的-api-密钥"

或在技能目录下创建 .env 文件:

FAL_KEY=您的-api-密钥

从以下网址获取 API 密钥:https://fal.ai/dashboard/keys

高级示例

高分辨率专业照片

uv run python fal-text-to-image \
  -m flux-pro/v1.1-ultra \
  "现代办公室中商业高管的专业头像" \
  -s 2048x2048

徽标/排版设计

uv run python fal-text-to-image \
  -m recraft/v3/text-to-image \
  "极简风格的现代科技初创公司徽标,包含文字 'AI Labs'"

从参考图像迁移风格

uv run python fal-text-to-image \
  -m flux-2/lora/edit \
  -i artistic_style.jpg \
  "花园中的女性肖像"

可重复生成

uv run python fal-text-to-image \
  -m flux-2 \
  --seed 42 \
  "带有飞行汽车的未来主义城市景观"

模型选择逻辑

当未指定 -m 时,脚本会自动选择最佳模型:

  1. 如果提供了 -i:使用 flux-2/lora/edit 进行风格迁移
  2. 如果提示词包含排版关键词(徽标、文本、海报、标志):使用 recraft/v3/text-to-image
  3. 如果提示词暗示高分辨率需求(专业、肖像、头像):使用 flux-pro/v1.1-ultra
  4. 如果提示词提及矢量/品牌:使用 recraft/v3/text-to-image
  5. 默认:使用 flux-2 进行通用生成

输出格式

生成的图像会保存元数据:
- 文件名包含时间戳和模型名称
- EXIF 数据存储提示词、模型和参数
- 控制台显示生成时间和成本估算

故障排除

问题 解决方案
FAL_KEY 未设置 导出 FAL_KEY 环境变量或创建 .env 文件
模型未找到 对照支持的模型列表检查模型名称
图像参考失败 确保图像路径/URL 可访问
生成超时 某些模型耗时较长;等待或尝试更快的模型
速率限制错误 检查 fal.ai 仪表板的使用限制

成本优化

  • 免费层级:FLUX.2 提供 100 次免费请求(有效期至 2025年12月25日)
  • 按使用付费:FLUX Pro 按每百万像素计费
  • 预算选项:通用用途使用 flux-2stable-diffusion-v35-large
  • 高级选项:仅在需要高分辨率时使用 flux-pro/v1.1-ultra

图像混搭:模型选择指南

可用于图生图混搭的模型:

flux-2/dev (默认,免费)

  • 最适合:通用混搭、风格迁移、快速迭代
  • 优势:质量/速度平衡、100 次免费请求
  • 使用时机:标准混搭需求
  • 端点fal-ai/flux/dev/image-to-image

flux-pro (高级品质)

  • 最适合:专业混搭、高品质输出
  • 优势:卓越品质、写实转换
  • 使用时机:专业或出版物级别的混搭
  • 端点fal-ai/flux-pro

flux-1.1-pro (超高级)

  • 最适合:最高品质混搭,细节最大化
  • 优势:超高品质、出色的细节保留
  • 使用时机:需要最佳输出的高级项目
  • 端点fal-ai/flux-pro/v1.1

recraft/v3 (矢量/插画)

  • 最适合:矢量风格、品牌图像、插画混搭
  • 优势:干净的矢量输出、品牌风格转换
  • 使用时机:转换为插画或矢量风格
  • 端点fal-ai/recraft/v3/text-to-image

stable-diffusion-v35 (艺术风格)

  • 最适合:艺术风格、绘画效果、创意混搭
  • 优势:强大的艺术风格应用
  • 使用时机:艺术化或风格化转换
  • 端点fal-ai/stable-diffusion-v35-large

图像混搭:命令行界面

uv run python fal-image-remix [选项] 输入图像 提示词

参数:
  输入图像                  源图像的路径或 URL
  提示词                    如何转换图像

选项:
  -m, --model TEXT         使用的模型(未指定则自动选择)
  -o, --output TEXT        输出文件名(默认:remixed_时间戳.png)
  -s, --strength FLOAT     转换强度 0.0-1.0(默认:0.75)
                           0.0 = 保留原图,1.0 = 完全转换
  --guidance FLOAT         引导尺度(默认:7.5)
  --seed INTEGER           用于可重复性的随机种子
  --steps INTEGER          推理步数
  --help                   显示帮助

混搭强度指南

--strength 参数控制转换强度:

强度 效果 使用场景
0.3-0.5 细微变化 轻微色彩调整、光照微调
0.5-0.7 中等变化 风格提示,同时保留细节
0.7-0.85 强烈变化 清晰的风格迁移、显著转换
0.85-1.0 最大变化 完全的风格重塑、戏剧性转换

混搭示例

# 微妙的艺术风格(低强度)
uv run python fal-image-remix photo.jpg "油画风格" --strength 0.4

# 平衡转换(默认)
uv run python fal-image-remix input.jpg "赛博朋克霓虹美学"

# 强烈转换(高强度)
uv run python fal-image-remix portrait.jpg "动漫角色" --strength 0.9

# 矢量转换
uv run python fal-image-remix -m recraft/v3 logo.png "干净的矢量插画"

# 高级品质混搭
uv run python fal-image-remix -m flux-1.1-pro photo.jpg "专业影棚肖像"

图像编辑:模型选择指南

可用于针对性编辑和修复的模型:

flux-2/redux (通用编辑)

  • 最适合:无需蒙版的通用图像编辑
  • 优势:快速、平衡、适合整体调整
  • 使用时机:无需针对特定区域
  • 端点fal-ai/flux-2/redux

flux-2/fill (修复,默认)

  • 最适合:蒙版区域编辑、对象移除、填充
  • 优势:无缝修复、自然融合
  • 使用时机:编辑特定的蒙版区域
  • 端点fal-ai/flux-2/fill

flux-pro-v11/fill (高级修复)

  • 最适合:最高品质的专业修复
  • 优势:卓越品质、专业效果
  • 使用时机:需要高级品质修复
  • 端点fal-ai/flux-pro-v11/fill

stable-diffusion-v35/inpainting (艺术修复)

  • 最适合:艺术编辑、创意修复
  • 优势:强大的艺术控制、细节生成
  • 使用时机:艺术化或风格化编辑
  • 端点fal-ai/stable-diffusion-v35-large/inpainting

ideogram/v2/edit (写实编辑)

  • 最适合:写实修改、精确编辑
  • 优势:高写实度、精确控制
  • 使用时机:需要写实编辑
  • 端点fal-ai/ideogram/v2/edit

recraft/v3/svg (矢量编辑)

  • 最适合:矢量风格编辑、干净插画
  • 优势:干净的矢量输出、插画风格
  • 使用时机:矢量或插画编辑
  • 端点fal-ai/recraft/v3/svg

图像编辑:命令行界面

uv run python fal-image-edit [选项] 输入图像 [蒙版图像] 提示词

参数:
  输入图像                  源图像的路径或 URL
  蒙版图像                  蒙版的路径或 URL(白色=编辑,黑色=保留)[可选]
  提示词                    如何编辑蒙版区域

选项:
  -m, --model TEXT         使用的模型(未指定则自动选择)
  -o, --output TEXT        输出文件名(默认:edited_时间戳.png)
  --mask-prompt TEXT       根据文本生成蒙版(无需蒙版图像)
  -s, --strength FLOAT     编辑强度 0.0-1.0(默认:0.95)
  --guidance FLOAT         引导尺度(默认:7.5)
  --seed INTEGER           用于可重复性的随机种子
  --steps INTEGER          推理步数
  --help                   显示帮助

编辑强度指南

--strength 参数控制编辑强度:

强度 效果 使用场景
0.5-0.7 细微编辑 轻微润色、色彩调整
0.7-0.9 中等编辑 清晰的修改,同时自然融合
0.9-1.0 强烈编辑 完全替换、对象移除

创建蒙版图像

蒙版图像定义编辑区域:
- 白色 (255):要编辑/修改的区域
- 黑色 (0):要保留不变的区域
- 灰色:部分融合(与亮度成比例)

创建蒙版的方法:
- 图像编辑器(GIMP、Photoshop、Krita)
- 绘图工具(选择并用白色/黑色填充)
- 基于文本的提示(--mask-prompt 标志)

编辑示例

# 使用蒙版图像编辑
uv run python fal-image-edit photo.jpg mask.png "替换为美丽的花园"

# 根据文本自动生成蒙版
uv run python fal-image-edit landscape.jpg --mask-prompt "天空" "改为带有云彩的日落"

# 移除对象
uv run python fal-image-edit photo.jpg object_mask.png "完全移除" --strength 1.0

# 无缝对象插入
uv run python fal-image-edit room.jpg region_mask.png "添加现代沙发" --strength 0.85

# 通用编辑(无蒙版)
uv run python fal-image-edit -m flux-2/redux photo.jpg "增强光照和饱和度"

# 高级品质修复
uv run python fal-image-edit -m flux-pro-v11/fill image.jpg mask.png "专业肖像背景"

# 艺术化修改
uv run python fal-image-edit -m stable-diffusion-v35/inpainting photo.jpg mask.png "梵高风格"

文件结构

fal-text-to-image/
├── SKILL.md                    # 本文档
├── README.md                   # 快速参考
├── pyproject.toml              # 依赖项 (uv)
├── fal-text-to-image           # 文生图脚本
├── fal-image-remix             # 图生图混搭脚本
├── fal-image-edit              # 图像编辑/修复脚本
├── references/
│   └── model-comparison.md     # 详细的模型基准测试
└── outputs/                    # 生成的图像(首次运行时创建)

依赖项

通过 `

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor