名称: fal-text-to-image
描述: 使用 fal.ai 的 AI 模型生成、混搭和编辑图像。支持文生图、图生图混搭以及目标区域修复/编辑。
使用 fal.ai 的尖端模型(包括 FLUX、Recraft V3、Imagen4 等)实现专业的 AI 图像工作流。
根据文本提示从头生成图像
在保留构图的基础上转换现有图像风格
目标区域修复与蒙版编辑
当用户有以下需求时触发:
- 请求根据文本描述生成图像
- 希望用 AI 转换/混搭现有图像
- 需要编辑图像的特定区域(修复)
- 希望创建特定风格(矢量、写实、排版)的图像
- 需要高分辨率专业图像(最高 2K)
- 想使用参考图像进行风格迁移
- 提及特定模型如 FLUX、Recraft 或 Imagen
- 要求生成徽标、海报或品牌风格图像
- 需要移除对象或进行针对性修改
# 基础生成
uv run python fal-text-to-image "日落时分的赛博朋克城市,霓虹闪烁"
# 指定模型
uv run python fal-text-to-image -m flux-pro/v1.1-ultra "专业头像"
# 带风格参考
uv run python fal-text-to-image -i reference.jpg "山景" -m flux-2/lora/edit
# 转换风格同时保留构图
uv run python fal-image-remix input.jpg "转换为油画风格"
# 控制转换强度 (0.0=原图, 1.0=完全转换)
uv run python fal-image-remix photo.jpg "动漫风格角色" --strength 0.6
# 高品质混搭
uv run python fal-image-remix -m flux-1.1-pro image.jpg "专业肖像"
# 使用蒙版图像编辑 (白色=编辑区域, 黑色=保留)
uv run python fal-image-edit input.jpg mask.png "替换为花朵"
# 根据文本自动生成蒙版
uv run python fal-image-edit input.jpg --mask-prompt "天空" "改为日落景色"
# 移除对象
uv run python fal-image-edit photo.jpg mask.png "移除物体" --strength 1.0
# 通用编辑(无蒙版)
uv run python fal-image-edit photo.jpg "增强光照和色彩"
脚本会根据任务上下文智能选择最佳模型:
fal-ai/flux-pro/v1.1-ultrafal-ai/recraft/v3/text-to-imagefal-ai/flux-2fal-ai/flux-2/lora-i 标志)fal-ai/flux-2/lora/editfal-ai/imagen4/previewfal-ai/stable-diffusion-v35-largefal-ai/ideogram/v2fal-ai/bria/text-to-image/3.2uv run python fal-text-to-image [选项] 提示词
参数:
提示词 要生成的图像的文本描述
选项:
-m, --model TEXT 使用的模型(见上方模型列表)
-i, --image TEXT 用于风格迁移的参考图像路径或 URL
-o, --output TEXT 输出文件名(默认:generated_image.png)
-s, --size TEXT 图像尺寸(例如:"1024x1024", "landscape_16_9")
--seed INTEGER 用于可重复性的随机种子
--steps INTEGER 推理步数(取决于模型)
--guidance FLOAT 引导尺度(越高越遵循提示词)
--help 显示此帮助信息并退出
首次使用前,请设置您的 fal.ai API 密钥:
export FAL_KEY="您的-api-密钥"
或在技能目录下创建 .env 文件:
FAL_KEY=您的-api-密钥
从以下网址获取 API 密钥:https://fal.ai/dashboard/keys
uv run python fal-text-to-image \
-m flux-pro/v1.1-ultra \
"现代办公室中商业高管的专业头像" \
-s 2048x2048
uv run python fal-text-to-image \
-m recraft/v3/text-to-image \
"极简风格的现代科技初创公司徽标,包含文字 'AI Labs'"
uv run python fal-text-to-image \
-m flux-2/lora/edit \
-i artistic_style.jpg \
"花园中的女性肖像"
uv run python fal-text-to-image \
-m flux-2 \
--seed 42 \
"带有飞行汽车的未来主义城市景观"
当未指定 -m 时,脚本会自动选择最佳模型:
-i:使用 flux-2/lora/edit 进行风格迁移recraft/v3/text-to-imageflux-pro/v1.1-ultrarecraft/v3/text-to-imageflux-2 进行通用生成生成的图像会保存元数据:
- 文件名包含时间戳和模型名称
- EXIF 数据存储提示词、模型和参数
- 控制台显示生成时间和成本估算
| 问题 | 解决方案 |
|---|---|
FAL_KEY 未设置 |
导出 FAL_KEY 环境变量或创建 .env 文件 |
模型未找到 |
对照支持的模型列表检查模型名称 |
图像参考失败 |
确保图像路径/URL 可访问 |
生成超时 |
某些模型耗时较长;等待或尝试更快的模型 |
速率限制错误 |
检查 fal.ai 仪表板的使用限制 |
flux-2 或 stable-diffusion-v35-largeflux-pro/v1.1-ultra可用于图生图混搭的模型:
fal-ai/flux/dev/image-to-imagefal-ai/flux-profal-ai/flux-pro/v1.1fal-ai/recraft/v3/text-to-imagefal-ai/stable-diffusion-v35-largeuv run python fal-image-remix [选项] 输入图像 提示词
参数:
输入图像 源图像的路径或 URL
提示词 如何转换图像
选项:
-m, --model TEXT 使用的模型(未指定则自动选择)
-o, --output TEXT 输出文件名(默认:remixed_时间戳.png)
-s, --strength FLOAT 转换强度 0.0-1.0(默认:0.75)
0.0 = 保留原图,1.0 = 完全转换
--guidance FLOAT 引导尺度(默认:7.5)
--seed INTEGER 用于可重复性的随机种子
--steps INTEGER 推理步数
--help 显示帮助
--strength 参数控制转换强度:
| 强度 | 效果 | 使用场景 |
|---|---|---|
| 0.3-0.5 | 细微变化 | 轻微色彩调整、光照微调 |
| 0.5-0.7 | 中等变化 | 风格提示,同时保留细节 |
| 0.7-0.85 | 强烈变化 | 清晰的风格迁移、显著转换 |
| 0.85-1.0 | 最大变化 | 完全的风格重塑、戏剧性转换 |
# 微妙的艺术风格(低强度)
uv run python fal-image-remix photo.jpg "油画风格" --strength 0.4
# 平衡转换(默认)
uv run python fal-image-remix input.jpg "赛博朋克霓虹美学"
# 强烈转换(高强度)
uv run python fal-image-remix portrait.jpg "动漫角色" --strength 0.9
# 矢量转换
uv run python fal-image-remix -m recraft/v3 logo.png "干净的矢量插画"
# 高级品质混搭
uv run python fal-image-remix -m flux-1.1-pro photo.jpg "专业影棚肖像"
可用于针对性编辑和修复的模型:
fal-ai/flux-2/reduxfal-ai/flux-2/fillfal-ai/flux-pro-v11/fillfal-ai/stable-diffusion-v35-large/inpaintingfal-ai/ideogram/v2/editfal-ai/recraft/v3/svguv run python fal-image-edit [选项] 输入图像 [蒙版图像] 提示词
参数:
输入图像 源图像的路径或 URL
蒙版图像 蒙版的路径或 URL(白色=编辑,黑色=保留)[可选]
提示词 如何编辑蒙版区域
选项:
-m, --model TEXT 使用的模型(未指定则自动选择)
-o, --output TEXT 输出文件名(默认:edited_时间戳.png)
--mask-prompt TEXT 根据文本生成蒙版(无需蒙版图像)
-s, --strength FLOAT 编辑强度 0.0-1.0(默认:0.95)
--guidance FLOAT 引导尺度(默认:7.5)
--seed INTEGER 用于可重复性的随机种子
--steps INTEGER 推理步数
--help 显示帮助
--strength 参数控制编辑强度:
| 强度 | 效果 | 使用场景 |
|---|---|---|
| 0.5-0.7 | 细微编辑 | 轻微润色、色彩调整 |
| 0.7-0.9 | 中等编辑 | 清晰的修改,同时自然融合 |
| 0.9-1.0 | 强烈编辑 | 完全替换、对象移除 |
蒙版图像定义编辑区域:
- 白色 (255):要编辑/修改的区域
- 黑色 (0):要保留不变的区域
- 灰色:部分融合(与亮度成比例)
创建蒙版的方法:
- 图像编辑器(GIMP、Photoshop、Krita)
- 绘图工具(选择并用白色/黑色填充)
- 基于文本的提示(--mask-prompt 标志)
# 使用蒙版图像编辑
uv run python fal-image-edit photo.jpg mask.png "替换为美丽的花园"
# 根据文本自动生成蒙版
uv run python fal-image-edit landscape.jpg --mask-prompt "天空" "改为带有云彩的日落"
# 移除对象
uv run python fal-image-edit photo.jpg object_mask.png "完全移除" --strength 1.0
# 无缝对象插入
uv run python fal-image-edit room.jpg region_mask.png "添加现代沙发" --strength 0.85
# 通用编辑(无蒙版)
uv run python fal-image-edit -m flux-2/redux photo.jpg "增强光照和饱和度"
# 高级品质修复
uv run python fal-image-edit -m flux-pro-v11/fill image.jpg mask.png "专业肖像背景"
# 艺术化修改
uv run python fal-image-edit -m stable-diffusion-v35/inpainting photo.jpg mask.png "梵高风格"
fal-text-to-image/
├── SKILL.md # 本文档
├── README.md # 快速参考
├── pyproject.toml # 依赖项 (uv)
├── fal-text-to-image # 文生图脚本
├── fal-image-remix # 图生图混搭脚本
├── fal-image-edit # 图像编辑/修复脚本
├── references/
│ └── model-comparison.md # 详细的模型基准测试
└── outputs/ # 生成的图像(首次运行时创建)
通过 `