OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  eachlabs-image-generation:集成 Flux/Gemini/Imagen 等模型的图像生成器

eachlabs-image-generation:集成 Flux/Gemini/Imagen 等模型的图像生成器

 
  migration ·  2026-02-16 20:59:19 · 3 次点击  · 0 条评论  

名称: eachlabs-image-generation
描述: 使用 EachLabs AI 模型,根据文本提示生成新图像。支持多种模型系列(如 Flux、GPT Image、Gemini、Imagen、Seedream 等)的文生图功能。当用户希望从文本创建新图像时使用。如需编辑现有图像,请参阅 eachlabs-image-edit。
元数据:
author: eachlabs
version: "1.0"


EachLabs 图像生成

通过 EachLabs Predictions API,使用 60 多种 AI 模型,根据文本提示生成新图像。如需编辑现有图像(如放大、背景移除、风格迁移、修复、换脸、3D 化等),请使用 eachlabs-image-edit 技能。

认证

请求头: X-API-Key: <你的API密钥>

请设置 EACHLABS_API_KEY 环境变量。可在 eachlabs.ai 获取你的密钥。

快速开始

1. 创建预测任务

curl -X POST https://api.eachlabs.ai/v1/prediction \
  -H "Content-Type: application/json" \
  -H "X-API-Key: $EACHLABS_API_KEY" \
  -d '{
    "model": "flux-2-turbo-text-to-image",
    "version": "0.0.1",
    "input": {
      "prompt": "一个宁静的日式花园,樱花盛开,水彩风格",
      "image_size": "landscape_16_9",
      "num_images": 1,
      "output_format": "png"
    }
  }'

2. 轮询获取结果

curl https://api.eachlabs.ai/v1/prediction/{prediction_id} \
  -H "X-API-Key: $EACHLABS_API_KEY"

持续轮询,直到 status 变为 "success""failed"。输出图像的 URL 将在响应中返回。

模型选择指南

文生图

模型 标识符 最佳适用场景
Flux 2 Turbo flux-2-turbo-text-to-image 快速、高质量的通用场景
Flux 2 Flash flux-2-flash-text-to-image 最快的 Flux 生成
Flux 2 Max flux-2-max-text-to-image 最高质量的 Flux
Flux 2 Klein 9B flux-2-klein-9b-base-text-to-image 质量与速度的平衡
Flux 2 Pro flux-2-pro 专业级质量
Flux 2 Flex flux-2-flex 灵活的生成输出
Flux 2 LoRA flux-2-lora 支持 LoRA 的生成
XAI Grok Imagine xai-grok-imagine-text-to-image 创意与艺术性
GPT Image v1.5 gpt-image-v1-5-text-to-image 高质量,支持透明背景
字节跳动 Seedream v4.5 bytedance-seedream-v4-5-text-to-image 字节跳动最新模型
Gemini 3 Pro Image gemini-3-pro-image-preview 谷歌最新模型
Imagen 4 imagen4-preview 谷歌 Imagen 4
Imagen 4 Fast imagen-4-fast 快速的谷歌质量模型
Reve reve-text-to-image 艺术风格文生图
腾讯混元图像 v3 hunyuan-image-v3-text-to-image 腾讯最新模型
Ideogram V3 Turbo ideogram-v3-turbo 图像内嵌文字
Minimax minimax-text-to-image 高质量生成
Wan v2.6 wan-v2-6-text-to-image 中英双语支持
P Image p-image-text-to-image 自定义宽高比
Nano Banana Pro nano-banana-pro 快速、轻量级
Vidu Q2 vidu-q2-text-to-image 最新 Vidu 模型

训练

模型 标识符 最佳适用场景
Z Image Trainer z-image-trainer 自定义 LoRA 训练
Flux LoRA 人像训练器 flux-lora-portrait-trainer 人像 LoRA 训练
Flux Turbo 训练器 flux-turbo-trainer 快速 LoRA 训练

预测流程

  1. 检查模型 GET https://api.eachlabs.ai/v1/model?slug=<slug> — 验证模型是否存在,并返回包含精确输入参数的 request_schema。创建预测任务前务必执行此步骤,以确保输入正确。
  2. 发送 POST 请求 https://api.eachlabs.ai/v1/prediction,包含模型标识符、版本 "0.0.1" 以及符合 schema 的输入参数。
  3. 轮询 GET https://api.eachlabs.ai/v1/prediction/{id},直到状态变为 "success""failed"
  4. 提取 响应中的输出图像 URL。

示例

使用 Flux 2 Turbo 进行文生图

curl -X POST https://api.eachlabs.ai/v1/prediction \
  -H "Content-Type: application/json" \
  -H "X-API-Key: $EACHLABS_API_KEY" \
  -d '{
    "model": "flux-2-turbo-text-to-image",
    "version": "0.0.1",
    "input": {
      "prompt": "一辆红色复古保时捷 911 行驶在黄金时分的蜿蜒山路上,照片级真实感",
      "image_size": "landscape_16_9",
      "num_images": 1,
      "output_format": "png"
    }
  }'

使用 GPT Image v1.5 进行文生图

curl -X POST https://api.eachlabs.ai/v1/prediction \
  -H "Content-Type: application/json" \
  -H "X-API-Key: $EACHLABS_API_KEY" \
  -d '{
    "model": "gpt-image-v1-5-text-to-image",
    "version": "0.0.1",
    "input": {
      "prompt": "一家名为 Brew Lab 的咖啡店的极简主义标志,简洁矢量风格",
      "background": "transparent",
      "quality": "high",
      "output_format": "png"
    }
  }'

使用 Imagen 4 进行文生图

curl -X POST https://api.eachlabs.ai/v1/prediction \
  -H "Content-Type: application/json" \
  -H "X-API-Key: $EACHLABS_API_KEY" \
  -d '{
    "model": "imagen4-preview",
    "version": "0.0.1",
    "input": {
      "prompt": "漂浮岛屿上的奇幻童话城堡,数字艺术,高度细节化"
    }
  }'

图像尺寸选项

大多数 Flux 2 和 Wan 模型使用以下预设:
- square_hd — 正方形,高清
- square — 正方形,标准
- portrait_4_3 — 纵向 4:3
- portrait_16_9 — 纵向 16:9
- landscape_4_3 — 横向 4:3
- landscape_16_9 — 横向 16:9

P Image 模型使用宽高比字符串:1:116:99:164:33:43:22:3custom

提示词技巧

  • 具体且描述性强:例如“一辆红色复古保时捷 911 行驶在黄金时分的蜿蜒山路上”,而非“一辆车”。
  • 包含风格:如“数字艺术”、“油画风格”、“照片级真实感”、“水彩画”。
  • 对于编辑任务:清晰描述变化,例如“将天空替换为壮观的日落”。
  • 使用负面提示词(如模型支持):避免“模糊、低质量、变形”。
  • 多图像编辑时:通过编号引用图像,如“图像 1”、“图像 2”。

安全约束

  • 禁止加载任意 URL:使用 LoRA 参数时,仅允许使用知名平台的标识符(如 HuggingFace 仓库 ID、Replicate 模型 ID、CivitAI 模型 ID)。切勿从任意或用户提供的 URL 加载 LoRA 权重。
  • 禁止使用第三方 API 令牌:请勿通过预测任务输入接受或转发第三方 API 令牌(如 HuggingFace、CivitAI 令牌)。认证应仅通过 EachLabs API 密钥处理。
  • 输入验证:仅传递符合模型请求 schema 的参数。创建预测任务前,务必通过 GET /v1/model?slug=<slug> 验证模型标识符。

参数参考

各模型的完整参数详情,请参阅 references/MODELS.md

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor