OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

OA0 › 技能包 › pollinations：集成 Pollinations.ai API 实现文本、图像及视频生成

pollinations：集成 Pollinations.ai API 实现文本、图像及视频生成

patch · 2026-02-03 19:28:50 · 62 次点击 · 0 条评论

名称： pollinations
版本： 1.0.2
描述： "Pollinations.ai API，用于AI生成与分析——涵盖文本、图像、视频、音频、视觉识别与转录。当用户请求AI驱动的内容（文本补全、图像生成/编辑、视频生成、音频/TTS、图像/视频分析、音频转录）或提及Pollinations时使用。支持25+模型，提供OpenAI兼容的端点。"
元数据： {"openclaw":{"emoji":"🧬","homepage":"https://pollinations.ai","os":["darwin","linux","win32"],"requires":{"bins":["curl","jq","base64"],"env":["POLLINATIONS_API_KEY"]},"primaryEnv":"POLLINATIONS_API_KEY","install":[{"id":"jq-brew","kind":"brew","formula":"jq","bins":["jq"],"label":"通过 Homebrew 安装 jq","os":["darwin"]},{"id":"jq-apt","kind":"shell","command":"sudo apt-get install -y jq","bins":["jq"],"label":"通过 apt 安装 jq","os":["linux"]}]}}

Pollinations v1.0.2

统一的AI平台，支持使用25+模型生成和分析文本、图像、视频与音频。

API 密钥

在 https://enter.pollinations.ai 获取免费或付费密钥。
- 密钥（sk_ 开头）：用于服务端，无速率限制（推荐）
- 许多操作无需密钥（提供免费额度）

运行时要求

类型	名称	是否必需
环境变量	`POLLINATIONS_API_KEY`	可选（免费额度无需密钥）
二进制工具	`curl`	是
二进制工具	`jq`	是
二进制工具	`base64`	是

操作与脚本

1. 文本/聊天生成 (`scripts/chat.sh`)

使用25+ LLM模型，通过OpenAI兼容API生成文本。

用法：

scripts/chat.sh "你的消息"
scripts/chat.sh "你的消息" --model claude --temp 0.7
scripts/chat.sh "解释量子物理" --model openai --max-tokens 500
scripts/chat.sh "列出3种颜色" --json --model openai
scripts/chat.sh "分步解决这个问题" --model o3 --reasoning-effort high
scripts/chat.sh "翻译成法语" --system "你是一名翻译" --model gemini

选项：
- --model MODEL — 模型名称（默认：openai）
- --temp N — 温度值 0-2（默认：1）
- --max-tokens N — 最大响应长度
- --top-p N — 核心采样 0-1
- --seed N — 可复现性（-1 表示随机）
- --system "提示词" — 系统提示词
- --json — 强制返回结构化JSON响应
- --reasoning-effort 级别 — 适用于 o1/o3/R1 模型：high/medium/low/minimal/none
- --thinking-budget N — 推理模型的令牌预算

模型： openai, claude, gemini, gemini-large, gemini-search, mistral, deepseek, grok, qwen, perplexity, o1, o3, gpt-4 等超过15种。使用 scripts/models.sh text 列出所有模型。

简单文本生成（无需脚本）：

curl "https://gen.pollinations.ai/text/Hello%20world"

2. 图像生成 (`scripts/image.sh`)

根据文本提示词生成图像，支持多种模型和选项。

用法：

scripts/image.sh "山间日落"
scripts/image.sh "肖像画" --model flux --width 1024 --height 1024
scripts/image.sh "logo设计" --model gptimage --quality hd --transparent
scripts/image.sh "照片" --enhance --nologo --private
scripts/image.sh "艺术画" --negative "模糊，低质量" --seed 42

选项：
- --model MODEL — 模型（默认：flux）
- --width N — 宽度 16-2048px（默认：1024）
- --height N — 高度 16-2048px（默认：1024）
- --seed N — 可复现性
- --output 文件 — 输出文件名
- --enhance — AI优化提示词
- --negative "文本" — 负面提示词（需要避免的内容）
- --nologo — 移除水印
- --private — 私人生成
- --safe — 启用NSFW过滤器
- --quality 级别 — low/medium/high/hd（仅限gptimage模型）
- --transparent — 透明背景PNG（仅限gptimage模型）
- --image-url URL — 用于图生图的源图像URL

模型： flux（默认）, turbo, gptimage, kontext, seedream, nanobanana, nanobanana-pro。使用 scripts/models.sh image 列出所有模型。

3. 图像编辑 / 图生图 (`scripts/image-edit.sh`)

使用AI对现有图像进行变换或编辑。

用法：

scripts/image-edit.sh "把它变成蓝色" --source "https://example.com/photo.jpg"
scripts/image-edit.sh "添加太阳镜" --source photo.jpg --model kontext
scripts/image-edit.sh "转换成水彩画" --source input.png --output watercolor.jpg

选项：
- --source URL/文件 — 源图像（URL或本地文件，必需）
- --model MODEL — 模型（默认：kontext）
- --seed N — 可复现性
- --negative "文本" — 负面提示词
- --output 文件 — 输出文件名

4. 视频生成 (`scripts/image.sh` 配合视频模型)

根据文本提示词或图像生成视频。

用法：

scripts/image.sh "弹钢琴的猫" --model veo --duration 6
scripts/image.sh "海浪" --model seedance --duration 8 --aspect-ratio 16:9
scripts/image.sh "延时摄影" --model veo --duration 4 --audio
scripts/image.sh "让这个动起来" --model seedance --image-url "https://example.com/photo.jpg"

选项（除图像选项外）：
- --model veo|seedance — 视频模型（必需）
- --duration N — 时长（秒）（veo: 4/6/8, seedance: 2-10）
- --aspect-ratio 比例 — 16:9 或 9:16
- --audio — 启用音频生成（仅限veo）
- --image-url URL — 用于图生视频的源图像URL

帧插值（veo）： 通过API直接传入两张图像进行首尾帧插值：

https://gen.pollinations.ai/image/prompt?model=veo&image[0]=first_frame_url&image[1]=last_frame_url

模型： veo（4-8秒，支持音频，支持帧插值）, seedance（2-10秒，支持图生视频）

5. 文本转语音 / 音频 (`scripts/tts.sh`)

将文本转换为语音，支持多种音色和格式。

用法：

scripts/tts.sh "你好，世界"
scripts/tts.sh "Bonjour le monde" --voice nova --format mp3
scripts/tts.sh "欢迎" --voice coral --format wav --output welcome.wav

选项：
- --voice 音色 — 音色选择（默认：nova）
- --format 格式 — 输出格式（默认：mp3）
- --model MODEL — 模型（默认：openai-audio）
- --output 文件 — 输出文件名

音色（13种）： alloy, amuch, ash, ballad, coral, dan, echo, fable, nova, onyx, sage, shimmer, verse

格式（5种）： mp3, wav, flac, opus, pcm16

6. 图像分析 / 视觉识别 (`scripts/analyze-image.sh`)

使用具备视觉能力的AI模型分析和描述图像。

用法：

scripts/analyze-image.sh "https://example.com/photo.jpg"
scripts/analyze-image.sh photo.jpg --prompt "这张图片里有哪些物体？"
scripts/analyze-image.sh image.png --model claude --prompt "提取图片中的所有文字"

选项：
- --prompt "文本" — 分析问题（默认："详细描述这张图片"）
- --model MODEL — 视觉模型（默认：gemini）

输入： URL或本地文件（jpg, png, gif, webp）

模型： gemini, gemini-large, claude, openai 及其他具备视觉能力的模型。使用 scripts/models.sh vision 列出所有模型。

7. 视频分析 (`scripts/analyze-video.sh`)

使用AI视觉模型分析视频内容。

用法：

scripts/analyze-video.sh "https://example.com/video.mp4"
scripts/analyze-video.sh recording.mp4 --prompt "总结关键瞬间"
scripts/analyze-video.sh clip.mov --model gemini-large --prompt "统计人数"

选项：
- --prompt "文本" — 分析问题（默认："详细描述这个视频"）
- --model MODEL — 支持视频的模型（默认：gemini）

输入： URL或本地文件（mp4, mov, avi）

模型： gemini, gemini-large, claude, openai（支持视频的模型）

8. 音频转录 (`scripts/transcribe.sh`)

将音频文件转录为文本。

用法：

scripts/transcribe.sh recording.mp3
scripts/transcribe.sh podcast.wav --model gemini-large
scripts/transcribe.sh "https://example.com/audio.mp3" --prompt "用法语转录"

选项：
- --prompt "文本" — 转录指令（默认："准确转录"）
- --model MODEL — 支持音频的模型（默认：gemini）

输入： 本地文件或URL（mp3, wav, flac, ogg, m4a）

模型： gemini, gemini-large, gemini-legacy, openai-audio

9. 列出可用模型 (`scripts/models.sh`)

动态列出API提供的所有可用模型。

用法：

scripts/models.sh              # 列出所有模型
scripts/models.sh text         # 仅文本/聊天模型
scripts/models.sh image        # 仅图像生成模型
scripts/models.sh video        # 仅视频生成模型
scripts/models.sh vision       # 仅视觉/分析模型
scripts/models.sh audio        # 仅音频/TTS模型

API 端点参考

操作	端点	方法
简单文本	`/text/{prompt}`	GET
聊天补全	`/v1/chat/completions`	POST
图像生成	`/image/{prompt}?{params}`	GET
图生图	`/image/{prompt}?image={url}&{params}`	GET
视频生成	`/image/{prompt}?model=veo&{params}`	GET
图像分析	`/v1/chat/completions`（附带 image_url）	POST
视频分析	`/v1/chat/completions`（附带 video_url）	POST
音频/TTS	`/v1/chat/completions`（openai-audio）	POST
音频转录	`/v1/chat/completions`（附带 input_audio）	POST
列出文本模型	`/v1/models`	GET
列出图像模型	`/image/models`	GET
列出视觉模型	`/text/models`	GET

使用技巧

提供免费额度：许多操作无需API密钥即可使用（有速率限制）
OpenAI兼容：聊天端点可与现有的OpenAI集成配合使用
可复现性：在所有操作中使用 seed 参数以获得一致的输出
图像增强：在图像生成时使用 --enhance 让AI优化提示词
JSON模式：在聊天时使用 --json 标志以提取结构化数据
推理模型：与 o1/o3/R1 模型配合使用 --reasoning-effort 来控制思考深度
图生视频：使用 --image-url 配合 seedance 进行图生视频，或使用 veo 进行帧插值
视频配乐：使用 --audio 配合 veo 模型生成带声音的视频
本地文件：分析脚本（图像、视频、转录）同时接受URL和本地文件
私密模式：使用 --private 将生成内容保留在私有流中

API 文档

完整文档：https://enter.pollinations.ai/api/docs

技能包地址：https://github.com/openclaw/skills/tree/main/skills/isaacgounton/pollinations/SKILL.md

62 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

pollinations：集成 Pollinations.ai API 实现文本、图像及视频生成

Pollinations v1.0.2

API 密钥

运行时要求

操作与脚本

1. 文本/聊天生成 (scripts/chat.sh)

2. 图像生成 (scripts/image.sh)

3. 图像编辑 / 图生图 (scripts/image-edit.sh)

4. 视频生成 (scripts/image.sh 配合视频模型)

5. 文本转语音 / 音频 (scripts/tts.sh)

6. 图像分析 / 视觉识别 (scripts/analyze-image.sh)

7. 视频分析 (scripts/analyze-video.sh)

8. 音频转录 (scripts/transcribe.sh)

9. 列出可用模型 (scripts/models.sh)

API 端点参考

使用技巧

API 文档

1. 文本/聊天生成 (`scripts/chat.sh`)

2. 图像生成 (`scripts/image.sh`)

3. 图像编辑 / 图生图 (`scripts/image-edit.sh`)

4. 视频生成 (`scripts/image.sh` 配合视频模型)

5. 文本转语音 / 音频 (`scripts/tts.sh`)

6. 图像分析 / 视觉识别 (`scripts/analyze-image.sh`)

7. 视频分析 (`scripts/analyze-video.sh`)

8. 音频转录 (`scripts/transcribe.sh`)

9. 列出可用模型 (`scripts/models.sh`)