名称: pollinations
版本: 1.0.2
描述: "Pollinations.ai API,用于AI生成与分析——涵盖文本、图像、视频、音频、视觉识别与转录。当用户请求AI驱动的内容(文本补全、图像生成/编辑、视频生成、音频/TTS、图像/视频分析、音频转录)或提及Pollinations时使用。支持25+模型,提供OpenAI兼容的端点。"
元数据: {"openclaw":{"emoji":"🧬","homepage":"https://pollinations.ai","os":["darwin","linux","win32"],"requires":{"bins":["curl","jq","base64"],"env":["POLLINATIONS_API_KEY"]},"primaryEnv":"POLLINATIONS_API_KEY","install":[{"id":"jq-brew","kind":"brew","formula":"jq","bins":["jq"],"label":"通过 Homebrew 安装 jq","os":["darwin"]},{"id":"jq-apt","kind":"shell","command":"sudo apt-get install -y jq","bins":["jq"],"label":"通过 apt 安装 jq","os":["linux"]}]}}
统一的AI平台,支持使用25+模型生成和分析文本、图像、视频与音频。
在 https://enter.pollinations.ai 获取免费或付费密钥。
- 密钥(sk_ 开头):用于服务端,无速率限制(推荐)
- 许多操作无需密钥(提供免费额度)
| 类型 | 名称 | 是否必需 |
|---|---|---|
| 环境变量 | POLLINATIONS_API_KEY |
可选(免费额度无需密钥) |
| 二进制工具 | curl |
是 |
| 二进制工具 | jq |
是 |
| 二进制工具 | base64 |
是 |
scripts/chat.sh)使用25+ LLM模型,通过OpenAI兼容API生成文本。
用法:
scripts/chat.sh "你的消息"
scripts/chat.sh "你的消息" --model claude --temp 0.7
scripts/chat.sh "解释量子物理" --model openai --max-tokens 500
scripts/chat.sh "列出3种颜色" --json --model openai
scripts/chat.sh "分步解决这个问题" --model o3 --reasoning-effort high
scripts/chat.sh "翻译成法语" --system "你是一名翻译" --model gemini
选项:
- --model MODEL — 模型名称(默认:openai)
- --temp N — 温度值 0-2(默认:1)
- --max-tokens N — 最大响应长度
- --top-p N — 核心采样 0-1
- --seed N — 可复现性(-1 表示随机)
- --system "提示词" — 系统提示词
- --json — 强制返回结构化JSON响应
- --reasoning-effort 级别 — 适用于 o1/o3/R1 模型:high/medium/low/minimal/none
- --thinking-budget N — 推理模型的令牌预算
模型: openai, claude, gemini, gemini-large, gemini-search, mistral, deepseek, grok, qwen, perplexity, o1, o3, gpt-4 等超过15种。使用 scripts/models.sh text 列出所有模型。
简单文本生成(无需脚本):
curl "https://gen.pollinations.ai/text/Hello%20world"
scripts/image.sh)根据文本提示词生成图像,支持多种模型和选项。
用法:
scripts/image.sh "山间日落"
scripts/image.sh "肖像画" --model flux --width 1024 --height 1024
scripts/image.sh "logo设计" --model gptimage --quality hd --transparent
scripts/image.sh "照片" --enhance --nologo --private
scripts/image.sh "艺术画" --negative "模糊,低质量" --seed 42
选项:
- --model MODEL — 模型(默认:flux)
- --width N — 宽度 16-2048px(默认:1024)
- --height N — 高度 16-2048px(默认:1024)
- --seed N — 可复现性
- --output 文件 — 输出文件名
- --enhance — AI优化提示词
- --negative "文本" — 负面提示词(需要避免的内容)
- --nologo — 移除水印
- --private — 私人生成
- --safe — 启用NSFW过滤器
- --quality 级别 — low/medium/high/hd(仅限gptimage模型)
- --transparent — 透明背景PNG(仅限gptimage模型)
- --image-url URL — 用于图生图的源图像URL
模型: flux(默认), turbo, gptimage, kontext, seedream, nanobanana, nanobanana-pro。使用 scripts/models.sh image 列出所有模型。
scripts/image-edit.sh)使用AI对现有图像进行变换或编辑。
用法:
scripts/image-edit.sh "把它变成蓝色" --source "https://example.com/photo.jpg"
scripts/image-edit.sh "添加太阳镜" --source photo.jpg --model kontext
scripts/image-edit.sh "转换成水彩画" --source input.png --output watercolor.jpg
选项:
- --source URL/文件 — 源图像(URL或本地文件,必需)
- --model MODEL — 模型(默认:kontext)
- --seed N — 可复现性
- --negative "文本" — 负面提示词
- --output 文件 — 输出文件名
scripts/image.sh 配合视频模型)根据文本提示词或图像生成视频。
用法:
scripts/image.sh "弹钢琴的猫" --model veo --duration 6
scripts/image.sh "海浪" --model seedance --duration 8 --aspect-ratio 16:9
scripts/image.sh "延时摄影" --model veo --duration 4 --audio
scripts/image.sh "让这个动起来" --model seedance --image-url "https://example.com/photo.jpg"
选项(除图像选项外):
- --model veo|seedance — 视频模型(必需)
- --duration N — 时长(秒)(veo: 4/6/8, seedance: 2-10)
- --aspect-ratio 比例 — 16:9 或 9:16
- --audio — 启用音频生成(仅限veo)
- --image-url URL — 用于图生视频的源图像URL
帧插值(veo): 通过API直接传入两张图像进行首尾帧插值:
https://gen.pollinations.ai/image/prompt?model=veo&image[0]=first_frame_url&image[1]=last_frame_url
模型: veo(4-8秒,支持音频,支持帧插值), seedance(2-10秒,支持图生视频)
scripts/tts.sh)将文本转换为语音,支持多种音色和格式。
用法:
scripts/tts.sh "你好,世界"
scripts/tts.sh "Bonjour le monde" --voice nova --format mp3
scripts/tts.sh "欢迎" --voice coral --format wav --output welcome.wav
选项:
- --voice 音色 — 音色选择(默认:nova)
- --format 格式 — 输出格式(默认:mp3)
- --model MODEL — 模型(默认:openai-audio)
- --output 文件 — 输出文件名
音色(13种): alloy, amuch, ash, ballad, coral, dan, echo, fable, nova, onyx, sage, shimmer, verse
格式(5种): mp3, wav, flac, opus, pcm16
scripts/analyze-image.sh)使用具备视觉能力的AI模型分析和描述图像。
用法:
scripts/analyze-image.sh "https://example.com/photo.jpg"
scripts/analyze-image.sh photo.jpg --prompt "这张图片里有哪些物体?"
scripts/analyze-image.sh image.png --model claude --prompt "提取图片中的所有文字"
选项:
- --prompt "文本" — 分析问题(默认:"详细描述这张图片")
- --model MODEL — 视觉模型(默认:gemini)
输入: URL或本地文件(jpg, png, gif, webp)
模型: gemini, gemini-large, claude, openai 及其他具备视觉能力的模型。使用 scripts/models.sh vision 列出所有模型。
scripts/analyze-video.sh)使用AI视觉模型分析视频内容。
用法:
scripts/analyze-video.sh "https://example.com/video.mp4"
scripts/analyze-video.sh recording.mp4 --prompt "总结关键瞬间"
scripts/analyze-video.sh clip.mov --model gemini-large --prompt "统计人数"
选项:
- --prompt "文本" — 分析问题(默认:"详细描述这个视频")
- --model MODEL — 支持视频的模型(默认:gemini)
输入: URL或本地文件(mp4, mov, avi)
模型: gemini, gemini-large, claude, openai(支持视频的模型)
scripts/transcribe.sh)将音频文件转录为文本。
用法:
scripts/transcribe.sh recording.mp3
scripts/transcribe.sh podcast.wav --model gemini-large
scripts/transcribe.sh "https://example.com/audio.mp3" --prompt "用法语转录"
选项:
- --prompt "文本" — 转录指令(默认:"准确转录")
- --model MODEL — 支持音频的模型(默认:gemini)
输入: 本地文件或URL(mp3, wav, flac, ogg, m4a)
模型: gemini, gemini-large, gemini-legacy, openai-audio
scripts/models.sh)动态列出API提供的所有可用模型。
用法:
scripts/models.sh # 列出所有模型
scripts/models.sh text # 仅文本/聊天模型
scripts/models.sh image # 仅图像生成模型
scripts/models.sh video # 仅视频生成模型
scripts/models.sh vision # 仅视觉/分析模型
scripts/models.sh audio # 仅音频/TTS模型
| 操作 | 端点 | 方法 |
|---|---|---|
| 简单文本 | /text/{prompt} |
GET |
| 聊天补全 | /v1/chat/completions |
POST |
| 图像生成 | /image/{prompt}?{params} |
GET |
| 图生图 | /image/{prompt}?image={url}&{params} |
GET |
| 视频生成 | /image/{prompt}?model=veo&{params} |
GET |
| 图像分析 | /v1/chat/completions(附带 image_url) |
POST |
| 视频分析 | /v1/chat/completions(附带 video_url) |
POST |
| 音频/TTS | /v1/chat/completions(openai-audio) |
POST |
| 音频转录 | /v1/chat/completions(附带 input_audio) |
POST |
| 列出文本模型 | /v1/models |
GET |
| 列出图像模型 | /image/models |
GET |
| 列出视觉模型 | /text/models |
GET |
seed 参数以获得一致的输出--enhance 让AI优化提示词--json 标志以提取结构化数据--reasoning-effort 来控制思考深度--image-url 配合 seedance 进行图生视频,或使用 veo 进行帧插值--audio 配合 veo 模型生成带声音的视频--private 将生成内容保留在私有流中完整文档:https://enter.pollinations.ai/api/docs