OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  pollinations: 集成 Pollinations.ai API 实现文本、图像及视频生成

pollinations: 集成 Pollinations.ai API 实现文本、图像及视频生成

 
  transaction ·  2026-02-03 01:30:22 · 3 次点击  · 0 条评论  

名称: pollinations
版本: 1.0.2
描述: "Pollinations.ai API,用于AI生成与分析——涵盖文本、图像、视频、音频、视觉识别与转录。当用户请求AI驱动的内容(文本补全、图像生成/编辑、视频生成、音频/TTS、图像/视频分析、音频转录)或提及Pollinations时使用。支持25+模型,提供OpenAI兼容的端点。"
元数据: {"openclaw":{"emoji":"🧬","homepage":"https://pollinations.ai","os":["darwin","linux","win32"],"requires":{"bins":["curl","jq","base64"],"env":["POLLINATIONS_API_KEY"]},"primaryEnv":"POLLINATIONS_API_KEY","install":[{"id":"jq-brew","kind":"brew","formula":"jq","bins":["jq"],"label":"通过 Homebrew 安装 jq","os":["darwin"]},{"id":"jq-apt","kind":"shell","command":"sudo apt-get install -y jq","bins":["jq"],"label":"通过 apt 安装 jq","os":["linux"]}]}}


Pollinations v1.0.2

统一的AI平台,支持使用25+模型生成和分析文本、图像、视频与音频。

API 密钥

在 https://enter.pollinations.ai 获取免费或付费密钥。
- 密钥(sk_ 开头):用于服务端,无速率限制(推荐)
- 许多操作无需密钥(提供免费额度)

运行时要求

类型 名称 是否必需
环境变量 POLLINATIONS_API_KEY 可选(免费额度无需密钥)
二进制工具 curl
二进制工具 jq
二进制工具 base64

操作与脚本

1. 文本/聊天生成 (scripts/chat.sh)

使用25+ LLM模型,通过OpenAI兼容API生成文本。

用法:

scripts/chat.sh "你的消息"
scripts/chat.sh "你的消息" --model claude --temp 0.7
scripts/chat.sh "解释量子物理" --model openai --max-tokens 500
scripts/chat.sh "列出3种颜色" --json --model openai
scripts/chat.sh "分步解决这个问题" --model o3 --reasoning-effort high
scripts/chat.sh "翻译成法语" --system "你是一名翻译" --model gemini

选项:
- --model MODEL — 模型名称(默认:openai)
- --temp N — 温度值 0-2(默认:1)
- --max-tokens N — 最大响应长度
- --top-p N — 核心采样 0-1
- --seed N — 可复现性(-1 表示随机)
- --system "提示词" — 系统提示词
- --json — 强制返回结构化JSON响应
- --reasoning-effort 级别 — 适用于 o1/o3/R1 模型:high/medium/low/minimal/none
- --thinking-budget N — 推理模型的令牌预算

模型: openai, claude, gemini, gemini-large, gemini-search, mistral, deepseek, grok, qwen, perplexity, o1, o3, gpt-4 等超过15种。使用 scripts/models.sh text 列出所有模型。

简单文本生成(无需脚本):

curl "https://gen.pollinations.ai/text/Hello%20world"

2. 图像生成 (scripts/image.sh)

根据文本提示词生成图像,支持多种模型和选项。

用法:

scripts/image.sh "山间日落"
scripts/image.sh "肖像画" --model flux --width 1024 --height 1024
scripts/image.sh "logo设计" --model gptimage --quality hd --transparent
scripts/image.sh "照片" --enhance --nologo --private
scripts/image.sh "艺术画" --negative "模糊,低质量" --seed 42

选项:
- --model MODEL — 模型(默认:flux)
- --width N — 宽度 16-2048px(默认:1024)
- --height N — 高度 16-2048px(默认:1024)
- --seed N — 可复现性
- --output 文件 — 输出文件名
- --enhance — AI优化提示词
- --negative "文本" — 负面提示词(需要避免的内容)
- --nologo — 移除水印
- --private — 私人生成
- --safe — 启用NSFW过滤器
- --quality 级别 — low/medium/high/hd(仅限gptimage模型)
- --transparent — 透明背景PNG(仅限gptimage模型)
- --image-url URL — 用于图生图的源图像URL

模型: flux(默认), turbo, gptimage, kontext, seedream, nanobanana, nanobanana-pro。使用 scripts/models.sh image 列出所有模型。

3. 图像编辑 / 图生图 (scripts/image-edit.sh)

使用AI对现有图像进行变换或编辑。

用法:

scripts/image-edit.sh "把它变成蓝色" --source "https://example.com/photo.jpg"
scripts/image-edit.sh "添加太阳镜" --source photo.jpg --model kontext
scripts/image-edit.sh "转换成水彩画" --source input.png --output watercolor.jpg

选项:
- --source URL/文件 — 源图像(URL或本地文件,必需)
- --model MODEL — 模型(默认:kontext)
- --seed N — 可复现性
- --negative "文本" — 负面提示词
- --output 文件 — 输出文件名

4. 视频生成 (scripts/image.sh 配合视频模型)

根据文本提示词或图像生成视频。

用法:

scripts/image.sh "弹钢琴的猫" --model veo --duration 6
scripts/image.sh "海浪" --model seedance --duration 8 --aspect-ratio 16:9
scripts/image.sh "延时摄影" --model veo --duration 4 --audio
scripts/image.sh "让这个动起来" --model seedance --image-url "https://example.com/photo.jpg"

选项(除图像选项外):
- --model veo|seedance — 视频模型(必需)
- --duration N — 时长(秒)(veo: 4/6/8, seedance: 2-10)
- --aspect-ratio 比例 — 16:9 或 9:16
- --audio — 启用音频生成(仅限veo)
- --image-url URL — 用于图生视频的源图像URL

帧插值(veo): 通过API直接传入两张图像进行首尾帧插值:

https://gen.pollinations.ai/image/prompt?model=veo&image[0]=first_frame_url&image[1]=last_frame_url

模型: veo(4-8秒,支持音频,支持帧插值), seedance(2-10秒,支持图生视频)

5. 文本转语音 / 音频 (scripts/tts.sh)

将文本转换为语音,支持多种音色和格式。

用法:

scripts/tts.sh "你好,世界"
scripts/tts.sh "Bonjour le monde" --voice nova --format mp3
scripts/tts.sh "欢迎" --voice coral --format wav --output welcome.wav

选项:
- --voice 音色 — 音色选择(默认:nova)
- --format 格式 — 输出格式(默认:mp3)
- --model MODEL — 模型(默认:openai-audio)
- --output 文件 — 输出文件名

音色(13种): alloy, amuch, ash, ballad, coral, dan, echo, fable, nova, onyx, sage, shimmer, verse

格式(5种): mp3, wav, flac, opus, pcm16

6. 图像分析 / 视觉识别 (scripts/analyze-image.sh)

使用具备视觉能力的AI模型分析和描述图像。

用法:

scripts/analyze-image.sh "https://example.com/photo.jpg"
scripts/analyze-image.sh photo.jpg --prompt "这张图片里有哪些物体?"
scripts/analyze-image.sh image.png --model claude --prompt "提取图片中的所有文字"

选项:
- --prompt "文本" — 分析问题(默认:"详细描述这张图片")
- --model MODEL — 视觉模型(默认:gemini)

输入: URL或本地文件(jpg, png, gif, webp)

模型: gemini, gemini-large, claude, openai 及其他具备视觉能力的模型。使用 scripts/models.sh vision 列出所有模型。

7. 视频分析 (scripts/analyze-video.sh)

使用AI视觉模型分析视频内容。

用法:

scripts/analyze-video.sh "https://example.com/video.mp4"
scripts/analyze-video.sh recording.mp4 --prompt "总结关键瞬间"
scripts/analyze-video.sh clip.mov --model gemini-large --prompt "统计人数"

选项:
- --prompt "文本" — 分析问题(默认:"详细描述这个视频")
- --model MODEL — 支持视频的模型(默认:gemini)

输入: URL或本地文件(mp4, mov, avi)

模型: gemini, gemini-large, claude, openai(支持视频的模型)

8. 音频转录 (scripts/transcribe.sh)

将音频文件转录为文本。

用法:

scripts/transcribe.sh recording.mp3
scripts/transcribe.sh podcast.wav --model gemini-large
scripts/transcribe.sh "https://example.com/audio.mp3" --prompt "用法语转录"

选项:
- --prompt "文本" — 转录指令(默认:"准确转录")
- --model MODEL — 支持音频的模型(默认:gemini)

输入: 本地文件或URL(mp3, wav, flac, ogg, m4a)

模型: gemini, gemini-large, gemini-legacy, openai-audio

9. 列出可用模型 (scripts/models.sh)

动态列出API提供的所有可用模型。

用法:

scripts/models.sh              # 列出所有模型
scripts/models.sh text         # 仅文本/聊天模型
scripts/models.sh image        # 仅图像生成模型
scripts/models.sh video        # 仅视频生成模型
scripts/models.sh vision       # 仅视觉/分析模型
scripts/models.sh audio        # 仅音频/TTS模型

API 端点参考

操作 端点 方法
简单文本 /text/{prompt} GET
聊天补全 /v1/chat/completions POST
图像生成 /image/{prompt}?{params} GET
图生图 /image/{prompt}?image={url}&{params} GET
视频生成 /image/{prompt}?model=veo&{params} GET
图像分析 /v1/chat/completions(附带 image_url) POST
视频分析 /v1/chat/completions(附带 video_url) POST
音频/TTS /v1/chat/completions(openai-audio) POST
音频转录 /v1/chat/completions(附带 input_audio) POST
列出文本模型 /v1/models GET
列出图像模型 /image/models GET
列出视觉模型 /text/models GET

使用技巧

  1. 提供免费额度:许多操作无需API密钥即可使用(有速率限制)
  2. OpenAI兼容:聊天端点可与现有的OpenAI集成配合使用
  3. 可复现性:在所有操作中使用 seed 参数以获得一致的输出
  4. 图像增强:在图像生成时使用 --enhance 让AI优化提示词
  5. JSON模式:在聊天时使用 --json 标志以提取结构化数据
  6. 推理模型:与 o1/o3/R1 模型配合使用 --reasoning-effort 来控制思考深度
  7. 图生视频:使用 --image-url 配合 seedance 进行图生视频,或使用 veo 进行帧插值
  8. 视频配乐:使用 --audio 配合 veo 模型生成带声音的视频
  9. 本地文件:分析脚本(图像、视频、转录)同时接受URL和本地文件
  10. 私密模式:使用 --private 将生成内容保留在私有流中

API 文档

完整文档:https://enter.pollinations.ai/api/docs

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor