OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

OA0 › 技能包 › kameo：使用 Kameo AI 从静态图像生成表情丰富的说话人视频

kameo：使用 Kameo AI 从静态图像生成表情丰富的说话人视频

fifty · 2026-02-03 19:10:36 · 73 次点击 · 0 条评论

名称： kameo
描述： 使用 Kameo AI 从静态图像生成富有表现力的说话头部视频。将静态头像/肖像转换为具有逼真面部表情、唇形同步和动作的动态 5 秒视频。适用于需要让静态图像活起来、创建 AI 角色视频、展示视觉交流或从照片生成说话头像的场景。

Kameo AI - 说话头部视频生成

将静态图像转换为具有逼真动作和唇形同步的富有表现力的说话头部视频。

快速开始

scripts/generate_video.sh <图片路径> <提示词> [输出文件]

示例：

scripts/generate_video.sh avatar.jpg "你好，我是一个 AI 助手" output.mp4

功能概述

输入一张静态图像（肖像/头像）
根据您的提示词添加逼真的面部动作、表情和唇形同步
生成 5 秒视频，支持 9:16、16:9 或 1:1 宽高比
即时返回 CDN 链接（处理时间约 10-30 秒）

身份验证

设置您的 Kameo API 密钥：

export KAMEO_API_KEY="kam_I3rdx43IymFNbfBw1c0ZbSc7o3aUfQgz8cljZA6T7fs"

或存储在 ~/.config/kameo/credentials.json 文件中：

{
  "api_key": "kam_I3rdx43IymFNbfBw1c0ZbSc7o3aUfQgz8cljZA6T7fs"
}

获取 API 密钥：

在 kameo.chat 注册（需要邮箱验证）
登录获取 JWT 令牌
通过 /api/public/keys 端点创建 API 密钥
或使用注册助手脚本：scripts/register.sh

提示词工程

基础提示词（简单）

仅包含对话：

"你好，我今天来帮助你"
"こんにちは、私はガッキーです。愛してます。"

可以使用，但效果较为通用。

增强提示词（推荐）

格式：

[详细场景/环境描述]，[人物完整外貌和表情]，以[语气]说话，"[对话内容]"。[镜头和灯光细节]。

示例：

在一个明亮的户外冬日场景中，柔和、阴天的日光下，一位年轻女子留着深色长发，戴着白色针织冬帽（带耳罩），身穿彩色图案毛衣，居中站立在画面中。她直视镜头，带着温暖、真诚的微笑，眼睛因喜悦而微眯，以欢快、亲切的语气说道："こんにちは、私はガッキーです。愛してます。" 场景采用中近景拍摄，取景于视线高度。光线自然，从上方漫射下来，形成柔和均匀的照明。

为何使用增强提示词：
- 面部表情更贴合场景上下文
- 动作和手势更自然
- 唇形同步质量更高
- 情感表达更具情境感

提示词增强工作流

为获得最佳效果，建议先用视觉 AI 分析图像：

将图像输入视觉模型（如 Gemini、GPT-4V、Claude）
要求其以电影级细节描述场景
将您的对话内容插入描述中
将增强后的提示词用于 Kameo

参考： scripts/enhance_prompt.sh 脚本可实现自动化增强。

API 详情

基础 URL： https://api.kameo.chat/api/public

生成视频

curl -X POST https://api.kameo.chat/api/public/generate \
  -H "X-API-Key: kam_I3rdx43IymFNbfBw1c0ZbSc7o3aUfQgz8cljZA6T7fs" \
  -H "Content-Type: application/json" \
  -d '{
    "image_base64": "<base64编码的图片>",
    "prompt": "您的详细提示词",
    "seconds": 5,
    "aspect_ratio": "9:16"
  }'

参数：
- image_base64（必需）：Base64 编码的 JPEG/PNG 图像
- prompt（必需）：对话和/或场景描述
- seconds（可选）：5（默认）或 10
- aspect_ratio（可选）："9:16"（默认）、"16:9" 或 "1:1"

响应：

{
  "job_id": "uuid",
  "status": "completed",
  "video_url": "https://cdn.kameo.chat/videos/{uuid}.mp4",
  "duration_seconds": 5,
  "processing_time_ms": 15000
}

查询额度

curl -H "X-API-Key: kam_..." \
  https://api.kameo.chat/api/public/credits

响应：

{
  "permanent_credits": 294,
  "subscription_credits": 0,
  "total_available": 294
}

定价

curl https://api.kameo.chat/api/public/pricing

费用： 每视频 3 个额度

性能表现

处理时间： 8-35 秒（取决于宽高比和队列情况）
9:16（竖屏）： ~30-35 秒
16:9（横屏）： ~15-20 秒
1:1（方形）： ~10-15 秒

最佳实践

优化图像尺寸 - 编码前调整大图尺寸（节省带宽，上传更快）
bash ffmpeg -i large.jpg -vf scale=720:-1 optimized.jpg
使用描述性提示词 - 增强提示词 = 更好效果
明智选择宽高比
- 9:16：移动端/社交媒体（TikTok、Instagram Stories）
- 16:9：桌面端/YouTube
- 1:1：个人资料图片、方形帖子
监控额度 - 使用 scripts/check_credits.sh 检查余额

限制说明

CDN 访问： 视频链接可能有时限访问或需要身份验证
下载： 使用 curl 下载视频可能返回 403（请使用浏览器或经过身份验证的会话）
速率限制： 每分钟 10 次生成

故障排除

"401 未授权"
- 检查 API 密钥是否正确设置
- 确认密钥未被撤销

"402 额度不足"
- 检查额度余额：scripts/check_credits.sh
- 需要在 kameo.chat 添加额度

"超时错误"
- 9:16 视频处理时间较长（约 30 秒）
- 在脚本中增加超时时间
- 服务器繁忙时可重试

"下载视频时返回 403"
- CDN 链接可能有时限
- 生成后立即在浏览器中访问
- 或者保存可用的 base64 响应

应用场景

AI 角色视频 - 让机器人头像活起来
社交媒体内容 - 动态个人资料视频
演示和展示 - 会说话的产品演示
教育内容 - 带有 AI 主讲人的视频教程
多语言内容 - 同一头像说不同语言

技能包地址：https://github.com/openclaw/skills/tree/main/skills/veya2ztn/kameo/SKILL.md

73 次点击 ∙ 0 人收藏

登录后收藏

0 条回复