flyworks-video：使用 Flyworks 技术生成的 AI 虚拟人视频工具视频工具

system · 2026-02-12 17:35:12 · 61 次点击 · 0 条评论

名称： flyworks-avatar-video
描述： 使用 Flyworks（又称 HiFly 飞影数字人）生成数字人视频。可从图片生成说话照片视频，使用公共数字人配合 TTS 合成语音，或通过音频样本克隆声音。
许可证： MIT
compatibility: 需要 Python 3 及网络连接以访问 hfw-api.hifly.cc

数字人视频生成技能

本技能允许您使用 Flyworks（又称 HiFly 飞影数字人）生成数字人视频。可用功能包括：
1. 公共数字人视频：使用预置的高仿真数字人，从文本或音频生成视频。
2. 说话照片：从单张图片和文本/音频生成“说话照片”视频。
3. 声音克隆：从音频样本克隆声音，用于 TTS 语音合成。

详细文档请参阅 references/ 文件夹：
- authentication.md - API 令牌设置
- avatars.md - 数字人使用指南
- voices.md - 声音选择与克隆
- video-generation.md - 视频生成工作流

API 令牌与限制

本技能默认使用免费层级的令牌，但存在以下限制：
- 水印：生成的视频将带有水印。
- 时长限制：视频时长限制为 30 秒。

如需解除限制：
1. 在 hifly.cc 或 flyworks.ai 注册。
2. 在用户设置中获取您的 API 密钥。
3. 设置环境变量：export HIFLY_API_TOKEN="your_token_here"

工具

`scripts/hifly_client.py`

所有操作的主入口点。

使用方法

# 列出可用的公共数字人
python scripts/hifly_client.py list_public_avatars

# 列出可用的公共声音
python scripts/hifly_client.py list_public_voices

# 使用公共数字人创建视频（TTS）
python scripts/hifly_client.py create_video --type tts --text "你好，世界" --avatar "avatar_id_or_alias" --voice "voice_id_or_alias"

# 使用公共数字人创建视频（音频 URL 或文件）
python scripts/hifly_client.py create_video --audio "https://... 或 path/to/audio.mp3" --avatar "avatar_id_or_alias"

# 使用捆绑资源创建说话照片视频
python scripts/hifly_client.py create_talking_photo --image assets/avatar.png --title "Bundled Avatar"

# 使用捆绑资源克隆声音
python scripts/hifly_client.py clone_voice --audio assets/voice.MP3 --title "Bundled Voice"

# 检查生成任务的状态
python scripts/hifly_client.py check_task --id "TASK_ID"

# 管理本地别名（保存在 memory.json 中）
python scripts/hifly_client.py manage_memory add my_avatar "av_12345"
python scripts/hifly_client.py manage_memory list

示例

1. 创建简单的问候视频

# 首先查找一个声音和数字人
python scripts/hifly_client.py list_public_avatars
python scripts/hifly_client.py list_public_voices

# 生成视频
python scripts/hifly_client.py create_video --type tts --text "欢迎使用我们的服务。" --avatar "av_public_01" --voice "voice_public_01"

2. 使用自定义说话照片

# 从图片 URL 创建数字人
python scripts/hifly_client.py create_talking_photo --image "https://mysite.com/photo.jpg" --title "CEO 照片"
# 输出将给出一个数字人 ID，例如 av_custom_99

# 将其保存到记忆库
python scripts/hifly_client.py manage_memory add ceo av_custom_99

# 使用新数字人生成视频
python scripts/hifly_client.py create_video --type tts --text "这是季度报告。" --avatar ceo --voice "voice_public_01"

助手行为指南

在协助用户生成视频时，请遵循以下指南：

必须选择声音

视频生成需要文本和声音。 如果用户提供了文本但未指定声音：

首先检查本地记忆库：运行 manage_memory list 查看用户是否保存了任何声音别名。
询问用户选择：
- “我看到您想用文本‘[text]’创建视频。您希望使用哪种声音？”
- 如果他们有保存的声音：“您保存了以下声音：[列表]。或者您更倾向于使用公共声音？”
- 如果没有保存的声音：“您想使用公共声音，还是先从音频样本克隆您自己的声音？”
协助他们选择：
- 查看公共声音：list_public_voices
- 克隆声音：clone_voice --audio [文件] --title [名称]

完整工作流示例

对于类似 “用我的照片创建一个说‘这是我的 AI 分身’的说话照片视频” 的请求：

询问：“您希望您的 AI 分身使用哪种声音？您可以使用公共声音或克隆您自己的声音。”
如果他们想克隆：协助他们使用 clone_voice。
使用文本和声音创建说话照片：
bash python scripts/hifly_client.py create_talking_photo \ --image user_photo.jpg \ --text "this is my AI twin" \ --voice SELECTED_VOICE_ID \ --title "My AI Twin"

为后续使用保存

在创建数字人或克隆声音后，建议用户保存它们：

python scripts/hifly_client.py manage_memory add my_avatar AVATAR_ID --kind avatar
python scripts/hifly_client.py manage_memory add my_voice VOICE_ID --kind voice

技能包地址：https://github.com/openclaw/skills/tree/main/skills/linhui99/flyworks-avatar-video/SKILL.md

61 次点击 ∙ 0 人收藏

登录后收藏

0 条回复