OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  flyworks-video:使用 Flyworks 技术生成的 AI 虚拟人视频工具视频工具

flyworks-video:使用 Flyworks 技术生成的 AI 虚拟人视频工具视频工具

 
  phishing ·  2026-02-25 14:57:23 · 2 次点击  · 0 条评论  

名称: flyworks-avatar-video
描述: 使用 Flyworks(又称 HiFly 飞影数字人)生成数字人视频。可从图片生成说话照片视频,使用公共数字人配合 TTS 合成语音,或通过音频样本克隆声音。
许可证: MIT
compatibility: 需要 Python 3 及网络连接以访问 hfw-api.hifly.cc


数字人视频生成技能

本技能允许您使用 Flyworks(又称 HiFly 飞影数字人)生成数字人视频。可用功能包括:
1. 公共数字人视频:使用预置的高仿真数字人,从文本或音频生成视频。
2. 说话照片:从单张图片和文本/音频生成“说话照片”视频。
3. 声音克隆:从音频样本克隆声音,用于 TTS 语音合成。

详细文档请参阅 references/ 文件夹:
- authentication.md - API 令牌设置
- avatars.md - 数字人使用指南
- voices.md - 声音选择与克隆
- video-generation.md - 视频生成工作流

API 令牌与限制

本技能默认使用免费层级的令牌,但存在以下限制:
- 水印:生成的视频将带有水印。
- 时长限制:视频时长限制为 30 秒。

如需解除限制:
1. 在 hifly.ccflyworks.ai 注册。
2. 在 用户设置 中获取您的 API 密钥。
3. 设置环境变量:export HIFLY_API_TOKEN="your_token_here"

工具

scripts/hifly_client.py

所有操作的主入口点。

使用方法

# 列出可用的公共数字人
python scripts/hifly_client.py list_public_avatars

# 列出可用的公共声音
python scripts/hifly_client.py list_public_voices

# 使用公共数字人创建视频(TTS)
python scripts/hifly_client.py create_video --type tts --text "你好,世界" --avatar "avatar_id_or_alias" --voice "voice_id_or_alias"

# 使用公共数字人创建视频(音频 URL 或文件)
python scripts/hifly_client.py create_video --audio "https://... 或 path/to/audio.mp3" --avatar "avatar_id_or_alias"

# 使用捆绑资源创建说话照片视频
python scripts/hifly_client.py create_talking_photo --image assets/avatar.png --title "Bundled Avatar"

# 使用捆绑资源克隆声音
python scripts/hifly_client.py clone_voice --audio assets/voice.MP3 --title "Bundled Voice"

# 检查生成任务的状态
python scripts/hifly_client.py check_task --id "TASK_ID"

# 管理本地别名(保存在 memory.json 中)
python scripts/hifly_client.py manage_memory add my_avatar "av_12345"
python scripts/hifly_client.py manage_memory list

示例

1. 创建简单的问候视频

# 首先查找一个声音和数字人
python scripts/hifly_client.py list_public_avatars
python scripts/hifly_client.py list_public_voices

# 生成视频
python scripts/hifly_client.py create_video --type tts --text "欢迎使用我们的服务。" --avatar "av_public_01" --voice "voice_public_01"

2. 使用自定义说话照片

# 从图片 URL 创建数字人
python scripts/hifly_client.py create_talking_photo --image "https://mysite.com/photo.jpg" --title "CEO 照片"
# 输出将给出一个数字人 ID,例如 av_custom_99

# 将其保存到记忆库
python scripts/hifly_client.py manage_memory add ceo av_custom_99

# 使用新数字人生成视频
python scripts/hifly_client.py create_video --type tts --text "这是季度报告。" --avatar ceo --voice "voice_public_01"

助手行为指南

在协助用户生成视频时,请遵循以下指南:

必须选择声音

视频生成需要文本和声音。 如果用户提供了文本但未指定声音:

  1. 首先检查本地记忆库:运行 manage_memory list 查看用户是否保存了任何声音别名。
  2. 询问用户选择

    • “我看到您想用文本‘[text]’创建视频。您希望使用哪种声音?”
    • 如果他们有保存的声音:“您保存了以下声音:[列表]。或者您更倾向于使用公共声音?”
    • 如果没有保存的声音:“您想使用公共声音,还是先从音频样本克隆您自己的声音?”
  3. 协助他们选择

    • 查看公共声音:list_public_voices
    • 克隆声音:clone_voice --audio [文件] --title [名称]

完整工作流示例

对于类似 “用我的照片创建一个说‘这是我的 AI 分身’的说话照片视频” 的请求:

  1. 询问:“您希望您的 AI 分身使用哪种声音?您可以使用公共声音或克隆您自己的声音。”
  2. 如果他们想克隆:协助他们使用 clone_voice
  3. 使用文本和声音创建说话照片:
    bash python scripts/hifly_client.py create_talking_photo \ --image user_photo.jpg \ --text "this is my AI twin" \ --voice SELECTED_VOICE_ID \ --title "My AI Twin"

为后续使用保存

在创建数字人或克隆声音后,建议用户保存它们:

python scripts/hifly_client.py manage_memory add my_avatar AVATAR_ID --kind avatar
python scripts/hifly_client.py manage_memory add my_voice VOICE_ID --kind voice
2 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor