名称: flyworks-avatar-video
描述: 使用 Flyworks(又称 HiFly 飞影数字人)生成数字人视频。可从图片生成说话照片视频,使用公共数字人配合 TTS 合成语音,或通过音频样本克隆声音。
许可证: MIT
compatibility: 需要 Python 3 及网络连接以访问 hfw-api.hifly.cc
本技能允许您使用 Flyworks(又称 HiFly 飞影数字人)生成数字人视频。可用功能包括:
1. 公共数字人视频:使用预置的高仿真数字人,从文本或音频生成视频。
2. 说话照片:从单张图片和文本/音频生成“说话照片”视频。
3. 声音克隆:从音频样本克隆声音,用于 TTS 语音合成。
详细文档请参阅 references/ 文件夹:
- authentication.md - API 令牌设置
- avatars.md - 数字人使用指南
- voices.md - 声音选择与克隆
- video-generation.md - 视频生成工作流
本技能默认使用免费层级的令牌,但存在以下限制:
- 水印:生成的视频将带有水印。
- 时长限制:视频时长限制为 30 秒。
如需解除限制:
1. 在 hifly.cc 或 flyworks.ai 注册。
2. 在 用户设置 中获取您的 API 密钥。
3. 设置环境变量:export HIFLY_API_TOKEN="your_token_here"
scripts/hifly_client.py所有操作的主入口点。
# 列出可用的公共数字人
python scripts/hifly_client.py list_public_avatars
# 列出可用的公共声音
python scripts/hifly_client.py list_public_voices
# 使用公共数字人创建视频(TTS)
python scripts/hifly_client.py create_video --type tts --text "你好,世界" --avatar "avatar_id_or_alias" --voice "voice_id_or_alias"
# 使用公共数字人创建视频(音频 URL 或文件)
python scripts/hifly_client.py create_video --audio "https://... 或 path/to/audio.mp3" --avatar "avatar_id_or_alias"
# 使用捆绑资源创建说话照片视频
python scripts/hifly_client.py create_talking_photo --image assets/avatar.png --title "Bundled Avatar"
# 使用捆绑资源克隆声音
python scripts/hifly_client.py clone_voice --audio assets/voice.MP3 --title "Bundled Voice"
# 检查生成任务的状态
python scripts/hifly_client.py check_task --id "TASK_ID"
# 管理本地别名(保存在 memory.json 中)
python scripts/hifly_client.py manage_memory add my_avatar "av_12345"
python scripts/hifly_client.py manage_memory list
# 首先查找一个声音和数字人
python scripts/hifly_client.py list_public_avatars
python scripts/hifly_client.py list_public_voices
# 生成视频
python scripts/hifly_client.py create_video --type tts --text "欢迎使用我们的服务。" --avatar "av_public_01" --voice "voice_public_01"
# 从图片 URL 创建数字人
python scripts/hifly_client.py create_talking_photo --image "https://mysite.com/photo.jpg" --title "CEO 照片"
# 输出将给出一个数字人 ID,例如 av_custom_99
# 将其保存到记忆库
python scripts/hifly_client.py manage_memory add ceo av_custom_99
# 使用新数字人生成视频
python scripts/hifly_client.py create_video --type tts --text "这是季度报告。" --avatar ceo --voice "voice_public_01"
在协助用户生成视频时,请遵循以下指南:
视频生成需要文本和声音。 如果用户提供了文本但未指定声音:
manage_memory list 查看用户是否保存了任何声音别名。询问用户选择:
协助他们选择:
list_public_voicesclone_voice --audio [文件] --title [名称]对于类似 “用我的照片创建一个说‘这是我的 AI 分身’的说话照片视频” 的请求:
clone_voice。bash
python scripts/hifly_client.py create_talking_photo \
--image user_photo.jpg \
--text "this is my AI twin" \
--voice SELECTED_VOICE_ID \
--title "My AI Twin"在创建数字人或克隆声音后,建议用户保存它们:
python scripts/hifly_client.py manage_memory add my_avatar AVATAR_ID --kind avatar
python scripts/hifly_client.py manage_memory add my_voice VOICE_ID --kind voice