nvidia/Audio2Face-3D-Dataset-v1.0.0-claire

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

NVIDIA Audio2Face 3D 数据集 (Claire)

简介：这是一个由 NVIDIA 发布的用于音频驱动 3D 面部动画生成的数据集，名为“Claire”版本。该数据集旨在支持音频到面部表情的映射任务。

主要用途：用于训练和评估“音频到面部”（Audio2Face）模型，即根据输入的语音音频，生成对应的、逼真的 3D 面部动画序列。

数据类型/模态：
* 音频：包含语音录音。
* 文本：可能包含与音频对应的转录文本或标注信息。

规模与统计：
* 数据集包含 108 个样本（行）。

使用场景：
* 开发语音驱动的虚拟数字人、虚拟助手或游戏角色的面部动画系统。
* 研究多模态学习，特别是音频与视觉（3D面部）的关联建模。
* 作为基准数据集，用于比较不同 Audio2Face 模型的性能。

65 次点击 ∙ 0 人收藏

登录后收藏

0 条回复