简介:这是一个由 NVIDIA 发布的用于音频驱动 3D 面部动画生成的数据集,名为“Claire”版本。该数据集旨在支持音频到面部表情的映射任务。
主要用途:用于训练和评估“音频到面部”(Audio2Face)模型,即根据输入的语音音频,生成对应的、逼真的 3D 面部动画序列。
数据类型/模态:
* 音频:包含语音录音。
* 文本:可能包含与音频对应的转录文本或标注信息。
规模与统计:
* 数据集包含 108 个样本(行)。
使用场景:
* 开发语音驱动的虚拟数字人、虚拟助手或游戏角色的面部动画系统。
* 研究多模态学习,特别是音频与视觉(3D面部)的关联建模。
* 作为基准数据集,用于比较不同 Audio2Face 模型的性能。