VidMuse-V2M 是一个由香港科技大学音频实验室(HKUSTAudio)发布的音视频数据集,主要用于视频到音乐的生成任务。
该数据集旨在支持视频与音乐之间跨模态关联的研究,特别是用于训练和评估视频驱动音乐生成的模型。
audiofolder
适用于计算机视觉、音频处理及多模态机器学习领域的研究,例如: * 为给定视频片段自动生成匹配的背景音乐。 * 研究视频内容(如场景、动作、情绪)与音乐特征(如节奏、旋律、风格)之间的对应关系。