HKUSTAudio/VidMuse-V2M-Dataset

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

数据集简介

VidMuse-V2M 是一个由香港科技大学音频实验室（HKUSTAudio）发布的音视频数据集，主要用于视频到音乐的生成任务。

该数据集旨在支持视频与音乐之间跨模态关联的研究，特别是用于训练和评估视频驱动音乐生成的模型。

适用于计算机视觉、音频处理及多模态机器学习领域的研究，例如：
* 为给定视频片段自动生成匹配的背景音乐。
* 研究视频内容（如场景、动作、情绪）与音乐特征（如节奏、旋律、风格）之间的对应关系。

71 次点击 ∙ 0 人收藏

登录后收藏

0 条回复