数据集简介
MMLBD-C 是一个由 lightonai 创建的中文多模态基准数据集,主要用于评估和开发多模态大语言模型(MLLM)在中文场景下的能力。
主要用途
- 评估多模态大语言模型在中文环境下的性能
- 支持多模态任务的基准测试
- 促进中文多模态AI研究
数据类型与模态
- 主要模态:文本(text)
- 数据格式:JSON
- 语言:中文
数据规模
- 总数据量:1,075 行
- 下载量:156 次
- 社区认可:5 个点赞
使用场景
- 多模态模型训练与微调
- 中文多模态任务基准测试
- 学术研究与模型评估
- 支持使用 datasets、pandas、polars、mlcroissant 等工具库进行数据处理
特点
- 专注于中文多模态任务
- 开放访问(非私有数据集)
- 结构化的JSON格式便于处理
- 适合作为基准数据集使用