数据集简介
OctoBench 是由 MiniMaxAI 发布的一个评估数据集,主要用于测试和评估多模态 AI 模型(尤其是大型语言模型与视觉模型)的综合能力。
主要用途
- 作为基准测试工具,用于衡量模型在多种任务上的性能。
- 支持对多模态模型进行系统性评估与比较。
数据类型/模态
- 多模态数据(可能包含文本、图像等多种输入形式)。
- 具体模态类型未在元数据中详细列出,但根据名称推测涉及多种数据类型的综合评估。
规模或统计信息
- 下载量:449 次
- 点赞数:19
- 数据集大小或样本数量未在元数据中提供。
使用场景
- 研究人员和开发者可用于测试多模态模型的综合能力。
- 适用于模型性能基准测试、学术研究及模型优化评估。