OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  LMMs-Lab

lmms-lab/LLaVA-NeXT-Data

 
  LMMs-Lab  ·  2024-08-30 05:24:23  ·  22 次点击  ·  0 条评论  

LLaVA-NeXT-Data 数据集简介

概述

这是一个用于训练和评估多模态大语言模型(特别是LLaVA-NeXT系列模型)的大规模图文对数据集。

主要用途

  • 训练视觉-语言多模态模型,使模型能够理解和关联图像与文本信息。
  • 评估模型在图像描述、视觉问答(VQA)等任务上的性能。

数据类型与模态

  • 模态:图像 (image) 与文本 (text) 双模态。
  • 格式:数据以 Parquet 格式存储,便于高效处理大规模数据。

数据规模

  • 包含约 77.9 万 条数据样本(行)。
  • 每条样本应包含图像及其对应的文本信息(如描述、问题、答案等)。

使用场景

  • 多模态模型研究:为视觉-语言理解与生成任务提供训练和测试数据。
  • 模型基准测试:可作为评估模型多模态能力的标准数据集之一。
  • 教育演示:用于展示或学习多模态数据处理流程。
22 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 48 ms
Developed with Cursor