首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

LLaVA-NeXT-Data 数据集简介

概述

这是一个用于训练和评估多模态大语言模型（特别是LLaVA-NeXT系列模型）的大规模图文对数据集。

主要用途

训练视觉-语言多模态模型，使模型能够理解和关联图像与文本信息。
评估模型在图像描述、视觉问答（VQA）等任务上的性能。

数据类型与模态

模态：图像 (image) 与文本 (text) 双模态。
格式：数据以 Parquet 格式存储，便于高效处理大规模数据。

数据规模

包含约 77.9 万 条数据样本（行）。
每条样本应包含图像及其对应的文本信息（如描述、问题、答案等）。

使用场景

多模态模型研究：为视觉-语言理解与生成任务提供训练和测试数据。
模型基准测试：可作为评估模型多模态能力的标准数据集之一。
教育演示：用于展示或学习多模态数据处理流程。

数据集地址：https://huggingface.co/datasets/lmms-lab/LLaVA-NeXT-Data

69 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 22 ms

Developed with Cursor