nvidia/Nemotron-VLM-Dataset-v2

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

该数据集由 NVIDIA 发布，旨在为视觉语言模型（VLM）的训练提供高质量的文本数据支持。它是 Nemotron 项目的一部分，专注于构建大规模、多样化的训练语料。

主要用途

用于训练和微调视觉语言模型，特别是需要强大文本理解与生成能力的多模态模型。

数据类型/模态

模态：纯文本
数据格式：JSON
数据规模：包含约 458 万条文本样本

数据特点

大规模：数据量达数百万级别，适合大规模模型预训练。
高质量：由 NVIDIA 精心构建，旨在提供适用于先进 VLM 训练的优质文本语料。
易用性：数据集非加密（gated: false），支持通过主流数据处理库（如 datasets, pandas）直接访问和使用。

使用场景

视觉语言模型的预训练与指令微调。
多模态模型研究中文本分支的训练数据。
作为构建或评估文本-视觉对齐能力的基准数据源之一。

数据集地址：https://huggingface.co/datasets/nvidia/Nemotron-VLM-Dataset-v2

66 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 13 ms

Developed with Cursor