sensenova/ConsistCompose3M

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

ConsistCompose3M 是由 SenseNova 发布的一个大规模图文对数据集，主要用于支持图像生成和跨模态理解任务。

主要用途

该数据集旨在为训练和评估多模态模型（特别是文生图模型）提供高质量的图文配对数据，以提升模型在生成内容一致性方面的能力。

数据类型/模态

模态：图像 (Image) 和文本 (Text)
格式：WebDataset 格式，便于高效的大规模数据流式处理。

规模与统计

数据量：包含超过 1130 万条图文对样本。
下载量：7 次
点赞数：4 次

使用场景

适用于训练和微调扩散模型、视觉-语言模型 (VLM) 等，尤其关注于提升模型根据文本描述生成连贯、一致图像的能力。

数据集地址：https://huggingface.co/datasets/sensenova/ConsistCompose3M

69 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 26 ms

Developed with Cursor