数据集简介
该数据集由 AllenAI 发布,是一个用于强化学习(RL)的多模态文本数据集,包含约 7k 个样本(实际行数为 15,360 行)。
主要用途
- 支持强化学习相关的研究与模型训练。
- 适用于多模态任务中文本模态的处理与分析。
数据类型/模态
- 模态类型:文本(text)
- 数据格式:支持 Parquet 和优化版 Parquet 格式,便于高效读取和处理。
规模与统计
- 样本数量:15,360 行
- 下载量:11 次
- 点赞数:2 次
使用场景
- 强化学习算法的训练与评估。
- 多模态学习项目中文本数据的预处理或基准测试。
- 学术研究或实验中的文本数据源。