数据集简介
SPEED-Bench 是由 NVIDIA 发布的一个基准测试数据集,主要用于评估和基准测试目的。它包含超过 8500 条数据记录,以文档和文本模态为主。
主要用途
该数据集旨在为相关任务提供标准化的评估基准,适用于模型性能对比、算法测试和研究验证等场景。
数据类型/模态
- 模态:文档(document)、文本(text)
- 数据格式:支持 Parquet 和优化版 Parquet 格式
- 处理库:兼容 datasets、pandas、polars、mlcroissant 等常用数据处理库
规模与统计
- 数据量:8,560 行记录
- 下载量:443 次(截至统计时)
- 公开状态:完全公开(非门控、非私有)
使用场景
- 模型基准测试与性能评估
- 文本处理与文档分析任务的研究
- 算法开发与验证