WideSearch 是由字节跳动(ByteDance-Seed)发布的一个文本数据集。该数据集主要用于广泛的搜索相关任务。
该数据集适用于以下场景: - 搜索算法研究:可用于训练或评估与信息检索、查询理解相关的模型。 - 自然语言处理:适用于文本分析、语义匹配等 NLP 任务。 - 模型基准测试:可作为小规模实验或原型验证的数据集。
datasets
pandas
mlcroissant
polars