OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  ByteDance Seed

ByteDance-Seed/WideSearch

 
  ByteDance Seed  ·  2025-09-08 03:12:40  ·  15 次点击  ·  0 条评论  

数据集简介

WideSearch 是由字节跳动(ByteDance-Seed)发布的一个文本数据集。该数据集主要用于广泛的搜索相关任务。

主要特性

  • 数据类型:纯文本数据。
  • 数据格式:JSON 格式。
  • 数据规模:包含 200 条数据样本。
  • 访问权限:公开,无需特殊申请即可下载。

主要用途与场景

该数据集适用于以下场景:
- 搜索算法研究:可用于训练或评估与信息检索、查询理解相关的模型。
- 自然语言处理:适用于文本分析、语义匹配等 NLP 任务。
- 模型基准测试:可作为小规模实验或原型验证的数据集。

其他信息

  • 该数据集在社区中已获得超过 5000 次下载和 32 次点赞,具有一定的关注度。
  • 支持使用 datasetspandasmlcroissantpolars 等主流数据处理库进行加载和分析。
15 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor