OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  AI4Bharat

ai4bharat/IndicMSMARCO

 
  AI4Bharat  ·  2025-06-03 04:24:23  ·  18 次点击  ·  0 条评论  

数据集简介

IndicMSMARCO 是由 ai4bharat 团队构建的文本数据集,主要用于支持印度语言的信息检索任务。

主要用途

该数据集旨在为印度语言的信息检索系统提供训练和评估资源,帮助开发跨语言搜索、问答系统等应用。

数据类型/模态

  • 模态类型:纯文本
  • 数据格式:Parquet

规模与统计

  • 数据行数:12,999 条
  • 下载量:306 次

使用场景

适用于自然语言处理研究,特别是在多语言信息检索、机器阅读理解、以及针对印度语言的搜索算法开发与评估。

18 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor