ai4bharat/IndicMSMARCO

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

IndicMSMARCO 是由 ai4bharat 团队构建的文本数据集，主要用于支持印度语言的信息检索任务。

主要用途

该数据集旨在为印度语言的信息检索系统提供训练和评估资源，帮助开发跨语言搜索、问答系统等应用。

数据类型/模态

模态类型：纯文本
数据格式：Parquet

规模与统计

数据行数：12,999 条
下载量：306 次

使用场景

适用于自然语言处理研究，特别是在多语言信息检索、机器阅读理解、以及针对印度语言的搜索算法开发与评估。

数据集地址：https://huggingface.co/datasets/ai4bharat/IndicMSMARCO

64 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 11 ms

Developed with Cursor