MS MARCO 是由微软发布的大规模文本数据集,主要用于信息检索和问答任务的研究与开发。
该数据集旨在为机器阅读理解、开放域问答和文档检索等任务提供训练和评估基准。
适用于自然语言处理领域的研究人员和开发者,特别是从事以下方向的工作: - 文档检索系统 - 机器阅读理解模型 - 开放域问答系统 - 信息检索算法评估