该数据集由 Salesforce 发布,是一个用于评估模型在常识推理任务上表现的基准数据集。
主要用于测试和评估人工智能模型在常识推理方面的能力,特别是针对多词表达(Multi-Word Expressions)的理解和推理。
文本数据,包含常识推理相关的问答对或任务。
适用于自然语言处理研究,特别是常识推理、问答系统和语言理解模型的开发与评估。