数据集简介
该数据集由 sentence-transformers 提供,主要用于评估句子嵌入模型在技术问答社区(Ask Ubuntu)上的语义检索性能。
主要用途
- 语义搜索评估:用于测试模型在技术问答场景下,对查询和候选答案进行语义匹配的能力。
- 句子嵌入模型基准测试:作为评估句子表示模型(如 Sentence-BERT)在特定领域检索任务中的标准数据集。
数据类型/模态
- 模态:纯文本(text)
- 数据内容为来自 Ask Ubuntu 社区的问答对,包含查询(问题)和相关的答案候选。
规模与统计
- 数据量:共 13,124 行
- 下载量:53 次
- 点赞数:1
使用场景
适用于自然语言处理(NLP)研究,特别是:
- 语义相似度计算
- 问答系统(QA)的检索模块评估
- 领域自适应句子表示学习