CancerGUIDE 数据集简介
概述
CancerGUIDE 是由微软(Microsoft)发布的一个文本数据集。该数据集旨在为癌症研究领域提供支持,可能包含与癌症指南、诊断或相关信息相关的结构化文本内容。
主要用途
- 辅助癌症相关的信息检索、知识提取或自然语言处理研究。
- 可能用于构建或评估与癌症医疗指南、临床决策支持相关的AI模型。
数据类型与规模
- 模态/类型:纯文本(Text)
- 数据格式:JSON
- 数据规模:包含 316 行数据记录
使用场景
- 医疗 NLP 研究:可用于训练或测试文本分类、命名实体识别、问答系统等模型。
- 知识库构建:作为构建癌症领域专业知识图谱或数据库的原始数据来源之一。
- 临床辅助工具开发:为开发基于文本的癌症诊断或治疗建议辅助工具提供数据基础。