数据集简介
II-Medical-Reasoning-SFT 是一个用于医疗推理任务的大规模指令微调数据集,由 Intelligent-Internet 团队发布。该数据集旨在通过监督式微调(SFT)提升模型在复杂医疗场景下的推理能力。
主要用途
- 医疗问答与诊断推理:训练模型理解和回答医学相关问题,模拟临床推理过程。
- 指令微调:作为高质量指令数据,用于对齐医疗领域大语言模型的输出。
- 研究支持:为医疗人工智能研究提供结构化的推理数据。
数据类型/模态
- 模态:纯文本(text)
- 格式:Parquet
- 内容:包含医疗领域的问答对或指令-响应对,涉及诊断、治疗建议、病理分析等推理任务。
规模与统计
- 数据量:约 219.8 万行(样本)
- 下载量:733 次
- 点赞数:49
使用场景
- 训练或微调医疗领域的专用语言模型(如临床助手、医学教育工具)。
- 构建需要深度推理的医疗对话系统或咨询平台。
- 评估模型在医疗知识理解和逻辑推理方面的性能。