UniMed-5M 是一个由 General-Medical-AI 团队发布的通用医学人工智能数据集,旨在为医学领域的自然语言处理任务提供大规模文本数据支持。
该数据集主要用于训练和评估医学领域的语言模型,支持如医学文本理解、信息抽取、问答系统等下游任务。
适用于研究人员和开发者构建或微调面向医疗健康领域的 AI 模型,特别是需要大规模、专业化医学语料进行预训练或指令微调的场景。