OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  General Medical AI

General-Medical-AI/UniMed-5M

 
  General Medical AI  ·  2026-02-05 13:29:39  ·  26 次点击  ·  0 条评论  

数据集简介

UniMed-5M 是一个由 General-Medical-AI 团队发布的通用医学人工智能数据集,旨在为医学领域的自然语言处理任务提供大规模文本数据支持。

主要用途

该数据集主要用于训练和评估医学领域的语言模型,支持如医学文本理解、信息抽取、问答系统等下游任务。

数据类型与模态

  • 模态类型:纯文本(Text)
  • 数据格式:Parquet

规模与统计信息

  • 数据量:包含超过 30 万行文本数据(306,913 行)。
  • 下载量:36 次。
  • 访问权限:公开(非门控),可直接下载使用。

使用场景

适用于研究人员和开发者构建或微调面向医疗健康领域的 AI 模型,特别是需要大规模、专业化医学语料进行预训练或指令微调的场景。

26 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 16 ms
Developed with Cursor