OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Docling

docling-project/DocLayNet

 
  Docling  ·  2023-01-25 17:01:19  ·  18 次点击  ·  0 条评论  

数据集简介

DocLayNet 是一个用于文档布局分析的公开数据集,由 docling-project 团队创建。它专门用于训练和评估模型,以理解和解析复杂文档(如科学论文、报告、表格等)的结构和布局。

主要用途

该数据集主要用于文档智能(Document AI)领域的研究和开发,特别是文档布局分析任务。模型可以学习识别文档中的不同元素,如文本段落、标题、表格、图片、列表、脚注等,并理解它们之间的空间和逻辑关系。

数据类型/模态

  • 模态类型:视觉文档(图像)与结构化标注。
  • 数据内容:数据集包含大量文档页面的图像,以及与之对应的精细标注。标注信息通常以边界框(Bounding Box)和类别标签的形式存在,标明了页面中每个语义区域(如正文、表格、图、标题等)的位置和类型。

规模与统计信息(基于元数据)

  • 下载量:超过 600 次,表明其在社区中有一定的使用度和关注度。
  • 受欢迎程度:获得了 100 多个点赞,反映了研究社区对其质量的认可。

使用场景

  1. 文档布局识别:自动分割和分类扫描文档或数字文档中的不同区域。
  2. 信息抽取:为更高级的文档理解任务(如表格提取、关键信息定位)提供结构基础。
  3. 模型训练与基准测试:作为训练文档布局分析模型(如基于深度学习的检测模型)的标准数据集,并用于公平比较不同模型的性能。
  4. 文档数字化与重构:帮助将非结构化的文档图像转换为结构化的、易于机器处理的数据格式。
18 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 31 ms
Developed with Cursor