首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

DocLayNet-v1.2 数据集介绍

数据集简介

DocLayNet-v1.2 是一个用于文档布局分析的大规模数据集，专注于从扫描或数字文档中识别和分割不同的布局元素。

主要用途

训练和评估文档布局分析模型
支持光学字符识别（OCR）后处理
文档结构理解和信息提取

数据类型/模态

图像模态：文档页面图像
文本模态：与图像对应的文本内容及布局标注

规模与统计

总样本数：80,863 行
数据格式：Parquet
支持处理库：Datasets、Dask、ML Croissant、Polars

使用场景

学术研究（文档分析、计算机视觉）
工业应用（自动化文档处理、智能文档管理系统）
机器学习模型训练（特别是多模态模型）

特点

开源可公开访问
专注于真实世界的文档布局复杂性
适用于多模态学习任务

数据集地址：https://huggingface.co/datasets/docling-project/DocLayNet-v1.2

73 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 25 ms

Developed with Cursor