DocVQA 数据集介绍

数据集简介

DocVQA 是一个面向文档视觉问答（Document Visual Question Answering）任务的数据集。它旨在评估和训练模型在理解文档图像内容的基础上，回答相关自然语言问题的能力。

该数据集主要用于开发和评估文档理解与视觉问答相结合的模型，是文档智能领域的重要基准之一。

适用于以下研究和应用方向：
* 文档视觉问答模型训练与评估。
* 文档图像理解与文本信息提取。
* 多模态机器学习，特别是结合计算机视觉与自然语言处理的任务。

数据集地址：https://huggingface.co/datasets/lmms-lab/DocVQA

67 次点击 ∙ 0 人收藏

登录后收藏

0 条回复