UGround-V1-Data 是一个由 osunlp 发布的多模态数据集,主要用于支持与文本理解和结构化数据相关的机器学习任务。
该数据集旨在为需要结合文本与表格数据进行模型训练或评估的研究与应用提供支持,例如信息抽取、数据到文本生成、多模态理解等任务。
适用于开发或测试能够同时处理结构化表格与非结构化文本的模型,例如: * 从文本中提取信息并填充到表格。 * 根据表格数据生成描述性文本。 * 进行跨模态的检索或问答任务。