ChartVerse-RL-40K 是一个包含 4 万条数据样本的多模态数据集,由 OpenDataLab 发布。它主要用于与图表相关的强化学习(RL)任务。
该数据集旨在支持图表理解和生成领域的强化学习模型训练与研究,例如训练智能体学习如何解读图表信息或生成合理的图表描述。
数据集包含两种模态的数据:
* 图像(Image):图表图像。
* 文本(Text):与图表相关的文本信息(可能包括描述、标签、问题等)。
适用于需要结合视觉(图表)和文本信息进行决策或生成的强化学习场景,例如:
* 图表问答(Chart QA)智能体训练。
* 自动化图表描述生成。
* 图表数据提取与分析任务。