该数据集由 AllenAI 发布,是一个包含约 42.2 万条样本的大规模监督微调(SFT)数据集。
用于训练或微调多模态模型,特别是结合文本与表格数据进行指令遵循和任务完成的模型。
适用于开发能够理解和处理混合格式(文本指令+结构化数据)的AI模型,例如: * 基于表格数据生成文本报告或回答。 * 根据自然语言指令查询或操作表格内容。 * 多模态大语言模型(LLM)的监督微调。