Proof-Pile-2 是由 EleutherAI 发布的一个开源数据集,主要用于数学推理和代码生成任务的训练。
该数据集旨在提升大型语言模型在数学证明、逻辑推理和编程代码生成方面的能力。
数据集包含文本数据,具体融合了数学证明、科学论文和代码等多种类型的文本内容。
适用于训练或微调专注于数学问题求解、定理证明和辅助编程的AI模型。