数据集简介
这是一个由 LocoreMind 创建的中文推理数据集,旨在训练或评估大语言模型(如 Qwen3.5-27B)的推理能力。数据集聚焦于通过命令行交互(CLI)形式呈现的复杂推理任务。
主要用途
- 模型训练与微调:专门用于提升语言模型在复杂、多步推理任务上的性能。
- 推理能力评估:可作为基准测试集,用于衡量模型解决逻辑推理、问题分解和分步思考的能力。
数据类型与模态
- 模态:纯文本(Text)
- 数据格式:以命令行交互(CLI)形式组织的问答对或推理链,模拟真实的问题解决与思考过程。
规模与统计
- 数据量:包含 3,632 条样本。
- 存储格式:支持 Parquet 和 Optimized-Parquet 格式,便于高效加载和处理。
使用场景
适用于需要增强模型逻辑推理、分步问题解决和指令跟随能力的研究与开发项目,特别是在模拟终端命令交互和复杂任务拆解的语境下。