数据集简介
该数据集由 AllenAI 发布,主要用于自然语言处理(NLP)中的语义解析和逻辑形式生成任务。它专注于将自然语言问题(如“谁是美国第一任总统?”)分解为可执行的逻辑形式或结构化查询。
主要用途
- 训练和评估语义解析模型
- 研究复杂问题的分解与推理过程
- 支持问答系统、对话代理等应用的开发
数据类型/模态
- 模态:纯文本(text)
- 数据内容包含自然语言问题及其对应的结构化逻辑表示
规模与统计
- 总数据量:约 22.8 万行
- 支持格式:Parquet
- 常用处理库:datasets、pandas、mlcroissant、polars
使用场景
- 学术研究(语义解析、逻辑推理)
- 教育工具开发(自动解题、分步推理)
- 智能助手与问答系统构建