lm-provers/ProofBench

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

ProofBench 是一个用于评估语言模型在形式化证明生成方面能力的基准数据集。

主要用途

该数据集旨在测试和比较不同语言模型在数学定理证明任务上的性能。

数据类型/模态

模态类型：纯文本
数据格式：Parquet

规模与统计

数据量：包含 290 条样本
下载量：108 次
社区反馈：获得 3 次点赞

使用场景

适用于研究语言模型在形式逻辑、自动定理证明、数学推理等领域的应用，可作为模型能力评估的基准工具。

数据集地址：https://huggingface.co/datasets/lm-provers/ProofBench

60 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 12 ms

Developed with Cursor