首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

AceMath-RewardBench 数据集简介

概述

这是一个由 NVIDIA 发布的文本数据集，主要用于评估和训练数学推理相关的奖励模型（Reward Model）。

主要用途

用于奖励模型的训练与评估。
专注于数学推理任务的性能基准测试。

数据类型与模态

模态：纯文本（text）
格式：JSON
规模：包含 18,518 行数据

核心特点

数据集专注于数学领域，旨在提升模型在数学问题上的推理和判断能力。
作为基准测试集，可用于衡量奖励模型在数学任务上的表现。
数据以 JSON 格式存储，便于程序化处理和使用。

数据集地址：https://huggingface.co/datasets/nvidia/AceMath-RewardBench

66 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 12 ms

Developed with Cursor