PatronusAI/trace-dataset

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

由 PatronusAI 发布的 TRACE 数据集，旨在用于评估大型语言模型（LLM）在遵循复杂指令方面的能力，特别是针对“拒绝回答”或“安全护栏”场景的测试。

主要用途

模型安全评估：测试 LLM 在面对不当、有害或越界请求时，能否正确拒绝回答。
指令遵循测试：评估模型对复杂、多步骤指令的理解与执行能力。
基准测试：为模型的安全性和可靠性提供一个标准化的评估基准。

数据类型与模态

模态：纯文本（Text）
数据格式：包含问题/指令以及期望的模型响应（尤其是“拒绝回答”类响应）。

规模与统计

数据量：517 行样本
格式：提供 Parquet 及优化后的 Parquet 格式，便于使用 datasets、pandas、polars 等库进行处理。

使用场景

AI 安全研究：研究人员和开发者可用其量化评估 LLM 的安全边界。
模型开发与审计：在部署前测试模型对敏感或违规请求的应对策略。
学术基准：作为比较不同模型在指令遵循与安全拒绝方面性能的数据集。

数据集地址：https://huggingface.co/datasets/PatronusAI/trace-dataset

72 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 15 ms

Developed with Cursor