首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

Real Toxicity Prompts 数据集简介

数据集概述

由 AllenAI 发布的数据集，旨在研究和检测语言模型生成内容中的毒性（有害、冒犯性）问题。数据集基于真实网络文本构建，用于评估模型生成安全性的基准工具。

主要用途

评估语言模型生成文本的毒性风险
训练和测试内容安全过滤系统
研究语言模型偏见与有害内容生成机制

数据类型与模态

模态类型：表格数据、文本数据
数据格式：JSON
数据内容：包含文本提示及相关的毒性标注信息

数据规模

总数据量：99,442 行记录
下载量：7,941 次
社区认可度：113 次点赞

使用场景

适用于自然语言处理安全研究、内容审核算法开发、语言模型伦理评估等领域的研究人员和开发者。

数据集地址：https://huggingface.co/datasets/allenai/real-toxicity-prompts

38 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 32 ms

Developed with Cursor