google/jigsaw_toxicity_pred

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

该数据集由 Google 发布，主要用于训练和评估模型以预测文本的毒性（toxicity）。它旨在帮助开发更安全的在线内容审核工具，识别和减少网络上的有害言论。

主要用途

毒性内容检测：训练模型自动识别评论或文本中的有毒、攻击性或不当内容。
内容安全研究：支持研究在线社区的言论安全，改进内容过滤系统。
模型基准测试：作为自然语言处理（NLP）任务中文本分类的基准数据集。

数据类型/模态

模态：文本（自然语言）
内容：包含用户评论或文本片段，通常带有毒性程度的标签（如毒性评分或分类标签）。

规模与统计信息

下载量：455 次
点赞数：32
更新日期：2024年1月18日
访问权限：公开（非私有，无需特殊权限访问）

使用场景

机器学习训练：适用于监督学习任务，训练文本分类模型。
社会计算研究：分析网络言论模式，研究毒性内容的特征和影响。
实际应用：集成到社交媒体平台、论坛或聊天工具中，实现实时内容审核。

数据集地址：https://huggingface.co/datasets/google/jigsaw_toxicity_pred

63 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 19 ms

Developed with Cursor