数据集简介
toxic-chat 是一个用于检测和评估聊天机器人中“毒性”或有害内容的对话数据集。
主要用途
- 训练和评估聊天机器人或语言模型,使其能够识别、避免或减少生成有毒、冒犯性或有害的回复。
- 研究对话系统中的安全性和内容过滤机制。
数据类型与模态
- 模态:表格数据、文本
- 格式:CSV
- 内容:包含对话文本,通常涉及用户输入和模型回复,并带有毒性相关的标签或注释。
数据规模
使用场景
- 人工智能安全研究。
- 开发更安全、负责任的对话AI系统。
- 作为基准数据集,用于测试模型在避免生成有害内容方面的性能。