EPFL-LLM 指导原则数据集
数据集简介
这是一个由 EPFL-LLM 团队整理的文本数据集,主要收集了各类指导原则、准则或规范文本。
主要用途
可用于大型语言模型(LLM)的训练、微调或评估,特别是在理解和生成符合特定准则的文本方面。
数据类型/模态
- 模态类型:纯文本
- 数据格式:JSON
- 数据规模:包含 37,970 行数据条目
使用场景
- 模型训练:训练语言模型理解和遵循各类指导原则。
- 基准测试:评估模型在生成符合规范文本方面的能力。
- 规则提取:从文本中自动提取结构化准则或规范。
特点
- 数据集完全开放(非门控访问)。
- 社区认可度较高(截至统计时已获 146 次点赞,607 次下载)。
- 支持多种数据处理库(如 pandas、polars 等)。