数据集简介
FACTS-grounding-public 是由 Google 发布的一个用于事实性基础评估的公开数据集。它旨在帮助评估和提升语言模型在生成内容时的事实准确性。
主要用途
该数据集主要用于测试和评估语言模型(或其他文本生成系统)在生成陈述时,是否能正确引用或“基于”给定的来源事实,即评估模型的“事实性基础”能力。
数据类型与模态
- 模态类型:文本
- 数据格式:CSV
- 内容:数据集包含文本形式的查询、来源事实以及相关的评估信息。
规模与统计
使用场景
- 模型评估:作为基准数据集,用于衡量模型生成文本的事实准确性、可靠性和可验证性。
- 研究开发:适用于自然语言处理、可信人工智能领域的研究,特别是针对减少模型“幻觉”和提升信息真实性的技术开发。