NVIDIA Nemotron-PII 是一个由 NVIDIA 发布的文本数据集,主要用于训练和评估大型语言模型(LLM)。该数据集的核心功能是处理个人身份信息(PII),旨在帮助模型学习识别、处理或保护敏感的个人数据。
适用于自然语言处理(NLP)领域的研究人员和开发者,特别是那些专注于数据隐私、文本匿名化、合规性检查以及需要模型理解敏感信息上下文的应用开发。