Nemotron-CC-Math-v1 是由 NVIDIA 发布的数学相关文本数据集,旨在为大型语言模型提供高质量的数学训练语料。
该数据集主要用于训练和评估语言模型在数学领域的理解和生成能力,可应用于数学问题求解、数学推理、代码生成(与数学计算相关)等任务。
适用于需要增强数学能力的大语言模型(LLM)的预训练或指令微调,是构建专业数学AI助手或通用模型数学模块的重要资源。