KMMLU-Pro 是一个由 LGAI-EXAONE 发布的知识评估数据集,主要用于测试和评估模型在多个学科领域的专业知识和推理能力。
该数据集的核心功能是作为评估基准,用于衡量模型(尤其是大语言模型)在复杂、专业问题上的理解和解答能力。
适用于: - 大语言模型(LLM)的能力评估与基准测试。 - 研究模型在跨学科知识上的表现。 - 用于学术研究或模型开发的性能验证。