OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  AI at Meta

facebook/kilt_tasks

 
  AI at Meta  ·  2024-01-04 14:01:11  ·  40 次点击  ·  0 条评论  

KILT Tasks 数据集简介

数据集概述

由 Facebook 发布的 KILT Tasks 是一个大规模、以知识密集型任务为中心的文本数据集。它旨在为自然语言处理模型提供统一的评估基准,特别是针对需要访问和利用外部知识(如维基百科)才能完成的任务。

主要用途

该数据集主要用于评估和训练模型在知识密集型任务上的性能,例如:
* 开放域问答
* 事实验证
* 对话系统
* 实体链接
* 槽位填充

数据类型与模态

  • 模态:纯文本
  • 数据格式:Parquet
  • 规模:包含超过 323 万行数据,体量庞大。

核心特点

  1. 统一基准:将多个经典的知识驱动型 NLP 任务整合到一个统一的框架和知识源(如维基百科快照)下,便于模型进行跨任务评估。
  2. 知识密集型:任务设计强调模型需要检索和理解外部知识,而非仅仅依赖文本模式匹配。
  3. 标准化格式:提供了标准化的输入输出格式,方便研究者使用和比较不同模型。

适用场景

  • 研究评估:作为评估模型在复杂、需要知识的 NLP 任务上能力的基准。
  • 模型训练:可用于训练需要结合检索与推理能力的端到端模型。
  • 多任务学习:适合用于探索模型在多种知识相关任务上的泛化能力。
40 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 17 ms
Developed with Cursor