OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  AI at Meta

facebook/anli

 
  AI at Meta  ·  2023-12-21 15:34:02  ·  23 次点击  ·  0 条评论  

ANLI 数据集简介

数据集概述

ANLI(Adversarial Natural Language Inference)是由 Facebook(现 Meta)发布的一个对抗性自然语言推理数据集。它旨在测试和提升模型在对抗性样本上的推理能力。

主要用途

  • 自然语言推理(NLI):判断一个假设(hypothesis)与一个前提(premise)之间的关系(蕴含、矛盾或中立)。
  • 模型鲁棒性评估:专门设计用于挑战和评估模型在对抗性、难以处理的样本上的性能。
  • 对抗训练:可用于训练模型以提高其对对抗性攻击的抵抗力。

数据类型与模态

  • 模态:纯文本(text)
  • 任务类型:文本分类/自然语言推理
  • 标签:蕴含(entailment)、矛盾(contradiction)、中立(neutral)

数据规模与统计

  • 总数据量:约 16.9 万条样本
  • 下载量:超过 1 万次
  • 社区认可:获得 45 次点赞

使用场景

  1. 研究与开发:适用于自然语言处理(NLP)领域的研究人员,特别是专注于模型鲁棒性、对抗性学习和自然语言推理的团队。
  2. 基准测试:可作为衡量模型在复杂、对抗性语境下推理能力的基准数据集。
  3. 模型训练:用于训练更稳健的NLI模型,或作为现有模型的补充训练数据。

核心特点

  • 对抗性构建:数据通过多轮、迭代的对抗性过程收集,其中模型在每一轮的困难样本上被挑战,从而创建出逐步更具挑战性的数据。
  • 难度分级:数据通常分为多轮(Rounds),难度逐轮增加。
  • 开源可用:数据集非封闭(gated: false),可公开访问和使用。
23 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 14 ms
Developed with Cursor