CoEdit 数据集简介
概述
CoEdit 是由 Grammarly 发布的一个文本编辑任务数据集,主要用于研究和开发文本修订与编辑相关的模型。
主要用途
- 支持文本编辑、语法修正和写作改进任务的研究
- 可用于训练和评估文本修订模型(如语法检查、风格改写等)
数据类型与模态
- 模态类型:纯文本(text)
- 数据格式:JSON
- 规模:包含 70,783 条数据样本
使用场景
- 自然语言处理中的文本修订任务
- 语法纠错与写作辅助工具的开发
- 文本编辑模型的训练与基准测试
特点
- 由 Grammarly 提供,专注于实际文本编辑场景
- 数据量适中,适用于模型训练与评估
- 开放访问(非私有数据集)