数据集简介
该数据集由微软(Microsoft)发布,主要用于中英(ZH-EN)翻译任务,旨在提供高质量的翻译语料,以支持机器翻译模型的研究与开发。
主要用途
- 训练和评估中英双向机器翻译模型。
- 作为基准数据集,用于比较不同翻译系统的性能。
数据类型/模态
- 文本数据:包含中文和英文的平行句对。
- 模态:纯文本。
规模与统计信息
- 下载量:36次(截至元数据记录时)。
- 点赞数:2次。
- 更新日期:2024年1月18日。
- 访问权限:公开(非私有、非门控)。
使用场景
- 学术研究:用于机器翻译、自然语言处理领域的实验。
- 工业应用:可作为构建或优化中英翻译系统的数据资源。
- 模型评估:提供标准语料,用于测试翻译模型的准确性和流畅度。