数据集简介
Helsinki-NLP/giga_fren 是一个由赫尔辛基大学自然语言处理团队(Helsinki-NLP)发布的公开数据集,主要用于机器翻译任务。
主要用途
该数据集的核心用途是训练和评估英语与法语之间的机器翻译模型。
数据类型/模态
- 模态类型:文本
- 语言对:英语 ↔ 法语
- 数据格式:平行语料(句子对齐的英法双语文本)
规模与统计
- 下载量:30次
- 点赞数:4次
- 更新日期:2024年1月18日
- 访问权限:公开(无需特殊许可)
使用场景
- 机器翻译模型(如神经机器翻译)的训练与微调
- 多语言自然语言处理研究的基准数据
- 语言学习或跨语言信息检索的语料资源