数据集简介
该数据集由Helsinki-NLP提供,是一个大规模文本平行语料库,主要用于机器翻译任务。
主要用途
- 机器翻译:为训练和评估机器翻译模型提供双语文本数据。
- 语言学研究:支持巴斯克语(或其他相关语言)的语言分析和研究。
数据类型/模态
- 模态:纯文本(text)
- 格式:Parquet格式
- 数据特性:平行语料(双语对齐的句子对)
规模与统计
- 数据量:包含约64.2万行文本数据
- 下载量:75次
- 点赞数:2次
使用场景
适用于需要巴斯克语与其他语言之间翻译的研究者、开发者,可用于构建或优化神经机器翻译系统。