Helsinki-NLP/opus

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

数据集简介

Helsinki-NLP/opus_memat 是一个由赫尔辛基大学自然语言处理团队（Helsinki-NLP）发布的文本数据集，主要用于机器翻译相关任务。

该数据集旨在支持机器翻译模型的研究与开发，特别是针对多语言翻译场景。

适用于训练或评估机器翻译模型，尤其适合需要处理大规模平行语料的研究者或开发者。数据集以高效的 Parquet 格式存储，便于使用常见的数据处理库（如 Pandas、Polars）进行加载和分析。

70 次点击 ∙ 0 人收藏

登录后收藏

0 条回复