这是一个由赫尔辛基大学自然语言处理团队(Helsinki-NLP)发布的文本数据集,属于 OPUS 多语言语料库项目的一部分。该数据集基于芬兰的“Infopankki”信息服务平台内容构建。
主要用于机器翻译模型的训练与评估,特别是涉及芬兰语与其他语言之间的翻译任务。
datasets
pandas
polars
适用于: * 训练或微调芬兰语相关的神经机器翻译模型。 * 多语言自然语言处理研究。 * 作为高质量、领域特定的双语语料资源。