首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

EUConst 数据集简介

概述

由赫尔辛基大学自然语言处理团队（Helsinki-NLP）发布的欧盟宪法相关文本数据集。

主要用途

适用于法律文本分析、多语言自然语言处理研究、欧盟法律文件翻译与对齐等任务。

数据类型与模态

模态类型：纯文本（text）
数据格式：Parquet

规模与统计

数据行数：约 206.5 万行
下载量：超过 7700 次

使用场景

法律文本挖掘：分析欧盟宪法及相关法律文档的语言特征。
多语言 NLP：支持跨语言模型训练或评估，适用于欧盟官方语言。
机器翻译：可用于法律领域特定术语的翻译对齐研究。
学术研究：为法学、政治学、计算语言学等跨学科研究提供结构化文本数据。

数据集地址：https://huggingface.co/datasets/Helsinki-NLP/euconst

66 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 21 ms

Developed with Cursor