这是一个葡萄牙语维基百科文本数据集,由TucanoBR整理提供,包含超过110万条文本条目。
适用于需要葡萄牙语文本资源的各类NLP项目,包括但不限于: - 文本分类 - 机器翻译 - 信息检索 - 语言建模预训练