首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

OA0 › 数据集 › PleIAs

PleIAs/common_corpus

PleIAs · 2026-02-19 13:13:01 · 62 次点击 · 0 条评论

表格处理文本处理

数据集简介

PleIAs/common_corpus 是一个由 PleIAs 创建的开源文本与表格混合数据集，主要用于自然语言处理和机器学习任务。

主要用途

支持文本分析、数据挖掘和模型训练。
适用于构建或微调语言模型、文本分类、信息提取等任务。

数据类型/模态

模态类型：文本（text）与表格（tabular）数据混合。
数据格式：以 Parquet 格式存储，支持高效的数据读取和处理。

规模与统计信息

数据量：包含 69,907 行数据。
受欢迎程度：下载量超过 10 万次，获得 382 个点赞，表明其被社区广泛使用和认可。

使用场景

适用于研究人员和开发者进行文本数据处理、模型预训练或下游任务实验。
可用于学术研究、工业项目或教育目的中的数据分析和机器学习应用。

数据集地址：https://huggingface.co/datasets/PleIAs/common_corpus

62 次点击 ∙ 0 人收藏

登录后收藏

表格处理文本处理

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 11 ms

Developed with Cursor