首页
注册
登录
OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请
登录
说明
条目同步来自
Hugging Face
主要方便针对性讨论。
OA0
›
数据集
›
Zyphra
Zyphra/Zyda
Zyphra
·
2024-06-19 01:06:43
· 16 次点击 ·
0
条评论
Zyda 数据集简介
概述
Zyda 是一个由 Zyphra 发布的大规模文本数据集,主要用于训练和评估大型语言模型。
主要特性
数据类型
:纯文本
数据规模
:包含超过 43.5 亿行文本数据
访问权限
:公开可用(非私有、非门控)
适用场景
大型语言模型的预训练
文本生成模型的微调
自然语言处理研究
需要海量文本数据的机器学习项目
数据集地址:
https://huggingface.co/datasets/Zyphra/Zyda
16 次点击 ∙ 0 人收藏
登录后收藏
0 条回复
关于
·
帮助
·
PING
·
隐私政策
·
服务条款
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 22 ms
Developed with
Cursor