数据集简介
Skywork/Nano-banana-150k 是由 Skywork 发布的一个数据集,包含约 15 万条样本,适用于模型训练或微调任务。
主要用途
该数据集主要用于语言模型的训练、微调或相关研究,尤其适合需要大规模文本数据的场景。
数据类型/模态
- 数据类型:文本数据
- 模态:纯文本(无图像、音频等多模态内容)
规模与统计信息
- 样本数量:约 15 万条
- 下载量:103 次
- 点赞数:6 次
- 访问权限:公开(无需特殊授权)
使用场景
- 语言模型预训练或微调
- 文本生成、分类等 NLP 任务
- 学术研究或实验性项目