首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

该数据集是 Alpaca 数据集的清洗版本，主要用于训练和微调大型语言模型（LLM）。

主要用途

用于指令微调（Instruction Tuning），提升模型遵循人类指令的能力。
可作为高质量的训练数据，帮助模型学习生成符合要求的文本回复。

数据类型与特点

模态：纯文本。
格式：JSON。
规模：包含约 5.2 万条数据样本。
核心特点：数据经过清洗，旨在提供更干净、噪声更少的指令-输出对，以提高模型训练的效果和稳定性。

使用场景

适用于需要构建或优化对话式AI、指令跟随模型的研究人员和开发者，作为基础的指令微调数据集。

数据集地址：https://huggingface.co/datasets/unsloth/alpaca-cleaned

71 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 10 ms

Developed with Cursor