OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  OpenOrca

Open-Orca/SlimOrca

 
  OpenOrca  ·  2023-10-12 06:43:59  ·  12 次点击  ·  0 条评论  

数据集简介

Open-Orca/SlimOrca 是一个由 Open-Orca 团队发布的大型文本数据集,主要用于训练和评估大型语言模型(LLMs)。

主要用途

该数据集旨在为语言模型的指令微调(Instruction Tuning)和对话能力优化提供高质量的训练语料。

数据类型/模态

  • 模态类型:纯文本(Text)
  • 数据格式:JSON

规模与统计信息

  • 数据量:包含约 51.8 万行数据
  • 下载量:超过 3000 次
  • 社区评价:获得 290 个点赞

使用场景

适用于:
- 大型语言模型的指令跟随训练
- 对话系统与聊天机器人的开发
- 自然语言处理研究中的模型微调实验

特点说明

数据集经过精简处理(Slim),在保证数据质量的同时优化了规模,便于研究人员和开发者高效使用。数据以 JSON 格式存储,支持通过主流数据处理库(如 pandas、polars)直接加载。

12 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor