OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  OpenOrca

Open-Orca/OpenOrca

 
  OpenOrca  ·  2025-02-19 07:32:36  ·  117 次点击  ·  0 条评论  

OpenOrca 数据集简介

概述

OpenOrca 是一个大规模、开源的文本数据集,主要用于训练和评估大型语言模型(LLMs)。它包含了数百万条高质量的指令-响应对。

主要用途

  • 模型训练:为指令微调(Instruction Tuning)提供数据。
  • 模型评估:作为评估模型遵循指令和生成能力的数据集。
  • AI研究:支持在对话、问答和指令遵循方面的研究。

数据类型与模态

  • 模态:纯文本(Text)
  • 数据格式:指令-响应对(Instruction-Response Pairs)
  • 存储格式:Parquet

规模与统计

  • 数据量:约 294 万行(数据条目)
  • 下载量:超过 1.3 万次
  • 社区认可:获得近 1500 次点赞

使用场景

  • 开发者和研究人员可用于:
    • 微调开源或自研的语言模型。
    • 构建更擅长理解和执行复杂指令的AI助手。
    • 进行对比实验,评估不同模型在指令遵循任务上的性能。
117 次点击  ∙  1 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 18 ms
Developed with Cursor