OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Mohamed Bin Zayed University of Artificial Intelligence

MBZUAI/Bactrian-X

 
  Mohamed Bin Zayed University of Artificial Intelligence  ·  2023-05-27 12:54:05  ·  18 次点击  ·  0 条评论  

MBZUAI/Bactrian-X 数据集简介

概述

Bactrian-X 是一个由 MBZUAI 发布的大规模多语言指令微调数据集,旨在支持跨语言的自然语言处理任务。

主要用途

  • 多语言指令微调训练
  • 跨语言模型评估与基准测试
  • 多语言对话系统开发

数据类型

  • 模态:纯文本数据
  • 语言:支持多种语言(具体语言范围需参考完整文档)
  • 格式:指令-响应对形式

数据规模

  • 总数据量:约 348 万条样本
  • 下载量:2,464 次
  • 社区认可:123 次点赞

使用场景

  1. 训练多语言对话助手
  2. 构建跨语言任务导向系统
  3. 研究指令跟随能力的语言迁移
  4. 评估模型的多语言理解能力

特点

  • 开源可公开访问
  • 专注于指令微调格式
  • 覆盖广泛的语言种类
  • 适用于资源受限语言的研究
18 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 35 ms
Developed with Cursor