nvidia/Nemotron-Personas-Singapore

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

由 NVIDIA 发布的文本数据集，包含 14.8 万行数据，旨在为 AI 模型提供特定于新加坡文化背景和语言习惯的“人物角色”（Personas）信息。

主要用途

用于训练或微调大型语言模型（LLM），使其能够更好地理解和生成符合新加坡本地语境、文化习惯和语言风格的文本内容，提升模型在新加坡相关场景下的对话与内容生成能力。

数据类型/模态

模态：纯文本（text）
数据格式：支持 Parquet 及优化版 Parquet 格式，便于高效读取与处理。

规模与统计

数据量：148,000 行文本数据
下载量：4,054 次
受欢迎度：46 次点赞

使用场景

文化适配的对话系统：开发适用于新加坡用户的聊天机器人、虚拟助手等。
内容生成：生成具有新加坡本地特色的营销文案、故事创作或教育材料。
模型微调：为通用语言模型注入新加坡特定的语言模式和文化知识，提升区域化表现。

数据集地址：https://huggingface.co/datasets/nvidia/Nemotron-Personas-Singapore

61 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 11 ms

Developed with Cursor