数据集简介
CharacterCodex 是一个由 NousResearch 发布的文本数据集,主要用于角色或人物相关的文本生成与分析任务。
主要用途
该数据集可用于训练或微调大语言模型,以生成、理解或分析具有特定性格、背景和对话风格的角色文本,适用于角色扮演、故事创作、对话系统开发等场景。
数据类型与模态
规模与统计
- 数据条目:约 15,939 条
- 下载量:129
- 点赞数:227
使用场景
- 角色驱动文本生成:为游戏、互动故事或聊天机器人创建个性鲜明的角色对话。
- 模型微调:提升语言模型在特定角色设定下的对话一致性和风格化表达能力。
- 叙事研究:分析不同角色属性的文本特征与模式。