由 OpenGVLab 发布的 ShareGPT-4o 数据集,是一个包含 59,400 条样本的对话数据集,旨在支持多模态语言模型的训练与评估。
该数据集主要用于训练和微调大型语言模型,特别是那些需要理解和生成复杂对话的模型,可应用于对话系统、指令遵循、文本生成等任务。
适用于研究人员和开发者进行: - 对话模型的预训练或指令微调 - 多轮对话理解和生成任务 - 基于表格与文本结合的混合数据处理实验