nvidia/embed-nemotron-dataset-v1

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

由 NVIDIA 发布的文本数据集，主要用于训练和评估嵌入模型（如 Nemotron 系列模型）。该数据集专注于文本模态，旨在提升模型对文本语义的理解和表示能力。

适用于需要高质量文本向量表示的研究与应用，例如：
* 语义搜索与检索增强生成（RAG）。
* 文本分类与聚类。
* 句子或文档级别的相似度计算。

59 次点击 ∙ 0 人收藏

登录后收藏

0 条回复