SCIN(Scientific Images)是由 Google 发布的一个科学图像数据集,主要用于支持多模态(图像与文本)的科学研究与应用开发。
该数据集旨在为科学领域的多模态学习任务提供资源,例如: - 科学图像的理解与描述 - 图像与相关文本信息的关联分析 - 训练或评估视觉-语言模型在科学领域的性能
适合研究人员和开发者用于: - 科学文档的图像-文本对齐研究 - 多模态模型(如图文理解、生成模型)的训练与微调 - 科学知识可视化或教育工具的开发