作者: Alexander Kirillov, Eric Mintun, Nikhila Ravi, Hanzi Mao, Chloe Rolland, Laura Gustafson, Tete Xiao, Spencer Whitehead, Alexander C. Berg, Wan-Yen Lo, Piotr Dollár, Ross Girshick
提交日期: 2023年4月5日
摘要:
本文介绍了“Segment Anything”(SA)项目:一个用于图像分割的新任务、新模型和新数据集。通过使用我们高效的模型进行数据收集循环,我们构建了迄今为止(迄今为止)最大的分割数据集,在1100万张获得许可且尊重隐私的图像上包含了超过10亿个掩码。该模型被设计和训练为可提示的,因此可以零样本迁移到新的图像分布和任务中。我们在众多任务上评估了其能力,发现其零样本性能令人印象深刻——通常与先前完全监督的结果相当甚至更优。我们发布了Segment Anything模型(SAM)以及包含10亿个掩码和1100万张图像的对应数据集(SA-1B),网址为 https://segment-anything.com,以促进计算机视觉基础模型的研究。
主题/分类:
- 计算机视觉与模式识别 (cs.CV)
- 人工智能 (cs.AI)
- 机器学习 (cs.LG)
项目网页: https://segment-anything.com