VL-LN-Bench 是一个由 InternRobotics 团队发布的基准测试数据集,旨在评估视觉-语言模型在机器人导航或相关任务中的性能。
该数据集主要用于基准测试,帮助研究人员和开发者评估和比较不同视觉-语言模型在特定任务(如视觉语言导航)上的表现。
根据数据集名称推断,可能包含视觉(V)和语言(L)模态的数据,具体涉及视觉感知与语言指令的结合。元数据中未明确列出具体模态,但“VL-LN”通常代表“Vision-Language for Navigation”。
适用于机器人学、计算机视觉和自然语言处理交叉领域的研究,特别是:
* 开发与测试视觉-语言导航算法。
* 训练或微调多模态模型,使其能理解自然语言指令并据此在视觉环境中进行导航。
* 作为基准数据集,用于学术论文中的模型性能评估与比较。