WAON-Bench 是一个由 llm-jp 团队创建的多模态基准测试数据集,旨在评估模型在图文混合任务上的性能。
适用于需要处理图文混合输入的自然语言处理和多模态研究,特别是针对日语语言环境的模型评估。