数据集简介
Terminal-Bench-2-Verified 是由 zai-org 发布的一个开源数据集,主要用于终端环境下的基准测试或评估任务。
主要用途
该数据集旨在为终端(命令行界面)相关的任务提供验证和评估基准,可能用于测试或优化在终端环境中运行的模型、工具或系统的性能。
数据特性
- 模态类型:推测为文本或代码类数据,与终端命令、操作或交互相关。
- 公开性:数据集完全公开(非门控),可自由下载使用。
- 规模:下载量超过 5700 次,具有一定的社区使用基础。
适用场景
- 终端命令行工具的自动化测试与评估
- 命令行界面(CLI)相关模型的训练与验证
- 系统或脚本在终端环境下的性能基准测试