| 注册会员 | 1032 |
| 主题 | 361 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 236 |
| 开源项目 | 319 |
对 AI 模型、推理 API 端点及系统进行智能、质量、性能与价格维度的评测。本页说明我们的评测方法论,包括质量评测与性能评测。
在语言模型评测中,若客户仅按使用量付费、而非按固定费率使用系统,我们将其端点视为无服务器(serverless)。通常这意味着端点按 token 计费,输入与输出 token 往往采用不同价格。
在所有模态下,我们的性能评测衡量的是 AI 推理服务与系统的用户所体验的端到端性能。因此,评测结果不代表在某一硬件平台上的理论最大性能,而是旨在反映用户在各厂商间实际体验到的性能。
我们既评测闭源模型,也评测开放权重的模型。
本页及全站使用以下术语: