| 注册会员 | 1081 |
| 主题 | 808 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 322 |
| 开源项目 | 520 |
|
|
bannerOA0 第 312 号会员,加入于 2025-11-13 12:18:56 |
|
|
PaLM:通过通路架构扩展语言模型 banner • abs/2204.02311 • 2026-01-18 | 0 |
|
|
DPO:大语言模型的人类偏好直接对齐算法 banner • abs/2305.18290 • 2026-01-08 | 0 |
|
|
让我们逐步骤验证:基于过程监督的推理增强 (PRM800K) banner • abs/2305.20050 • 2025-11-30 | 0 |