| 注册会员 | 1032 |
| 主题 | 340 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 228 |
| 开源项目 | 305 |
|
|
ToRA:集成外部工具解决复杂数学问题的推理智能体 orbit • abs/2309.17452 • 2025-12-10 | 0 |
|
|
ReSt-MCTS:结合蒙特卡洛树搜索与自我重构的推理强化技术 cipherx • abs/2406.03816 • 2025-12-09 | 0 |
|
|
LogicGuide:利用逻辑约束指导大语言模型生成可验证推理 cluster • abs/2305.13744 • 2025-12-08 | 0 |
|
|
TS-LLM:利用树搜索引导大语言模型进行复杂规划 burst • abs/2402.04247 • 2025-12-07 | 0 |
|
|
Step-DPO:通过逐步直接偏好优化提升数学推理能力 fourteen • abs/2406.11695 • 2025-12-05 | 0 |
|
|
CodeRL:基于强化学习与单元测试反馈的代码生成框架 client • abs/2207.01780 • 2025-12-04 | 0 |
|
|
思维之眼(Mind's Eye):利用物理模拟增强语言模型的物理推理能力 ocean • abs/2210.05359 • 2025-12-03 | 0 |
|
|
LINC:将思维链与符号逻辑推理相结合的混合系统 llama • abs/2310.15154 • 2025-12-03 | 0 |
|
|
Self-Debug:通过自我反馈使语言模型编写并修复代码 apex • abs/2304.05128 • 2025-12-02 | 0 |
|
|
思维缓冲(BoT):通过思维索引增强 LLM 的推理效率与精度 devops • abs/2406.04271 • 2025-12-02 | 0 |
|
|
大语言模型真的能自我修正吗?推理中的自我校正机制研究 barrel • abs/2310.01798 • 2025-12-01 | 0 |
|
|
搜索流:将大语言模型的推理视为状态空间搜索 grok • abs/2404.03683 • 2025-12-01 | 0 |
|
|
让我们逐步骤验证:基于过程监督的推理增强 (PRM800K) banner • abs/2305.20050 • 2025-11-30 | 0 |
|
|
忠实推理:利用大语言模型进行多步可验证的逻辑推理 airpods • abs/2301.11471 • 2025-11-27 | 0 |
|
|
LLEMMA:用于数学推理的高性能大语言模型 ci • abs/2310.10625 • 2025-11-25 | 0 |
|
|
代码链:将推理任务转化为代码执行 epoch • abs/2312.04474 • 2025-11-20 | 0 |
|
|
LeanDojo:形式化定理证明中的机器证明与搜索 globe • abs/2306.15626 • 2025-11-20 | 0 |
|
|
SWE-bench:评估大语言模型解决软件工程问题的基准 ghost • abs/2310.06770 • 2025-11-19 | 0 |
|
|
InterCode:交互式代码生成与推理的框架基准 deep • abs/2306.09896 • 2025-11-17 | 0 |
|
|
RepoCoder:基于迭代检索生成的仓库级代码补全 bamboo • abs/2303.12570 • 2025-11-17 | 0 |