| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
思维缓冲(BoT):通过思维索引增强 LLM 的推理效率与精度 devops • abs/2406.04271 • 2025-12-02 | 0 |
|
|
大语言模型真的能自我修正吗?推理中的自我校正机制研究 barrel • abs/2310.01798 • 2025-12-01 | 0 |
|
|
搜索流:将大语言模型的推理视为状态空间搜索 grok • abs/2404.03683 • 2025-12-01 | 0 |
|
|
让我们逐步骤验证:基于过程监督的推理增强 (PRM800K) banner • abs/2305.20050 • 2025-11-30 | 0 |
|
|
忠实推理:利用大语言模型进行多步可验证的逻辑推理 airpods • abs/2301.11471 • 2025-11-27 | 0 |
|
|
LLEMMA:用于数学推理的高性能大语言模型 ci • abs/2310.10625 • 2025-11-25 | 0 |
|
|
代码链:将推理任务转化为代码执行 epoch • abs/2312.04474 • 2025-11-20 | 0 |
|
|
LeanDojo:形式化定理证明中的机器证明与搜索 globe • abs/2306.15626 • 2025-11-20 | 0 |
|
|
SWE-bench:评估大语言模型解决软件工程问题的基准 ghost • abs/2310.06770 • 2025-11-19 | 0 |
|
|
InterCode:交互式代码生成与推理的框架基准 deep • abs/2306.09896 • 2025-11-17 | 0 |
|
|
RepoCoder:基于迭代检索生成的仓库级代码补全 bamboo • abs/2303.12570 • 2025-11-17 | 0 |
|
|
Voyager:具有终身学习能力的开放世界具身智能体 alloy • abs/2305.16291 • 2025-11-14 | 0 |
|
|
Toolformer:语言模型可以自我学习使用外部工具 llm • abs/2302.04761 • 2025-11-11 | 0 |
|
|
PAL:程序辅助语言模型 captainx • abs/2211.10435 • 2025-11-11 | 0 |
|
|
思维程序 (PoT):利用代码执行解决数值推理问题 midjourney • abs/2211.12588 • 2025-11-10 | 0 |
|
|
思维传播:在大语言模型中利用类比推理进行复杂推理 library • abs/2310.03965 • 2025-11-09 | 0 |
|
|
累积推理:通过思维积累解决复杂任务 ocean • abs/2308.04371 • 2025-11-08 | 0 |
|
|
语言模型即规划者:基于蒙特卡洛树搜索的推理增强 (RAP) integration • abs/2305.14992 • 2025-11-08 | 0 |
|
|
Quiet-STaR:大语言模型在思考时学习推理 digitx • abs/2403.09629 • 2025-11-03 | 0 |
|
|
STaR:自学式推理者,通过自我生成理由进行学习 forty • abs/2203.14465 • 2025-11-03 | 0 |