| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
Kimi k1.5:通过 MCTS 与强化学习扩展推理能力 forge • MoonshotAI/Kimi-k1.5 • 2025-12-22 | 0 |
|
|
DeepSeek-V3 技术报告:迈向超大规模混合专家模型 cobaltix • abs/2412.19437 • 2025-12-22 | 0 |
|
|
AgentCoder:通过多智能体协作实现自动化代码编写、测试与修复 essence • abs/2312.13010 • 2025-12-17 | 0 |
|
|
逻辑之思(LoT):通过逻辑规则结构化思维过程的推理框架 loadbalancer • abs/2409.17531 • 2025-12-16 | 0 |
|
|
MARS:基于多智能体协作与竞赛的复杂逻辑推理框架 bronze • abs/2407.13623 • 2025-12-15 | 0 |
|
|
演绎验证:通过逻辑一致性检查增强语言模型的长程推理 paas • abs/2310.03111 • 2025-12-13 | 0 |
|
|
Self-Verify:大语言模型解决数学问题的自我验证机制 figure • abs/2308.01757 • 2025-12-13 | 0 |
|
|
对比解码:通过大小模型对比显著减少推理幻觉 eighty • abs/2210.15097 • 2025-12-13 | 0 |
|
|
思维骨架(SoT):通过并行化结构显著提升 LLM 推理速度 journey • abs/2307.15337 • 2025-12-13 | 0 |
|
|
EvoPrompt:基于进化算法的自动提示词优化与推理增强 authorization • abs/2309.08532 • 2025-12-11 | 0 |
|
|
SciPhi:通过自校正指令微调提升模型的科学推理能力 malware • abs/2310.13121 • 2025-12-10 | 0 |
|
|
ToRA:集成外部工具解决复杂数学问题的推理智能体 orbit • abs/2309.17452 • 2025-12-10 | 0 |
|
|
ReSt-MCTS:结合蒙特卡洛树搜索与自我重构的推理强化技术 cipherx • abs/2406.03816 • 2025-12-09 | 0 |
|
|
LogicGuide:利用逻辑约束指导大语言模型生成可验证推理 cluster • abs/2305.13744 • 2025-12-08 | 0 |
|
|
TS-LLM:利用树搜索引导大语言模型进行复杂规划 burst • abs/2402.04247 • 2025-12-07 | 0 |
|
|
Step-DPO:通过逐步直接偏好优化提升数学推理能力 fourteen • abs/2406.11695 • 2025-12-05 | 0 |
|
|
CodeRL:基于强化学习与单元测试反馈的代码生成框架 client • abs/2207.01780 • 2025-12-04 | 0 |
|
|
思维之眼(Mind's Eye):利用物理模拟增强语言模型的物理推理能力 ocean • abs/2210.05359 • 2025-12-03 | 0 |
|
|
LINC:将思维链与符号逻辑推理相结合的混合系统 llama • abs/2310.15154 • 2025-12-03 | 0 |
|
|
Self-Debug:通过自我反馈使语言模型编写并修复代码 apex • abs/2304.05128 • 2025-12-02 | 0 |