| 注册会员 | 1032 |
| 主题 | 340 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 228 |
| 开源项目 | 305 |
|
|
CRITIC:通过工具交互反馈实现大语言模型的自我校正 middleware • abs/2305.11738 • 2025-12-30 | 0 |
|
|
从自然语言到可执行代码:结合执行反馈的闭环生成 git • abs/2405.12185 • 2025-12-30 | 0 |
|
|
ACECoder:利用 A* 搜索进行代码生成的强化学习方法 canvas • abs/2407.02890 • 2025-12-29 | 0 |
|
|
Math-Shepherd:可验证的过程监督反馈框架 lantern • abs/2312.08937 • 2025-12-27 | 0 |
|
|
LeanCopilot:将大语言模型作为 Lean 证明助手引导器 android • abs/2404.12253 • 2025-12-27 | 0 |
|
|
Qwen2.5-Coder 技术报告:最强开源代码模型 photo • abs/2411.04905 • 2025-12-26 | 0 |
|
|
LiveCodeBench:大语言模型代码能力的全方位评估基准 breeze • abs/2403.07974 • 2025-12-26 | 0 |
|
|
Marco-o1:探索开源推理模型的思维链与决策边界 backup • abs/2411.14405 • 2025-12-23 | 0 |
|
|
Skywork-o1:开源首个类 o1 推理模型的技术方案 cipher • abs/2411.10440 • 2025-12-23 | 0 |
|
|
Kimi k1.5:通过 MCTS 与强化学习扩展推理能力 forge • MoonshotAI/Kimi-k1.5 • 2025-12-22 | 0 |
|
|
DeepSeek-V3 技术报告:迈向超大规模混合专家模型 cobaltix • abs/2412.19437 • 2025-12-22 | 0 |
|
|
AgentCoder:通过多智能体协作实现自动化代码编写、测试与修复 essence • abs/2312.13010 • 2025-12-17 | 0 |
|
|
逻辑之思(LoT):通过逻辑规则结构化思维过程的推理框架 loadbalancer • abs/2409.17531 • 2025-12-16 | 0 |
|
|
MARS:基于多智能体协作与竞赛的复杂逻辑推理框架 bronze • abs/2407.13623 • 2025-12-15 | 0 |
|
|
演绎验证:通过逻辑一致性检查增强语言模型的长程推理 paas • abs/2310.03111 • 2025-12-13 | 0 |
|
|
Self-Verify:大语言模型解决数学问题的自我验证机制 figure • abs/2308.01757 • 2025-12-13 | 0 |
|
|
对比解码:通过大小模型对比显著减少推理幻觉 eighty • abs/2210.15097 • 2025-12-13 | 0 |
|
|
思维骨架(SoT):通过并行化结构显著提升 LLM 推理速度 journey • abs/2307.15337 • 2025-12-13 | 0 |
|
|
EvoPrompt:基于进化算法的自动提示词优化与推理增强 authorization • abs/2309.08532 • 2025-12-11 | 0 |
|
|
SciPhi:通过自校正指令微调提升模型的科学推理能力 malware • abs/2310.13121 • 2025-12-10 | 0 |