| 注册会员 | 1054 |
| 主题 | 580 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 272 |
| 开源项目 | 469 |
|
|
HuatuoGPT-o1:医疗领域的复杂医学逻辑推理模型 cd • abs/2412.18181 • 2026-01-01 | 0 |
|
|
OpenCodeInterpreter:整合代码生成、执行与精炼的开源系统 aspect • abs/2402.14658 • 2026-01-01 | 0 |
|
|
StarCoder 2 技术报告:面向开发者的高效率代码模型 seventy • abs/2402.19173 • 2025-12-31 | 0 |
|
|
Logic-of-Thought:基于逻辑结构化思维的推理增强框架 idea • abs/2409.16527 • 2025-12-30 | 0 |
|
|
CRITIC:通过工具交互反馈实现大语言模型的自我校正 middleware • abs/2305.11738 • 2025-12-30 | 0 |
|
|
从自然语言到可执行代码:结合执行反馈的闭环生成 git • abs/2405.12185 • 2025-12-30 | 0 |
|
|
ACECoder:利用 A* 搜索进行代码生成的强化学习方法 canvas • abs/2407.02890 • 2025-12-29 | 0 |
|
|
Math-Shepherd:可验证的过程监督反馈框架 lantern • abs/2312.08937 • 2025-12-27 | 0 |
|
|
LeanCopilot:将大语言模型作为 Lean 证明助手引导器 android • abs/2404.12253 • 2025-12-27 | 0 |
|
|
Qwen2.5-Coder 技术报告:最强开源代码模型 photo • abs/2411.04905 • 2025-12-26 | 0 |
|
|
LiveCodeBench:大语言模型代码能力的全方位评估基准 breeze • abs/2403.07974 • 2025-12-26 | 0 |
|
|
Marco-o1:探索开源推理模型的思维链与决策边界 backup • abs/2411.14405 • 2025-12-23 | 0 |
|
|
Skywork-o1:开源首个类 o1 推理模型的技术方案 cipher • abs/2411.10440 • 2025-12-23 | 0 |
|
|
Kimi k1.5:通过 MCTS 与强化学习扩展推理能力 forge • MoonshotAI/Kimi-k1.5 • 2025-12-22 | 0 |
|
|
DeepSeek-V3 技术报告:迈向超大规模混合专家模型 cobaltix • abs/2412.19437 • 2025-12-22 | 0 |
|
|
AgentCoder:通过多智能体协作实现自动化代码编写、测试与修复 essence • abs/2312.13010 • 2025-12-17 | 0 |
|
|
逻辑之思(LoT):通过逻辑规则结构化思维过程的推理框架 loadbalancer • abs/2409.17531 • 2025-12-16 | 0 |
|
|
MARS:基于多智能体协作与竞赛的复杂逻辑推理框架 bronze • abs/2407.13623 • 2025-12-15 | 0 |
|
|
演绎验证:通过逻辑一致性检查增强语言模型的长程推理 paas • abs/2310.03111 • 2025-12-13 | 0 |
|
|
Self-Verify:大语言模型解决数学问题的自我验证机制 figure • abs/2308.01757 • 2025-12-13 | 0 |