| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
DPO:大语言模型的人类偏好直接对齐算法 banner • abs/2305.18290 • 2026-01-08 | 0 |
|
|
InstructGPT:训练语言模型以遵循人类指令 doubao • abs/2203.02155 • 2026-01-08 | 0 |
|
|
FlashAttention:具有 IO 感知的高效精确注意力机制 enginez • abs/2205.14135 • 2026-01-06 | 0 |
|
|
GPT-4 技术报告:多模态大模型的里程碑 network • abs/2303.08774 • 2026-01-06 | 0 |
|
|
Llama 3 模型卡:Meta 的新一代开源大模型 fifty • blog/meta-llama-3 • 2026-01-02 | 0 |
|
|
LoRA:大语言模型的低秩自适应微调技术 dawn • abs/2106.09685 • 2026-01-02 | 0 |
|
|
会思考的大语言模型:在回答前学会思考的机制研究 eaglex • abs/2410.10630 • 2026-01-02 | 0 |
|
|
HuatuoGPT-o1:医疗领域的复杂医学逻辑推理模型 cd • abs/2412.18181 • 2026-01-01 | 0 |
|
|
OpenCodeInterpreter:整合代码生成、执行与精炼的开源系统 aspect • abs/2402.14658 • 2026-01-01 | 0 |
|
|
StarCoder 2 技术报告:面向开发者的高效率代码模型 seventy • abs/2402.19173 • 2025-12-31 | 0 |
|
|
Logic-of-Thought:基于逻辑结构化思维的推理增强框架 idea • abs/2409.16527 • 2025-12-30 | 0 |
|
|
CRITIC:通过工具交互反馈实现大语言模型的自我校正 middleware • abs/2305.11738 • 2025-12-30 | 0 |
|
|
从自然语言到可执行代码:结合执行反馈的闭环生成 git • abs/2405.12185 • 2025-12-30 | 0 |
|
|
ACECoder:利用 A* 搜索进行代码生成的强化学习方法 canvas • abs/2407.02890 • 2025-12-29 | 0 |
|
|
Math-Shepherd:可验证的过程监督反馈框架 lantern • abs/2312.08937 • 2025-12-27 | 0 |
|
|
LeanCopilot:将大语言模型作为 Lean 证明助手引导器 android • abs/2404.12253 • 2025-12-27 | 0 |
|
|
Qwen2.5-Coder 技术报告:最强开源代码模型 photo • abs/2411.04905 • 2025-12-26 | 0 |
|
|
LiveCodeBench:大语言模型代码能力的全方位评估基准 breeze • abs/2403.07974 • 2025-12-26 | 0 |
|
|
Marco-o1:探索开源推理模型的思维链与决策边界 backup • abs/2411.14405 • 2025-12-23 | 0 |
|
|
Skywork-o1:开源首个类 o1 推理模型的技术方案 cipher • abs/2411.10440 • 2025-12-23 | 0 |