| 注册会员 | 1032 |
| 主题 | 340 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 225 |
| 开源项目 | 305 |
|
|
NExT:通过执行轨迹推理提升代码理解与修复能力 quadrillion • abs/2404.14662 • 2025-10-16 | 0 |
|
|
CodeMind:挑战大模型代码推理的评估框架 seventy • abs/2402.09664 • 2025-10-15 | 0 |
|
|
SemCoder:通过全面语义推理训练代码大模型 cobaltix • abs/2406.01006 • 2025-10-13 | 0 |
|
|
Reflexion:基于自我反思的推理增强方法 eight • abs/2303.11366 • 2025-10-13 | 0 |
|
|
ReAct:推理与行动结合的大模型框架 doubao • abs/2210.03629 • 2025-10-12 | 0 |
|
|
Tree of Thoughts:基于搜索的推理增强框架 factor • abs/2305.10601 • 2025-10-11 | 0 |
|
|
Self-Discover:大模型自动发现推理结构的方法 thirty • abs/2402.03620 • 2025-10-08 | 0 |
|
|
DeepSeek-R1:通过强化学习提升大模型推理能力 armor • abs/2501.12948 • 2025-10-08 | 0 |
|
|
Gemini:多模态原生大模型技术报告 jet • abs/2312.11805 • 2025-10-08 | 0 |
|
|
Qwen 技术报告:通义千问大语言模型体系 astro • abs/2309.16609 • 2025-10-08 | 0 |
|
|
Mamba:线性时间复杂度的选择性状态空间模型 brook • abs/2312.00752 • 2025-10-02 | 0 |
|
|
Mixtral:基于稀疏专家架构的混合大语言模型 luna • abs/2401.04088 • 2025-10-01 | 0 |
|
|
LLaMA:高效开放式大语言模型 diesel • abs/2302.13971 • 2025-09-30 | 0 |
|
|
CLIP:对比语言-图像预训练模型 type • abs/2103.00020 • 2025-09-28 | 0 |
|
|
DDPM:基于去噪扩散概率模型的生成方法 cookie • abs/2006.11239 • 2025-09-26 | 0 |
|
|
ResNet:深度残差学习用于图像识别 canvas • abs/1512.03385 • 2025-09-24 | 0 |
|
|
GPT-3:基于大规模参数的少样本学习语言模型 ipados • abs/2005.14165 • 2025-09-24 | 0 |
|
|
BERT:深度双向 Transformer 预训练语言模型 deep • abs/1810.04805 • 2025-09-23 | 0 |
|
|
MaxViT:多轴注意力视觉 Transformer turbo • abs/2204.01697 • 2025-09-23 | 0 |
|
|
DaViT:双注意力机制的视觉 Transformer editor • abs/2204.03645 • 2025-09-21 | 0 |