| 注册会员 | 1054 |
| 主题 | 579 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 272 |
| 开源项目 | 469 |
|
|
Plan-and-Solve Prompting:先规划再求解以减少推理错误 cd • abs/2305.04091 • 2026-03-16 | 0 |
|
|
DeepSeekMath:通过持续预训练强化数学推理能力 replication • abs/2402.03300 • 2026-03-15 | 0 |
|
|
Code Llama:面向代码补全与生成的大语言模型 model • abs/2308.12950v2 • 2026-03-14 | 0 |
|
|
Qwen2 Technical Report:新一代通用大语言模型家族技术报告 firewall • abs/2407.10671 • 2026-03-13 | 0 |
|
|
IDEFICS 2:面向开放场景视觉语言理解的新一代多模态模型 commit • abs/2405.02246 • 2026-03-13 | 0 |
|
|
LLaVA-1.5:更强视觉指令微调带来高效多模态对话能力 macos • abs/2310.03744 • 2026-03-11 | 0 |
|
|
SEINE:面向长时序一致性的文本到视频生成方法 clock • abs/2312.09224 • 2026-03-11 | 0 |
|
|
VideoPoet:统一视频生成、补全与编辑的多模态模型 docker • abs/2312.14125v2 • 2026-03-07 | 0 |
|
|
WebVoyager:让多模态大模型在真实网页环境中执行任务 drift • abs/2401.13919v2 • 2026-03-07 | 0 |
|
|
Math-Shepherd:面向过程监督的数学推理数据集与方法 garden • abs/2312.08935v2 • 2026-03-04 | 0 |
|
|
SWE-agent:利用语言模型自动修复真实软件仓库问题 dagger • abs/2405.15793 • 2026-03-03 | 0 |
|
|
CodeAct:通过可执行动作统一代码生成与智能体任务求解 ping • abs/2402.01030 • 2026-03-01 | 0 |
|
|
DSPy:以声明式方式编程语言模型流水线 gravity • abs/2310.03714 • 2026-02-28 | 0 |
|
|
AutoGen:面向多智能体协作的大模型对话编排框架 craft • abs/2308.08155 • 2026-02-27 | 0 |
|
|
BLIP-2:轻量连接视觉模型与大语言模型的多模态预训练方法 seventeen • abs/2301.12597 • 2026-02-27 | 0 |
|
|
WebVoyager:让多模态大模型在真实网页环境中完成智能体任务 grok • abs/2401.13919 • 2026-02-27 | 0 |
|
|
OpenDevin:面向通用软件开发任务的开源 AI Agent 框架 nosql • abs/2401.13601 • 2026-02-26 | 0 |
|
|
RAG-Fusion:通过多查询融合提升检索增强生成效果 protocol • abs/2402.03367 • 2026-02-23 | 0 |
|
|
Math-Shepherd:用过程监督提升数学推理能力 bravo • abs/2312.08935 • 2026-02-17 | 0 |
|
|
CodeT5+:面向代码理解与生成的一体化大型模型 cookie • abs/2305.07922 • 2026-02-17 | 0 |