| 注册会员 | 1054 |
| 主题 | 579 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 272 |
| 开源项目 | 469 |
|
|
LLaVA:视觉指令微调打造强大的多模态对话模型 before • abs/2304.08485v2 • 2026-03-22 | 0 |
|
|
RAG:检索增强生成,将外部知识注入语言模型 benchmark • abs/2005.11401v4 • 2026-03-22 | 0 |
|
|
ViperGPT:通过代码生成与视觉工具组合实现通用视觉推理 consider • abs/2303.08128 • 2026-03-22 | 0 |
|
|
ReAct:结合推理与行动,让语言模型边想边做 navigate • abs/2210.03629v3 • 2026-03-22 | 0 |
|
|
Graph of Thoughts:用图结构组织推理过程以提升复杂问题求解 fossil • abs/2308.09687v2 • 2026-03-22 | 0 |
|
|
Tree of Thoughts:利用树搜索扩展大语言模型的深度推理能力 kubernetes • abs/2305.10601v1 • 2026-03-22 | 0 |
|
|
Self-Consistency:通过多路径采样提升思维链推理稳定性 dashboard • abs/2203.11171 • 2026-03-22 | 0 |
|
|
WebArena:评测智能体在真实网页环境中完成复杂任务的基准 attention • abs/2307.13854 • 2026-03-21 | 0 |
|
|
WizardMath:面向数学推理专项增强的大语言模型 behave • abs/2308.09583 • 2026-03-21 | 0 |
|
|
RLAIF:通过 AI 反馈强化学习实现模型对齐 beautiful • abs/2309.00267 • 2026-03-21 | 0 |
|
|
FLAN:通过指令微调显著提升语言模型的泛化能力 flux • abs/2109.01652 • 2026-03-21 | 0 |
|
|
AlphaCode 2 技术报告:面向竞赛编程的代码生成系统 almost • abs/2401.08500 • 2026-03-21 | 0 |
|
|
QLoRA:用 4-bit 量化高效微调大语言模型 gold • abs/2305.14314 • 2026-03-21 | 0 |
|
|
SEED-Bench:系统评测多模态大模型视觉理解与推理能力 nonillion • abs/2307.16125 • 2026-03-21 | 0 |
|
|
LongLoRA:低成本方法扩展大语言模型的长上下文能力 asset • abs/2309.12307 • 2026-03-21 | 0 |
|
|
Chronos:将时间序列预测统一为语言建模问题 elephant • abs/2403.07815 • 2026-03-21 | 0 |
|
|
Idefics2:支持图文理解与生成的新一代开放多模态模型 central • abs/2405.02258 • 2026-03-21 | 0 |
|
|
MAmmoTH:通过思维链与代码联合训练提升数学推理 budget • abs/2305.03582 • 2026-03-21 | 0 |
|
|
TinyLlama:面向高效部署的开源小型语言模型预训练 chrome • abs/2401.02385 • 2026-03-21 | 0 |
|
|
Qwen-VL:具备强视觉理解能力的大规模多模态模型 testing • abs/2308.12966 • 2026-03-21 | 0 |