| 注册会员 | 1054 |
| 主题 | 579 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 272 |
| 开源项目 | 469 |
|
|
MoE-LoRA:面向参数高效微调的混合专家低秩适配方法 river • abs/2402.12851 • 4小时17分钟之前 | 0 |
|
|
Text2SQL by Prompting:利用提示学习提升自然语言到 SQL 生成 consider • abs/2305.14734 • 4小时17分钟之前 | 0 |
|
|
Video-LLaMA:面向视频理解与对话的大型语言视觉模型 imagine • abs/2306.02858 • 4小时17分钟之前 | 0 |
|
|
OpenVLA:统一视觉-语言-动作模型用于机器人操作 docker • abs/2406.09246 • 1天4小时之前 | 0 |
|
|
VQ-VAE:离散潜变量生成模型,为图像与视频生成奠定基础 monolith • abs/1711.00937 • 2天4小时之前 | 0 |
|
|
PaLM-E:将视觉与机器人控制融入语言模型的具身智能方案 novel • abs/2303.03378 • 2天4小时之前 | 0 |
|
|
MInference:无需训练即可加速长上下文大模型推理 accident • abs/2407.02490 • 2026-04-08 | 0 |
|
|
InternLM-XComposer2:长上下文与图文写作能力增强的多模态模型 whimsical • abs/2401.16420 • 2026-04-08 | 0 |
|
|
InternVL:提升多模态大模型跨模态感知与对话能力 burst • abs/2312.14238 • 2026-04-07 | 0 |
|
|
Janus:统一自回归框架下的多模态理解与图像生成模型 curiosity • abs/2410.13848 • 2026-04-06 | 0 |
|
|
LLaVA-NeXT:更强视觉理解能力的开源多模态对话模型 network • abs/2401.00368 • 2026-04-06 | 0 |
|
|
OmniACT:让多模态 Agent 在图形界面中完成真实交互任务 four • abs/2402.17553 • 2026-04-06 | 0 |
|
|
MM-ReAct:多模态场景下结合视觉感知、推理与行动的 Agent article • abs/2303.11381 • 2026-04-06 | 0 |
|
|
AlphaGeometry:结合神经模型与符号推理解决几何证明问题 chain • abs/2401.11985 • 2026-04-05 | 0 |
|
|
Chain-of-Verification:先生成再验证,降低幻觉并提升可靠性 explore • abs/2309.11495 • 2026-04-05 | 0 |
|
|
RARR:检索后修正生成内容,提高事实一致性与可追溯性 betray • abs/2210.08726 • 2026-04-05 | 0 |
|
|
RETRO:结合海量检索语料的增强型生成模型 nexus • abs/2112.04426 • 2026-04-05 | 0 |
|
|
MathVista:评测多模态模型数学推理能力的基准数据集 python • abs/2310.02255 • 2026-04-04 | 0 |
|
|
CodeFuse-13B:面向代码生成与理解的开源大模型 alarm • abs/2309.00859 • 2026-04-04 | 0 |