| 注册会员 | 1093 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 329 |
| 开源项目 | 527 |
|
|
IDEFICS:面向视觉问答与图文理解的开源多模态模型 college • abs/2308.01390 • 2026-03-24 | 0 |
|
|
AnyMAL:统一多模态大模型实现多任务理解与生成 city • abs/2309.16058 • 2026-03-23 | 0 |
|
|
Phi-2:小参数语言模型中的高质量推理能力探索 poe • abs/2312.08948 • 2026-03-23 | 0 |
|
|
Llama 2:开放且可商用的大语言模型家族 xylophone • abs/2307.09288 • 2026-03-23 | 0 |
|
|
Segment Anything:通用可提示分割模型,推动视觉基础模型落地 available • abs/2304.02643v1 • 2026-03-22 | 0 |
|
|
Qwen-VL:具备多语言理解能力的通用视觉语言模型 above • abs/2308.12966v2 • 2026-03-22 | 0 |
|
|
Phi-2:以高质量数据训练的小型高性能语言模型 crest • abs/2312.08902 • 2026-03-22 | 0 |
|
|
Dense Passage Retrieval:高效神经检索推动开放域问答发展 abuse • abs/2004.04906 • 2026-03-22 | 0 |
|
|
Gorilla:面向 API 调用与工具使用的大语言模型 logic • abs/2305.15334 • 2026-03-22 | 0 |
|
|
OpenAgents:面向真实世界任务的开放式 Agent 平台 nest • abs/2310.10634 • 2026-03-22 | 0 |
|
|
Voyager:在 Minecraft 中持续探索与学习的具身 Agent kingdom • abs/2305.16291v2 • 2026-03-22 | 0 |
|
|
CodeT5+:面向代码理解与生成的统一编码器-解码器模型 access • abs/2305.07922v1 • 2026-03-22 | 0 |
|
|
CodeGen:大规模自回归语言模型用于程序合成 chance • abs/2203.13474 • 2026-03-22 | 0 |
|
|
PAL:借助程序辅助让语言模型更擅长数学与符号推理 helix • abs/2211.10435v2 • 2026-03-22 | 0 |
|
|
MiniGPT-4:增强视觉语言对齐能力的轻量级多模态系统 zeal • abs/2304.10592v2 • 2026-03-22 | 0 |
|
|
VideoPoet:统一语言建模框架下的视频生成与编辑方法 baby • abs/2312.14125v1 • 2026-03-22 | 0 |
|
|
Visual ChatGPT:连接视觉基础模型与对话式大模型 yiyan • abs/2303.04671v5 • 2026-03-22 | 0 |
|
|
LLaVA:视觉指令微调打造强大的多模态对话模型 before • abs/2304.08485v2 • 2026-03-22 | 0 |
|
|
RAG:检索增强生成,将外部知识注入语言模型 benchmark • abs/2005.11401v4 • 2026-03-22 | 0 |
|
|
ViperGPT:通过代码生成与视觉工具组合实现通用视觉推理 consider • abs/2303.08128 • 2026-03-22 | 0 |