| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
VILA:面向视觉语言任务的高效可扩展多模态模型 bless • abs/2405.04482 • 2026-04-17 | 0 |
|
|
Video-LLaVA:统一视频与图像理解的视觉语言助手 three • abs/2311.10122 • 2026-04-17 | 0 |
|
|
DreamCraft3D:通过 2D 扩散先验实现高质量 3D 内容生成 question • abs/2310.16818 • 2026-04-16 | 0 |
|
|
Language Agent Tree Search:将树搜索引入 Agent 任务规划与决策 yonder • abs/2310.04406 • 2026-04-16 | 0 |
|
|
MoRA:用高秩更新增强参数高效微调表达能力 beauty • abs/2405.12130 • 2026-04-16 | 0 |
|
|
V-JEPA:通过预测视频抽象表示学习世界模型 agency • abs/2401.09417 • 2026-04-16 | 0 |
|
|
Phi-2:小参数语言模型也能展现出强推理与代码能力 course • abs/2312.08957 • 2026-04-16 | 0 |
|
|
LLaVA-NeXT:在更高分辨率与更强感知能力上推进视觉语言模型 hunterx • abs/2401.03744 • 2026-04-15 | 0 |
|
|
MotionGPT:统一文本、动作与多模态控制的人体运动生成模型 discovery • abs/2306.14795 • 2026-04-15 | 0 |
|
|
TinyStories:用极简故事语料研究小模型的语言学习能力 empire • abs/2305.07759 • 2026-04-15 | 0 |
|
|
CAMEL:通过角色扮演让多智能体协作完成复杂任务 titan • abs/2303.17760v1 • 2026-04-14 | 0 |
|
|
DeepSeekMath:专注数学推理与定理求解的语言模型 absorb • abs/2402.03300v1 • 2026-04-14 | 0 |
|
|
Qwen2 Technical Report:新一代通用与代码能力兼具的大模型 bicycle • abs/2407.10671v1 • 2026-04-14 | 0 |
|
|
AlphaGeometry:结合神经模型与符号推理解决几何证明 astral • abs/2401.15320 • 2026-04-14 | 0 |
|
|
OpenCodeInterpreter:面向代码执行与编程任务的开源系统 puzzle • abs/2402.14658v1 • 2026-04-14 | 0 |
|
|
CodeAct:以可执行动作统一代码生成与智能体交互 artwork • abs/2402.01030v1 • 2026-04-14 | 0 |
|
|
SWE-agent:用语言模型自动修复真实软件仓库问题 atom • abs/2405.15793v1 • 2026-04-14 | 0 |
|
|
VILA:面向视觉语言理解与生成的可扩展开源模型 reverie • abs/2401.04468 • 2026-04-14 | 0 |
|
|
VideoPoet:统一文本、图像、视频与音频生成的大模型 nurture • abs/2312.14125v3 • 2026-04-14 | 0 |
|
|
LLaVA-NeXT:更强视觉感知与指令跟随的多模态模型 ladder • abs/2401.00368v2 • 2026-04-14 | 0 |