| 注册会员 | 1093 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 329 |
| 开源项目 | 527 |
|
|
CAMEL:通过角色扮演让多智能体协作完成复杂任务 titan • abs/2303.17760v1 • 2026-04-14 | 0 |
|
|
DeepSeekMath:专注数学推理与定理求解的语言模型 absorb • abs/2402.03300v1 • 2026-04-14 | 0 |
|
|
Qwen2 Technical Report:新一代通用与代码能力兼具的大模型 bicycle • abs/2407.10671v1 • 2026-04-14 | 0 |
|
|
AlphaGeometry:结合神经模型与符号推理解决几何证明 astral • abs/2401.15320 • 2026-04-14 | 0 |
|
|
OpenCodeInterpreter:面向代码执行与编程任务的开源系统 puzzle • abs/2402.14658v1 • 2026-04-14 | 0 |
|
|
CodeAct:以可执行动作统一代码生成与智能体交互 artwork • abs/2402.01030v1 • 2026-04-14 | 0 |
|
|
SWE-agent:用语言模型自动修复真实软件仓库问题 atom • abs/2405.15793v1 • 2026-04-14 | 0 |
|
|
VILA:面向视觉语言理解与生成的可扩展开源模型 reverie • abs/2401.04468 • 2026-04-14 | 0 |
|
|
VideoPoet:统一文本、图像、视频与音频生成的大模型 nurture • abs/2312.14125v3 • 2026-04-14 | 0 |
|
|
LLaVA-NeXT:更强视觉感知与指令跟随的多模态模型 ladder • abs/2401.00368v2 • 2026-04-14 | 0 |
|
|
Ferret:支持区域感知与细粒度理解的多模态模型 captain • abs/2310.07704 • 2026-04-14 | 0 |
|
|
RAFT:面向领域问答的检索增强微调方法 fifteen • abs/2403.10131v1 • 2026-04-14 | 0 |
|
|
LongRoPE:让大模型高效扩展到超长上下文窗口 close • abs/2402.13753v1 • 2026-04-14 | 0 |
|
|
MobileVLM:面向移动端部署的高效视觉语言模型 explore • abs/2312.16886v2 • 2026-04-14 | 0 |
|
|
RAPTOR:递归摘要树结构增强检索生成效果 scaling • abs/2401.18059v1 • 2026-04-14 | 0 |
|
|
REST meets ReAct:面向现实任务的规划与工具调用智能体 serenity • abs/2305.18323 • 2026-04-14 | 0 |
|
|
MoEfication:将稠密 Transformer 转化为高效混合专家模型的思路 phishing • abs/2110.01798 • 2026-04-13 | 0 |
|
|
MoE-LoRA:面向参数高效微调的混合专家低秩适配方法 river • abs/2402.12851 • 2026-04-12 | 0 |
|
|
Text2SQL by Prompting:利用提示学习提升自然语言到 SQL 生成 consider • abs/2305.14734 • 2026-04-12 | 0 |
|
|
Video-LLaMA:面向视频理解与对话的大型语言视觉模型 imagine • abs/2306.02858 • 2026-04-12 | 0 |