| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
SEED-Bench:系统评测多模态大模型视觉理解与推理能力 nonillion • abs/2307.16125 • 2026-03-21 | 0 |
|
|
LongLoRA:低成本方法扩展大语言模型的长上下文能力 asset • abs/2309.12307 • 2026-03-21 | 0 |
|
|
Chronos:将时间序列预测统一为语言建模问题 elephant • abs/2403.07815 • 2026-03-21 | 0 |
|
|
Idefics2:支持图文理解与生成的新一代开放多模态模型 central • abs/2405.02258 • 2026-03-21 | 0 |
|
|
MAmmoTH:通过思维链与代码联合训练提升数学推理 budget • abs/2305.03582 • 2026-03-21 | 0 |
|
|
TinyLlama:面向高效部署的开源小型语言模型预训练 chrome • abs/2401.02385 • 2026-03-21 | 0 |
|
|
Qwen-VL:具备强视觉理解能力的大规模多模态模型 testing • abs/2308.12966 • 2026-03-21 | 0 |
|
|
WizardCoder:通过进化式指令微调提升代码生成能力 berry • abs/2306.08568 • 2026-03-21 | 0 |
|
|
TextGrad:把反向传播思想迁移到文本与提示优化中 flora • abs/2406.07496 • 2026-03-20 | 0 |
|
|
CAMEL:通过角色扮演让多智能体协作完成复杂任务 discovery • abs/2303.17760 • 2026-03-20 | 0 |
|
|
MotionLM:面向动作生成与理解的语言建模方法 badge • abs/2309.14343 • 2026-03-20 | 0 |
|
|
DreamFusion:基于文本到图像扩散模型的 3D 生成方案 bot • abs/2209.14988 • 2026-03-20 | 0 |
|
|
WebGPT:利用网页浏览能力提升开放域问答质量 forty • abs/2112.09332 • 2026-03-20 | 0 |
|
|
MiniGPT-4:对齐视觉编码器与大语言模型实现多模态对话 hero • abs/2304.10592 • 2026-03-20 | 0 |
|
|
Self-Instruct:让语言模型自举生成指令数据并完成对齐 key • abs/2212.10560 • 2026-03-20 | 0 |
|
|
CodeT5:面向代码理解与生成的统一预训练编码器-解码器 basic • abs/2109.00859 • 2026-03-20 | 0 |
|
|
RoFormer:引入旋转位置编码的高效 Transformer 表示方法 chisel • abs/2104.09864 • 2026-03-20 | 0 |
|
|
Math-Shepherd:通过过程监督提升数学推理的可验证性 cat • abs/2312.08935v1 • 2026-03-19 | 0 |
|
|
LLaVA-NeXT:更强视觉指令跟随能力的多模态模型升级版 nonillion • abs/2401.12534 • 2026-03-19 | 0 |
|
|
RAPTOR:递归摘要树结构用于更强的检索增强生成 bill • abs/2401.18059 • 2026-03-19 | 0 |