| 注册会员 | 1032 |
| 主题 | 340 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 225 |
| 开源项目 | 305 |
|
|
CodeT5:面向代码理解与生成的统一预训练编码器-解码器 basic • abs/2109.00859 • 2天23小时之前 | 0 |
|
|
Self-Instruct:让语言模型自举生成指令数据并完成对齐 key • abs/2212.10560 • 2天23小时之前 | 0 |
|
|
RoFormer:引入旋转位置编码的高效 Transformer 表示方法 chisel • abs/2104.09864 • 2天23小时之前 | 0 |
|
|
Math-Shepherd:通过过程监督提升数学推理的可验证性 cat • abs/2312.08935v1 • 3天23小时之前 | 0 |
|
|
LLaVA-NeXT:更强视觉指令跟随能力的多模态模型升级版 nonillion • abs/2401.12534 • 3天23小时之前 | 0 |
|
|
RAPTOR:递归摘要树结构用于更强的检索增强生成 bill • abs/2401.18059 • 3天23小时之前 | 0 |
|
|
AnimateDiff:无需专门训练文本到视频模型即可生成动画片段 act • abs/2307.04725 • 3天23小时之前 | 0 |
|
|
MM1:大规模多模态模型的训练配方与能力研究 sapphire • abs/2403.09611 • 3天23小时之前 | 0 |
|
|
CodeGeeX:面向多语言代码生成的大规模预训练模型 birth • abs/2303.17568 • 3天23小时之前 | 0 |
|
|
OmniParser:将通用 GUI 截图解析为可交互结构表示 session • abs/2408.00203 • 3天23小时之前 | 0 |
|
|
Mobile ALOHA:低成本双臂机器人模仿学习与远程操作系统 tunnel • abs/2401.02117 • 3天23小时之前 | 0 |
|
|
LongRoPE:面向超长上下文的大模型位置编码扩展方法 database • abs/2402.13753 • 3天23小时之前 | 0 |
|
|
Least-to-Most Prompting:通过从易到难分解步骤提升组合泛化 justice • abs/2205.10625 • 2026-03-18 | 0 |
|
|
Plan-and-Solve Prompting:先规划再求解以减少推理错误 cd • abs/2305.04091 • 2026-03-16 | 0 |
|
|
DeepSeekMath:通过持续预训练强化数学推理能力 replication • abs/2402.03300 • 2026-03-15 | 0 |
|
|
Code Llama:面向代码补全与生成的大语言模型 model • abs/2308.12950v2 • 2026-03-14 | 0 |
|
|
Qwen2 Technical Report:新一代通用大语言模型家族技术报告 firewall • abs/2407.10671 • 2026-03-13 | 0 |
|
|
IDEFICS 2:面向开放场景视觉语言理解的新一代多模态模型 commit • abs/2405.02246 • 2026-03-13 | 0 |
|
|
LLaVA-1.5:更强视觉指令微调带来高效多模态对话能力 macos • abs/2310.03744 • 2026-03-11 | 0 |
|
|
SEINE:面向长时序一致性的文本到视频生成方法 clock • abs/2312.09224 • 2026-03-11 | 0 |