| 注册会员 | 1093 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 329 |
| 开源项目 | 527 |
|
|
CodeT:利用测试时反馈改进代码生成与选择 alter • abs/2207.10397v1 • 2026-04-23 | 0 |
|
|
WizardCoder:经进化指令微调的代码大语言模型 bachelor • abs/2306.08568v1 • 2026-04-23 | 0 |
|
|
SEINE:面向长视频生成的统一扩散建模方法 almost • abs/2310.20700v1 • 2026-04-23 | 0 |
|
|
AdaSPEC:通过自适应推测解码加速大语言模型生成 quintessence • abs/2402.11131 • 2026-04-23 | 0 |
|
|
STaR:借助自举式推理轨迹提升语言模型推理能力 thousand • abs/2203.14465v1 • 2026-04-23 | 0 |
|
|
RAG-Fusion:通过多查询融合提升检索增强生成效果 digit • abs/2402.03367v1 • 2026-04-23 | 0 |
|
|
Textbooks Are All You Need:高质量教材数据驱动的小模型训练范式 dairy • abs/2306.11644 • 2026-04-22 | 0 |
|
|
Sora 技术报告:大规模视频生成模型的建模思路 almost • abs/2402.17177 • 2026-04-21 | 0 |
|
|
MoE-LLaVA:基于混合专家架构的高效多模态大模型 chatbot • abs/2401.15947 • 2026-04-20 | 0 |
|
|
AgentBench:评测大语言模型作为智能体执行复杂任务的能力 decillion • abs/2308.03688 • 2026-04-17 | 0 |
|
|
VILA:面向视觉语言任务的高效可扩展多模态模型 bless • abs/2405.04482 • 2026-04-17 | 0 |
|
|
Video-LLaVA:统一视频与图像理解的视觉语言助手 three • abs/2311.10122 • 2026-04-17 | 0 |
|
|
DreamCraft3D:通过 2D 扩散先验实现高质量 3D 内容生成 question • abs/2310.16818 • 2026-04-16 | 0 |
|
|
Language Agent Tree Search:将树搜索引入 Agent 任务规划与决策 yonder • abs/2310.04406 • 2026-04-16 | 0 |
|
|
MoRA:用高秩更新增强参数高效微调表达能力 beauty • abs/2405.12130 • 2026-04-16 | 0 |
|
|
V-JEPA:通过预测视频抽象表示学习世界模型 agency • abs/2401.09417 • 2026-04-16 | 0 |
|
|
Phi-2:小参数语言模型也能展现出强推理与代码能力 course • abs/2312.08957 • 2026-04-16 | 0 |
|
|
LLaVA-NeXT:在更高分辨率与更强感知能力上推进视觉语言模型 hunterx • abs/2401.03744 • 2026-04-15 | 0 |
|
|
MotionGPT:统一文本、动作与多模态控制的人体运动生成模型 discovery • abs/2306.14795 • 2026-04-15 | 0 |
|
|
TinyStories:用极简故事语料研究小模型的语言学习能力 empire • abs/2305.07759 • 2026-04-15 | 0 |