| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
SEEKR:将搜索引擎、知识库与强化学习结合的检索增强语言模型 mercy • abs/2305.15225 • 2026-04-27 | 0 |
|
|
RARR:通过检索与引用修正提升语言模型回答可信度 client • abs/2305.14627 • 2026-04-24 | 0 |
|
|
AgentBench:系统评测大语言模型作为智能体的能力边界 aim • abs/2308.03688v1 • 2026-04-23 | 0 |
|
|
TinyStories:用极简高质量语料研究小模型语言学习 three • abs/2305.07759v2 • 2026-04-23 | 0 |
|
|
Ferret:面向区域级理解的多模态大语言模型 quiver • abs/2310.07704v1 • 2026-04-23 | 0 |
|
|
Math-Shepherd:用过程监督训练更擅长数学推理的大模型 alice • abs/2312.08935v3 • 2026-04-23 | 0 |
|
|
Quiet-STaR:让语言模型在生成时学会内隐思考 advance • abs/2403.09629v1 • 2026-04-23 | 0 |
|
|
Symbol-LLM:把符号规划能力引入大模型推理过程 biology • abs/2402.00803 • 2026-04-23 | 0 |
|
|
RCI:通过检索校正提升大模型在知识密集任务上的表现 compass • abs/2305.10474 • 2026-04-23 | 0 |
|
|
MM1:大规模多模态预训练模型的设计与训练经验 twenty • abs/2403.09611v1 • 2026-04-23 | 0 |
|
|
CodeT:利用测试时反馈改进代码生成与选择 alter • abs/2207.10397v1 • 2026-04-23 | 0 |
|
|
WizardCoder:经进化指令微调的代码大语言模型 bachelor • abs/2306.08568v1 • 2026-04-23 | 0 |
|
|
SEINE:面向长视频生成的统一扩散建模方法 almost • abs/2310.20700v1 • 2026-04-23 | 0 |
|
|
AdaSPEC:通过自适应推测解码加速大语言模型生成 quintessence • abs/2402.11131 • 2026-04-23 | 0 |
|
|
STaR:借助自举式推理轨迹提升语言模型推理能力 thousand • abs/2203.14465v1 • 2026-04-23 | 0 |
|
|
RAG-Fusion:通过多查询融合提升检索增强生成效果 digit • abs/2402.03367v1 • 2026-04-23 | 0 |
|
|
Textbooks Are All You Need:高质量教材数据驱动的小模型训练范式 dairy • abs/2306.11644 • 2026-04-22 | 0 |
|
|
Sora 技术报告:大规模视频生成模型的建模思路 almost • abs/2402.17177 • 2026-04-21 | 0 |
|
|
MoE-LLaVA:基于混合专家架构的高效多模态大模型 chatbot • abs/2401.15947 • 2026-04-20 | 0 |
|
|
AgentBench:评测大语言模型作为智能体执行复杂任务的能力 decillion • abs/2308.03688 • 2026-04-17 | 0 |