| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
PagedAttention (vLLM):通过分块内存管理实现 LLM 服务的高吞吐 angle • abs/2309.06180 • 2026-01-22 | 0 |
|
|
RAG:针对知识密集型 NLP 任务的检索增强生成 session • abs/2005.11401 • 2026-01-22 | 0 |
|
|
ViT:一张图等同于 16x16 个单词,用于大规模图像识别的 Transformer apex • abs/2010.11929 • 2026-01-21 | 0 |
|
|
潜扩散模型(Stable Diffusion):高分辨率图像合成基石 dojo • abs/2112.10752 • 2026-01-20 | 0 |
|
|
Falcon 技术报告:具有挑战性的开源基础模型 deep • abs/2306.01116 • 2026-01-19 | 0 |
|
|
BLOOM:一个 176B 参数的开源多语种语言模型 breezeo • abs/2211.05100 • 2026-01-18 | 0 |
|
|
PaLM:通过通路架构扩展语言模型 banner • abs/2204.02311 • 2026-01-18 | 0 |
|
|
T5:利用统一的文本到文本传递框架探索迁移学习的极限 devops • abs/1910.10683 • 2026-01-18 | 0 |
|
|
RoBERTa:稳健优化的 BERT 预训练方法 cosmic • abs/1907.11692 • 2026-01-15 | 0 |
|
|
Kolors:来自快手团队的大规模高质量文本生成图像模型 journey • abs/2407.06927 • 2026-01-14 | 0 |
|
|
Mistral 7B:高效且强大的开源 7B 语言模型 desktop • abs/2310.06825 • 2026-01-14 | 0 |
|
|
Scaling Laws:神经语言模型的缩放定律研究 zenith • abs/2001.08361 • 2026-01-14 | 0 |
|
|
GraphRAG:结合图机器学习提升 RAG 的全局问答能力 mongodb • abs/2404.16130 • 2026-01-13 | 0 |
|
|
DINOv2:无需监督学习的鲁棒视觉特征预训练 seven • abs/2304.07193 • 2026-01-13 | 0 |
|
|
GaLore:实现消费级显存微调全量参数的内存高效算法 culture • abs/2403.03528 • 2026-01-12 | 0 |
|
|
Chinchilla:探索训练计算量最优的大语言模型 admin • abs/2203.15556 • 2026-01-11 | 0 |
|
|
Segment Anything (SAM):图像分割的通用基石模型 breezeo • abs/2304.02643 • 2026-01-10 | 0 |
|
|
LLaVA:视觉指令微调与多模态理解 airpods • abs/2304.08485 • 2026-01-10 | 0 |
|
|
BitNet:1比特 Transformer 时代下的模型缩放定律 logging • abs/2310.11453 • 2026-01-10 | 0 |