| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
Self-Discover:大模型自动发现推理结构的方法 thirty • abs/2402.03620 • 2025-10-08 | 0 |
|
|
DeepSeek-R1:通过强化学习提升大模型推理能力 armor • abs/2501.12948 • 2025-10-08 | 0 |
|
|
Gemini:多模态原生大模型技术报告 jet • abs/2312.11805 • 2025-10-08 | 0 |
|
|
Qwen 技术报告:通义千问大语言模型体系 astro • abs/2309.16609 • 2025-10-08 | 0 |
|
|
Mamba:线性时间复杂度的选择性状态空间模型 brook • abs/2312.00752 • 2025-10-02 | 0 |
|
|
Mixtral:基于稀疏专家架构的混合大语言模型 luna • abs/2401.04088 • 2025-10-01 | 0 |
|
|
LLaMA:高效开放式大语言模型 diesel • abs/2302.13971 • 2025-09-30 | 0 |
|
|
CLIP:对比语言-图像预训练模型 type • abs/2103.00020 • 2025-09-28 | 0 |
|
|
DDPM:基于去噪扩散概率模型的生成方法 cookie • abs/2006.11239 • 2025-09-26 | 0 |
|
|
ResNet:深度残差学习用于图像识别 canvas • abs/1512.03385 • 2025-09-24 | 0 |
|
|
GPT-3:基于大规模参数的少样本学习语言模型 ipados • abs/2005.14165 • 2025-09-24 | 0 |
|
|
BERT:深度双向 Transformer 预训练语言模型 deep • abs/1810.04805 • 2025-09-23 | 0 |
|
|
MaxViT:多轴注意力视觉 Transformer turbo • abs/2204.01697 • 2025-09-23 | 0 |
|
|
DaViT:双注意力机制的视觉 Transformer editor • abs/2204.03645 • 2025-09-21 | 0 |
|
|
Longformer:长文档处理的高效 Transformer view • abs/2004.05150 • 2025-09-21 | 0 |
|
|
Tensor Comprehensions:一种框架无关的高性能机器学习抽象框架 epic • abs/1802.04730 • 2025-09-21 | 0 |
|
|
生成对抗网络(GAN)算法、理论与应用综述 epic • abs/2001.06937 • 2025-09-20 | 0 |
|
|
ImageNet 图像分类与深度卷积神经网络(AlexNet) anthem • abs/1202.2745 • 2025-09-20 | 0 |
|
|
Attention Is All You Need:Transformer 自注意力架构 quadrillion • abs/1706.03762 • 2025-09-20 | 0 |