| 注册会员 | 1032 |
| 主题 | 340 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 228 |
| 开源项目 | 305 |
|
|
Code Llama:面向代码生成与补全的大语言模型家族 ghost • abs/2308.12950 • 2026-02-14 | 0 |
|
|
Visual ChatGPT:将视觉基础模型接入对话系统的多模态协作框架 query • abs/2303.04671 • 2026-02-14 | 0 |
|
|
CogView:通用的跨模态文本到图像生成模型 graphql • abs/2105.13290 • 2026-02-13 | 0 |
|
|
CogVideo:高分辨率文本到视频生成的预训练 Transformer radar • abs/2205.15868 • 2026-02-13 | 0 |
|
|
DeepSeek-Coder:让代码触手可及的开源编程大语言模型 exploit • abs/2401.14196 • 2026-02-12 | 0 |
|
|
Yi 模型:零一万物的大规模基础模型系列 fiber • abs/2403.04652 • 2026-02-09 | 0 |
|
|
Baichuan 2:大规模多语言预训练的技术报告 fourteen • abs/2309.10305 • 2026-02-08 | 0 |
|
|
ChatGLM:面向对话优化的中英双语大模型技术实践 root • abs/2303.11145 • 2026-02-06 | 0 |
|
|
GLM-130B:双语预训练大语言模型的高效训练与应用 crystalx • abs/2210.02414 • 2026-02-06 | 0 |
|
|
ControlNet:为文本生成图像扩散模型添加条件控制 eighty • abs/2302.05543 • 2026-02-06 | 0 |
|
|
Grok-1 技术报告:由 xAI 训练的 314B 参数 MoE 模型 logging • blog/grok-os • 2026-02-06 | 0 |
|
|
Gemini 1.5:性能强大的多模态长上下文语言模型 claude • abs/2403.05530 • 2026-02-05 | 0 |
|
|
Claude 3 技术报告:新一代多模态模型对齐方案 impact • news/claude-3-family • 2026-02-03 | 0 |
|
|
Self-RAG:通过自我反馈学习检索、生成与批判 ghost • abs/2310.11511 • 2026-02-02 | 0 |
|
|
LongRAG:通过检索增强实现 10 万词级别的超长文本处理 oracle • abs/2406.15319 • 2026-01-31 | 0 |
|
|
SimPO:简单的偏好优化方法 blueprint • abs/2405.14734 • 2026-01-30 | 0 |
|
|
KTO:基于卡恩曼-特沃斯基优化的模型对齐方法 list • abs/2402.01306 • 2026-01-30 | 0 |
|
|
PPO:近端策略优化算法 mcp • abs/1707.06347 • 2026-01-29 | 0 |
|
|
GSM8K:训练语言模型解决多步数学应用题 rocket • abs/2110.14168 • 2026-01-29 | 0 |
|
|
MMLU:大规模多任务语言理解基准测试 arrowx • abs/2009.03300 • 2026-01-28 | 0 |