| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
ControlNet:为文本生成图像扩散模型添加条件控制 eighty • abs/2302.05543 • 2026-02-06 | 0 |
|
|
Grok-1 技术报告:由 xAI 训练的 314B 参数 MoE 模型 logging • blog/grok-os • 2026-02-06 | 0 |
|
|
Gemini 1.5:性能强大的多模态长上下文语言模型 claude • abs/2403.05530 • 2026-02-05 | 0 |
|
|
Claude 3 技术报告:新一代多模态模型对齐方案 impact • news/claude-3-family • 2026-02-03 | 0 |
|
|
Self-RAG:通过自我反馈学习检索、生成与批判 ghost • abs/2310.11511 • 2026-02-02 | 0 |
|
|
LongRAG:通过检索增强实现 10 万词级别的超长文本处理 oracle • abs/2406.15319 • 2026-01-31 | 0 |
|
|
SimPO:简单的偏好优化方法 blueprint • abs/2405.14734 • 2026-01-30 | 0 |
|
|
KTO:基于卡恩曼-特沃斯基优化的模型对齐方法 list • abs/2402.01306 • 2026-01-30 | 0 |
|
|
PPO:近端策略优化算法 mcp • abs/1707.06347 • 2026-01-29 | 0 |
|
|
GSM8K:训练语言模型解决多步数学应用题 rocket • abs/2110.14168 • 2026-01-29 | 0 |
|
|
MMLU:大规模多任务语言理解基准测试 arrowx • abs/2009.03300 • 2026-01-28 | 0 |
|
|
Gopher:语言模型在 2800 亿参数规模下的表现分析 seven • abs/2112.11446 • 2026-01-28 | 0 |
|
|
FunSearch:通过大语言模型在数学科学中发现新知识 ci • articles/s41586-023-06924-6 • 2026-01-27 | 0 |
|
|
Minerva:利用语言模型解决定量推理问题 circuit • abs/2206.14858 • 2026-01-26 | 0 |
|
|
CAMEL:用于探索大语言模型智能体“心灵”对话的交流式框架 git • abs/2303.17778 • 2026-01-26 | 0 |
|
|
MetaGPT:多智能体协作框架下的元编程方案 architecture • abs/2308.00352 • 2026-01-26 | 0 |
|
|
生成式智能体(25人的虚拟小镇):人类行为的计算模拟 android • abs/2304.03442 • 2026-01-26 | 0 |
|
|
BitNet 1.58b:所有大语言模型都应该使用 1.58 比特 ladder • abs/2402.17764 • 2026-01-23 | 0 |
|
|
AWQ:低比特大语言模型的激活感知权重降噪量化 protocol • abs/2306.00978 • 2026-01-23 | 0 |
|
|
GPTQ:生成式预训练模型的高效后训练量化 integration • abs/2210.17323 • 2026-01-22 | 0 |