| 注册会员 | 1054 |
| 主题 | 580 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 272 |
| 开源项目 | 469 |
|
|
KTO:基于卡恩曼-特沃斯基优化的模型对齐方法 list • abs/2402.01306 • 2026-01-30 | 0 |
|
|
PPO:近端策略优化算法 mcp • abs/1707.06347 • 2026-01-29 | 0 |
|
|
GSM8K:训练语言模型解决多步数学应用题 rocket • abs/2110.14168 • 2026-01-29 | 0 |
|
|
MMLU:大规模多任务语言理解基准测试 arrowx • abs/2009.03300 • 2026-01-28 | 0 |
|
|
Gopher:语言模型在 2800 亿参数规模下的表现分析 seven • abs/2112.11446 • 2026-01-28 | 0 |
|
|
FunSearch:通过大语言模型在数学科学中发现新知识 ci • articles/s41586-023-06924-6 • 2026-01-27 | 0 |
|
|
Minerva:利用语言模型解决定量推理问题 circuit • abs/2206.14858 • 2026-01-26 | 0 |
|
|
CAMEL:用于探索大语言模型智能体“心灵”对话的交流式框架 git • abs/2303.17778 • 2026-01-26 | 0 |
|
|
MetaGPT:多智能体协作框架下的元编程方案 architecture • abs/2308.00352 • 2026-01-26 | 0 |
|
|
生成式智能体(25人的虚拟小镇):人类行为的计算模拟 android • abs/2304.03442 • 2026-01-26 | 0 |
|
|
BitNet 1.58b:所有大语言模型都应该使用 1.58 比特 ladder • abs/2402.17764 • 2026-01-23 | 0 |
|
|
AWQ:低比特大语言模型的激活感知权重降噪量化 protocol • abs/2306.00978 • 2026-01-23 | 0 |
|
|
GPTQ:生成式预训练模型的高效后训练量化 integration • abs/2210.17323 • 2026-01-22 | 0 |
|
|
PagedAttention (vLLM):通过分块内存管理实现 LLM 服务的高吞吐 angle • abs/2309.06180 • 2026-01-22 | 0 |
|
|
RAG:针对知识密集型 NLP 任务的检索增强生成 session • abs/2005.11401 • 2026-01-22 | 0 |
|
|
ViT:一张图等同于 16x16 个单词,用于大规模图像识别的 Transformer apex • abs/2010.11929 • 2026-01-21 | 0 |
|
|
潜扩散模型(Stable Diffusion):高分辨率图像合成基石 dojo • abs/2112.10752 • 2026-01-20 | 0 |
|
|
Falcon 技术报告:具有挑战性的开源基础模型 deep • abs/2306.01116 • 2026-01-19 | 0 |
|
|
BLOOM:一个 176B 参数的开源多语种语言模型 breezeo • abs/2211.05100 • 2026-01-18 | 0 |
|
|
PaLM:通过通路架构扩展语言模型 banner • abs/2204.02311 • 2026-01-18 | 0 |