| 注册会员 | 1054 |
| 主题 | 579 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 272 |
| 开源项目 | 469 |
|
|
Graph of Thoughts:用图结构组织思维过程以提升复杂推理 framework • abs/2308.09687 • 2026-02-16 | 0 |
|
|
OpenHands:面向软件开发任务的开放式智能体平台 thirteen • abs/2407.16741 • 2026-02-16 | 0 |
|
|
CRAG:面向检索增强生成的全面评测基准 claude • abs/2406.04744 • 2026-02-15 | 0 |
|
|
VideoPoet:统一语言模型框架下的视频生成、理解与编辑 docker • abs/2312.14125 • 2026-02-15 | 0 |
|
|
Code Llama:面向代码生成与补全的大语言模型家族 ghost • abs/2308.12950 • 2026-02-14 | 0 |
|
|
Visual ChatGPT:将视觉基础模型接入对话系统的多模态协作框架 query • abs/2303.04671 • 2026-02-14 | 0 |
|
|
CogView:通用的跨模态文本到图像生成模型 graphql • abs/2105.13290 • 2026-02-13 | 0 |
|
|
CogVideo:高分辨率文本到视频生成的预训练 Transformer radar • abs/2205.15868 • 2026-02-13 | 0 |
|
|
DeepSeek-Coder:让代码触手可及的开源编程大语言模型 exploit • abs/2401.14196 • 2026-02-12 | 0 |
|
|
Yi 模型:零一万物的大规模基础模型系列 fiber • abs/2403.04652 • 2026-02-09 | 0 |
|
|
Baichuan 2:大规模多语言预训练的技术报告 fourteen • abs/2309.10305 • 2026-02-08 | 0 |
|
|
ChatGLM:面向对话优化的中英双语大模型技术实践 root • abs/2303.11145 • 2026-02-06 | 0 |
|
|
GLM-130B:双语预训练大语言模型的高效训练与应用 crystalx • abs/2210.02414 • 2026-02-06 | 0 |
|
|
ControlNet:为文本生成图像扩散模型添加条件控制 eighty • abs/2302.05543 • 2026-02-06 | 0 |
|
|
Grok-1 技术报告:由 xAI 训练的 314B 参数 MoE 模型 logging • blog/grok-os • 2026-02-06 | 0 |
|
|
Gemini 1.5:性能强大的多模态长上下文语言模型 claude • abs/2403.05530 • 2026-02-05 | 0 |
|
|
Claude 3 技术报告:新一代多模态模型对齐方案 impact • news/claude-3-family • 2026-02-03 | 0 |
|
|
Self-RAG:通过自我反馈学习检索、生成与批判 ghost • abs/2310.11511 • 2026-02-02 | 0 |
|
|
LongRAG:通过检索增强实现 10 万词级别的超长文本处理 oracle • abs/2406.15319 • 2026-01-31 | 0 |
|
|
SimPO:简单的偏好优化方法 blueprint • abs/2405.14734 • 2026-01-30 | 0 |