| 注册会员 | 1054 |
| 主题 | 579 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 272 |
| 开源项目 | 469 |
|
|
DragNUWA:支持轨迹控制的文本到视频生成框架 graphql • abs/2308.08089 • 2026-04-04 | 0 |
|
|
AgentVerse:多智能体任务求解与仿真平台框架 across • abs/2308.10848 • 2026-04-02 | 0 |
|
|
Q* 推理相关方向:通过搜索与验证增强数学解题能力 approach • abs/2402.14083 • 2026-04-02 | 0 |
|
|
Sora 技术路径相关探索:视频扩散 Transformer 的早期代表研究 central • abs/2403.03206 • 2026-04-02 | 0 |
|
|
MobileVLM:面向终端设备的轻量级视觉语言模型 volcano • abs/2312.16886 • 2026-04-02 | 0 |
|
|
AlpacaFarm:低成本自动化评测与对齐指令跟随模型的方法 aero • abs/2305.14387 • 2026-03-31 | 0 |
|
|
MMMU:面向多学科复杂任务的多模态理解基准 domainx • abs/2311.16502 • 2026-03-31 | 0 |
|
|
RAFT:面向检索增强生成的领域自适应评测基准 anything • abs/2403.10131 • 2026-03-30 | 0 |
|
|
MemGPT:让大语言模型通过分层记忆管理处理长程上下文 fourteen • abs/2310.08560 • 2026-03-27 | 0 |
|
|
LLaVA-Plus:将多模态理解与工具使用统一到视觉语言助手中 five • abs/2311.05437 • 2026-03-27 | 0 |
|
|
SETR:将语义分割建模为纯 Transformer 序列到序列任务 user • abs/2012.15840 • 2026-03-27 | 0 |
|
|
DreamBooth:仅需少量样本即可实现个性化文生图生成 neo • abs/2208.12242 • 2026-03-27 | 0 |
|
|
Magicoder:受启发式进化训练启发的代码生成语言模型 blind • abs/2312.02120 • 2026-03-27 | 0 |
|
|
MiniCPM-V:轻量级但高性能的端侧多模态视觉语言模型 baby • abs/2408.01800 • 2026-03-26 | 0 |
|
|
OpenDevin:面向通用软件开发任务的开源智能体平台 fusionx • abs/2401.02994 • 2026-03-26 | 0 |
|
|
Mobile-Agent:让多模态智能体在手机界面上执行复杂任务 jwt • abs/2401.16158 • 2026-03-26 | 0 |
|
|
CogVLM:融合视觉编码器与语言模型的开源多模态模型 zest • abs/2311.03079 • 2026-03-25 | 0 |
|
|
SEINE:支持长时一致性的文本到视频生成方法 ivory • abs/2310.20700 • 2026-03-25 | 0 |
|
|
Phi-3 Technical Report:小模型高能力的技术报告 aware • abs/2404.14219 • 2026-03-25 | 0 |
|
|
MiniCPM:面向端侧部署的高效大语言模型方案 eighteen • abs/2404.06395 • 2026-03-25 | 0 |