| 注册会员 | 1142 |
| 主题 | 846 |
| 模型 | 3026 |
| 技能包 | 13874 |
| 数据集 | 1047 |
| 论文 | 359 |
| 开源项目 | 565 |
|
|
MM-ReAct:多模态场景下结合视觉感知、推理与行动的 Agent article • abs/2303.11381 • 2026-04-06 | 0 |
|
|
AlphaGeometry:结合神经模型与符号推理解决几何证明问题 chain • abs/2401.11985 • 2026-04-05 | 0 |
|
|
Chain-of-Verification:先生成再验证,降低幻觉并提升可靠性 explore • abs/2309.11495 • 2026-04-05 | 0 |
|
|
RARR:检索后修正生成内容,提高事实一致性与可追溯性 betray • abs/2210.08726 • 2026-04-05 | 0 |
|
|
RETRO:结合海量检索语料的增强型生成模型 nexus • abs/2112.04426 • 2026-04-05 | 0 |
|
|
MathVista:评测多模态模型数学推理能力的基准数据集 python • abs/2310.02255 • 2026-04-04 | 0 |
|
|
CodeFuse-13B:面向代码生成与理解的开源大模型 alarm • abs/2309.00859 • 2026-04-04 | 0 |
|
|
DragNUWA:支持轨迹控制的文本到视频生成框架 graphql • abs/2308.08089 • 2026-04-04 | 0 |
|
|
AgentVerse:多智能体任务求解与仿真平台框架 across • abs/2308.10848 • 2026-04-02 | 0 |
|
|
Q* 推理相关方向:通过搜索与验证增强数学解题能力 approach • abs/2402.14083 • 2026-04-02 | 0 |
|
|
Sora 技术路径相关探索:视频扩散 Transformer 的早期代表研究 central • abs/2403.03206 • 2026-04-02 | 0 |
|
|
MobileVLM:面向终端设备的轻量级视觉语言模型 volcano • abs/2312.16886 • 2026-04-02 | 0 |
|
|
AlpacaFarm:低成本自动化评测与对齐指令跟随模型的方法 aero • abs/2305.14387 • 2026-03-31 | 0 |
|
|
MMMU:面向多学科复杂任务的多模态理解基准 domainx • abs/2311.16502 • 2026-03-31 | 0 |
|
|
RAFT:面向检索增强生成的领域自适应评测基准 anything • abs/2403.10131 • 2026-03-30 | 0 |
|
|
MemGPT:让大语言模型通过分层记忆管理处理长程上下文 fourteen • abs/2310.08560 • 2026-03-27 | 0 |
|
|
LLaVA-Plus:将多模态理解与工具使用统一到视觉语言助手中 five • abs/2311.05437 • 2026-03-27 | 0 |
|
|
SETR:将语义分割建模为纯 Transformer 序列到序列任务 user • abs/2012.15840 • 2026-03-27 | 0 |
|
|
DreamBooth:仅需少量样本即可实现个性化文生图生成 neo • abs/2208.12242 • 2026-03-27 | 0 |
|
|
Magicoder:受启发式进化训练启发的代码生成语言模型 blind • abs/2312.02120 • 2026-03-27 | 0 |