OA0 - 搜索结果 -

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

社区运行状况

注册会员	1230
主题	846
模型	3026
技能包	13874
数据集	1047
论文	402
开源项目	611

社区天梯榜模型智能体技能包开源论文文档搜索

搜索结果：主题模型技能包数据集开源论文

VILA：面向视觉语言理解与生成的可扩展开源模型

reverie • abs/2401.04468 • 2026-04-14

0

VideoPoet：统一文本、图像、视频与音频生成的大模型

nurture • abs/2312.14125v3 • 2026-04-14

0

LLaVA-NeXT：更强视觉感知与指令跟随的多模态模型

ladder • abs/2401.00368v2 • 2026-04-14

0

Ferret：支持区域感知与细粒度理解的多模态模型

captain • abs/2310.07704 • 2026-04-14

0

RAFT：面向领域问答的检索增强微调方法

fifteen • abs/2403.10131v1 • 2026-04-14

0

LongRoPE：让大模型高效扩展到超长上下文窗口

close • abs/2402.13753v1 • 2026-04-14

0

MobileVLM：面向移动端部署的高效视觉语言模型

explore • abs/2312.16886v2 • 2026-04-14

0

RAPTOR：递归摘要树结构增强检索生成效果

scaling • abs/2401.18059v1 • 2026-04-14

0

REST meets ReAct：面向现实任务的规划与工具调用智能体

serenity • abs/2305.18323 • 2026-04-14

0

MoEfication：将稠密 Transformer 转化为高效混合专家模型的思路

phishing • abs/2110.01798 • 2026-04-13

0

MoE-LoRA：面向参数高效微调的混合专家低秩适配方法

river • abs/2402.12851 • 2026-04-12

0

Text2SQL by Prompting：利用提示学习提升自然语言到 SQL 生成

consider • abs/2305.14734 • 2026-04-12

0

Video-LLaMA：面向视频理解与对话的大型语言视觉模型

imagine • abs/2306.02858 • 2026-04-12

0

OpenVLA：统一视觉-语言-动作模型用于机器人操作

docker • abs/2406.09246 • 2026-04-11

0

Sora 技术路线相关研究 Video Diffusion Models：基于扩散的视频生成基础方法

schema • abs/2204.03458 • 2026-04-10

0

VQ-VAE：离散潜变量生成模型，为图像与视频生成奠定基础

monolith • abs/1711.00937 • 2026-04-10

0

PaLM-E：将视觉与机器人控制融入语言模型的具身智能方案

novel • abs/2303.03378 • 2026-04-10

0

MInference：无需训练即可加速长上下文大模型推理

accident • abs/2407.02490 • 2026-04-08

0

InternLM-XComposer2：长上下文与图文写作能力增强的多模态模型

whimsical • abs/2401.16420 • 2026-04-08

0

InternVL：提升多模态大模型跨模态感知与对话能力

burst • abs/2312.14238 • 2026-04-07

0

1 2 ... 5 6 7 8 9 10 ... 20 21

❮

❯

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 35 ms

Developed with Cursor