| 注册会员 | 1032 |
| 主题 | 340 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 225 |
| 开源项目 | 305 |
|
|
WebArena:评测智能体在真实网页环境中完成复杂任务的基准 attention • abs/2307.13854 • 1天15小时之前 | 0 |
|
|
WizardMath:面向数学推理专项增强的大语言模型 behave • abs/2308.09583 • 1天15小时之前 | 0 |
|
|
RLAIF:通过 AI 反馈强化学习实现模型对齐 beautiful • abs/2309.00267 • 1天15小时之前 | 0 |
|
|
FLAN:通过指令微调显著提升语言模型的泛化能力 flux • abs/2109.01652 • 1天15小时之前 | 0 |
|
|
AlphaCode 2 技术报告:面向竞赛编程的代码生成系统 almost • abs/2401.08500 • 1天15小时之前 | 0 |
|
|
QLoRA:用 4-bit 量化高效微调大语言模型 gold • abs/2305.14314 • 1天15小时之前 | 0 |
|
|
LongLoRA:低成本方法扩展大语言模型的长上下文能力 asset • abs/2309.12307 • 1天23小时之前 | 0 |
|
|
SEED-Bench:系统评测多模态大模型视觉理解与推理能力 nonillion • abs/2307.16125 • 1天23小时之前 | 0 |
|
|
MAmmoTH:通过思维链与代码联合训练提升数学推理 budget • abs/2305.03582 • 1天23小时之前 | 0 |
|
|
Idefics2:支持图文理解与生成的新一代开放多模态模型 central • abs/2405.02258 • 1天23小时之前 | 0 |
|
|
Chronos:将时间序列预测统一为语言建模问题 elephant • abs/2403.07815 • 1天23小时之前 | 0 |
|
|
TinyLlama:面向高效部署的开源小型语言模型预训练 chrome • abs/2401.02385 • 1天23小时之前 | 0 |
|
|
Qwen-VL:具备强视觉理解能力的大规模多模态模型 testing • abs/2308.12966 • 1天23小时之前 | 0 |
|
|
WizardCoder:通过进化式指令微调提升代码生成能力 berry • abs/2306.08568 • 1天23小时之前 | 0 |
|
|
TextGrad:把反向传播思想迁移到文本与提示优化中 flora • abs/2406.07496 • 2天23小时之前 | 0 |
|
|
CAMEL:通过角色扮演让多智能体协作完成复杂任务 discovery • abs/2303.17760 • 2天23小时之前 | 0 |
|
|
MotionLM:面向动作生成与理解的语言建模方法 badge • abs/2309.14343 • 2天23小时之前 | 0 |
|
|
DreamFusion:基于文本到图像扩散模型的 3D 生成方案 bot • abs/2209.14988 • 2天23小时之前 | 0 |
|
|
MiniGPT-4:对齐视觉编码器与大语言模型实现多模态对话 hero • abs/2304.10592 • 2天23小时之前 | 0 |
|
|
WebGPT:利用网页浏览能力提升开放域问答质量 forty • abs/2112.09332 • 2天23小时之前 | 0 |