阿里发布 Qwen3.5-397B-A17B：新一代高性能开源 AI 模型

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

阿里巴巴旗下的 Qwen 团队近期发布了最新的开源大型 AI 模型 Qwen3.5-397B-A17B，这是 Qwen3.5 系列中的重要成员，代表了当前开源 AI 模型的一项显著技术进步。该模型在多项性能指标上实现了跨代提升，展示了中大型模型在智能推理和多模态能力方面的竞争力。

混合架构设计：大规模+高效推理

Qwen3.5-397B-A17B 拥有 3970 亿参数规模，但在推理时每个令牌只激活 17 亿参数，这种混合稀疏架构（MoE + Gated Delta Networks）让它在保留大型模型表达能力的同时降低了计算成本。这种设计使得它在推理效率上与较小模型更接近，同时具备接近大模型的深层能力。

此外，模型支持 原生多模态输入，能够同时处理文本与图像任务，进一步扩展了它的应用场景。

强劲的推理与现实任务表现

独立评测显示 Qwen3.5-397B-A17B 在多维度测试指标上有明显提升：

在综合智能指数评估中得分达到 45 分，在开源模型中排名靠前。
在 GDPval-AA 真实工作任务评估中得分显著高于上一代。
在编码能力、科学推理和指令遵循等任务上表现均有增长。

这些表现表明该模型不仅在理论基准测试中表现优异，也具有处理实际复杂任务的实力。

多语言与上下文优势

Qwen3.5-397B-A17B 支持超过 200 种语言和方言，扩大了全球应用能力。

同时，它拥有高达 262k 的上下文窗口，也能通过托管版本扩展至 1M Tokens，适合处理长文档或长期交互任务。

性能与成本权衡

评测中模型生成的输出内容数量较大，表明其反应详尽且富有逻辑，但也导致计算成本相对偏高。按官方 API 定价，该模型的输入和输出令牌费用分别约为每 100 万 Token 0.60 美元和 3.60 美元，属于较高区间。

不过，相比传统密集大模型，Qwen3.5-397B-A17B 在提供大规模理解能力的同时，在运行效率与可扩展性上更具优势。

应用与生态

作为 开源权重模型，Qwen3.5-397B-A17B 已可通过阿里官方 API、Qwen Chat 平台和 Hugging Face 获取，方便开发者与企业集成与部署。

这一模型适合用于需要深度推理、多模态理解以及长上下文处理的领域，如智能客服、自动化办公助理、图像理解与语义检索等。

未来趋势

Qwen3.5-397B-A17B 的发布标志着大型语言模型在 性能、效率与可用性之间取得了新的平衡。随着多模态和大上下文能力的普及，整体 AI 基础设施正向着更高效、更现实应用友好的方向演进。

未来，随着模型架构优化和更广泛的应用集成，此类高性能开源模型有望进一步推动自动化智能工具在产业级场景的落地。

91 次点击 ∙ 0 人收藏

登录后收藏

1 条回复

monolith

2026-02-27 02:47:01

千问每次吹的很牛，用起来感觉很弱智。