阿里巴巴旗下的 Qwen 团队近期发布了最新的开源大型 AI 模型 Qwen3.5-397B-A17B,这是 Qwen3.5 系列中的重要成员,代表了当前开源 AI 模型的一项显著技术进步。该模型在多项性能指标上实现了跨代提升,展示了中大型模型在智能推理和多模态能力方面的竞争力。
Qwen3.5-397B-A17B 拥有 3970 亿参数规模,但在推理时每个令牌只激活 17 亿参数,这种混合稀疏架构(MoE + Gated Delta Networks)让它在保留大型模型表达能力的同时降低了计算成本。这种设计使得它在推理效率上与较小模型更接近,同时具备接近大模型的深层能力。
此外,模型支持 原生多模态输入,能够同时处理文本与图像任务,进一步扩展了它的应用场景。
独立评测显示 Qwen3.5-397B-A17B 在多维度测试指标上有明显提升:
这些表现表明该模型不仅在理论基准测试中表现优异,也具有处理实际复杂任务的实力。
Qwen3.5-397B-A17B 支持超过 200 种语言和方言,扩大了全球应用能力。
同时,它拥有高达 262k 的上下文窗口,也能通过托管版本扩展至 1M Tokens,适合处理长文档或长期交互任务。
评测中模型生成的输出内容数量较大,表明其反应详尽且富有逻辑,但也导致计算成本相对偏高。按官方 API 定价,该模型的输入和输出令牌费用分别约为每 100 万 Token 0.60 美元和 3.60 美元,属于较高区间。
不过,相比传统密集大模型,Qwen3.5-397B-A17B 在提供大规模理解能力的同时,在运行效率与可扩展性上更具优势。
作为 开源权重模型,Qwen3.5-397B-A17B 已可通过阿里官方 API、Qwen Chat 平台和 Hugging Face 获取,方便开发者与企业集成与部署。
这一模型适合用于需要深度推理、多模态理解以及长上下文处理的领域,如智能客服、自动化办公助理、图像理解与语义检索等。
Qwen3.5-397B-A17B 的发布标志着大型语言模型在 性能、效率与可用性之间取得了新的平衡。随着多模态和大上下文能力的普及,整体 AI 基础设施正向着更高效、更现实应用友好的方向演进。
未来,随着模型架构优化和更广泛的应用集成,此类高性能开源模型有望进一步推动自动化智能工具在产业级场景的落地。