Google 发布 Gemini 3.1 Flash-Lite：性能显著提升，输出成本上涨

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

一、发布概况

Gemini 3.1 Flash-Lite 是面向大规模生产环境推出的高效版本，强调低延迟与高吞吐能力，在保持多模态与长上下文支持的同时提升整体响应性能。

该模型在高频调用和实时交互场景下具备更强优势。

整体推理与多模态能力较前代模型有所增强，表现趋近更高阶模型水平。

与前代版本相比，Gemini 3.1 Flash-Lite 的定价出现明显上调：

项目	旧价格	新价格	涨幅
输入（每百万 tokens）	$0.10	$0.25	2.5 倍
输出（每百万 tokens）	$0.40	$1.50	超过 3 倍

输出成本上涨幅度最大，在高调用场景下总体支出增长明显。

模型支持根据任务复杂度调节“思考”深度，开发者可在性能、成本与精度之间灵活权衡。

适用场景包括：

Gemini 3.1 Flash-Lite 在响应速度、推理能力与多模态表现方面实现全面升级，定位为高效率、可规模化部署的生产级模型。然而，其输出成本较前代大幅上涨，使企业在大规模应用时需更加关注整体预算结构。性能与成本之间的平衡将成为实际落地的重要考量因素。

40 次点击 ∙ 0 人收藏

登录后收藏

0 条回复