​谷歌发布全新 Gemini 2.5 Flash-Lite 稳定版:速度与成本的完美平衡

近日,正式宣布其最新的 Gemini2.5Flash-Lite 模型已进入稳定版本 (GA)。这一版本被称为是速度最快、成本最低的模型,标志着谷歌在领域的又一重要进展。Gemini2.5Flash-Lite 在性能和成本之间取得了良好的平衡,能够原生支持高达 100 万 token 的上下文,带来了诸多高级功能。

Gemini2.5Flash-Lite 的定价策略也相当引人注目: 每百万输入 token 的费用仅为 0.10 美元,而每百万输出 token 的费用为 0.40 美元,这与竞争对手 -4.1Nano 的价格相当。此外,相较于早期的预览版,这一模型在音频输入方面的定价降低了 40%,显示出其对用户需求的敏感度和对市场竞争的回应。

在各项基准测试中,Gemini2.5Flash-Lite 的表现超越了之前的 2.0 版本,涵盖了编码、数学、推理和多模态理解等多个领域。该模型支持 100 万 token 的上下文窗口,具备可控的思考预算 (thinkingbudgets),并提供多种原生工具,如与 搜索的结合、代码执行以及 URL 上下文的功能。

开发者们可以通过简单的代码指令使用 Gemini2.5Flash-Lite 模型,具体方式是指定模型为 -2.5-flash-lite。需要注意的是,原有的预览版别名计划将于 8 月 25 日移除,开发者们应尽快适应新的版本。

此次 Gemini2.5Flash-Lite 的发布,标志着谷歌在人工智能技术方面不断创新和优化的决心,为开发者提供了更加高效且经济实惠的选择,未来无疑会在多种应用场景中发挥更大的作用。

划重点:

🌟Gemini2.5Flash-Lite 是谷歌最新发布的速度最快、成本最低的 ,已进入稳定版本 (GA)。

💰该模型每百万输入 token 定价为 0.10 美元,每百万输出 token 定价为 0.40 美元,相比预览版音频输入价格降低了 40%。

🔧开发者可通过指定模型名 gemini-2.5-flash-lite 使用新版本,原有预览版别名将于 8 月 25 日移除。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

Kimi K2 技术报告重磅发布!这款模型如何在全球开源赛场上独占鳌头?

2025-7-24 1:21:16

AI 资讯

​OpenAI 赢得商标诉讼,阻止竞争对手使用相似名称

2025-7-24 1:21:21

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索