8 月 2 日消息,谷歌昨晚宣布,Gemini 2.5 Deep Think 模型现已正式上线,现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。

据外媒 Neowin 报道,今年 5 月,谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式,采用全新研究方法,可在作答前综合多个假设进行推理。本次发布的是该功能的升级版,结合早期内测用户的反馈和最新研究成果进行了优化。谷歌表示,新版本在性能上相比最初的 I/O 版本有了显著提升。

多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型第一张图

谷歌还透露,这一模型是此前模型的一个变体(注:前述模型已在国际数学奥林匹克竞赛中获得金牌)。为适应日常使用场景,谷歌对其进行了加速优化,因此在 2025 年 IMO 基准测试中仅达到铜牌水平。

从基准测试结果可知,Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等项目中均表现优异。

多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型第二张图

目前,Google AI Ultra 用户每天可以在 Gemini 应用中以限定次数使用 Deep Think。当启用 Gemini 2.5 Pro 模型时,输入栏会显示“Deep Think”选项。谷歌指出,该功能将自动集成代码执行和谷歌搜索等工具。谷歌还计划在未来几周内,通过 Gemini API 向部分开发者提供带工具与不带工具的 Deep Think 模型版本。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。