
智东西
作者 ZeR0
编辑 漠影
智东西8月2日报道,昨夜,谷歌推出其迄今最强推理模型Gemini 2.5 Deep Think。
这是最近在今年国际数学奥林匹克(IMO)上“拿金牌”的模型的变体。近期高级版Gemini Deep Think完美解答了IMO 6道题目中的5道,总分35分(满分42分),达到金牌水平。
该模型需要几个小时才能推理出复杂的数学问题。新发布的版本在日常使用中速度更快、更易用,根据内部评估,在2025年IMO基准测试中仍达到铜牌水平。
谷歌在今年5月的I/O开发者大会上首次预览了Gemini 2.5 Deep Think。新版本进行了“重大改进”。在具有挑战性的编程、科学、知识、推理基准测试中,与OpenAI o3、Grok 4等其他不使用工具的模型相比,Gemini 2.5 Deep Think在LiveCodeBench V6和Humanity’s Last Exam均取得最佳性能。
Gemini app中的Deep Think模型,使用思考技巧来提供更详细、更有创意和更周到的回答,甚至可以帮助数学家来测试数学猜想,还能提高Web开发任务的美观性。
Deep Think支持文本、图像、音频、视频等输入和1M tokens上下文窗口,输出长度为192K tokens。
其工作原理是利用谷歌的并行思维技术,能同时生成多个想法,并同时进行思考,甚至随着时间的推移不断修改或整合不同的想法,最终得出最佳答案。
此外,通过延长推理时间或“思考时间”,谷歌给了Gemini更多的时间来探索不同的假设,并为复杂问题找到创造性的解决方案。
谷歌还开发了新颖的强化学习技术,鼓励模型利用这些扩展的推理路径,从而使Deep Think随时间推移成为更好、更直观的问题解决者。
Deep Think可以帮助人们解决需要创造力、战略规划和逐步改进的问题,例如:
- 迭代开发和设计:在需要逐块构建复杂事物的任务上的表现出色,比如可以提高网络开发任务的美学和功能。
- 科学和数学发现:可推理出高度复杂的问题,通过复杂的科学文献帮助制定和探索数学猜想或推理,可能加速发现之路。
- 算法开发和代码:在棘手的编码问题上特别出色,其中问题制定和仔细考虑权衡和时间复杂性是最重要的。
目前仅有最高级别的Google AI Ultra订阅者可选用“Deep Think”,每月订阅费为249.99美元(约合人民币1803元)。
Deep Think自动与代码执行和谷歌搜索等工具配合使用,并能产生更长的响应。
同时,达到IMO金牌水平的Deep Think模型将进一步测试,并向一小部分数学家和学者分享,用于辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。
谷歌还正在努力在未来几周内通过Gemini API向一组受信任的测试人员发布带和不带工具的Deep Think,以更好地了解其对开发者和企业用例的可用性。
猜你喜欢


嫦娥六号月球样品最新研究成果发布,揭示月...
IT之家 8 月 8 日消息,据央视新闻报道,国家航天局探月与航天工程中心公布了嫦娥六号月球样品最新研究成果。 据介绍,中国科学家通过对嫦娥六号从月球背面采集的...
READ MORE

输掉与山姆正面较量,再迎美团京东夹击,盒...
成立十周年之际,盒马彻底结束了“对标山姆”梦。 近日,盒马公告最后一家X会员店将于8月31日关闭。尽管去年年底,盒马提出战略聚焦于“盒马鲜生”和“盒马NB(Ne...
READ MORE
外卖商家也“照骗”:平台上的头像由AI生...
AI生成图片越来越多,连外卖店铺都用上了AI门店图。 打开外卖软件,商家五花八门,头像构成了第一印象。一些别具烟火气的头像悄然增多,看起来像是门店实景图:醒目的...
READ MORE最新发布
-
北京再次优化住房限购政策
综合新闻, 2025-08-08 -
嫦娥六号月球样品最新研究成果发布,揭示月球背面月幔超还原状态
综合新闻, 2025-08-08 -
北京再次优化住房限购政策
综合新闻, 2025-08-08 -
输掉与山姆正面较量,再迎美团京东夹击,盒马面
综合新闻, 2025-08-08 -
外卖商家也“照骗”:平台上的头像由AI生成,实
综合新闻, 2025-08-08
热门
-
北京再次优化住房限购政策
- 作者
- 2025-08-08
-
嫦娥六号月球样品最新研究成果发布,揭示月...
- 作者
- 2025-08-08
-
北京再次优化住房限购政策
- 作者
- 2025-08-08
-
输掉与山姆正面较量,再迎美团京东夹击,盒...
- 作者
- 2025-08-08
-
外卖商家也“照骗”:平台上的头像由AI生...
- 作者
- 2025-08-08
-
北京再次优化住房限购政策
- 作者
- 2025-08-08
-
嫦娥六号月球样品最新研究成果发布,揭示月...
- 作者
- 2025-08-08
-
北京再次优化住房限购政策
- 作者
- 2025-08-08
-
输掉与山姆正面较量,再迎美团京东夹击,盒...
- 作者
- 2025-08-08
-
外卖商家也“照骗”:平台上的头像由AI生...
- 作者
- 2025-08-08