DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场_deepseek|互联网公司

文章图片

文章图片

文章图片

文章图片

【DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场】鱼羊发自凹非寺量子位 | 公众号 QbitAI又双?，抢在OpenAI直播之前，谷歌Gemini 2.5系列来了。首个版本Pro Experimental一登场就抢下大模型竞技场第一名，并且整整比GPT-4.5高出40分！

Gemini 2.5同样是推理模型，用Jeff Dean的说法是：这是我们最智能的模型，具有令人印象深刻的高级推理和编码能力。 Be like ，给出一段提示词：帮我制作一款吸引人的无尽跑酷游戏。屏幕上要有关键操作说明。使用p5js ，不要用HTML 。我喜欢像素风格的恐龙和有趣的背景。 1分钟左右，就能得到：

谷歌“最先进复杂任务模型”谷歌介绍，相较于Gemini 2.0 Flash Thinking这个谷歌首个推理模型， Gemini 2.5在基础模型和后训练技术上都有改进。不仅是在大模型竞技场上一举拿下高分，在各种推理、数学、科学、编程基准上， Gemini 2.5 Pro都表现出色，属于是编程能跟Claude 3.7 Sonnet掰手腕，数学能跟Grok 3相媲美。

更详细测试结果看这里：

Gemini 2.5 Pro的上下文窗口是1M tokens ，并且支持原生多模态：可以理解庞大数据集并处理来自不同信息源的复杂问题，包括文本、音频、图像、视频，甚至是整个代码库。在推理能力之外，谷歌官方还强调了一把Gemini 2.5 Pro的编程性能：2.5 pro擅长创造视觉上引人注目的Web应用程序和智能体代码。谷歌DeepMind研究员们也释出了更多案例，比如把“六边形内旋转小球”这事整得更加酷炫：

Jeff Dean则兴奋地放出了一个编程+数学的用例，还说：我记起了小时候第一次了解到曼德布罗特集时的兴奋之情。（曼德布罗特集：一种在复平面上形成的分形集合）

p.s. 距离谷歌上新Gemini 2.0家族，也不过一个多月时间，怕不是让DeepSeek给逼急了（doge）。目前， Gemini 2.5 Pro已经面向Gemini Advanced付费用户开放，开发人员也可以在Google AI Studio中试用。谷歌表示，未来几周内还将在Vertex AI上推出该模型。不过，当我们拿最新大模型难题“竹竿问题”测试Gemini 2.5 Pro时，它并没能顺利通关。

DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场

推荐阅读

蕨类植物的养殖方法和注意事项，金毛狗蕨类植物养殖方法？

如何停止自我PUA

西瓜不放冰箱可以隔夜吗

征兵体检需要带什么证件

车钥匙灯亮但是不管用怎么回事

关于定亲的祝福语

商业贷款买房需要准备什么材料

西梅在中国哪个省适合种植西梅适合种植在哪里

开封旅游攻略三日游

swot什么意思

眼发红是怎么了,黑背眼发红怎么了

酷我K歌电脑版的快速上手的基础使用教程详细介绍

汉服分为哪几种，汉服有哪几种款式

小猫为什么不喜欢吃水果？猫为什么讨厌水果

牛蛙怎样烹饪

Win8系统命令提示符不见了怎么解决？