
文章图片

文章图片

文章图片

文章图片
【DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场】鱼羊 发自 凹非寺量子位 | 公众号 QbitAI又双?, 抢在OpenAI直播之前 , 谷歌Gemini 2.5系列来了 。 首个版本Pro Experimental一登场就抢下大模型竞技场第一名 , 并且整整比GPT-4.5高出40分!
Gemini 2.5同样是推理模型 , 用Jeff Dean的说法是:这是我们最智能的模型 , 具有令人印象深刻的高级推理和编码能力 。 Be like , 给出一段提示词:帮我制作一款吸引人的无尽跑酷游戏 。 屏幕上要有关键操作说明 。 使用p5js , 不要用HTML 。 我喜欢像素风格的恐龙和有趣的背景 。 1分钟左右 , 就能得到:
谷歌“最先进复杂任务模型”谷歌介绍 , 相较于Gemini 2.0 Flash Thinking这个谷歌首个推理模型 , Gemini 2.5在基础模型和后训练技术上都有改进 。 不仅是在大模型竞技场上一举拿下高分 , 在各种推理、数学、科学、编程基准上 , Gemini 2.5 Pro都表现出色 , 属于是编程能跟Claude 3.7 Sonnet掰手腕 , 数学能跟Grok 3相媲美 。
更详细测试结果看这里:
Gemini 2.5 Pro的上下文窗口是1M tokens , 并且支持原生多模态:可以理解庞大数据集并处理来自不同信息源的复杂问题 , 包括文本、音频、图像、视频 , 甚至是整个代码库 。 在推理能力之外 , 谷歌官方还强调了一把Gemini 2.5 Pro的编程性能:2.5 pro擅长创造视觉上引人注目的Web应用程序和智能体代码 。 谷歌DeepMind研究员们也释出了更多案例 , 比如把“六边形内旋转小球”这事整得更加酷炫:
Jeff Dean则兴奋地放出了一个编程+数学的用例 , 还说:我记起了小时候第一次了解到曼德布罗特集时的兴奋之情 。 (曼德布罗特集:一种在复平面上形成的分形集合)
p.s. 距离谷歌上新Gemini 2.0家族 , 也不过一个多月时间 , 怕不是让DeepSeek给逼急了(doge) 。 目前 , Gemini 2.5 Pro已经面向Gemini Advanced付费用户开放 , 开发人员也可以在Google AI Studio中试用 。 谷歌表示 , 未来几周内还将在Vertex AI上推出该模型 。 不过 , 当我们拿最新大模型难题“竹竿问题”测试Gemini 2.5 Pro时 , 它并没能顺利通关 。
推荐阅读
- 谷歌史上最强推理模型全面屠榜!击败DeepSeek断层第一,“人类最后考试”暴碾OpenAI,免费可用
- 25个超实用的DeepSeek指令!让你轻松驾驭 AI
- DeepSeek-V3-0324 私有化部署全攻略:硬件配置与实战指南
- DeepSeek深夜更新V3,生成的画面也太美了,实测案例+提示词
- DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户
- DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议
- 李开复点名:中国AI大模型或只剩3家!DeepSeek能笑到最后?
- 中国大模型终局:李开复断言只剩三家?DeepSeek重拳砸OpenAI命门
- 元宝土味刷墙广告爆火!狂砸3.8亿日活飙20倍,干翻DeepSeek?
- 他是AI界任正菲,甩出DeepSeek,打破欧美科技霸权
