终于,GPT-5发布了,也被喷惨了

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了

文章图片

终于,GPT-5发布了,也被喷惨了



划重点:
1、期盼2年的GPT-5终于在如期而至 , 超过那些全球最聪明的大模型 , 达到博士水平 。
2、GPT-5目前已面向普通用户提供免费、plus和Pro三种模式;同时在API平台上 , 推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择 。
3、OpenAI直播期间出现重大失误 , 播出的性能图表被网友怒喷 。
作者 常远
编辑 重点君
GPT-5 , 终于在深夜出炉 。
以为很震惊 , 以为很惊艳???确实有 。
但先来看一张图:

OpenAI到底是如何做到在全球直播的场合展示Benchmark , 竟然能把52.8显示得比69.1都高 , 甚至这个69.1能跟30.8平齐的???
其它的不谈 , 单就这一点 , 开场直接号称“博士水平”的AI , 就这么水灵灵地“按需缩放”坐标系 , 也是引得网友怒喷不已 。

甚至Altman都赶忙出来转移话题 , 称技术博客上是正确的……

确实 , 技术博客确实是有所更正 。

但如此失误 , 着实不应该 , 毕竟大家都等了2年?。 ?

博士水平的AI , 来了
不过有一说一 , 除了这个被大众诟病的致命失误之外 , GPT-5在现场的表现还算是可圈可点 。
在技术博客中 , OpenAI开场直接一句:“迄今为止 , 这是我们最智能、最快速、最实用的模型 , 内置的思考能力让每个人都能拥有专家级智能 。 ”
这次发布的GPT-5拥有四个版本:
GPT-5:在不同领域中进行Coding和执行任务的标准模式;
GPT-5 mini:轻量版版本 , 适用于对明确界定的任务和场景;
GPT-5 nano:强调运行速度和性价比;
GPT-5 Chat:ChatGPT中使用的版本 。
GPT-5目前已面向普通用户提供免费、plus和Pro三种模式 。
同时在API平台上 , 推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择 。
不仅如此 , 承接昨天时隔6年的开源 , OpenAI表示这次GPT-5面向所有人 , 免费!并且是博士水平的那种 。
我们先来看下Benchmark 。
最让人吸睛的 , 还是GPT-5在AIME 2025的表现 , 直接拿下满分的成绩 。

其次就是编程能力 , 相较于o3和4o , GPT-5在思考模式加持之下 , 达到了74.9%的水平 。

除此之外 , 这个模型在多种多模态评测中表现出色 , 覆盖了图像、视频、空间理解和科学推理等方面 。
更强的多模态能力 , 意味着ChatGPT在处理图片和其他非文字信息时更聪明了——比如看懂图表、总结一张演示照片的内容 , 或者回答关于图示的问题 。

而且比较罕见的是 , 第三方的大模型竞技?。 ↖marena.ai)也是及时跟进 , 直接发声表明:“全方面第一” 。
具体而言 , 竞技场涉及的内容包括:文本、Web开发、视觉、编程、数学、创造力、长查询等 。

由此可见 , GPT-5从目前评测标准来看 , 确实是AI大模型的卫冕之王 。

再看效果
成绩是一方面 , 但实际效果才是硬道理 。
深谙此理的Sam Altman在自己的X账号上也是立马跟进 , 发布了由GPT-5生成的效果:

并且Altman还表示 , 有GPT-5权限的用户 , 只需发送“use beatbot to make a sick beat to celebrate gpt-5”即可体验 。
不多不说 , 营销这块 , Altman还是非常手拿把掐的 。
不过在直播的现场演示过程中 , GPT-5还是有不少惊艳的表现在身上的 。
例如让GPT-5生成一个学语法的APP , 效果是这样的:

不要以为是简单的网站 , 除了可以完成市面上AI的交互之外 , 它在里面还可以内嵌一个小游戏(点击“MouseCheese”):

并且若是想改变APP里面的内容 , 只要一句话 , 瞬间(现场实测)就可以改变布局:

对于更加庞大且复杂的项目 , 例如现场OpenAI展示了用GPT-5先编程出来的代码:

在运行之后 , 便得到了一个3D效果的“世界”:

总而言之 , 从现场效果来看 , GPT-5也是担得起“最聪明、最强编程”的大模型 。

“观众”们买单吗?
从目前X上“观众”的反馈来看 , 讨论最激烈的就是前面我们提到的图表bug 。
甚至有网友做了一张简单粗暴的Excel表格来讽刺这次的失误:

不过另一方面 , 老东家微软CEO火速出面站台 , 并配有一个“爱心”图片以表支持:

再如开发者们常用的VS Code , 官方也是Day 0无缝衔接GPT-5:

不过对于普罗大众来说 , 反馈声音最大的莫过于:“说好的免费 , 我的ChatGPT咋没有呢?”
总而言之 , 用户到底买不买单 , 实测效果到底有没有那么神 , 需要让子弹再飞一会了 。
参考链接:
1、https://openai.com/index/introducing-gpt-5/
【终于,GPT-5发布了,也被喷惨了】2、https://x.com/EgeErdil2/status/1953505551570415718

    推荐阅读