真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

文章图片

【真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强】真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

文章图片

真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

文章图片

真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

文章图片

真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

文章图片

真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

文章图片


金磊 发自 凹非寺
量子位 | 公众号 QbitAI
好好好 , 都赶着国庆节之前开卷是吧 。
前脚DeepSeek更新到了V3.2 , 现在智谱又更新了——
正式推出GLM-4.6 , 代码能力直接推到了国内最强 。

根据智谱的测试结果 , 他们在Claude Code环境下进行了74个真实场景编程任务测试:GLM-4.6实测超过Claude Sonnet 4 , 超越其他国产模型 。
类似的结果还出现在了其它测评中 。
例如在通用能力评测上 , GLM-4.6在AIME 25、GPQA、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA , 这八大榜单中大部分都已经对齐了Claude Sonnet 4 , 国内第一 。

分数高还只是一方面 , 智谱的GLM-4.6甚至还把“平均token消耗”给打了下来——比GLM-4.5节省30%以上 , 为同类模型最低 。

而且智谱这次还大大方方地把全部测试题目与Agent轨迹亮了出来 , 方便大家复现验证:
https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
有一说一 , 卷 , 是真的卷 。

实测GLM-4.6根据量子位的老传统 , 新模型一出 , 那必须是得安排一波实测 。
我们先小试牛刀地来一道题:
生成一个射击类的小游戏 。

从实测体验来看 , 代码生成的速度是相当之快 , 不到一分钟 , 游戏就被设计出来了 。

进阶一下 , 我们再让GLM-4.6再做一个交互动画:
用p5js创建多彩的可交互动画 。

可以看到 , 鼠标点到哪里就会产生交互效果 。
编程这块 , 我们最后来测一道经典的题目:
显示球在旋转的六边形内弹跳 。 球应该受到重力和摩擦力的影响 , 并且必须逼真地从旋转的墙壁上反弹 。

嗯 , 小球是按照物理规律在运转 。
在编程能力之后 , 我们再来测试一下GLM-4.6的数学能力 。
请听一道AIME 2025的试题:

在这次测试中 , 我们是直接把题目截图“喂”给了GLM-4.6 , 不仅考察了解数学题的能力 , 同时还检测了一下它识图的多模态能力 。

可以看到 , GLM-4.6完美地给出了正解:70 。
整体来看 , 智谱这次新模型能力提升可以概括如下:
高级编码能力:在公开基准与真实编程任务中 , GLM-4.6的代码能力对齐Claude Sonnet 4 , 是国内已知的最好的Coding模型 。 上下文长度:上下文窗口由128K→200K , 适应更长的代码和智能体任务 。 推理能力:推理能力提升 , 并支持在推理过程中调用工具 。 搜索能力:增强了模型在工具调用和搜索智能体上的表现 , 在智能体框架中表现更好 。 写作能力:在文风、可读性与角色扮演场景中更符合人类偏好 。 寒武纪、摩尔线程都跟进了昨晚DeepSeek更新的时候 , 一个新现象伴随着诞生——
很多国产芯片公司立即宣布“Day0适配” 。
这一现象在GLM-4.6身上也是发生了 。
据了解 , GLM-4.6 已经在寒武纪的国产芯片上实现了FP8+Int4的混合量化部署 , 这是国产芯片上第一次真正落地的FP8+Int4模型芯片一体化方案 。

在保证精度不受影响的同时 , 还大幅降低了推理成本 , 也为国产芯片本地运行大模型提供了一条可行的新路径 。
在vLLM推理框架的支持下 , 摩尔线程新一代GPU能够用原生FP8精度稳定运行GLM-4.6 , 这充分体现了MUSA架构和全功能GPU在生态兼容性和快速适配上的优势 。

接下来 , GLM-4.6将与寒武纪、摩尔线程的国产芯片组合 , 通过智谱MaaS平台正式对企业和大众开放服务 。
最后 , 划个重点 。
智谱在能力提升的同时 , 还把价格给打下来了!
智谱同步升级的GLM Coding Plan(最低20元包月畅玩套餐):用1/7的价格 , 可以享受到Claude的9/10智商 。
GLM-4.6体验地址:chat.z.ai
智谱MaaS平台:bigmodel.cn
— 完 —
量子位 QbitAI · 头条号
关注我们 , 第一时间获知前沿科技动态

    推荐阅读