
文章图片

文章图片

文章图片
机器之心报道
机器之心编辑部
国产开源力量的集中爆发 。
都在说国内大模型正在驰骋开源领域 , 具体的情况如何?
近日 , 随着新一代大语言模型(LLM)的一波更新 , 开源大模型再次成为了热门讨论话题 。 软件工程师、自媒体 Rohan Paul 发现了一个惊人的现象:Design Arena 排行榜上排名前十几位开源 AI 模型全部来自中国 。
Design Arena 是目前全球最大规模的众包 AI 生成设计 Benchmark 平台 , 它的核心机制是让真实的人类用户进行评测 , 基于 Elo Rating(类似于国际象棋评分体系)等级分制度进行模型对战 。
【全球开源大模型,前十五名全是中国的】
用户在平台上会被随机展示两段由不同模型生成的回答 , 然后进行投票选择「哪一个更好」 。 每一次投票都会影响对应模型的 Elo 分数 , 进而形成动态的排行榜 。 Elo 核心原理是 , 高分选手击败低分选手 , 得分会很少 , 而低分选手爆冷战胜高分选手时 , 得分会很多 。 因此用对弈的角度来看的话 , 这是一个相对公平、符合认知的评分系统 。
因此 , 不同于 MMLU、SWE-Bench 这类客观指标 , Design Arena 更贴近于「用户真实体验」 。 新模型一上线 , 就能迅速通过对战获得口碑分数 。
在 Design Arena 上 , 如果把条件设定为「开源」 , 可见现在的前 15 名是清一色的国产开源大模型:
排名第一的是 DeepSeek-R1-0528 , 智谱的 GLM-4.5 和阿里的 Qwen 3 Coder 480B 紧随其后 。
再往下我们能看到 DeepSeek、Qwen、GLM 的各种型号 , Kimi 在 7 月份开源的 K2 模型…… 一直到第 16 名才是 OpenAI 最近开源的 GPT OSS 120B 。
在前 15 名中 , 各家大模型厂商上榜的模型数量依次如下:
阿里:6 款 DeepSeek:5 款 智谱:3 款 Kimi:1 款
最近一段时间 , 国内 AI 公司不断发布新一代开源大模型 , 正在开拓 AI 技术的前沿 。 甚至对于国内科技公司来说 , 开源已经成为了最近一两个月发布的主旋律 。
在 Hugging Face 发布的中国 AI 社区 7 月开放成果中 , 包括阿里、智谱、昆仑万维、月之暗面、腾讯、阶跃星辰等在内的多家厂商先后开源了 33 款大模型 。
此前还有机构 Interconnects(深度聚焦前沿 AI 研究的高质量内容平台)汇总了国内顶尖的 19 家开源模型实验室 , 包括 DeepSeek 这样的顶级机构 , 以及一些通过技术报告和小众模型崭露头角的新兴学术实验室 。
这 19 个开源玩家依次是:DeepSeek、Qwen、Moonshot AI (Kimi)、Zhipu / Z.AI、StepFun、Tencent (Hunyuan)、RedNote (Xiaohongshu)、MiniMax、OpenGVLab / InternLM、Skywork、ByteDance Seed、OpenBMB、Xiaomi (MiMo)、Baidu (ERNIE)、Multimodal Art Projection、Alibaba International Digital Commerce Group、BAAI 以及 inclusionAI、Pangu (Huawei) 。
在大模型领域里 , 技术和性能领先的一直是以 GPT 系列为代表的闭源大模型 。 但随着 Llama 系列兴起 , 越来越多的开源模型逐渐成为了推动技术向前进步的重要动力 。 近一年多时间里 , 国产大模型集群式的崛起 , 则重塑了全球 AI 版图 。
现在说起开源的大模型 , 大多数人的第一反应早已不是 Llama , 而是 Qwen 和 DeepSeek 。 有人认为 , 正是 DeepSeek 等开源大模型能够与闭源顶尖模型分庭抗礼 , 才让众多应用端公司得以转变工作重点 , 把精力放在模型调优和应用优化的工作上来 , 进而加速了 AI 技术的落地 。
或许这样的趋势也会扭转 AI 研究社区的趋势 , 让未来最先进模型的开源成为必选项 。
最后 , 在外网也有人在为中国的 AI 模型崛起寻找深层原因 。 这位 Illya Gerasymchuk 是数学专业的硕士 , 他认为原因在于数学基础 —— 目前东亚人在数学领域上已经占据了主导地位 。
这是否和我们一直以来的印象已经有些不一样了?
参考链接:
https://www.designarena.ai/
https://x.com/rohanpaul_ai/status/1959710355208499692
https://x.com/interconnectsai/status/1957105950201950715
推荐阅读
- 刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
- 2nm芯片价格出炉:太贵了,全球没几家企业,用得起了
- 三个月、零基础手搓一块TPU,能推理能训练,还是开源的
- 北京大学打造TransMLA:让大模型推理速度飞跃10倍的神奇转换器
- 形势严峻,全球AI算力对比,美国占69%,中国仅15%,差距巨大?
- 比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!
- 华为全球发布会定档,多领域新品登场
- 全球首个百兆瓦级重卡超充站发布:华为方案 5分钟补能百公里!
- 华为开源CANN,要跨过英伟达又一条护城河?
- “A计划”发布!智元机器人董事长邓泰华:全球正处于具身智能大爆发前夜
