阿里大模型突然震惊全世界

阿里大模型突然震惊全世界

文章图片

阿里大模型突然震惊全世界

文章图片

阿里大模型突然震惊全世界

文章图片

阿里大模型突然震惊全世界

文章图片

阿里大模型突然震惊全世界

文章图片



阿里千问3登顶全球最强开源模型
阿里大模型又甩出一张王炸 。
4月29日凌晨 , 阿里新一代通义千问模型Qwen3(简称千问3)开源 , 一发布就直接登顶全球最强开源模型 。 随即相关话题引发全网关注 。

图源:微博
这款让全世界震撼的模型 , 有何特别之处?据了解 , Qwen3是国内首个“混合推理模型” , 它将“快思考”和“慢思考”集成进同一个模型 , 能快速低算力处理简单问题 , 也能通过多步骤深度推理解决复杂问题 , 有效降低算力消耗 。
目前 , Qwen3系列模型一共开源了8款“混合推理模型” , 包括两款MoE(混合专家)模型Qwen3-235B-A22B和Qwen3-30B-A3B , 以及六个Dense(稠密)模型32B、14B、8B、4B、1.7B和0.6B 。

图源:阿里云
那么 , Qwen3又强在哪里?首要原因是算力成本大幅降低 , 直接碾压全球各个顶尖大模型 。
比如旗舰模型Qwen3-235B-A22B参数量仅为DeepSeek-R1的1/3 , 总参数量235B , 激活仅需22B 。
据市场多方消息 , 仅需4张H20即可部署Qwen3满血版 , 而且Qwen3旗舰模型的部署成本是满血版R1的25%~35% , 部署成本大降75%~65% , 显存占用仅为性能相近模型的三分之一 。
其次 , Qwen3大模型的性能也比同类大模型更强 , 在多个基准测试中表现出色 , 甚至超过了DeepSeek-R1和OpenAI o1等顶级模型 。
在Qwen3系列模型中 , 旗舰版本Qwen3-235B-A22B是性能最强的 。 据阿里云披露的Qwen3基准测试结果 , 这款开源模型在代码、数学、通用能力等基准测试中 , 与一众顶级模型相比极具竞争优势 , 与DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro等模型不相上下 , 甚至有赶超的趋势 。

Qwen3基准测试结果 图源:阿里云
具体来看 , 比如 , 在奥数水平的AIME25测评中 , 千问3取得了81.5分 , 刷新开源纪录;在考察代码能力的LiveCodeBench评测中 , 千问3得分超过70分 , 表现优于Grok3;在评估模型人类偏好对齐的ArenaHard测评中 , 千问3以95.6分超越了OpenAI-o1及DeepSeek-R1 。
另外 , 在评估模型Agent能力的BFCL评测中 , Qwen3取得了70.8分的成绩 , 刷新了该评测的记录 , 并超越了Gemini2.5-Pro、OpenAI-o1等顶尖模型 。
值得一提的是 , Qwen3模型还支持全球119种语言和方言 , 意味着Qwen 3试图开辟更多的国际市场 。
不得不说 , Qwen3模型的各项表现极为亮眼 。 当然 , 如果拿阿里自身来比较 , Qwen3模型取得的成绩就理所当然和不足为奇 。
因为阿里大模型都很能拿得出手 , 去年6月底 , 通义千问第二代开源模型Qwen2-72B亮相即登顶 。
当时全球著名开源平台Hugging Face(笑脸)的联合创始人兼首席执行官在社交平台透露 , 通义千问第二代开源模型Qwen2-72B拿下全球开源第一 , 力压Meta、Mistralai等海外科技巨头 。

图源:微博
紧接着今年3月3日 , 阿里的另一款大模型“万相2.1(Wan2.1)”也取得了优异成绩 。
当时开源社区Hugging Face最新榜单显示 , 阿里大模型“万相2.1(Wan2.1)”登顶模型热榜和模型空间榜 , 成为近期全球开源社区最受欢迎的大模型 。

图源:通义万相Wan公众号
如今 , 阿里大模型登顶全球最强开源模型 , 对阿里来说 , 又是一次重大的技术突破和战略布局 。

阿里巴巴要全面AI化
阿里大模型能取得如此突破 , 与阿里在资源上的大力投入密不可分 。
在战略层面 , 阿里巴巴对AI业务的重视提高到了前所未有的高度 。 在上个月的财报电话会议上 , 阿里巴巴集团CEO吴泳铭明确指出 , 阿里巴巴将持续聚焦国内外电商业务、AI+云计算的科技业务、互联网平台产品这三大业务类型 。
而对于大模型 , 吴泳铭强调 , 未来三年 , 阿里将围绕AI这个战略核心 , 在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入 。
显而易见 , 阿里巴巴正加速从传统电商公司向AI技术驱动的科技公司转型 , 这是随着AI战略深入推进的必然结果 , 也是两年前吴泳铭提出的“用户为先、AI驱动”战略的延续 。
要知道过去两年 , 阿里深受电商低价竞争和市场格局变化的困扰 , 亟需借助AI的力量来打开新的局面 。
去年4月正值阿里变革一周年 , 马云在内部会议上激情澎湃地表示:“AI时代刚刚到来 , 一切才刚开始 , 我们正当其时!”
同年12月 , 在蚂蚁集团20周年庆典上 , 马云再次现身并分享了他对未来20年AI时代的深刻见解 , 他强调了AI技术将如何重塑各行各业 , 并鼓励蚂蚁集团抓住这一历史机遇 。
今年4月 , 马云发表最新演讲 , 再次大谈AI 。

显然 , 马云对AI战略的重视程度非同一般 , 将其视为阿里巴巴未来发展的核心驱动力 。
为支撑这一战略 , 阿里巴巴在资源投入上展现出惊人魄力 。
去年 , 阿里接连出售银泰百货、大润发、高鑫零售等非核心资产 , 同时阿里还频繁减持快狗打车、B站、陌陌、网易云音乐等长期亏损的非核心业务 。
这些动作背后与其聚焦电商、云计算等核心主业的战略目标息息相关 。
除了减轻非核心业务的负担 , 阿里还加大与云计算有关的AI投入 。
比如加大AI人才招聘力度 。 在3月25日的汇丰全球投资峰会上 , 阿里巴巴主席蔡崇信表示 , 经历了几轮裁员之后 , 阿里的员工数量已经触底了 。 接下来 , 阿里将重新开启招聘 。
紧接着4月 , 阿里国际随即传出 , 首次启动一项面向全球的头部AI科技人才培养计划“Bravo 102” , 打破传统的校招体系 , 面试通过后可反选项目和团队 。 另据阿里国际招聘官网 , 2026届校招中80%为AI岗位 , 包括AI算法、研发、AI产品经理等 。

图源:阿里国际招聘
今年2月 , 阿里还挖来全球顶尖AI科学家、前Salesforce副总裁许主洪(Steven Hoi) , 为AI业务助力 。
在资金投入方面 , 阿里也毫不含糊 。 吴泳铭直接放话 , 未来三年 , 阿里将投入超过3800亿元用于建设云和AI硬件基础设施 , 总额超过过去十年总和 。
这一连串的动作 , 正在把阿里AI业务推向高潮 。

互联网大厂掀起新一轮AI大战
AI热潮已经持续了两年 , 今年年初DeepSeek的横空出世再次引爆了整个AI圈 , 新一轮的竞赛已然拉开帷幕 。 无论国内还是国外 , 各大模型公司都在加速布局 , 竞相角逐 。
当我们聚焦于阿里、抖音、腾讯、百度等国内互联网大厂 , 他们都以各自的方式铺开业务 。
阿里利用开源大模型打开市场 , 自2023年8月开始 , 阿里云便开始大规模开源其大模型系列 , 成为我国首家大规模开源的大厂 , 并屡获佳绩 。
同时 , 阿里AI业务有了新变化 , 从过去的侧重面向B端 , 转而向C端用户倾斜 。 上个月夸克上线全新功能“AI超级框” , 以及通义APP的持续升级改版 , 都是针对C端用户侧的调整 。
AI大模型技术正在快速成熟 , 应用场景从B端向个人用户扩展 , C端用户对AI产品的需求日益多样化 , 由此 , C端市场已成为阿里争夺的新战场 。
抖音方面 , 则选择采取了“广撒网”式的战略打法 , 先构建起庞大的AI产品矩阵 , 并采用 “赛马机制” , 鼓励内部团队围绕同类产品进行差异化开发 。
通过多版本并行测试、数据实时反馈 , 筛选出最具潜力的产品方向 , 并快速迭代升级 。
自2023 年起 , 抖音在国内市场加速AI产品的落地节奏 。 据不完全统计 , 短短两年间 , 其在移动端推出近10款AI应用 , 形成了覆盖聊天、社交、办公、教育、图像、视频、音乐全场景的产品生态 。
目前来看 , 各大互联网公司都力图构建自身的AI护城河 , 抢占先机 , 重塑行业竞争格局 。
【阿里大模型突然震惊全世界】作者 |木易

    推荐阅读