
文章图片

文章图片

文章图片

文章图片
机器之心报道
编辑:Panda、泽南
AI 行业很多人相信 , 我们正在或已经进入所谓的「AI 下半场」 。 在这一轮 AI 的浪潮中 , 硬件的竞争早已不再是单纯的算力比拼 , 而是一场围绕软件、开发者与生态的「护城河」之战 。 当国产 AI 生态的转型成为科技领域的时代呼声 , 华为昇腾及其异构计算架构 CANN 正站在了这场变革的聚光灯下 。
2025 年 8 月 5 日 , 华为轮值董事长徐直军宣布 , 昇腾硬件使能的 CANN 将全面开源开放 , 并承诺在 12 月 30 日前完成 。
这并非一次简单的技术路线调整 , 而是国产 AI 基础设施在生态战略上一次深刻的自我革命 。 它标志着昇腾正试图打破过去由硬件厂商自上而下主导的封闭模式 , 转而拥抱一种更开放、更依赖社区共建、也更不确定的未来 。 这不仅是对行业领导者 CUDA 所建立的强大壁垒发起的挑战 , 更是对自身的一次考验:从「可用」到「首选」的道路 , 关键不再仅仅是技术的迭代 , 更在于能否真正构建起一个让开发者愿意参与进来的繁荣生态 。
为了探寻 CANN 开源的真实意义 , 以及它将为整个生态带来怎样的机遇与挑战 , 我们与三位身处不同位置的核心开发者与观察者进行了深度对话 。 他们分别是:
苏统华教授 , 哈尔滨工业大学计算学部软件学院副院长 。 作为国内最早开展 CUDA 科研和教学 , 也是最早投入昇腾生态的高校学者之一 , 他既是前沿的科研探索者 , 也是一线的人才培养者 。 李秀红先生 , 无问芯穹技术副总裁 。 他从 AI 基础设施提供商的视角出发 , 对一个计算生态如何构建「最大公约数」有着深刻的商业与技术洞察 。 陈昀博士 , 华南理工大学的青年研究者 。 他奋战在最底层的算子开发领域 , 专注于挖掘硬件的极致性能 , 代表了硬核开发者对底层工具最直接的诉求 。对于 CANN 开源的意义 , 他们的观点精准地回应了我们开篇的判断 。 在苏统华教授看来 , 要让国产平台真正繁荣 , 关键在于吸引学术圈进行「原生创新」 , 当引领性的新模型诞生于此 , 生态自然会吸引全球的目光 。 而李秀红先生则指出 , 一个成功的生态本质上是要为最广泛的开发者构建稳定、通用、高效的底层工具 , 找到「最大公约数」 。 而对于陈昀博士这样奋战在一线的算子开发者来说 , 开源意味着底层不再是黑箱 , 那些曾阻碍性能优化的瓶颈将有机会被彻底打破 。
他们的观点 , 共同构成了一幅关于 CANN 开源与国产 AI 生态未来的全景图 。 本文将深入一线 , 通过这些核心开发者与教育者的视角 , 共同探寻答案 。
从「砖」到「大厦」
一线开发者眼中的 CANN 演进与挑战
「如果一个 AI 框架或大模型是一座宏伟的大厦 , 那么算子就是其中的每一块砖 。 」陈昀博士如此形容他所从事的工作 。 作为一名奋战在最底层的算子开发者 , 他与团队日复一日地打磨着这些「砖块」 , 确保它们坚固、高效 , 从而为整个昇腾 AI 生态这座「大厦」提供坚实的基石 。
不过 , 这座「大厦」的构建并非一帆风顺 。 在 CANN 全面开源之前 , 开发者们走过的是一段「摸着石头过河」的艰难探索之路 。 他们既是先行者 , 也是拓荒者 , 亲身体验了从零到一的全部阵痛 , 也见证了 CANN 在磨砺中逐步成长的完整轨迹 。
吃螃蟹的人:在刀耕火种中前行
回顾 CANN 的早期阶段 , 几乎所有亲历者都用了「艰难」二字来形容 。 苏统华教授将第一批开发者比作「吃螃蟹的人」 , 这不仅意味着先行一步的机遇 , 更伴随着「吃一口可能把牙给崩一块」的巨大风险 。
这种风险首先源于极高的技术门槛 。 在 2018 年发布的 1.0 版本中 , CANN 甚至要求开发者在接近汇编的层面进行编程 , 这无异于「刀耕火种」般的原始开发模式 , 生产效率极低 。 对于陈昀博士这样的算子开发者而言 , 即便在后续版本中 , 许多工作也需要依赖基础 API 进行「从流水排布到内存调度」的全手动调优 , 每一行代码的优化都极其费时费力 。
CANN 是连接 AI 框架与昇腾芯片的底层架构
更严峻的挑战 , 来自平台自身架构的剧烈迭代 。 苏教授分享了一段令人印象深刻的经历:他的团队曾花费一年时间为 CANN 编写应用案例并集结成书 , 却在最终审核时被告知「底层的软件已经全部推倒重来了」 。 这一句「自己把自己革命了」的背后 , 是整个团队又花了一年时间 , 将所有案例重做一遍的巨大付出 。
这正是早期生态建设最真实的缩影 —— 在缺乏稳定架构和成熟工具的条件下 , 第一批开发者凭借着拓荒者的精神 , 为昇腾奠定了最来之不易的基础 。
磨砺出的利器:在黑暗中摸索的光
然而 , 即便在充满挑战的拓荒期 , CANN 也在不断进化 , 并为开发者磨砺出了一批强大的工具 , 成为他们在黑暗中摸索时的「光」 。
Ascend C 编程语言就是一个决定性的进步 。 苏统华教授指出 , 早期的 TIK 和 TBE 方案「用起来还是比较费劲 , 性能比较差」 , 而新推出的 Ascend C 「其实就已经跟现在的 CUDA C 基本上对标了」 。 对于开发者而言 , 这意味着一种更现代化、更符合主流习惯的编程范式的确立 。
其中 , 性能分析工具 Profiling 更是在开发者社区中获得了极高的评价 。 它能够将 NPU 的利用率、指令周期、带宽瓶颈等底层信息完全可视化 。 当成功将一个算子的利用率从 50% 逼近 90% 的理论峰值时 , 那种成就感是无与伦比的 。 正如陈昀博士所形容的 , 「那种感觉就很像是爬山…… 当你征服一座大山时 , 那一刻感觉之前所有的调试和试错都值了 。 」 这种来自一线开发者的真实喜悦 , 正是驱动生态不断向前的最朴素动力 。
性能分析工具 Profiling 中的计算内存热力图
经过数年迭代 , CANN 的工具链已具备相当的完备性 , 整体上满足了开发者 80% 以上的需求 。 然而 , 局部的「点状」优势 , 依然无法完全解决系统性的「面状」难题 。
突破瓶颈 , 开发者需要「最大公约数」
当训练不再收敛 , 当高级调试需求无法满足时 , 开发者依然会感受到「黑箱」带来的束缚 。 一个典型且棘手的场景是 , 模型在昇腾上无法复现与其他框架一致的精度 , 收敛结果可能相差十几个百分点 , 但由于底层信息不透明 , 开发者很难定位问题根源 。 苏教授坦言 , 这种「找不到原因 , 也不好找」的困境 , 曾让很多参与其中的学生备受打击 。
这种挫败感 , 源于开发者无法完全掌控自己的代码 。 从技术上看 , 当时的工具链仍有明显短板 , 例如缺少 GDB 那种强大的断点回溯功能 , 高级分布式调试的教程也相对匮乏 , 使得性能优化在很大程度上依赖于经验和猜测 。
这种系统性的不便 , 还体现在软件架构的敏捷性上 。 其中一个核心痛点是过去 CANN 的软件包过于庞大和耦合 , 导致开发者无法进行灵活、快速的迭代 。 这种架构上的限制 , 使得即使是一个小功能的更新 , 也需要依赖整个平台的版本发布 , 极大地拖慢了创新速度 。
李秀红先生一语道破了问题的核心:「开发者用芯片 , 是想在上面创造东西 。 如果他的表达能力被各种限制 , 他是非常痛苦的 , 相当于天然的创造力被遏制住了 。 」 他提出的「最大公约数」概念 , 正是所有计算生态的终极追求:一个成功的生态 , 必须为最广泛的开发者群体提供最稳定、通用、高效的底层工具 , 将复杂的硬件细节封装起来 , 让开发者能聚焦于应用创新本身 。
一个计算生态的终极价值 , 是赋能开发者 , 而非限制开发者 。 从这个角度看 , CANN 的早期演进正是一个在不断提供强大工具的同时 , 又不断遭遇系统性瓶颈 , 并最终走向全面开放的必然过程 。 将生态的主导权交还给开发者 , 让他们能看清、能修改、能共建 , 这不仅是回应他们的诉求 , 更是 CANN 从「可用」迈向「首选」的必由之路 。
从我们的视角看 , CANN 的这段早期演进史几乎是所有挑战行业巨头的国产基础软件都必须经历的「成人礼」 。 它揭示了一个深刻的规律:一个计算生态的构建 , 初期或许可以依赖少数「拓荒者」的信念和高强度投入 , 但其长期的生命力 , 必然源于一个开放、透明、能够激发集体智慧的体系 。 CANN 所遭遇的系统性瓶颈 , 正是这种封闭模式走到尽头的必然结果 , 这也使其后续的「全面开源」显得顺理成章 , 甚至可以说是一种必然 。
破壁与赋能
开源将为开发者带来什么?
「开源是起点 , 而不是终点 。 」这几乎是所有受访者的共识 。
当华为宣布 CANN 将全面开源时 , 这不仅仅是一次技术策略的调整 , 更是一场深刻的生态理念变革 。 对于身处其中的开发者而言 , 开源的核心价值在于破壁与赋能 。
「破壁」意味着打破技术黑箱与信任壁垒 , 让平台变得透明、可控;而「赋能」则是在此基础上 , 将创新的主动权从平台所有者真正地交还到每一位开发者手中 。 这正是 CANN 全面开源所要讲述的核心故事 。
技术破壁:从黑箱到透明的革命
对于长期与底层硬件和代码打交道的开发者来说 , 一个黑箱系统是他们施展拳脚最大的障碍 。 CANN 的全面开源 , 首先带来的就是一场透明度的革命 。
过去 , 这些底层机制只能依赖官方文档的描述 , 开发者无法精确地进行自定义扩展 。 而开源意味着包括编译器、运行时在内的核心组件代码将完全可见;开发者可以直接洞察硬件的运行逻辑 , 从而进行更深层次、更精准的性能优化 。
这种透明度将直接解决过去开发中遇到的诸多顽疾 。 例如 , 过去在不同 CANN 版本间进行移植时 , 开发者常常会遇到 IR (Intermediate Representation) 生成不匹配的难题 , 开源之后 , 通过 fork 并修改底层代码来加速迭代将成为可能 。 苏统华教授也认为 , 开源的最大价值在于 , 当企业客户在实际应用中遇到深层次问题时 , 不再需要等待华为数月甚至半年的版本更新 , 而是可以自己动手或借助社区的力量快速解决 。
从黑箱到透明的转变 , 不仅是技术上的开放 , 更是赋予了开发者前所未有的自由度和掌控力 。
值得一提的是 , 华为此次所承诺的「全面开源」 , 其深度和广度甚至超越了当前的行业领导者 。 英伟达 CUDA 虽然拥有庞大的生态 , 但其核心组件并未完全开放 。 我们认为 , 这背后是两种截然不同的生态理念:英伟达更偏向于企业级用户和商业价值 , 而全面开源后的 CANN 则能提供更大的探索和创新空间 —— 这正是 CANN 全面开源所要赋予开发者的核心价值 。
生态赋能:当使用者成为贡献者
如果说技术透明是开源的「里子」 , 那么生态的赋能则是更具深远影响的「面子」 。 CANN 的开源正在为整个国产 AI 生态注入新的活力 。
首先 , 开源为产学研的深度融合提供了前所未有的机遇 。 苏统华教授将开源的生态形容为一个巨大的「问题宝库」:「原来我们是看不到的 , 不知道它好与坏;现在一测就能知道 , 比如这个内存消耗特别大 , 我给它做一个改进 —— 那可能就能发一篇论文 , 就是一个成果 。 」 开源让高校的研究者能够直面产业的真实痛点 , 将解决实际问题转化为科研成果 , 从而形成良性循环 。
陈昀博士所在的团队正是这一模式的积极践行者 。 作为高校研究者 , 他们不受短期商业压力的束缚 , 得以专注在更高质量、更具前瞻性的算法开发上 , 并将这些高质量的算子原型通过开源社区贡献给 CANN , 为整个昇腾「大厦」添砖加瓦 。
陈昀博士在华为全联接大会做了主题为「让昇腾算子开发便捷 10 倍 , 我与 CATALASS 成长之路」的开发经验分享
其次 , 开源是培养下一代开发者的最佳土壤 。 正如陈昀博士所言:「我们以前用 CUDA 可能只是一个单纯的使用者 , 但现在 CANN 开源 , 我们可以从使用者转化为一个贡献者 。 」这种身份的转变可为青年开发者提供黄金机遇 , 让他们能够在真实的、世界级的项目中锻炼自己 , 其成长远非封闭开发所能比拟 。
更重要的是 , 要让一个生态真正繁荣 , 创新力量必然源自社区 。 李秀红先生以 CUDA 生态中的 FlashAttention 为例 , 指出很多革命性的工具并非由英伟达官方规划 , 而是第三方开发者基于开放平台创造出来的 。 CANN 的开源 , 正是希望改变过去社区问题高度依赖少数官方专家的模式 , 让更多外部力量能够参与进来 , 最终形成一个自生长的、充满活力的创新社区 。
降低门槛:让高性能计算触手可及
除了技术透明和生态赋能 , 降低开发门槛 , 让更多人能够轻松利用强大的算力 , 是开源带来的最直接的红利 。
对于深入底层的性能优化专家而言 , 像 CATLASS 这类算子模板库的出现 , 堪称 Game Changer 。 它将开发门槛「从硬件专家级直接降到了模板调参级」 , 过去可能需要一个多月才能手动写出的内核 , 现在利用模板库「可能一周多就可以组装一个高性能矩阵层了 , 效率提升至少 5 到 10 倍」 。 而全面开源无疑将加速这类高效易用工具的诞生和迭代 。
与此同时 , 更高层次的易用性探索也在同步进行 。 苏统华教授的团队正在构建一套昇腾算子的 Python 编程体系 , 致力于让开发者能更便捷高效地调用昇腾算力;其中不仅包括前端 AsNumpy , 还有作为后端的高性能 Ascend C 算子库 OpenBOAT , 以及用于算子性能评测的便捷工具 AscOpTest 。 对于大量习惯使用 Python 的 AI 算法工程师而言 , 这意味着他们无需深入学习 C++ 或复杂的硬件知识 , 就能直接享受到昇腾 NPU 带来的强大算力 。
苏统华教授在华为全联接大会的「CANN 全面开源开放」技术分论坛上分享了「校企协同 , 开源赋能」的核心理念
除了在开源工具上身体力行 , 苏统华教授同样致力于开发者知识体系的构建以及更基础的人才培养工作 。 作为国内最早开展 GPU 计算教学的学者之一 , 他将丰富的经验带到了昇腾生态的建设中 。 他的团队不仅编写了国内第一本关于 Ascend C 的教材 , 还陆续推出了多本围绕 CANN 的著作 , 填补了系统性学习资料的空白 。 比如去年他与华为昇腾技术专家陈仲铭(B 站知名 AI 科普 UP 主 ZOMI 酱)合著的《AI 系统》一书 , 其中专门对 CANN 进行了系统性介绍 。
无论是为专家打造的底层算子模板库 , 还是为大众铺设的上层 Python 编程接口 , 其背后都离不开一种高效的创新模式 —— 产学研的深度协同 。 正是通过这种紧密的校企合作 , CANN 生态得以将学界的理论创新与产业界的真实需求相结合 , 共同打造出真正能降低开发者入门门槛的实用工具和系统性教材 。 这不仅加速了前沿技术的普及 , 更形成了一个良性循环:高校为生态注入创新活力与新生力量 , 企业则为学术研究提供宝贵的实践土壤和资源 。 这一模式 , 正是 CANN 生态能够让顶尖专家和算法新人都能各取所需 , 最终实现「让一线开发者可以聚焦算法 , 而不是去聚焦底层调优」这一共同目标的关键 。
构建最大公约数
CANN 的生态战略与未来展望
如果说打造一系列强大的开发工具是 CANN 在「术」层面的精进 , 那么全面开源则是一场「道」层面的系统性变革 。 这并非一次孤立的技术发布 , 而是一场深刻的生态战略选择 。 其最终目标是要将李秀红先生所说的「为开发者构建最大公约数」从一种工具层面的追求上升为整个生态的指导哲学 , 让开发者能够聚焦于应用创新本身 。
这种战略选择的背后是一种对生态边界的清晰认知 。 也就是说 , 平台方的核心任务是提供稳定、高效且值得信赖的底层能力 , 而非试图包揽上层应用的一切 。 只有这样 , 才能为社区的「原生创新」留出最广阔的生长空间 。
正是基于这种「有所为 , 有所不为」的理念 , 华为围绕 CANN 展开了一系列系统性的生态建设布局 , 其核心思想清晰而坚定:将生态的主导权交还给开发者 。
这一战略体现在多个层面 。 首先是更敏捷的架构:针对开发者反映的软件包臃肿、迭代缓慢等问题 , CANN 正在进行彻底的「分层解耦」 。 这一理念具有双重含义:
组件的解耦 。 这直接回应了开发者长期以来对「软件包过于庞大和耦合」的关切 。 CANN 将过去的大软件包拆分为 20 多个更细颗粒度的组件包 , 允许开发者按需更新 , 甚至围绕某个特定的小组件进行创新和修复 , 极大地提升了开发的灵活性与敏捷性 。 开放策略的分层 。 CANN 根据不同层级的特性采取了差异化的开放模式 。 对于需要最大化创新自由度的运行时/驱动、编译器和编程语言(如 Ascend C) , CANN 将进行彻底的全量代码开源 。 而对于需要承上启下、保持长期稳定性的虚拟指令集 , 则选择开放接口 。 这种设计 , 既通过接口的稳定性保护了上层生态的兼容性 , 又通过核心组件的代码级开放 , 为社区的深度定制和创新提供了最广阔的空间 。
CANN 的多层架构示意图 , 其中不同的层级有不同的开源策略
其次是更开放的姿态:为了最大程度降低开发者的迁移成本 , CANN 团队在适配 PyTorch、TensorFlow、vLLM 等主流 AI 框架和加速库上投入了巨大精力 , 力求实现「零感知」迁移 。 同时 , 通过成立 CANN 技术指导委员会 , 吸纳来自高校、企业的外部专家共同决策 , 标志着 CANN 正从企业主导走向真正的社区共治 。 目前 , 该委员会共有 26 位成员 , 包括苏统华教授与华南理工大学陆璐教授两位高校学者以及多位来自华为、讯飞、移动等企业的研究者 。
在华为全联接大会 2025 期间 , 华为昇腾计算业务总裁张迪煊宣布正式成立了「CANN 技术指导委员会」 , 为后面 CANN 的全面开源和社区化运作奠定了基础 。
最后是更系统的人才培养:华为深知生态的根基在于人 。 为此 , 华为实施了一系列举措 , 包括通过鲲鹏昇腾科教创新孵化中心等平台与国内 16 所顶尖高校合作 , 提供算力资助支持高校课题组老师开展科研创新研究 , 开设鲲鹏昇腾相关课程推进基于国产技术路线的完整人才培养体系 。 与此同时 , 华为还通过举办 CANN 训练营、昇腾 AI 原生创新算子挑战赛等一系列开发者活动和昇腾开发者计划等激励活动 , 将生态的触角从高校延伸至更广泛的开发者社区 , 加速人才的聚集与成长 。
昇腾 AI 原生创新算子挑战赛 S7 赛季即将开赛
至于未来 , CANN 当前阶段的重要任务是对标 CUDA , 补齐功能短板 。 但所有受访者都清醒地认识到 , CANN 的终点并不仅仅是成为一个替代品 。 国产 AI 生态要想真正繁荣 , 必须拥有自己的「原生创新」能力 。 正如我们所采访的专家们普遍认为的 , 当下一个类似 FlashAttention 的革命性创新诞生于 CANN 生态时 , 它才能真正从追赶者变为引领者 。
CANN 详细的开源计划已在华为全联接大会公布:
9 月底 , CANN 全量算子将开源到 GitCode 社区; 12 月底 , 领域加速库、图引擎、Ascend C、MindIE 等软件代码也会陆续上仓 , 完成昇腾软件开源开放 , 全球共享 , 共同定义技术标准和发展方向 。华为还承诺「将每年投入 1500P 算力和 3 万片开发板 , 与全球开发者共创、共享昇腾开源生态 。 」
蓝图已经绘就 , 资源也将到位 , 这座属于国产 AI 生态的「宏伟大厦」 , 正等待着开发者社区添砖加瓦 。
新篇章
将与开发者共同书写
从需要手动调优的「拓荒时代」 , 到即将全面开源的「共建时代」 , CANN 的演进之路正是国产 AI 基础软件自立自强的一个缩影 。
CANN 的全面开源 , 不仅是代码的开放 , 更是发展模式和创新机会的开放 。 这背后 , 我们看到的是一种深刻的理念变迁:国产基础软件的竞争 , 正从过去单纯追求技术指标的对标 , 转向构建一个开放、透明、值得信赖的开发者社区 。 这不再仅仅是华为一家的战略 , 更是整个行业走向成熟的标志 。 它将评判标准从「我们能做出什么」 , 转向了「开发者愿意用我们创造什么」 。
而这座「大厦」能否真正建成 , 最终取决于开发者的选择 。 一个繁荣的生态应是何种模样?李秀红先生指明了平台方的根本任务:「你只要把你基础软件做好 , 第三方的创新就能基于这些基础软件生长出来 。 」苏统华教授则给出了一个质朴而深刻的答案:「越多人去想办法(贡献) , 这个生态就越快繁荣起来 , 就容易做大 。 」而如何让更多人愿意参与进来?陈昀博士指明了路径:「真的需要去构建一个开发者友好的社区 , 要去完善很多的文档以及教程 , 还有一些示例仓库 , 让全球开发者零门槛上手…… 形成雪球效应 。 」
【「从追赶者到引领者,路有多远?」 我们和CANN一线开发者聊了聊】这正是所有生态建设者共同努力的方向 。 当底层的「砖块」经由千万开发者之手共同打磨 , 当创新的思想在这片开放的土壤上自由生根发芽 , 属于国产 AI 生态的「宏伟大厦」终将拔地而起 。 而这座大厦的未来 , 正由像苏统华教授、李秀红先生、陈昀博士这样的开发者们书写着 。
推荐阅读
- 纯视觉VLA方案从有限数据中学到强大的空间泛化能力
- 面对开不完的会,我们距离「信息自由」还有多久?
- 8000mAh!刚公布这顶配直屏,可能是米粉最爱的「MIX」手机
- 从自研架构统一到生态软件完善,骁龙高调秀“肌肉”
- 拆解新 iPhone 的「高原」设计,以及「可替换电池」的线索
- iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」
- 荣耀放大招!罗巍亲曝AiMAGE“绝密项目”即将登场:从未见过,甚至不敢想
- Meta最新研究RecoWorld,从「猜你喜欢」到「听你指令」
- 168 元一年的「小红卡」,是小红书打破本地生活红海的钥匙
- 估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
