昇腾CANN再进化:开放创新繁荣AI生态

昇腾CANN再进化:开放创新繁荣AI生态

文章图片

昇腾CANN再进化:开放创新繁荣AI生态

文章图片

昇腾CANN再进化:开放创新繁荣AI生态

文章图片


【昇腾CANN再进化:开放创新繁荣AI生态】在当前人工智能飞速发展的浪潮中 , 随着各行各业模型应用的不断深入 , 开放创新正决定着AI产业的未来走向 。 AI计算架构/平台作为最核心的中间层 , 向下连接底层硬件平台 , 向上支撑开发框架 , 其开放创新程度更是决定着AI生态的广度与AI应用的深度 。
在刚刚落幕的鲲鹏昇腾开发者大会2025——昇腾AI开发者峰会2025 , 异构计算架构CANN作为昇腾AI的核心软件平台 , 正把开放创新当作首要任务 , 进一步分层开放+技术创新 , 释放硬件极致潜能 , 推动AI开发效率与性能双重突破 , 繁荣AI生态 , 引领产业蝶变 。

华为昇腾计算业务总裁 张迪煊
会上 , 来自企业、高校的优秀开发者们现身说法 , 展示与昇腾CANN携手共创的优秀成果案例 , 呈现了一幅以开放创新繁荣AI生态 , 重塑AI产业创新范式的生动画卷 。
分层开放+技术创新 , 昇腾CANN再进化
秉持\"使能每一位创新者\"的核心理念 , 昇腾CANN坚持深度开放和技术创新两条腿走路 , 推动AI产业链协同进化 , 打通从技术突破到商业转化的生态闭环 。 本次峰会 , 昇腾CANN在这两个维度再进化 , 通过分层开放架构与核心技术引领 , 实现AI开发效率与性能突破双双升级 。
在分层开放方面 , 昇腾CANN以提升AI开发效率为导向 , 构建起覆盖算子开发、系统调优到深入编译链优化的全场景赋能体系 , 满足开发者场景“魔改”和敏捷开发的诉求 。
峰会期间 , 昇腾CANN发布CATLASS算子模板库、开源Ascend C 2.0 , 以最佳实践赋能降低开发门槛;开放190+Runtime运行时接口 , 赋能开发者灵活组合调用底层原子级能力 , 实现整图调度优化与硬件性能极限挖掘;全新升级毕昇编译器 , 并与Triton、FlagTree等第三方编程框架的无感对接 , 为开发者提供更友好的编程体验 , 进一步实现了“效率与性能兼得”的开发体验升级 。

在技术创新方面 , 昇腾CANN立足充分释放处理器极致性能 , 持续在计算加速、通信加速、内存优化三大领域协同发力 , 满足前沿模型架构及工程创新的发展诉求 。
峰会期间 , 昇腾CANN通过MLAPO融合算子技术将MoE模型13个串行小算子整合成超级大算子 , 结合Vector与Cube并行处理 , 使计算耗时降至45us , 性能提升超58%;以NPUDirect算法革新传统通信模式 , 将MoE模型推理过程中的小包通信耗时降低90% , 整网时延减少50%;创新多重地址映射技术拼接不连续空闲内存 , 将利用率提升20%以上 , 破解动态shape场景下的碎片难题 。

开放创新成果卓著 , AI生态日益繁荣
自昇腾CANN逐步开放以来 , 基于开放的创新成果卓著 。 目前昇腾CANN创新社区已汇聚6000+认证开发者 , 携手互联网、运营商、金融等30余个行业伙伴 , 累计开发260多个高性能算子 , 显著提升多场景业务性能表现 。 一系列基于昇腾CANN的创新成果涌现 , 正为AI生态注入强劲动力 。
在企业层面 , 科大讯飞在日常研发中深入参与到昇腾的软件生态建设 , 联合昇腾CANN共同优化底层算子 , 进行分布式训练框架新特性的开发 , 实现了讯飞星火大模型训练和推理计算效率的翻番 。 得益于此 , 最新发布的星火X1推理模型在多个公开测试集上的效果达到业界领先 。 同时双方联合攻克 , 实现了基于昇腾的MoE模型训练推理的应用落地 , 将训练性能提升2倍 , 推理端到端时延降低50% 。

科大讯飞星火大模型训练工程资深技术专家 张海俊
除科大讯飞外 , 硅基流动、无问芯穹等一批AI Infra(AI基础设施)企业也携手昇腾CANN开展底层创新 , 打造更高效的训练和推理能力 。 分层开放满足着客户多样的个性化需求 , 提供高效、省心、划算的AI开发和应用体验 。
在高校领域 , 清华大学计算机系计图团队基于昇腾CANN构建MoE专用算子体系 , 在算子实现、内存布局、并行策略、并发处理和低精度量化等方面开展优化 , 成功实现了DeepSeek R1模型在单机8卡昇腾服务器上的部署 , 并且将DeepSeek V2的推理性能平均提升了53% , 为资源受限环境下的大模型部署提供了有效的解决方案 。

华南理工大学算力并行加速团队致力于昇腾CANN核心算子性能优化 , 通过共建模板库和编译优化等技术手段 , 使大模型训练推理一体化算子的开发更加简单高效 , 目前算子模板库已在Gitee开源20余个主流高性能算子 。 会上 , 华南理工大学计算机科学与工程学院教授、博士生导师陆璐现场演示了昇腾CANN算子模板库CATLASS的使用 , 展示如何通过自定义模板编程释放Ascend C高性能算子开发潜能 , 让企业不再“重复造车” 。

华南理工大学计算机科学与工程学院教授、博士生导师 陆璐
在科研方面 , 鹏城云脑依托昇腾CANN的全栈协同优化 , 构建了性能领先的AI训练集群 , 面向全社会开放 , 为大模型训练提供算力底座 。 紫东太初基于昇腾CANN构建开放服务平台2.0 , 使能行业大模型高效开发、加速行业应用落地 。 这些来自科研院所的创新成果正赋能多个商用场景 , 创造更大社会价值 。
除了与企业、高校和科研院所 , 一大批个人开发者也与昇腾CANN双向奔赴 , 通过参加CANN训练营、昇腾AI算子挑战赛、昇腾AI创新大赛等方式学习和使用CANN , 不断攀登Ascend C算子开发和应用的高峰 , 实现个人成长与生态繁荣的共赢 。 华为也持续推进产教融合 , 推动各种活动赛事走进校园 , 在实战中培育更多优秀开发者 。
产学研用齐头并进之下 , 6年下来累计已有超过60万开发者学习并使用CANN , 赋予CANN更多创新活力 。 在这一核心软件平台生态的带动下 , 整个昇腾AI生态的开发者已超过330万 , 培养学生超40万 , 为我国竞逐AI产业未来奠定了坚实的人才基础 。
生态做广技术做深 , 重塑AI产业创新范式
综上可见 , 从分层开放的生态裂变 , 到底层技术的原子级突破 , 昇腾CANN正以\"生态做广、技术做深\"的双轮驱动 , 重塑AI产业创新范式 。 值此计算产业重大变革之际 , 昇腾CANN此举逻辑非常清晰:深度开放是生态繁荣的前提 , 技术创新是产业行远的根基 , 两者共同决定AI产业的未来 。
回顾过去 , 从PC时代到移动互联网时代 , 开放创新是成就繁荣生态、驱动产业爆发的不二法门 。 步入AI时代后 , 当深度开源的DeepSeek冲破OpenAI的闭源高墙 , 大模型已从“参数摸高”转变为“参数摸高”与“工程创新”并行 , 快速提升模型效果 , 降低行业应用门槛 , 实现技术平权 , 开放创新又一次站在了时代前沿 。
在这轮以开放创新托举产业生态的新征程中 , 昇腾CANN作为昇腾AI的核心软件平台 , 不仅是中国AI创新的技术底座 , 更是全球开发者突破想象边界的星辰大海 。 凭借与生俱来的异构计算架构特性 , 昇腾CANN必将以开放之姿、极致之力与时代共“昇腾” , 携手全球开发者加速AI技术向千行万业渗透 , 引领AI产业蝶变!

    推荐阅读