960颗类脑芯片,浙大“悟空”出世

960颗类脑芯片,浙大“悟空”出世

文章图片

960颗类脑芯片,浙大“悟空”出世

文章图片

960颗类脑芯片,浙大“悟空”出世


本文由半导体产业纵横(ID:ICVIEWS)综合
国际首台神经元规模超过20亿、基于专用神经拟态芯片的类脑计算机 。
【960颗类脑芯片,浙大“悟空”出世】
浙江大学脑机智能全国重点实验室发布最新研制的新一代神经拟态类脑计算机—Darwin Monkey(”悟空”) 。 该类脑计算机搭载了960颗实验室自研的达尔文3代类脑计算芯片 , 支持的脉冲神经元规模超过20亿 , 神经突触超过千亿 , 其神经元数量已接近猕猴大脑规模 , 在典型运行状态下功耗约为2000瓦 。
这是国际上首台神经元规模超过20亿的基于专用神经拟态芯片的类脑计算机 , 同时也是浙江大学类脑计算团队继2020年9月份研制成功我国首台亿级神经元类脑计算机Darwin Mouse(“米奇”)之后的又一重要突破 。
达尔文3代类脑计算芯片Darwin Monkey所采用的达尔文3代类脑计算芯片是由浙江大学牵头、联合之江实验室于2023年初研制成功 , 单颗芯片支持超过235万脉冲神经元与亿级神经突触 , 并支持类脑计算专用指令集和神经拟态在线学习机制 。 与其它类脑芯片相比 , 达尔文3代类脑计算芯片在神经元规模、突触存储密度、推理学习任务的效率等方面具有优势 。

类脑计算机“悟空”搭载的达尔文3代类脑计算芯片
在神经元模型的灵活性方面 , 研究者提出了一种专用的指令集体系结构(ISA) , 能够高效灵活地描述不同的神经动力学模型和学习规则 , 利用高并行性的计算操作实现多组运行参数加载和状态变量更新 , 解决模型构建灵活性和运行效率之间的矛盾 。
在突触连接的规模与密度方面 , 研究组设计了一种高效连接表示机制 , 有效压缩了描述突触连接所需的信息 , 提升了整体片上存储的使用效率 , 增加了突触密度和规模使得单芯片能够支持200万以上神经元和1亿以上神经突触 。
在片上学习能力方面 , 达尔文3代类脑芯片具备灵活的片上学习和芯片级扩展能力 , 能够高效实现不同类型的神经元和突触模型 , 运行大规模脉冲神经网络 。
Darwin Monkey类脑计算机据介绍 , 整台Darwin Monkey类脑计算机由15台刀片式神经拟态类脑服务器组成 , 每一台刀片式类脑服务器内部集成了64颗达尔文3代类脑计算芯片 。

类脑计算机“悟空”
值得一提的是 , 在类脑计算芯片的基础上 , 为了构建超大规模的类脑计算机Darwin Monkey , 研究团队突破了以下关键技术:

  • 构建大规模神经元系统互连与集成架构 , 支持以多维网格为基本拓扑结构的层次化、可扩展芯片间互连 。
  • 实现自适应时间步控制方法 , 支持大规模神经元之间的任务协同运行 。
  • 采用国产晶圆基板工艺 , 基于CoWoS-S 2.5D先进封装技术 , 实现晶圆级类脑计算芯片 。
  • 提出分层的系统资源管理框架 , 设计多级内存系统中的数据换入换出策略 , 实现对大规模神经元系统资源的管理与调度 。

晶上系统SoW集成方式的神经拟态类脑服务器
刀片式类脑服务器的集成方式除了基于传统PCB板级互连的方式之外 , 为了突破芯片间互连速度与系统能效的瓶颈 , 团队联合浙大集成电路学院 , 利用2.5D先进封装技术研制出晶圆级超集成类脑计算芯片DarwinWafer , 搭建了基于DarwinWafer的晶上系统刀片服务器 , 整个SoW刀片式服务器主体仅仅包含一张集成64颗达尔文3代类脑计算芯片裸片的12寸晶圆 , 摆脱了传统光罩的物理约束 , 实现导线微纳尺度的互连优化 。
为了充分释放类脑计算机的能力 , 团队还研制了新一代达尔文类脑操作系统 。 该系统采用分层资源管理架构 , 通过构建负载感知调度算法与动态时间片划分机制等技术 , 在考虑通信带宽与任务特征的基础上 , 实现了神经拟态任务的高效并发调度与系统资源的动态优化 。
Darwin Monkey的应用场景Darwin Monkey(悟空)类脑计算系统具备大规模、高并行、低功耗等特点 , 团队负责人、浙江大学脑机智能全国重点实验室主任潘纲教授称其将为现有的计算场景提供新的计算范式 , 为人工智能发展提供新的算力基座 。
首先 , 类脑计算系统既能解决现有深度网络及大模型高能耗、高计算量的问题 , 其无人监督的在线方式学习机制也能为人工智能发展带来进步 。
其次 , 作为脑模拟的天然平台 , Darwin Monkey可以作为脑研究的仿真工具 , 减少真实的生物实验 。 这种新的实验手段 , 便于探索大脑工作机理 , 更好地理解大脑 。
第三 , 人类的推理能力和效率远超当前人工智能 , Darwin MonKey计算机仿脑的工作机制和超越人脑的运算速度 , 将为未来类脑AI的研究提供强大的支持 。
目前团队在Darwin Monkey类脑计算机上已成功部署多项智能应用 , 不仅通过运行DeepSeek类脑大模型完成逻辑推理、内容生成和数学求解等智能任务 , 还初步模拟了包括秀丽线虫、斑马鱼、小鼠以及猕猴等不同神经元规模的动物大脑 。
*声明:本文系原作者创作 。 文章内容系其个人观点 , 我方转载仅为分享与讨论 , 不代表我方赞成或认同 , 如有异议 , 请联系后台 。
想要获取半导体产业的前沿洞见、技术速递、趋势解析 , 关注我们!

    推荐阅读