光子芯片,硬刚英伟达NVLink

光子芯片,硬刚英伟达NVLink

文章图片


本文由半导体产业纵横(ID:ICVIEWS)编译自eetimes
光子芯片新势力 , 年内量产冲AI 。
据接受《EE Times》独家采访的高管透露 , 初创芯片制造商 Celestial 和 OpenLight 最早将于今年生产出首批芯片 , 为亚马逊、微软和谷歌等运行 AI 数据中心的超大规模客户提供更快的光子学和更低的功耗 。
8月份 , Celestial从台积电旗下的VentureTech Alliance和三星催化基金(Samsung Catalyst Fund)获得了2.55亿美元的融资 , 使其融资总额达到5.2亿美元 。 同样在8月份 , OpenLight从瞻博网络(Juniper Networks , 现已并入HPE)和Lam Research旗下的企业风险投资部门Lam Capital等投资者处筹集了3400万美元的资金 。
到明年 , Celestial 将出售其首批芯片 , 包括该公司的 Photonic Fabric , 该技术可在处理器封装内提供从芯片到芯片的光学扩展网络 , 或跨数据中心机架提供从服务器到服务器的光学扩展网络 。 随着下一代人工智能基础设施需求的飙升 , Celestial 将利用新融资来加强其供应链 , 并深化与包括台积电在内的代工厂的合作 。
OpenLight 将利用新资本扩展其由代工厂 Tower Semiconductor 制造的有源和无源光子元件 PDK 库 , 该库包括 400 千兆位每秒 (Gbps) 的调制器和在芯片上异构集成激光器的磷化铟技术 。
Celestial 首席运营官 Preet Virk 告诉《EE Times》:“超大规模厂商计划在我们能够交付解决方案后立即采用 , 时间大概在明年中下半年 。 这包括超大规模厂商以及我们为其提供一些有趣解决方案的半导体公司 。 ”
OpenLight 首席执行官Adam Carter表示将于今年开始生产 , 他向《EE Times》表示 , 该公司有一些“相当大的”客户有兴趣采用磷化铟用于共封装光学器件 (CPO) 等应用 。
Carter表示:“一个 CPO 产生的总带宽将会非常大 , 比其他任何人宣传的都要大得多 。 ”他还补充说 , 该公司将在今年年底前为首批客户投入生产 。
Virk 表示:“超大规模企业迫不及待地想要采用光学技术 。 ”
Celestial 专注于服务器内的“纵向扩展”网络 , 85% 的数据中心流量都流向此类网络 。 Virk 指出 , 去年纵向扩展网络的销量超过了基于铜缆的以太网横向扩展交换机 。 光子芯片领域的其他竞争对手包括 Ayar Labs、Lightmatter 和华为 。
今年3月 , Lightmatter宣布推出Passage M1000 , 其总光学带宽可达每秒114 Tbps 。 M1000参考平台是一款多光罩有源光子中介层 , 可连接3D封装中的大型芯片 , 从而为数千个GPU提供连接 。 Lightmatter已与GlobalFoundries和芯片封装商Amkor合作 , 开始基于M1000进行客户设计的生产 。
Ayar Labs 和 Alchip Technologies 于 9 月建立合作伙伴关系 , 将 Ayar 的 CPO 和 Alchip 的设计专业知识与台积电的紧凑型通用光子引擎 (COUPE) 先进封装技术相结合 。
据 Celestial 报道 , 随着各大公司竞相打造 AI 计算能力 , 全球历史上规模最大的基础设施投资正在进行中 。 IBM等公司也加入了这场竞争 。 量子计算初创公司PsiQuantum 已在 GlobalFoundries 位于纽约州马耳他的晶圆厂采用标准 45 纳米氮化硅工艺制造光子芯片 。
Celestial 首席执行官 David Lazovsky 在一份声明中表示:“人工智能行业正遭遇根本性的瓶颈 , 即人工智能处理器之间通过铜线传输数据 。 目前的铜基互连根本无法高效扩展 , 以满足下一代人工智能所需的数百万个处理器的需求 。 ”
挑战Nvidia的NVLinkCelestial 声称其光子结构在功耗方面明显优于 Nvidia 的 NVLink 。 与传统的 PCIe 相比 , NVLink 互连实现了 GPU 之间更快、更直接的通信 。
Virk 表示:“在进行 GPU 到 GPU 的通信时 , 我们消耗的功率仅为 NVLink 交换机的四分之一 。 ”

来源:Celestial
Celestial 正在推出其专利的光存储器接口桥接器 (OMIB) , 作为 NVLink 的替代方案 。 OMIB 类似于英特尔的 EMIB、台积电的 CoWoS 和三星的 IQE 等先进封装技术 。 OMIB 可在芯片内部以及与其他芯片之间提供光子连接 。 Celestial 的控制电路的发送/接收部分采用台积电的 4 纳米和 5 纳米工艺 。
华为也瞄准NVLink华为轮值董事长徐直军表示 , 本周 , 该公司发布了全新的SuperPod集群 , 该集群将连接多达15488个Ascend NPU , 并将它们作为一个连贯的系统运行 。 SuperPod产品将于明年应用于华为的Ascend芯片 。
EMI挑战“如果你看看 Nvidia 和 AMD 的路线图 , 就会发现他们正在把大型全光罩芯片集成到一个封装中 , ”Virk 说 。 “将这些芯片连接到封装内的高速、高密度互连 , 正成为 EMI 信号完整性的一大挑战 。 我们可以把光学 IO 放置在芯片上的任何位置 。 如今世界上生产的每一块芯片 , 光学 IO 都位于芯片的边缘 。 我们没有这个问题 , 因为我们的调制器不像微环那样对热敏感 。 ”
Celestial 不使用微环 , 而是使用 EAM(电吸收调制器)通过施加电场来调节光吸收 , 从而控制激光束强度 。
Virk 表示:“目前 Nvidia 的一项操作需要 600 到 700 纳秒 , 而我们可以在 100 到 200 纳秒内完成 , 而且功耗极低 , 约为每位 2.8 皮焦耳 。 ”
OpenLight 的 Carter 表示 , 他的公司已经利用其 200 千兆比特每秒的调制器实现了约 1.5 皮焦耳/比特的传输效率 。 “如果现在使用相同的 DFB(分布式反馈激光器)进行扩展 , 并将 200 千兆比特的调制器换成 400 千兆比特的调制器 , 那么由于电压提升幅度没有那么大 , 每比特的传输效率基本上可以减半 。 这就是异构集成的固有优势 。 ” 该公司于 2 月份宣布推出一款 400 千兆比特的调制器 。
“我们已经成功演示了基于磷化铟的400千兆调制器 , ”Carter说道 。 “这意味着客户能够扩展和横向扩展其网络 , 以获得更大的带宽和更高的密度 。 ”
关于封装Carter表示 , 竞争的焦点是先进封装 。
“许多公司在发布有关 CPO 或调制的公告时都会有不同的要求 , 特别是在包装方面 , 包装里有什么 , 尺寸是多少 , 规模是什么样的 。
它最初不会基于标准 。 OpenLight 的定位非常独特 , 因为我们不一定为你制造芯片 。 我们为你提供一个组件库 , 这样你就可以设计自己的芯片 。
OpenLight 正在与芯片封装商 ASE 位于加州的子公司 ISE 合作 。 Celestial 的目标是在量产后向芯片设计人员提供其自有的芯片集 。 “一种采用方式是 , 我们为您提供一个需要您封装的光学芯片集 , ”Virk 说道 。 “该光学芯片集带有一个 EIC(嵌入式中介层载体) 。 ”
EIC 是一种新型封装技术 , 它充当嵌入式中介层 , 将芯片集成到类似 SOC 的多层封装中 , 成本低于传统的 3D IC 。 Virk 表示:“我们为您提供芯片以及所有封装和光学技术 , 您可以前往任何 OSAT 进行封装 。 ” 作为芯片的替代方案 , Celestial 还计划将其 IP 应用于客户芯片 。
该公司正在流片硅片 , Virk 认为这是世界上第一个在芯片中间配备光学 IO 的大型 SoC 。
Celestial 产品管理高级总监 Ravi Mahatme 表示:“我们将内存控制器放置在芯片边缘 。 在芯片的南边缘 , 我们放置了两个用于 HBM3e 的 HBM 控制器 。 在东西两侧 , 我们放置了四个 DDR 控制器 , 用于寻址八个 DDR DIMM 。 通过软件 , HBM 可以充当 DDR 的缓存 。 这样一来 , 基本上就可以隐藏 DRAM 的内存访问延迟了 。 ”
Mahatme 称这一发展将改变游戏规则 。
“这是一个统一的内存空间 , 任何处理器都可以读写任何内存位置 , ”他说 。 “DLRM(深度学习推荐模型)的大小达到TB级 。 目前 , 存储这些模型的唯一方法是将XPU连接在一起 。 这改变了游戏规则 , 因为这个模型可以本地存储 。 ”
*声明:本文系原作者创作 。 文章内容系其个人观点 , 我方转载仅为分享与讨论 , 不代表我方赞成或认同 , 如有异议 , 请联系后台 。
【光子芯片,硬刚英伟达NVLink】想要获取半导体产业的前沿洞见、技术速递、趋势解析 , 关注我们!

    推荐阅读