
文章图片

文章图片
智东西9月29日消息 , 据“互联网八卦小喇叭”等媒体爆料 , 全球顶尖AI科学家、IEEE Fellow许主洪(Steven Hoi)已加盟阿里通义 , 转向通义大模型的相关研发工作 。
许主洪拥有超20年AI产业和学术经验 , 是新加坡管理大学终身教授、曾任新加坡南洋理工大学终身副教授 , 在AI领域发表了300多篇顶级学术论文 , 论文被引用超过5万次 , 曾被斯坦福大学评为全球顶尖1%的AI科学家之一 。
【曝顶级AI大牛,加入阿里通义,事关下一代大模型】作为多模态大模型领域的领军人物 , 许主洪曾担任全球最大的企业软件公司Salesforce的副总裁 , 从零开始构建了Salesforce在亚洲的AI研究生态系统;他还于2023年创立了一家多模态AI创企HyperAGI , 可以说是业内少有的产学研多栖AI大牛 。
许主洪
2025年2月 , 许主洪加入阿里并担任阿里集团副总裁、智能信息事业群首席科学家 , 向智能信息事业群总裁吴嘉汇报 , 负责AI To C业务的多模态基础模型及智能体(Agents)研究与应用 。
按原本的定位 , 许主洪的核心任务大概是组建顶级AI算法团队 , 整合通义(应用)、夸克、天猫精灵等内部资源 , 促进多模态交互产品迭代 , 加速AI To C商业化 。
在今年6月的2025上海世界移动通信大会上 , 许主洪发表题为《多模态大模型发展与演进》的演讲 , 在演讲中他以夸克App的AI超级框、AI相机等功能为例讲解了多模态大模型的应用场景 。
许主洪以夸克为例讲解多模态大模型应用场景
然而 , 在加入阿里7个多月后 , 许主洪传出加入通义实验室团队 , 这意味着他可能将从面向AI To C商业化研发转向更基础前沿的大模型研发 。
如果消息属实 , 这意味着阿里完成了一次重大的人才重配 , 也标志阿里在多模态大模型研发领域再投重码 。
当下 , 阿里通义大模型正处于“拼迭代速度”、“多模态发展”的关键阶段 , 十分需要许主洪这样对口的顶尖产学研多栖且有分量的AI大牛坐镇 。
在9月底举办的2025云栖大会期间 , 阿里云智能集团首席技术官、通义实验室负责人周靖人透露 , 连续发布数十款模型背后有战略考量:全球AI模型进展都在加速 , 整个通义家族一直在跟全球AI领域的领先者进行你追我赶 , AI今天已进入加速期 , 比拼的是模型迭代效率;同时模型从单模态到多模态的演进是必然趋势 , 阿里期待接下来在多模态方面还有进一步的创新和突破 。
许主洪或是目前阿里最适合牵头做这件事情的人 。 他曾在在今年5月蚂蚁技术开放日上的演讲中提到 , 当下 , 用统一的框架做理解和生成 , 发展多模态大模型的一大演进趋势 。 但这一领域发展尚处于的初级阶段 , 需要实践验证 。
许主洪在讲解统一多模态模型产业发展脉络
许主洪指出 , 统一理解与生成的多模态大模型面临众多技术挑战 。 在全模态交互挑战方面 , 当下支持音、视、图、文全模态交互的公开单模型非常少见;在理解与生成统一方面 , 图像和语意的理解生成统一模型鲜有出现 , 且理解和生成效果难以平衡 。
而在6月的演讲中 , 许主洪也提到:“多模态Agent AI时代才刚刚开始 , 未来要真正达到AGI , 我们还需要解决很多技术难题 , 包括多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制等等 , 都有很多的挑战 , 但是这也是未来多模态大模型行业的机会 。 ”
截至目前 , 阿里及许主洪方未对此进行置评 。
本文来自微信公众号 “智东西”(ID:zhidxcom) , 作者:李水青 , 36氪经授权发布 。
推荐阅读
- AMD AFMF 3帧生成技术曝光,A卡游戏帧数或再迎飞跃
- 荣耀MagicPad3 Pro 13.3参数曝光:真正性能最强的安卓平板
- iPhone 17 Pro机身划痕太多?曝苹果官方有两种方法应对!
- 麒麟9030参数曝光,采用等效5nm制程工艺,性能追赶第三代骁龙8
- 英特尔顶级Granite Rapids CPU曝光:86核心,172线程
- 新屏下摄像头手机!努比亚Z80 Ultra曝光,第五代骁龙8至尊版芯片
- 量子计算理论大牛盛赞GPT-5!不到半小时给出关键研究思路
- 苹果图像模型Manzano曝光 媲美ChatGPT
- 小米17 Ultra影像配置曝光,后置依旧四摄,告别索尼传感器
- 荣耀Magic8 Pro配置曝光:双3D解锁+7200mAh,这次真有点猛!
