有鹿机器人创始人兼CEO陈俊波:具身智能是中国产业革命的机遇

有鹿机器人创始人兼CEO陈俊波:具身智能是中国产业革命的机遇

文章图片

有鹿机器人创始人兼CEO陈俊波:具身智能是中国产业革命的机遇

文章图片

有鹿机器人创始人兼CEO陈俊波:具身智能是中国产业革命的机遇

文章图片

有鹿机器人创始人兼CEO陈俊波:具身智能是中国产业革命的机遇

WAVES新浪潮2025邀你一起走向中国创投的「新纪元」 。
这是属于中国创投的新纪元 。 当下的中国创投市场 , 既是周期筑底的转折点 , 也是结构性转型的深化期 。 在政策主导、国资与资本高度集中的新生态下 , 唯有顺应趋势、灵活调整 , 方能在不确定性中捕捉确定性机遇 。
6月11-12日 , 杭州良渚文化艺术中心 , 36氪WAVES新浪潮2025大会以「新纪元」为主题 , 汇聚创投领域顶级投资人、新锐企业创始人 , 以及深耕科技、创新、商业的科学家、创作者与学者 , 共同探讨AI技术革新、全球化浪潮与价值重估等前沿议题 , 拆解他们眼中的商业理想和未来世界 , 一起讨论、寻找、走向中国创投「新纪元」 。
·
【有鹿机器人创始人兼CEO陈俊波:具身智能是中国产业革命的机遇】6月12日下午 , 在创业者会场有鹿机器人陈俊波进行了一场独立演讲 , 主题为「具身智能是中国产业革命的机遇」 。 以下为演讲全文:
大家中午好!很高兴和大家做一个交流 。 刚刚和具身智能相关的主题也有一些 , 大家可能有有些自己的理解 , 我们觉得具身智能坦白讲是可能比大家想象的更加重要 。 这个重要性体现在哪里呢?大家想一下过去30年 , 中国最核心的能力提升是在制造业 , 我们的制造业已经占到了全球的30%以上的体量 , 虽然我们的制造业很优秀 , 但一直在价值链最低端 。 具身智能是我们去提升整个制造业如何在价值链上往上攀升的特别好的技术 , 甚至把它叫做国运级的技术也不为过 。
·
具体是什么意思呢?大家看一个案例 , 最左边的设备是中国的一家公司叫明诺 , 生产设计的一台传统有轮胎的清洁设备的机器 , 这台机器售价不到4万人民币 , 全球最大的一家公司(图中中间的产品) , 这个产品在海外售价超过8万甚至10万人民币 。 大家会觉得是不是德国的质量比较好 , 所以卖的比较贵 , 其实不是 , 它们的品质一模一样 , 为什么?因为德国的产品就是中国代工的 , 所以人家就是印一个logo就拿走了所有的利润 。
今天我们做的事情是通过有鹿通用的机器人大脑 , 把它适配到一个传统的设备上 , 升级成一个智能的机器人 。 今天这款智能机器人在海外的售价超过4万美金 , 而且供不应求 , 原因很简单 。 你在欧美任意请一个人 , 一年的年薪都超过5万美金 , 而我们这样一台机器人 , 它设计的使用寿命是6年 , 所以它是一个极其优秀的ROI 。
通过这样一个简单的例子 , 我们能看到 , 我们通过具身智能的技术 , 把中国非常优秀但特别传统、在价值链最低端的产品 , 它的价值提升了7倍 , 接近一个数量级 , 我觉得这是具身智能对于中国来说最大的意义 。
显然 , 我们这个通用的大脑不仅仅可以放到一个清洁的设备上 , 我们真正在做的是“一脑多型” , 就是怎么能够把我们具身智能的大脑适配到各种各样不同的传统设备上 , 把它升级为一个机器人 , 这是我们真正应该做的事情 。
下面 , 介绍一下我们的模型 。 我们的模型本质上是一个左右脑融合的通用机器人模型 。 在这个部分 , 目前我们是放了一个开源的通义千问 , 它显然有非常好的语言交互能力、推理能力 , 但就像人的大脑一样 , 我们的语言脑是左脑 , 但是我们仍然需要一个右脑 , 上面右脑的部分是有鹿真正投入最核心的时间精力开发的 。 右脑最核心做什么事情呢?是做两件事情:一件事情是空间的智能 , 一件事情是决策的智能 。 什么叫空间的智能?所有的传感器的数据做输入 , 都可以恢复出一个三维世界 , 并且三维世界的编码和我们的语言模型特征做融合 。 什么是决策智能呢?通过预测未来来决定机器人接下来的行为序列应该是什么样子 。
·
这是一个更加直观的介绍 , 未来任何一个具身智能的通用大模型都会包含这三部分 , 左脑就是刚刚说的语言脑 , 逻辑推理的能力 , 右脑就是空间智能 , 决策智能 , 以及小脑 。 今年宇树特别火热 , 本质上宇树真正的核心技术在小脑的部分 。
·
·
这是一个特别直观的介绍 , 上面是我们传感器的输入 , 下面会直接进行一个翻译 , 把这个特质在一个三维空间里做展示 , 其实是一个四维的时空里 , 所有的特征和语言对齐 , 这有一个好处 , 它就能做各种各样更复杂的交互任务 。 比如说 , 其中一个任务 , 这是一个叫做VQA的任务 , 当有传感器序列的输入以后 , 人类就可以用语言的方式与模型交互 。 比如说 , 我们问它的是 , 你直接介绍你看到的世界 , 下面所有的文本就是我们模型的输出 , 它会详细的介绍这是一个在车道线的环境 , 它的限速是什么样 , 接下来是伸向的行为 。
大家可能会问 , 我们能做VQA有什么用?本质上这个问题就好像我们问DeepSeek和之前的大语言模型有什么不一样 , 最核心的一点是DeepSeek有推理能力 , 而今天很多的情况下 , 仅仅靠上一代的小模型的模式识别的技术已经不够我们用了 , 我们必须让我们的模型有推理的能力 , 才能真正完成具身智能的能力 , 而推理这件事情只有靠语言才能完成 。 即便是人类的大脑 , 我们不用语言也是不能做推理的 。
我们通过这样一个全新的技术 , 有鹿成立大概两年左右的时间 , 我们已经获得了10项全球的算法冠军 , 而且和我们一起参加这些比赛的都是英伟达、Facebook、谷歌等全球AI巨头 。 同时 , 我们也获得了很多的行业大奖 。
我们有两类产品 , 一类是刚刚提到的大脑的模式 , 有点像机器人行业的Tier1的供应商 , 而我们的目标客户就是现在在中国已经非常成熟 , 占据了庞大市场的传统的设备供应商 。 我们的使命就是通过这样一款具身智能的大脑 , 帮传统的制造业去做智能化的升级 。 第二个 , 有鹿也会围绕一个场景去实现自己的或者提供自己完整的机器人产品的矩阵 。 这个场景是我们觉得世界上最大的市场 , 就是家庭市场或者家庭周边的市场 , 围绕这个场景 , 我们会去提供如清洁、物流、服务等各种各样不同的机器人 。
简单介绍一下进展 , 这款清洁的机器人是我们2024年9月份发布 , 到现在大概9个月的时间 , 我们已经签署了超过4亿人民币的订单 , 已经成为这个行业的销售冠军 。
·
中间是我们在样机阶段的产品 , 这款产品最核心的想法是去实现一个外卖员能够实现的所有工作 , 端到端 , 包括跑到商家端、shoppingmall取外卖包裹 , 包括按电梯 , 能够自动上下楼 , 开门 , 在开放道路上跑三五公里 , 进到小区、单元楼 , 并且把包裹放到家门口 , 这是它要完成的任务 。 当然 , 它使用的场景非常广泛 , 不仅像美团、饿了么 , 盒马、山姆、KFC等各种各样的场景都需要 。
人形机器人 , 我们也在投入 , 但是我们投入的方式和大部分人形机器人不太一样 , 比如说刚刚过去的亦庄人形机器人马拉松 , 平均一个人形机器人后面跟了三个人 , 一个人拿遥控器 , 一个人防止它摔倒 , 另外一个人拿水浇它 , 防止它过热 。 现在绝大部分做人形机器人的公司本质上是在做小脑、运控 , 我们的想法很简单 , 我们觉得一个人形机器人所看到的世界、要解决的智能性任务 , 和一个轮式的机器人没有太大的区别 , 所以我们希望用一个通用的大脑去服务好所有的机器人产品 。 这里面最核心的点是什么?就是这张图 , 无论是右边轮式机器人用到的模型 , 还是左边人形机器人用到的模型 , 它的底层模型是同一个模型 , 轮式或轮+臂的机器人今天已经开始大规模出货 。 不管是大语言模型 , 还是具身智能领域 , 有一个叫scaling law特别重要 , 我们搜集了足够广泛的数据 , 才有可能让我们的模型往前走一小步 。 我们最核心的想法是 , 今天既然我们轮式、轮+臂的机器人已经大规模推向市场 , 如果我们是用同一个底层模型去学习的时候 , 它不仅仅可以让我们的轮式、轮+臂机器人变得越来越智能 , 也能够让我们的人形机器人变得越来越智能 , 所以这是我们最核心的观点 。 我们最核心的想法是通过我们的大脑 , 可以让各种各样的设备都变得越来越智能 。
·
这句话是孙正义讲的 , 但是我们特别赞成 , “未来机器人物种的数量会超过生物物种的数量” 。 为什么?因为人类希望机器人在不同的场景去完成不同的任务 , 而在那个场景、那个任务的前提条件下 , 它的本体收敛到最优的形态 , 一定长的不一样 , 但是我们觉得所有这些机器人都应该拥有一个同样高度智慧的通用大脑 。
谢谢大家!以上是我今天的分享 。

    推荐阅读