
文章图片

文章图片

文章图片

文章图片

明敏 发自 凹非寺
量子位 | 公众号 QbitAI
不造硬件、不量产、不做商业化 。
这是腾讯加入当下具身智能热潮的姿势 。
那要做什么?
一个具身智能的通用外接大脑 。 而且不是端到端 , 是模块化提供能力 。 也就是各家机器人可以从中获取自己想要的部分能力 。
效果be like , 搭载了该大脑的宇树机器人 , 可以实时处理人类语音指令 , 闲聊、完成任务 , 还能判断自己能干什么、不能干什么 。
比如它能看到桌子上比原先多了一个玩偶 , 但是它没有灵巧手 , 所以并不能拿起玩偶 。
这就是具身智能Tarios平台 , 在WAIC 2025期间正式亮相 。
它集成了目前腾讯在具身智能领域的软件能力 , 包括多模态、规划、感知算法 , 以及开发、仿真、数据等工具 。
包括宇树、越疆、乐聚、帕西尼、擎朗、众擎等大热具身智能领域玩家 , 都已火速达成合作 。
而且还没啥后顾之忧——腾讯再次强调了自己不下场做硬件本体、不搞量产、不搞商业化 。
这一波直接格局打开 , 谁都能来当“腾讯系”机器人了(doge) 。
爆火具身智能 , 需要“外接大脑”首先来拆解一下Tairos平台本身 。
它核心包含两个方面:
模型算法 云服务模型层面主要包含三部分:多模态感知模型、规划大模型、感知行动联合大模型 。 每个部分可以类比成人类大脑的一部分 。
云服务方面主要是以工具平台形式提供 , 可以用于开发、训练、测试和部署机器人应用 。
平台通过标准化接口调用以及软件开发工具包(SDK)的方式对外提供服务 。
腾讯强调 , Tairos是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台 , 即插即用的方式向机器人行业开放 。
这意味着机器人厂商能基于自身情况进行更灵活选择 。
比如有的厂商在感知模块上还有欠缺 , 那就可以直接使用Tairos上的感知大模型;如果是长线程规划做得不够好 , 那就可以使用规划大模型 。
以及如果机器人厂商接入了开源模型 , Tairos也能提供后训练一套完整流程能力 , 能让厂商只需少量数据就能完成适配 。
简而言之 , Tarios就是希望成为各家机器人的外接大脑 , 为不同厂商补齐关键软件能力 。
目前首批合作的机器人厂商伙伴包括:越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技、宇树科技等 。
与此同时 , 腾讯首席科学家、腾讯RoboticsX实验室主任张正友博士也再次重申了腾讯做具身智能的“三不原则”:
不做硬件、不做量产、不搞商业化 。
具身智能如火如荼 , 腾讯还是如此克制 , 背后又有哪些考量?
只考虑双足人形、硬件本体 , 就限制发展了首先对于腾讯内部而言 , 对机器人的长期关注重点 , 始终都不是商业化、量产以及硬件本体 。
腾讯RoboticsX实验室成立于2018年 , 由张正友领导创立 , 实验室的目标是致力于机器人前沿技术的研究与应用 , 重点关注在人居环境的实际应用 。
张正友目前是腾讯首席科学家、腾讯Robotics X实验室主任、福田实验室主任 。 他是ACM Fellow和 IEEE Fellow , 也是国际上最早将计算机视觉与机器人结合研究的知名科学家 , 在计算机视觉、语音处理、多媒体技术和机器人领域都颇具影响力 。 在加入腾讯之前 , 张正友已经在微软研究院工作20年 。
2018年 , 腾讯成为国内最早一批布局机器人技术的大厂 。
张正友最初制定的“A2G”指导方针包含7大方向 , 如今也是具身智能讨论度最高的几个维度:
人工智能(AI) 机器人本体(Body) 精准控制(Control) 发育学习(Developmental learning) 情感理解(EQ) 灵巧操控(Flexible manipulation) 守护天使(Guardian Angel)后面技术路线进一步收敛到三大方向:移动、操作和智能决策 。 这是因为实验室认为最终要服务于人、走进千家万户的任何一类机器人都基本包含这三块能力 。
目前腾讯RoboticsX发布的研究原型包括机器狗Max、人居环境机器人“5号”等 。
这些成果更多强调具身智能“通用大脑”层面的提升 , 并不是只局限在一个硬件本体上做迭代 。
比如在机器狗上研发的多模态感知-规划技术 , 可以让腾讯Max与宇树Go 2两款不同机器人根据人类语音指令在动态开放环境中自主完成多项交互任务 。
人居环境机器人“小五”则融合了四腿轮足设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项技术 。 可以在人居环境里行走、搬东西并和人交互 。
张正友解释 , 他并不建议腾讯去聚焦做机器人硬件本体 , 因为具身智能本身存在更大的目标 , 比如养老 。 在这一命题下 , 触觉传感器、定制皮肤等方面能力能不能继续前进?
假如我一开始就停留在Max腿轮一体化机器狗上面 , 那后面可能就没有精力做其他东西了 。
同理 , 腾讯一直没有做双足人形机器人 , 也有类似的考量 。
【腾讯入局具身智能,宇树首批用上“大脑”】一方面 , 双足人形的形态已经存在 , 不需要花太多精力思考 , 只需要去控制它就好了 。
另一方面 , 双足人形是几千万年下在复杂环境中逐渐进化出的形态 , 但现如今的人居环境已经大不相同 , 大部分都是平地 , 那么双足就不再是必须 , 因为效率很低 。
腾讯做轮腿一体化不是为了仿生 , 而是想要探索在人居环境里有没有更高效、更理想的形态?
以及现在假如以人形为标准 , 那么很多想象力就被限制了 。 比如 , 如果机器人的交流也像人一样只基于语言 , 那么它的讲话速度就限制在了每分钟100个字左右 , 但是如果机器人有一个屏幕可以直接阅读 , 一分钟可以阅读的文字是300字左右 , 效率直接提升3倍 。
所以 , 在具身智能还处于非常早期的阶段时 , 腾讯还是希望更关注于基础研究与前沿探索 , 不希望技术路线过早收敛 。
其次 , 结合外部趋势来看 , 腾讯现在其实更不需要做硬件 。
张正友表示 , 在2018年时国内还很难找到做机器人硬件的厂家 , 所以腾讯不得不既做硬件又做软件 , 各方面能力都要关注 。
现如今国内涌现出一大批机器人创业公司 , 腾讯走访过的企业就高达60家 , 这意味着在硬件领域已经不缺好用可落地的方案 , 因此腾讯当下可以更加关注软件层面 , 与硬件厂商一起打磨技术推动落地 。
此次发布Tarios也是希望和厂商们深层合作 , 进一步优化拓展平台能力 。 腾讯强调 , 相较于商业化 , 他们认为这一步动作更应该被称为“产品化” , 是将过去积累的能力包装成外部可以直接使用的产品 。
此外 , 通过和广大厂商的合作 , 腾讯可以更好洞察行业趋势与痛点 。
比如张正友多次提到 , 具身智能当下还需要补足对3D世界、动态环境以及物体材料各方面的认知 。 这不是一句话、一张照片生成3D环境即可 , 而是需要让机器人在仿真环境里能够真正操作 。
以及现在很多方案都是基于大语言模型做规划 , 但是针对现实世界 , 很多东西是文本所不能描述的 。 比如动物没有语言 , 但是它们都能在3D世界里很好生活下来……
以上都是产业界亟需解决的问题 。
目前 , 腾讯已经提出了区别于业界端到端的解决方案——提出层次化学习解决方案 ,在SLAP框架下(感知、学习、行动、规划) , 通过多个层次的不断积累和更新知识 , 让机器人更加智能 , 能够与现实世界进行交互 , 实现真正的具身智能 , 包括反应式的自主和有意识的自主 。
张正友提到 , 未来具身智能的发展将围绕“IDEAS”框架展开 , 包括虚实集成世界、技术门槛降低、智能演进、智能体化和感知拓展 。 这些方向将推动机器人在复杂场景下的应用 , 例如养老服务等需要安全复杂交互的领域 。
由此 , 从内到外 , 腾讯的具身智能战略更进一步清晰明了 。
对于具身智能的时刻 , 张正友觉得距离“iPhone时刻”、“大哥大时刻”都还有一段距离 , 推出Tarios就是希望能推动行业更快进入到“大哥大时刻” 。
至于大家都好奇的终极形态 , 张正友则借用了唐朝智聪大师的一句话点明:
三身元我体 , 四智本心明 。 身智融无碍 , 应物任随形 。
— 完 —
量子位 QbitAI
关注我们 , 第一时间获知前沿科技动态
推荐阅读
- 清华&腾讯混元X发现「视觉头」:仅5%注意力头负责多模态视觉理解
- 一图读懂腾讯AI全景布局:以混元大模型为基础,“1+3+N”体系成型
- 具身智能,腾讯「低调入局」
- 北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势
- 腾讯AI IDE发布!四大智能体,一站式搞定开发全流程
- 具身智能机器人公司逐际动力LimX Dynamics获京东战略领投
- 尼康入局FOPLP,三星遇劲敌
- 没华为!黄仁勋列自己在中国的杰出朋友:阿里/美团/腾讯/百度、小米和比亚迪
- 京东和美团的战火,烧到具身智能 |智能涌现独家
- 影目CEO杨龙昇:小米入局AI眼镜是好事,大家销量翻了两三倍
