
文章图片

文章图片

文章图片

文章图片

Jay 发自 凹非寺量子位 | 公众号 QbitAI
前谷歌DeepMind资深研究员 , 现在是马斯克的人了 。
大佬叫Dustin Tran , 他是Gemini DeepThink的共同创造者 , 该模型一经发布便展现出SOTA级别的推理能力 , 在过去两个月内连斩IMO和ICPC金牌 。
不仅如此 , 可以说是Tran一手成就了Gemini , 帮助谷歌在后GPT失速时刻重新追回了AI的风口 。
不过 , 谁能想到 , Grok-4-fast的背后居然也有Tran的影子 。
是的 , 就在Grok新模型发布当天 , Tran便在X上发长文官宣已经加入xAI 。
文章里 , Tran回顾了自己8年来在谷歌的经历 , 还顺带给xAI和新老板点了个大大的赞 。
目前 , 这篇小作文阅读量达13w , 就连马斯克本人也亲自转发 , 表示热烈欢迎 。
谷歌IMO和ICPC背后的大神要知道 , 老马一向以极其严苛的高要求著称 , 能让他亲自夹道欢迎的人可没几个 。
那Tran , 究竟是什么来头?
实际上 , Tran身上贴满了「里程碑」级别的标签 , 他可以说是帮助谷歌在AI时代一次次突围的关键人物 。
不止是谷歌的推理模型 , 整条Gemini产品线跌宕起伏的成长故事都离不开Tran的身影 。
在GPT-3.5发布后 , 谷歌内部拉响“红色警报” , 公司紧急调整优先级 , 把Tran所在的LaMDA 团队(史上第一个指令式聊天机器人)列为最高任务 。
短短100天里 , Tran所在的团队基于LaMDA完成训练 , 推出了Gemini的前身Bard 。
然而由于仓促上马 , Bard反响不佳 。
发布当天 , 谷歌股价蒸发近千亿美元 , 外界几乎都认为谷歌会被搜索引擎的历史包袱和冗杂的内部组织拖垮 。
但Tran所在的团队没有放弃 。 此后 , 他们不断打磨推理和深度思考能力 , 从2023年底开始 , Tran与团队持续发力 , 陆续推出Gemini 1、1.5、2、2.5 。
这一次 , 他们可谓做足了准备 , Gemini系列的表现与Bard时期有天壤之别 , 谷歌一度屠榜各类AI Benchmark , 其中 , Gemini 1.5 Pro更是在LMArena霸榜一年多** , 成为谷歌翻盘的标志性产品 , 谷歌也依靠Gemini再次成为了AI的风向标 。
可以说 , 正是Tran所在的团队 , 在谷歌被OpenAI打得晕头转向时帮助公司重新找回了方向 , 一举扭转了悲观的市场预期 。
Tran的谷歌之旅始于8年前 。 他从Google Brain起步 , 后并入Google DeepMind 。
除了Gemini , Tran早期还参与了TensorFlow、Tensor2Tensor、Image Transformer、Vision Transformer等多个重量级项目 , 这些论文在谷歌学术上都有不错的影响力 。
在加入谷歌之前 , Tran还曾在OpenAI有过短期实习 , 他将这段经历称为博士项目休假的「伪博士后」时期 。
有趣的是 , Tran在那段短暂的实习期里 , 正好赶上了OpenAI的Dota 2 AI项目 , 由此撞上了OpenAI成立初期的一次「小高光时刻」——基于该模型训练出的AI Bot在1v1对战中击败了当时的世界顶级Dota职业选手Dendi 。
在职业生涯开始之前 , Tran的学术履历同样耀眼 。
他本科毕业于加州大学伯克利分校 , 随后在哈佛大学取得了统计学硕士 , 后转校到哥伦比亚大学攻读计算机科学PhD , 师从David Blei与Andrew Gelman 。
除了搭建训练框架 , Tran还在NeurIPS等期刊上发表了数篇有关模型评估的论文 , 尤其是2016年发表的《Measuring calibration in deep learning》 , 这篇论文开创了深度学习中的校准度量基准 , 影响了LLM的可信度评估 。
迄今 , Tran在谷歌学术的引用次数超过2.4万 。
加入xAI , 为什么?尽管Tran在谷歌与老东家并肩奋战了8年 , 最终他还是选择跳槽到xAI 。
这可不是冲动下的决定 , Tran本人对此给出了大致三点理由 。
第一 , 是算力 。
Tran直言自己被“硅谷钢铁侠”的钞能力震撼了 , 即便在谷歌干了这么多年 , 他也没享受过这种挥「卡」如土的好日子 。
在算力方面 , 即便在Google我也从未体验过如此奢侈的人均芯片数量 , 更别说Colossus 2还有数十万张GB200芯片尚未到货 。
第二 , 是数据 。
Tran指出 , Grok 4已经在RL和后训练的规模化上押下最大赌注 , 而xAI还在数据、深度思维和训练配方上不断尝试新的扩展路径 。
结合不久前xAI大规模扩充专业数据标注团队的动作 , Grok训练方式将迎来一次重大升级应该是实锤了 。
第三 , 是老板的硬核理念 。
Tran对马斯克企业理念颇为认同 。
他表示 , 除了xAI , 没有任何一家公司能在如此短时间内实现后来者居上 。
在如此短的时间内 , 没有任何一家公司的 AI 能力能发展到 xAI 的水平 。 正如埃隆所说 , 一家公司的“一阶导数和二阶导数”最重要 。 所以 , xAI的加速度是最高的 。
有了Gemini技术大脑的加持 , 再加上马斯克All in , 这下Grok 5值得好好期待一下了 。
One More Thing没想到的是 , 除了夸奖xAI和老东家 , Tran还顺手补刀了一下前司OpenAI:
过去 , 每次 Google 刚发布点新成果 , OpenAI都会拿出提前囤好的点子抢先官宣 , 占领头条 。 不过 , 他们的点子库存现在已经见底了哎~
参考链接:[1
https://x.com/dustinvtran/status/1969183617881686405[2
https://dustintran.com/
— 完 —
量子位 QbitAI · 头条号
【Gemini灵魂人物加盟xAI,马斯克亲自夹道欢迎!】关注我们 , 第一时间获知前沿科技动态
推荐阅读
- 谷歌Gemini人工智能助手将登陆电视端 预计覆盖超3亿台设备
- 谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
- 马斯克新模型:9折价格实现Gemini 2.5性能,支持2M上下文
- 登顶多模态推理榜MMMU,UCSD新方法超越GPT-5、Gemini
- OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首
- 会「思考」!字节跳动发布OmniHuman-1.5,让虚拟人拥有逻辑灵魂
- AI读网页,这次真不一样了,谷歌Gemini解锁「详解网页」新技能
- Gemini 2.5 Flash Image发布,图像编辑精度大幅提升
- 刚刚,大模型装上鹰眼!首创高刷视频理解,谷歌Gemini 2.5完败
- 字节大模型关键人物被曝离职!
