
文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

梦晨 发自 凹非寺量子位 | 公众号 QbitAI
奥特曼点名表扬了两个波兰人 。
没有他们 , OpenAI就不是今天的样子 。
他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor 。
△左:Jakub Pachocki , 右:Szymon Sidor
两人不仅是波兰老乡 , 而且是高中同学 , 读博时分别选择了计算机科学和机器人 , 后来又在OpenAI重聚 。
在ChatGPT风靡全球、每天服务数亿用户的今天 , 奥特曼感慨大多数人永远不会想到背后那些付出心血的人 , 这两位波兰科学家 , 正是其中的关键角色 。
他们在OpenAI的贡献从Dota项目大规模扩展了强化学习 , 到领导了GPT-4的预训练 , 还与 Ilya和Lukasz共同推动了导致推理突破的最初想法 。
当然 , 奥特曼对他们如此高评价或许还有另一个原因:
在2023年OpenAI内乱事件中 , 他俩也是带头站出来宣布辞职 , 要追随奥特曼离开的 。
从高中同窗到OpenAI重聚故事还要从波兰的一所学校说起 , 格丁尼亚第三高中 。
在那里两人跟随同一位老师学习计算机 , 接受的教育深度远超普通高中课程 , 涉及图论等内容 。
两人第一次相遇是在编程夏令营 , 每年他们要在夏令营做两个月高强度训练 。
不过后来他们回忆 , 两人在高中时关系还没那么好 , 只算学业上的同伴 。 离开高中后一同在美国闯荡 , 才让他们建立深厚友谊 。
先说Pachocki(以下简称帕哥)这边 。
15岁的时候 , 他像很多少年一样还不确定自己未来想做什么 。
父亲给了他一本书 , 是YC联合创始人保罗·格雷厄姆散文集《黑客与画家》的波兰语译本 。
给帕哥触动最深的是书中这样的描写:黑客和画家的共同点在于 , 他们都是创造者 。
与作曲家、建筑师和作家一样 , 黑客和画家努力做的是创造美好的事物 。 他们本质上并非在进行研究 , 但如果在尝试创造美好事物的过程中发现了一些新技术 , 那就更好了 。
帕哥很幸运 , 不仅发现自己对计算机有兴趣 , 不久后还发现自己在这方面是真的有天赋:高中时期拿过国际信息学奥林匹克竞赛IOI的银牌 。
话说回来 , 奥特曼本曼的职业道路也是受到格雷厄姆影响很深 , 不过是创投事业的那一面 。
在8月份的OpenAI播客节目中 , 帕哥表示现在想想整件事还挺好笑的 , 当时真的没有把这些联系起来 。
高中毕业后 , 帕哥来到波兰华沙大学读计算机专业 , 在本科期间又拿过许多竞赛奖项 。
2012年ICM-ICPC的金牌和Google Code Jam , 至今仍然能搜到他在ICPC的获奖感言片段 。
△中:Jakub Pachocki
本科毕业后他来到卡耐基梅隆大学攻读计算机科学博士学位 。
对于AI , 他原以为真正能做到推理的AI需要很长时间才能开发出来 , 需要更大的计算机和非常扎实的数学基础 。
但2016年的AlphaGo改变了一切 。
围棋的搜索空间太大了 , 我们的算法根本无法应对 。 但他们用深度学习解决了这个问题 , 这迫使我重新思考 。
毕业后帕哥先在哈佛大学做了一年博士后之后 , 2017年2月就加入了OpenAI 。
再来看Sidor(以下简称西哥)这边 , 让他坚定研究强化学习的也是AplphaGo , 不过青少年时期给他启发最大的是《钢铁侠》电影 。
高中毕业后 , 他本科先去的英国读剑桥大学 , 博士就读于MIT 。
但不是他主动选择了MIT , 而是他当时申请了很多美国学校 , 只有MIT没有拒绝他 , 因为MIT不考英语 , 而他的英语很差(允悲) 。
一开始他选择的是机器人专业 , 不过很快他就对现实中的机器人并没有电影里那么炫酷感到失望了 , 转而学习深度学习和强化学习 。
最终毕业时他的论文课题是“自然语言处理中多阶段推理的强化学习方法” , 这个题目拿到现在当成最新的大模型研究题目都没问题 。
只不过当时西哥的研究对象是LSTM模型、Deep Q-learning强化学习算法 , 多阶段推理任务指的是句子打乱重排序问题 。
博士毕业后 , 他受AlphaGo影响 , 先申请的DeepMind岗位 , 不过面试时被问到很多理论机器学习问题 , 他一个都不会就挂掉了 。
尽管当时OpenAI还是个名不见经传的小公司 , 但看起来对做强化学习这件事很认真 , 西哥就加入了 。
2017年 , 两个波兰人在OpenAI重聚 。
加入OpenAI后不久 , 两人投入到Dota 2项目中 , 目标是让AI在复杂的电子竞技游戏中击败人类职业选手 。
△Dota项目早期访谈 , 右:Szymon SIdor
他们原本想通过这个项目找到强化学习的极限在哪里 , 到什么程度会失效 , 结果却大获成功 , 击败人类职业选手队伍创造了历史 。
代价是两人都失去了发际线 。
在这个项目中 , 帕哥专注于大规模强化学习与优化 , 而西哥参与开发了分布式训练系统和持续训练工具 。
两人的合作模式在这个项目中逐渐成型 。
帕哥会在办公室或公寓里走来走去 , 深入思考应该如何研究一个现象 。 而西哥更倾向于直接开干 , 先整出一些数据再说 。
这种一个深度思考、一个动手实验的组合 , 成为他们的制胜法宝 。
到了GPT-4的开发阶段 , 帕哥已经成为项目的领导者 。 奥特曼曾公开表示:”如果没有他的贡献 , 我们无法取得今天的成就 。 ”
西哥的角色非常灵活 , 他将自己定位为“独立贡献者” , 只是偶尔承担领导职责 , 核心是去做最有价值的事 。
危机时刻见真章2023年11月的OpenAI内乱危机 , 让这对搭档的分量彻底显现出来 。
11月17日中午 , 正在吃午饭的两人收到了奥特曼被解职的消息 。
西哥回忆到 , 当时他正在走廊里思考问题 , 收到消息马上去找帕哥 。 帕哥正在与别人讨论一个一个很深入问题 。 西哥很粗鲁地打断了他们 , 给他们看公告内容 。
帕哥的反应非常果断 , 立即走出大楼给奥特曼打电话询问到底发生了什么 , 电话那头的奥特曼同样困惑 。
后来两人步调一致 , 与Aleksander Madry一起率先宣布辞职 , 要追随奥特曼一起加入微软 , 也正是他们坚定的支持成为促使Altman回归的关键因素之一 。
这次危机给两人带来了深刻的教训 。 帕哥感慨:
直到那一刻 , 我才真正意识到治理结构有多重要 。 我们建设了近十年的东西 , 突然间就可能面临剧变 。
对此西哥也有同感 , “当初设立这些治理结构时 , 感觉像是杀鸡用牛刀” , 而现在他得到的教训是“在公司早期做出的决策 , 即使当时看起来微不足道 , 也可能在未来产生深远影响” 。
后来事情暂告一段落之后 , 帕哥正式接棒Ilya成为首席科学家 , 主要职责是为公司制定研究路线图 , 并确立长期的技术愿景 。
他认为深度学习尽管基于数学 , 但更像是一门自然科学 , 研究者需要通过实验去理解其内在现象 。
他未来的目标是构建能够进行自主科学研究的AI系统 , 认为这种系统将在不远的将来成为”持久的实体” , 并有望解决AI对齐等行业难题 。
西哥继续保持着独立贡献者的角色 , 他的社交媒体签名是“一行一行代码地构建AGI” 。
对他俩的搭档关系 , 奥特曼有感而发:
我听说过一些两个人能够完美互补的合作关系 , 但能够见证这种合作关系多年来的演变 , 真的非常特别 。
而奥特曼给他们的最新评价是:OpenAI还没有遇到过他们无法解决的问题 。
这里面或许既指研究上的问题 , 也暗含管理上的问题 。
【奥特曼:点名表扬两个波兰人,OpenAI还没有过他们解决不了的问题】参考链接:[1
https://blog.samaltman.com/jakub-and-szymon[2
https://www.youtube.com/watch?v=yBzStBK6Z8c[3
https://www.youtube.com/watch?v=LauSf7HoxwM
推荐阅读
- 奥特曼一席话,剑桥小哥当场撕毁合约转AI!附00后44万AI岗面经
- 刚刚,OpenAI把1GW超算中心直接给了印度,奥特曼即将亲赴办事处
- 小米被点名!格力公开喊话:敢不敢把空调保修延长到10年?
- 喜当爹后,奥特曼自曝神经化学骤变!养娃能为人类做出更优AI决策
- OpenAI权力交接!奥特曼退居幕后,法裔女CEO执掌大权统管3000人
- 奥特曼警惕泡沫,但OpenAI或许是最大泡沫
- 只有5%AI项目在挣钱,MIT最新报告印证奥特曼警告
- 马斯克奥特曼中文对喷, AI 视频终于从「玩具」变成「工具」
- 奥特曼首曝GPT-6,亲口承认GPT-5「搞砸了」,接入大脑读心,估值或飙破5000亿
- OpenAI CEO奥特曼:美国或低估中国AI实力,出口管制难奏效
