以前,我工作了9年。
去年八月,他选择离开并加入。
当时,在给他以前的同事的一封信中,他说,他选择这个选择的原因是“加深他对AI的关注,在职业生涯中开设新的篇章,并重返技术工作,可以由他自己完成。”
但是现在他刚刚加入了半年,但他突然选择离开。
:表示遗憾
首席科学官贾里德(Jared)在一份声明中说:“我们为约翰的离开感到遗憾,但充分支持他寻求新的机会并祝他一切顺利。”
有人说,辞职是一个打击。他不仅是加强学习的先驱,而且还是其背后发展的核心建筑师。
2024年8月,当时的“训练后”团队负责人约翰正式宣布他在上进入敌人。
当时,这个消息引起了巨大的震惊。
原因不仅是它是最受关注的技术领导者之一,还导致团队为突破结果做出了重要贡献。
他对离开的时间也非常敏感。当时,高级行政辞职浪潮,包括CTO MIRA在内的其他高管也几乎同时离开了。
作为回应,山姆甚至庄严地使用“胶囊字母”来发布答复。
建筑师,PPO
完成研究生学习后,与他的关系正式加入了创始人。
到目前为止,他已经任职9年了。值得一提的是,这是除实习外唯一工作的公司。
以前,他负责对齐团队,然后他开始领导“训练后”团队,以微调部署的模型和API。
约翰在加州理工学院的本科生学习物理学,然后去加州大学伯克利分校学习他的神经科学博士学位。
当时,他对人工智能也有些感兴趣,但是他没有像神经科学那样看到任何可以遵循的途径。
在他参与伯克利的实验室轮换项目之前,他与他一起使用直升机和机器人技术,并决定搬到EEC(电子工程和计算机科学)。
已经与之联系了很长时间。作为一名建筑师,他在2015年仍在学习博士学位时加入了联合创始人之一。
在一次采访中,我解释了为什么我加入:
“我想对人工智能进行研究,我认为该公司有一个雄心勃勃的使命,并致力于建立通用人工智能。”
“尽管谈论AGI似乎有点疯狂,但我认为开始思考它是合理的,我希望在一个地方谈论AGI是可以接受的。”
此外,据透露,引入人类反馈增强学习(RLHF)的想法可以追溯到2017年,当时Jan Leike和Dario等人发表的论文。提到了这种方法。
纸张地址:
此外,在2017年的任期期间,他还首次与团队提出了近端战略优化(PPO)算法,其变体PPO-CLIP成为了使用的主要算法。
纸张地址:
安全团队致力于这项工作,因为他们希望该模型适合人类的偏好,真正倾听人类的意见,并尝试做人类想要做的事情。
GPT-3完成培训后,我看到了整个研究方向的潜力,并决定加入趋势。
在许多访谈中,我们对人工智能的下一个尖端领域表达了我们的看法:当AI不断改善更艰巨的任务时,人类应该做什么?在哪些任务中,人类可以在大型模型的帮助下具有更大的影响力并做更多的工作。
此外,机器学习指南在个人博客上发表的指南最初是在2017年为研究人员计划编写的。充满了实用信息,值得一看。
文章地址:
参考:
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论