免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > Keller Jordan凭借博客及新优化器成功入职OpenAI,颠覆传统AI研究路径

Keller Jordan凭借博客及新优化器成功入职OpenAI,颠覆传统AI研究路径

时间:2025-06-16 17:35

小编:小世评选

编辑:定慧 桃子

在这个快速发展的人工智能领域,成功应聘OpenAI似乎是一项充满挑战的任务。究竟有哪些条件能够让一个人脱颖而出,加入这样一个顶尖的团队呢?许多人可能会认为,具备深厚的学术背景、有影响力的顶会论文,或者师从AI界大师如Hinton和LeCun等是必不可少的。Keller Jordan的故事则给出了一种全新的视角,让我们看到,成功的另一种路径来自于一篇简单的博客和他在优化器设计上的创新。

Keller Jordan,这位来自机器学习领域的研究者,于2024年底推出了他的优化器——Muon,专门针对神经网络的隐藏层进行了重新设计,并通过博客分享他的研究进展。他的做法吸引了大量社区成员的关注与参与,许多人开始在他的基础上进行并行实验并反馈结果。这一切迅速引起了OpenAI与xAI的注意,Keller选择加入Open成为其团队的一员。Muon的影响力已经显露出其非凡的潜力,甚至有观点认为,该优化器已经被用于GPT-5的训练中。

在这一过程中,Muon的第二作者Yuchen Jin明确指出,发表论文并不等同于影响力。事实证明,在人工智能研究的新时代,传统的学术出版模式似乎已经渐渐落后于时代的发展。以开放、协作与快速响应为特征的“社区共建”模式,正成为推动研究的重要动力。

Keller Jordan的事迹与DeepSeek的兴起有些雷同,尽管两者的影响力无法相提并论,但从中可观察到一个共同的趋势:在人工智能领域,快速反馈与社区支持能够极大地提升研究的效率。微软研究院的研究工程师Shital Shah表示,他非常兴奋地看到Keller Jordan的创新方法,并强调研究应当以这样的方式进行。即使在现代的开放研究环境中,许多研究者依然对早期想法的分享持保留态度。传统的研究分享往往只在小圈子内进行,一个想法的诞生可能需要经历数月才能发表,而在这漫长的周期内,它的价值可能已经大打折扣。

Keller选择的则是一条截然不同的道路,他将自己的初步构想提交到了GitHub上,让任何人都能即时尝试并改进。在这种“分布式实时人工智能研究”的模式下,Keller与社区的合作反馈周期被缩短到了仅仅几天,极大地激发了合作创造的热情与潜力。

值得注意的是,Keller并没有被传统的学术出版所束缚。他明确表示,尽管Muon的成功帮助他进入了Open但他不会为此撰写学术论文。在他看来,相比于可能被淹没在学术论坛中的一篇论文,继续深入研究和完善他的优化器显然更为重要。他更直言不讳地批评现有AI论文的质量,称其为“虚假的水文”。

Keller Jordan的背景又是怎样的呢?他于2020年毕业于加州大学圣地亚哥分校,获得数学与计算机科学双学士学位,之后曾在多所大学进行深造,并作为机器学习工程师在AI公司Hive工作。随后,他在维也纳复杂性科学中心担任访问研究员,最终在2024年12月成功加入OpenAI。

在这一过程中,Keller所创造的Muon优化器成为其最具影响力的GitHub项目之一。他和团队使用仅8块H100显卡复现了GPT模型,并在处理0.73B tokens的过程中表现出色。Muon的核心创新是在SGD动量法的基础上,通过Newton-Schulz迭代生成接近半正交矩阵的更新矩阵,从而提高了训练效率。与以往的优化器相比,Muon在多个任务中的表现都显得极为惊艳。

传统的AI优化器,比如AdamW,虽然广泛应用于GPT、LLaMA等大型模型的训练,但随着模型规模的不断扩大,其效率开始显得捉襟见肘。因此,开发更高效的优化器不仅是技术上的挑战,更是推动AI研究和应用进程的重要课题。Muon的出现正是填补了这一空白,尽管现在它还未成为业界的焦点,但其独特的设计和优异的性能展示了它可能引发的一场基础创新。

Keller Jordan的故事告诫我们,传统学术界的标准已不再适用,尤其是在快速发展的人工智能领域。即便是没有博士学位的人也能在OpenAI找到自己的位置,像他一样,注重实际能力和对问题的探索才是更为重要的。在未来的人工智能研究中,现实世界的采用与可复现性将成为更重要的考量,而不是仅仅依靠传统的同行评审。在这个不断变化的世界中,Keller Jordan的成功为我们提供了新的思考和启示,展现出了一条通向未来的崭新道路。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多