马斯克Grok 4发布,AI算力飙涨100倍引爆业界关注
时间:2025-07-12 23:10
小编:小世评选
在短短两年里,马斯克旗下的xAI团队凭借Grok 4的发布,迅速攀升至人工智能领域的顶尖位置。昨日,xAI举行了一场引人瞩目的发布会,Grok 4以其超乎寻常的性能和创新能力震撼全场,尤其是在AIME 2025和人类的考试(HLE)两项重磅基准测试中脱颖而出。这一成果是xAI团队通过集中20万GPU资源实现的,算力飙涨达100倍,再次证明了该团队在AI领域的领先地位。
xAI的研究人员们自豪地表示:“Scaling强化学习是我们追求的最佳路线。”硅谷的目光不仅停留在AI模型本身,更开始关注这些顶尖团队的核心成员。在当前人才争夺战愈演愈烈的背景下,Facebook创始人扎克伯格也开始对xAI团队的成员表现出浓厚的兴趣。
在发布会后的短时间内,xAI的员工Daniel晒出了一张团队合照,迅速引发了社交媒体的热议。照片中的80%成员都是华人学者,这引发了人们对这个顶尖AI团队的广泛关注与讨论。
值得关注的是,发布会上紧挨马斯克的两位华人学者,他们已经成为xAI的“老熟人”。一位是Jimmy Ba,他是多伦多大学计算机科学助理教授,也是著名AI专家Hinton的学生,作为Grok的创始团队成员,他对Grok 4的成功贡献良多。另一位是吴怀宇(Tony Wu),同样来自多伦多大学的博士,年轻且才华横溢,在加入xAI之前,他曾参与过AlphaGeometry和AlphaStar的核心开发。
其他参与Grok 4研发的华人学者还包括:
1. 杨格:xAI创始成员之一,本硕均毕业于哈佛大学数学系,曾获摩根奖(Morgan Prize)荣誉奖。
2. 戴子航:清华大学计算机系本科毕业,后于卡耐基梅隆大学获得硕士和博士学位,前谷歌大脑研究员,擅长自然语言处理领域的研究。
3. 张国栋:浙江大学本科、加拿大多伦多大学博士,他曾在谷歌DeepMind担任研究科学家,为Grok 4的贡献不可小觑。
随着Grok 4的发布,马斯克也对此表示了极大的满意,他称xAI办公室的氛围极其友好,团队的合作精神十分强烈。
在发布后,独立评测机构Artificial Analysis也迅速公布了Grok 4的全面基准测试结果。Grok 4以73分的成绩在“Artificial Analysis智能指数”中拔得头筹,明显超越了其他顶级AI模型,如OpenAI的o3(70分)、谷歌Gemini 2.5 Pro(70分)等。
根据最新测试,Grok 4在以下几个领域表现尤为突出:
代码与数学能力:在“编码指数”与“数学指数”中,Grok 4均荣获第一,显示了其在处理复杂算法和程序设计上的强大能力。
高难度测试记录刷新:在GPQA Diamond测试中,Grok 4取得了88%的历史最高分,超越了Gemini 2.5 Pro的84%记录。
多项全能:在MMLU-Pro和AIME 2024两项测试中,分别取得了87%和94%的最高分,展现了其在多个任务中的优异表现。
除了以上成绩,Grok 4在速度与数据处理方面的表现也相当可观,能够每秒输出75个token,虽然比o3(188 token/s)和Gemini 2.5 Pro(142 token/s)慢,但在Claude 4 Opus(66 token/s)中却处于领先。
在定价方面,Grok 4延续了前代产品的策略,每百万输入/输出token的价格分别定在3美元和15美元,虽然这一价格与Claude 4 Sonnet相当,但已高于Gemini 2.5 Pro和o3的定价。
也有专家提出了不同的看法,知名人士“karminski-牙医”对Grok 4的代码基准测试结果表示怀疑,认为可能存在过拟合的隐患。在一些经典的“七边形小球弹跳”测试和新近推出的“拆烟囱”测试中,Grok 4的表现不如旧版DeepSeek R1,甚至在生成代码时也需要依赖Claude进行调试。
随着Grok 4的发布,xAI在人工智能领域再一次引发了巨大的关注,业界对于未来AI发展的期待也随之高涨。在人才竞争日益激烈的环境中,xAI团队凭借其卓越的技术和出色的人才成便成为了业界的焦点,掀起了一场新的AI浪潮。