马斯克Grok 4发布，AI算力飙涨100倍引爆业界关注

时间：2025-07-12 23:10

小编：小世评选

在短短两年里，马斯克旗下的xAI团队凭借Grok 4的发布，迅速攀升至人工智能领域的顶尖位置。昨日，xAI举行了一场引人瞩目的发布会，Grok 4以其超乎寻常的性能和创新能力震撼全场，尤其是在AIME 2025和人类的考试（HLE）两项重磅基准测试中脱颖而出。这一成果是xAI团队通过集中20万GPU资源实现的，算力飙涨达100倍，再次证明了该团队在AI领域的领先地位。

xAI的研究人员们自豪地表示：“Scaling强化学习是我们追求的最佳路线。”硅谷的目光不仅停留在AI模型本身，更开始关注这些顶尖团队的核心成员。在当前人才争夺战愈演愈烈的背景下，Facebook创始人扎克伯格也开始对xAI团队的成员表现出浓厚的兴趣。

在发布会后的短时间内，xAI的员工Daniel晒出了一张团队合照，迅速引发了社交媒体的热议。照片中的80%成员都是华人学者，这引发了人们对这个顶尖AI团队的广泛关注与讨论。

值得关注的是，发布会上紧挨马斯克的两位华人学者，他们已经成为xAI的“老熟人”。一位是Jimmy Ba，他是多伦多大学计算机科学助理教授，也是著名AI专家Hinton的学生，作为Grok的创始团队成员，他对Grok 4的成功贡献良多。另一位是吴怀宇（Tony Wu），同样来自多伦多大学的博士，年轻且才华横溢，在加入xAI之前，他曾参与过AlphaGeometry和AlphaStar的核心开发。

其他参与Grok 4研发的华人学者还包括：

1. 杨格：xAI创始成员之一，本硕均毕业于哈佛大学数学系，曾获摩根奖（Morgan Prize）荣誉奖。

2. 戴子航：清华大学计算机系本科毕业，后于卡耐基梅隆大学获得硕士和博士学位，前谷歌大脑研究员，擅长自然语言处理领域的研究。

3. 张国栋：浙江大学本科、加拿大多伦多大学博士，他曾在谷歌DeepMind担任研究科学家，为Grok 4的贡献不可小觑。

随着Grok 4的发布，马斯克也对此表示了极大的满意，他称xAI办公室的氛围极其友好，团队的合作精神十分强烈。

在发布后，独立评测机构Artificial Analysis也迅速公布了Grok 4的全面基准测试结果。Grok 4以73分的成绩在“Artificial Analysis智能指数”中拔得头筹，明显超越了其他顶级AI模型，如OpenAI的o3（70分）、谷歌Gemini 2.5 Pro（70分）等。

根据最新测试，Grok 4在以下几个领域表现尤为突出：

代码与数学能力：在“编码指数”与“数学指数”中，Grok 4均荣获第一，显示了其在处理复杂算法和程序设计上的强大能力。

高难度测试记录刷新：在GPQA Diamond测试中，Grok 4取得了88%的历史最高分，超越了Gemini 2.5 Pro的84%记录。

多项全能：在MMLU-Pro和AIME 2024两项测试中，分别取得了87%和94%的最高分，展现了其在多个任务中的优异表现。

除了以上成绩，Grok 4在速度与数据处理方面的表现也相当可观，能够每秒输出75个token，虽然比o3（188 token/s）和Gemini 2.5 Pro（142 token/s）慢，但在Claude 4 Opus（66 token/s）中却处于领先。

在定价方面，Grok 4延续了前代产品的策略，每百万输入/输出token的价格分别定在3美元和15美元，虽然这一价格与Claude 4 Sonnet相当，但已高于Gemini 2.5 Pro和o3的定价。

也有专家提出了不同的看法，知名人士“karminski-牙医”对Grok 4的代码基准测试结果表示怀疑，认为可能存在过拟合的隐患。在一些经典的“七边形小球弹跳”测试和新近推出的“拆烟囱”测试中，Grok 4的表现不如旧版DeepSeek R1，甚至在生成代码时也需要依赖Claude进行调试。

随着Grok 4的发布，xAI在人工智能领域再一次引发了巨大的关注，业界对于未来AI发展的期待也随之高涨。在人才竞争日益激烈的环境中，xAI团队凭借其卓越的技术和出色的人才成便成为了业界的焦点，掀起了一场新的AI浪潮。

马斯克Grok 4发布，AI算力飙涨100倍引爆业界关注

精品推荐

相关文章