马斯克发布全球最强AI模型Grok 4,推理能力大幅提升
时间:2025-07-12 19:25
小编:小世评选
今天,马斯克旗下的xAI公司在全球科技界引发轰动,正式发布其最新的人工智能模型Grok 4。此次发布的Grok 4系列包括两个版本:标准版Grok 4和功能更强的Grok 4 Heavy,官方称其为“全球最强AI模型”。这一声明不仅吸引了广泛的关注,也成为业界热议的焦点。
Grok 4的发布标志着xAI在人工智能领域中再次取得了重大突破。根据发布会的介绍,Grok 4在xAI自建的Colossus超级计算机上进行训练,这台超级计算机以其20万块GPU的强大硬件配置成为全球顶尖的AI计算之一。这种庞大的算力投入,使得Grok 4在推理能力上实现质的飞跃,相较于前代产品Grok 2,其推理能力提高了十倍,训练数据量则增长到了100倍之多。
在性能方面,Grok 4几乎刷新了各类主流基准测试的最高记录。在被誉为“人类考试”的HLE(Humanity's Last Exam)基准测试中,Grok 4的准确率高达38.6%。而其进阶版Grok 4 Heavy通过多智能体的协作进一步提升了准确率,达到了44.4%,这一成绩远超了谷歌的Gemini 2.5 Pro(26.9%)和OpenAI的o3模型(20.32%)。在AIME 2025美国数学邀请赛中,Grok 4 Heavy更是取得了满分的骄人成绩,充分展现了其在数学推理领域的卓越能力。
除此之外,Grok 4也拥有出色的多模态功能,支持多种输入形式如文本、图像等。其上下文窗口高达256K tokens,能够处理更加复杂的交互任务。为了确保信息的时效性和准确性,Grok 4还集成了实时联网搜索功能(DeepSearch),可以从X上提取最新的数据。这使得Grok 4在理解互联网文化、俚语以及梗图等方面表现出色。例如,在发布会上,马斯克展示了Grok 4快速检索出“xAI员工最古怪的头像”,让现场观众惊叹不已。
在语音交互方面,Grok 4同样进行了显著的优化。其语音模式的延迟减少了50%,新增了多种声音选择,包括深沉的“Sal”和优美的英伦女声“Eve”,能够更加自然地与用户进行对话,甚至能够即兴创作歌剧,这也展现了其高超的情感表达能力。
Grok 4在实际应用场景中展示了其强大的能力。在商业模拟场景“Vending-Bench”测试中,Grok 4能够模拟经营自动售货机的各个环节,表现出色的战略规划和执行能力,最终实现的平均净资产达到4684.15美元,远超第二名的Claude 4。
Grok 4的产品定价也反映出其强大实力。普通版Grok 4的订阅价为30美元,而更高级的Grok 4 Heavy则需要每月300美元。虽然价格不菲,但xAI声称提供的性价比仍旧具有竞争力。
尽管Grok 4的发布取得了诸多的突破与成功,但其背后也隐藏着一些争议与挑战。Grok系列模型由于其宽松的审查策略,曾在某些场合输出过极端的言论,引发社会舆论的广泛关注。在此背景下,马斯克强调了AI安全性与价值观的重要性,表示xAI将致力于构建一个“善良、追求真理”的AI。
在发布会的尾声,马斯克表示,未来几个月,xAI将推出一系列新产品,包括为开发者打造的Grok 4 Code、增强多模态智能体,以及视频生成模型。他指出,这些新产品的推出旨在构建一个覆盖文本、图像、视频、代码及智能体的全方位AI生态系统。
眼下,整个AI领域竞争激烈。随着OpenAI的GPT-5与谷歌Gemini系列的不断演进,业界对Grok 4的未来表现充满期待。马斯克能否凭借这一最新产品在激烈的竞争中脱颖而出,将成为业界观察的一个重要课题。
Grok 4不仅展示了先进的技术与强大的推理能力,更预测了AI在未来将会在科学发现和技术创新领域扮演的关键角色。未来的AI世界将由Grok 4及其后续产品所引领,值得我们共同期待。