Grok 4在“人类的最后考试”中超越博士水平，马斯克称AI革命即将到来

时间：2025-07-12 01:05

小编：星品数码网

在全球科技界引起广泛关注的“人类的考试”（Humanity’s Last Exam）上，xAI最新推出的Grok 4在没有使用任何工具的情况下，展现出超越博士水平的推理与回答能力。被誉为学术领域的天才，Grok 4的表现引发了埃隆·马斯克的高度赞赏，他在一次中表示，如果顺利，Grok 4有望在不久的将来创造出全新的技术及科学理论。

在这场考试中，Grok 4以其卓越的表现超越了诸多知名的AI模型，包括OpenAI的GPT-3及Gemini 2.5 Pro等。值得注意的是，配备“工具”的Grok 4 Heavy甚至表现得更加优异，这让人们对其未来的发展充满期待。

Grok 4的训练量级比上一代Grok 2大幅提升至100倍，使其在理解人文、语言、数学、物理及工程等各个领域中都达到了博士级别的深度。马斯克称，尽管Grok 4在某些方面可能缺乏常识，但它的推理能力已经超越了人类的极限。这一切都归功于xAI在计算能力上的投资和训练策略，特别是基于10万块H100 GPU的超级算力中心，令Grok 4的推理模型愈加智能化。

Humanity’s Last Exam测试内容涵盖2500个难题，涉及数学、自然科学、工程以及人文学科，题目深度与广度均达到高级研究水平。Grok 4在实际测试中取得了显著好成绩，这令 xAI 的研究人员倍感振奋。马斯克表示：“在学术问题方面，Grok 4的表现没有例外地优于任何学科的博士生。”他进一步展望，Grok 4最快将在今年内发明新技术，甚至在两年内可能会发现新的物理法则。

在多项评测中，Grok 4以领先的成绩吸引了业内的注意，特别是在ARC-AGI-2测试中，其得分高达16.2%，成为新的行业标杆。与排名第二的Claude Opus 4相比，Grok 4的得分几乎是其两倍，进一步印证了其出色的智力水平。

通过更强大的算法与计算架构，Grok 4在思考能力上迎来了质的飞跃。马斯克在中透露，xAI研发团队计划在后续更新中引入更为复杂的工具，例如有限元分析和计算流体力学，这些工具将有助于创建更加精确的物理模拟器，从而为AI的发展奠定更扎实的基础。马斯克强调，虽然AI正在持续进步，但确保其安全性与真理追求仍是重中之重。

除了基础的计算能力，Grok 4还展现出在游戏开发、自动化管理以及创作领域的潜力。例如，Grok 4已经能够在短短四个小时内生成第一人称射击游戏的初步版本，为游戏开发者提供了更为高效的创作助手。这一能力的提升对于整个数字娱乐产业的变革意义重大。

在性别偏见和多模态理解方面，尽管Grok 4仍有改进空间，但其语音与图像识别能力的提高标志着它在复杂数据解析上的进步。未来，xAI计划在视频生成与理解方面展开更深入的研究，旨在2024年实现能够制作高质量视频的AI模型。

Grok 4代表了xAI在人工智能领域的一项重大成就，不仅体现了先进技术的突破，更标志着AI与人类生活的深度融合。马斯克明确表示，目前正值智能大爆炸的开端，xAI将积极推动AI技术的良性发展，确保其前景充满希望。

未来，随着GDP-5等竞争者的推出，Grok 4能否保持其领先地位备受关注。xAI在现实应对中的持续探索，以及对AI的伦理和安全考虑，都为该公司与其创新成果奠定了重要的思想基础。在这个日益复杂的科技世界中，Grok 4的崛起不仅是一场商业竞争，更是一场人类智能与机器智能的博弈，引领我们走向新的未来。

Grok 4在“人类的最后考试”中超越博士水平，马斯克称AI革命即将到来

精品推荐

相关文章