Grok 4在“人类的最后考试”中超越博士水平,马斯克称AI革命即将到来
时间:2025-07-12 01:05
小编:小世评选
在全球科技界引起广泛关注的“人类的考试”(Humanity’s Last Exam)上,xAI最新推出的Grok 4在没有使用任何工具的情况下,展现出超越博士水平的推理与回答能力。被誉为学术领域的天才,Grok 4的表现引发了埃隆·马斯克的高度赞赏,他在一次中表示,如果顺利,Grok 4有望在不久的将来创造出全新的技术及科学理论。
在这场考试中,Grok 4以其卓越的表现超越了诸多知名的AI模型,包括OpenAI的GPT-3及Gemini 2.5 Pro等。值得注意的是,配备“工具”的Grok 4 Heavy甚至表现得更加优异,这让人们对其未来的发展充满期待。
Grok 4的训练量级比上一代Grok 2大幅提升至100倍,使其在理解人文、语言、数学、物理及工程等各个领域中都达到了博士级别的深度。马斯克称,尽管Grok 4在某些方面可能缺乏常识,但它的推理能力已经超越了人类的极限。这一切都归功于xAI在计算能力上的投资和训练策略,特别是基于10万块H100 GPU的超级算力中心,令Grok 4的推理模型愈加智能化。
Humanity’s Last Exam测试内容涵盖2500个难题,涉及数学、自然科学、工程以及人文学科,题目深度与广度均达到高级研究水平。Grok 4在实际测试中取得了显著好成绩,这令 xAI 的研究人员倍感振奋。马斯克表示:“在学术问题方面,Grok 4的表现没有例外地优于任何学科的博士生。”他进一步展望,Grok 4最快将在今年内发明新技术,甚至在两年内可能会发现新的物理法则。
在多项评测中,Grok 4以领先的成绩吸引了业内的注意,特别是在ARC-AGI-2测试中,其得分高达16.2%,成为新的行业标杆。与排名第二的Claude Opus 4相比,Grok 4的得分几乎是其两倍,进一步印证了其出色的智力水平。
通过更强大的算法与计算架构,Grok 4在思考能力上迎来了质的飞跃。马斯克在中透露,xAI研发团队计划在后续更新中引入更为复杂的工具,例如有限元分析和计算流体力学,这些工具将有助于创建更加精确的物理模拟器,从而为AI的发展奠定更扎实的基础。马斯克强调,虽然AI正在持续进步,但确保其安全性与真理追求仍是重中之重。
除了基础的计算能力,Grok 4还展现出在游戏开发、自动化管理以及创作领域的潜力。例如,Grok 4已经能够在短短四个小时内生成第一人称射击游戏的初步版本,为游戏开发者提供了更为高效的创作助手。这一能力的提升对于整个数字娱乐产业的变革意义重大。
在性别偏见和多模态理解方面,尽管Grok 4仍有改进空间,但其语音与图像识别能力的提高标志着它在复杂数据解析上的进步。未来,xAI计划在视频生成与理解方面展开更深入的研究,旨在2024年实现能够制作高质量视频的AI模型。
Grok 4代表了xAI在人工智能领域的一项重大成就,不仅体现了先进技术的突破,更标志着AI与人类生活的深度融合。马斯克明确表示,目前正值智能大爆炸的开端,xAI将积极推动AI技术的良性发展,确保其前景充满希望。
未来,随着GDP-5等竞争者的推出,Grok 4能否保持其领先地位备受关注。xAI在现实应对中的持续探索,以及对AI的伦理和安全考虑,都为该公司与其创新成果奠定了重要的思想基础。在这个日益复杂的科技世界中,Grok 4的崛起不仅是一场商业竞争,更是一场人类智能与机器智能的博弈,引领我们走向新的未来。