斯坦福与华盛顿大学仅用50美元成功训练出具备推理能力的AI模型s1

时间：2025-02-06 20:10

小编：小世评选

在人工智能领域，推理能力的提升是一项重要的研究方向。近日，斯坦福大学和华盛顿大学的研究团队成功地开发出了一个名为s1的人工智能模型。在这项研究中，他们仅花费了不到50美元的云计算费用（约合364元人民币），便训练出了具备推理能力的AI。这一成绩刷新了人们对AI开发成本的认知，也引发了许多关于AI研究的讨论。

根据2月6日发布的一份研究报告，s1模型在数学和编程能力测试方面，表现与OpenAI的o1和DeepSeek的r1等顶尖推理模型相当。这表明，使用一些较为简单的技术，研究团队便能训练出具有竞争力的AI系统。更值得一提的是，s1的代码和训练所用的数据已经在GitHub上开源，这为广大的研究人员和开发者提供了一个珍贵的资源，促进了AI技术的进一步发展。

蒸馏技术的巧妙运用

s1模型背后的关键技术是所谓的“蒸馏”方法。这一方法的核心在于通过训练一个小型的人工智能模型来模仿一个更强大的模型的推理过程。这次，研究人员采用了谷歌的推理模型Gemini 2.0 Flash Thinking Experimental作为蒸馏的来源。与其相比，斯坦福大学与华盛顿大学的团队以更低的成本达到了类似的目标。这种蒸馏技术在当今人工智能研究中越来越受到重视，因为它不仅可以减少计算成本，还能加速模型的训练过程。

值得注意的是，早在一个月前，加州大学伯克利分校的研究人员也采用了类似的蒸馏方法制作了一个AI推理模型，虽然成本高达450美元，但依然显示出这一技术的有效性和潜力。

随着s1模型的出现，关于人工智能模型商品化的讨论再次被提上议程。如果以相对较低的成本便能复制出价值数百万美元的模型，这些大型科技公司所构建的AI算法“护城河”又在哪里呢？这种情况让行业偃旗息鼓，特别是对于那些依赖高成本AI开发的公司来说。

流行的竞品与现实挑战

大型人工智能实验室对此趋势表示不满，OpenAI不仅批评DeepSeek不当获取其API数据用于模型蒸馏，也在不断寻求保护其技术资源的方式。这也反映了现阶段AI行业仍在探索的一个复杂问题：如何平衡开放与保护之间的关系，既能促进创新，又不被他人轻易复制。

在实际操作过程中，s1研究团队希望找到一种简单的方式，以实现强大的推理性能，同时促进“测试时扩展”的能力。这种能力可以让AI在回答问题前进行更深入的思考。经过研究，s1团队发现，利用被称为监督微调（SFT）的方法，可以在相对较小的数据集上进行效果显著的蒸馏训练。SFT鼓励模型模仿特定的行为，而这种方式的成本远低于DeepSeek所采用的大规模强化学习方法。

未来的发展方向

谷歌通过其Google AI Studio向外界免费提供了Gemini 2.0 Flash Thinking Experimental模型的访问权限，然而其条款却禁止进行逆向工程，这一限制使得研究人员在利用该模型进行开发时面临挑战。s1的研究人员决定使用阿里巴巴旗下的中国人工智能实验室Qwen提供的一个小型、现成的免费模型进行训练。经过精心设计，他们创建了一个仅包含1000个问题的数据集，并针对这些问题设计了对应的答案，结合了谷歌模型所提供的思考过程。

在训练方面，s1团队使用了16个Nvidia H100 GPU，消耗时间不足30分钟，训练成本仅为约20美元。在一些AI基准测试中，s1展示出了令人满意的表现，印证了他们团队的努力和策略。

在s1的推理过程中，研究者们还采用了一种巧妙的技巧，即在模型的推理过程中增加“等待”这个环节，这使得模型能在思考时获得更加准确的答案。这种设计反映了AI研究中对细节的重视，也展示了未来AI在推理能力上可拓展的潜力。

斯坦福与华盛顿大学的s1模型的出现，为人工智能领域的研发提供了新的视角。在极低的成本之下，研究人员不仅拓展了AI的推理能力，同时也引发了关于AI技术商业化、技术保护的广泛讨论。在技术迅速发展的今天，未来的AI训练和研究将会面临更多挑战，也将迎来更大的机遇。

斯坦福与华盛顿大学仅用50美元成功训练出具备推理能力的AI模型s1

精品推荐

相关文章