DeepSeek开启国产AI新局：算力需求再攀升，开源时代来临

时间：2025-02-20 07:10

小编：小世评选

随着人工智能技术的快速发展，DeepSeek的出现标志着国产AI领域的一次重大革新。它通过结合“算法创新”与“有限算力”的独特路径，推动了开源AI时代的到来，同时预示着国产AI市场估值的重塑。本文将深入探讨DeepSeek在算力需求、文本与多模态模型应用、芯片格局影响等方面的表现和前景。

一、DeepSeek对算力需求的深远影响

DeepSeek在算法创新方面的突破，为算力的需求带来了新的思考。根据Jevons悖论的分析，尽管在短期内，DeepSeek对算力的影响似乎使得训练阶段的算力需求有所波动，但随着推理价格的下降，DeepSeek吸引了更多用户调用其模型，从而推动了英伟达H100 GPU的租赁价格上升。因此，从总体趋势来看，算力需求在短期内仍将继续攀升。并且，从中长期来看，推理算力需求有望持续增长，尤其是当各行业对AI的依赖越来越加强时。

二、文本与多模态模型对算力的需求差异

在不同类型的模型中，多模态模型的崛起或将对算力的需求产生更大的影响。DeepSeek推出的Sora模型，不仅支持传统文本和图像数据的处理，更扩展到视频数据的处理，这意味着其对算力需求的提升可能是以倍数计算的。这一转变突显了人工智能应用场景的多样性，需求层次的提升，预示着算力将不可避免地经历一轮升级。

三、对芯片未来格局的影响

在深度学习的训练过程中，英伟达依然具备较强的计算和生态护城河。而DeepSeek的引入，通过提升模型训练的算力使用效率，将推动芯片市场的竞争格局进一步变化。未来，英伟达的高等级芯片将主要用于探索 AGI（通用人工智能）；而在推理阶段，推理化、国产化、ASIC化将成为发展中的三大主要趋势，促使芯片市场呈现多样化的发展景象。

四、DeepSeek系列模型的技术与开源之路

DeepSeek引发广泛关注的原因，在于其在技术上的卓越表现。通过优化模型结构（如MLA+MOE、MTP）、先进的模型训练方法（如DualPipe）以及对GPU的针对性优化（如FP8混合精度），DeepSeek显著降低了模型的训练成本。同样值得一提的是，DeepSeek选择开源的策略，让各下游企业能够直接利用模型，降低了调用成本。这一举措将推动整个行业的协作与发展，降低了各方进入人工智能领域的门槛。

五、未来模型的偏向：Dense与Sparse

在探讨模型优化的未来时，Dense（通才）与Sparse（专家）的辩论愈加激烈。通才模型具备一次性处理多任务的能力，而专家模型则能够更专业、更高效地解决特定问题。未来的重点将倾向于如何从两者之间寻找平衡，以实现高效能的AI解决方案。

六、蒸馏模型的演进与潜力

蒸馏模型作为压缩和优化大参数模型的一项重要技术，能够有效减少原本高昂的部署成本、推理时间与硬件需求。这种方法不仅提升了计算效率，更极大地促进了本地部署与端侧推理业务的发展，为各种设备的智能化应用创造了良好条件。

七、多模态的发展路径

随着AI大模型应用的逐渐演变，从文本扩展到视频、图像等多种数据模态的使用，将带来更多的技术创新和应用机会。这一演进过程注定将推动新兴技术的发展与应用，进一步强化AI在各行各业的影响力。

八、DeepSeek对应用侧的推动

DeepSeek技术的发展，不仅降低了AI模型的成本，还推动了推理能力的提升，这将为AI应用的普及创造良好的条件。随着AI在越来越多的场景中被广泛应用，我们将迎来数字化转型的跨越式发展。

九、DeepSeek对终端技术的影响

在终端侧，DeepSeek的“模型蒸馏”功能更新了线上产品的用户协议，这将极大加速AI在各类设备中的快速部署，未来智能手机、PC及其他小型设备都将有可能投入使用AI相应服务。

十、北美资本支出增加的背景与DeepSeek的展望

，随着北美云服务提供商（CSP）提升资本开支，专注于服务器和数据中心的发展，DeepSeek所代表的先进技术得到了越来越多的重视。这一趋势不仅为DeepSeek的持续发展提供了强大动力，也反映出全球对人工智能未来发展的信心。

DeepSeek不仅推动了算力需求的攀升，更为国产AI的开源时代奠定了基础。随着技术的不断进步，预计将会有更多企业从中受益，整个行业也将迎来新的增长期。