DeepSeek在知乎发布推理系统细节,标志“开源周”圆满结束
时间:2025-03-03 18:00
小编:小世评选
2023年3月1日,DeepSeek正式在知乎开设了官方账号,并发布了技术文章《DeepSeek-V3/R1推理系统概览》,首次详细介绍了其模型推理系统的优化细节,并披露了成本与利润率的关键数据。这一行动标志着全球广泛关注的“DeepSeek开源周”圆满落幕。自2月24日至2月28日,众多开源项目如月之暗面、微软研究院、清华大学和阶跃星辰等都参与了这一盛举,并在知乎上积极分享各自的研究成果与经验。
选择知乎作为“DeepSeek开源周”的一站,实际上进一步巩固了这一在人工智能领域的领导地位。知乎不仅是AI从业者和创业者聚集的社区,还成为了前沿技术讨论的重要场所。而在这一波动的背景下,DeepSeek的发布加深了对AI领域趋势的关注。
作为开源周的压轴之作,DeepSeek在知乎官方账号中发布的推理系统概述的内容引起了广泛的关注。文章重点提到,DeepSeek-V3/R1推理系统的优化目标是提升吞吐量和减少延迟。为实现这一目标,DeepSeek采用了大规模跨节点专家并行(EP)的方案——尽管这一方案提升了性能,但同时也带来了系统复杂性增加的挑战。文章深入探讨了如何利用EP来扩大批量大小,提高传输效率,并实现负载均衡等技术问题。
DeepSeek首次对外披露了其构建和运行的成本与利润率。根据文章内容,假设GPU的租赁成本为每小时2美元,总成本为每天87,072美元。相对而言,若按照DeepSeek R1的定价计算,每天的理论总收入将达到562,027美元,这意味着成本利润率高达545%。这一数字不仅引发了业界的热议,也为关于DeepSeek训练成本的议论提供了有力的证据,回应了外界对其训练成本被故意低估的质疑。
在“DeepSeek开源周”期间,开源项目如FlashMLA、DeepEP、DeepGEMM、3FS以及DualPipe、EPLB等相继上线,这些技术的发布在知乎上引发了热烈的讨论和赞赏。行业内的专家与爱好者们纷纷加入了对这些新技术的探讨,与DeepSeek的研究人员进行交流和互动。一位知乎知名答主“刘聪NPL”评论道:“DeepSeek和OpenAI同样重要。” 正如他所指出的,DeepSeek开源周的影响力甚至被认为超过了OpenAI近期的发布会。
随着开源周的结束,DeepSeek再一次点燃了知乎对人工智能的讨论热潮,研究者和从业者们纷纷在相关问题下分享见解。可以看出,“发完论文,来知乎亲自答”已成为目前AI研究者一种新兴的风潮。早在2月20日,月之暗面框架的研发人员在知乎分享了他们的思路,激发了对“稀疏注意力”框架的深入探讨。同时,微软研究院、清华大学团队以及阶跃星辰的开源参与者也纷纷分享了各自的研究成果与成长历程。这种交流被业界誉为继模型和论文开源后,又一次重要的“思维链开源”。
知乎的表现显示出它对互联网、AI、机器人等领域从业者的广泛吸引力,成为技术讨论与思想碰撞的前沿阵地。尤其是在DeepSeek将知乎作为开源周的终点,进一步体现了这一在AI讨论领域的独特价值。通过这样的开放与透明交流,DeepSeek不仅展示了自身的技术实力,也有效推动了整个社会对AI领域知识共享和创新的热情。
“DeepSeek开源周”的成功举办,为行业内的技术进步与思想传承提供了新的动力,也激励着更多的AI从业者积极参与到知识共享与合作之中。这一周的精彩内容与讨论,必将对未来的AI发展产生深远影响。