蚂蚁集团发布万亿参数的旗舰模型Ling-1T，推理能力实现SOTA表现

时间：2025-10-14 00:00

小编：星品数码网

2023年10月9日，蚂蚁集团发布了其最新研发的旗舰语言模型Ling-1T，这一模型的参数规模高达万亿，标志着蚂蚁在人工智能领域的新突破。Ling-1T是蚂蚁百灵团队在Ling 2.0系列基础上推出的首款旗舰产品，代表了目前该团队所开发的最大规模和最强能力的非思考大模型。

在多项复杂推理基准测试中，Ling-1T取得了显著的成果，尤其在有限输出Token条件下，其推理能力达到了当前领域内的SOTA（State-Of-The-Art）表现。例如，在竞赛数学的AIME 25（American Invitation Math Examination 25）中，Ling-1T以平均消耗4000多个Token达到了70.42%的准确率，超过了表现较好的Gemini-2.5-Pro（平均消耗超过5000 Token，准确率70.10%）。

根据官方披露，Ling-1T模型依然沿用了Ling 2.0架构，并在超过20万亿个高质量、具备高推理浓度的语料上进行了预训练。这一模型支持最长达到128K的上下文窗口，极大拓展了模型的理解和推理范围。值得一提的是，Ling-1T采用了“中训练+后训练”的演进式思维链（Evo-CoT），这一创新方法显著提升了模型高效思考和精准推理的能力，使其在执行复杂任务时表现更为优异。

技术上，Ling-1T采用了FP8混合精度训练，这使得其成为目前已知最大规模的使用FP8训练的基座模型。FP8技术的引入为训练过程带来了显著的显存节省，同时允许更灵活的并行切分策略，实现了超过15%的端到端加速。这种优化不仅提高了模型训练的效率，也为后续的实时应用提供了更为强大的支持。

在强化学习的阶段，百灵团队开发了一种名为LPO（Linguistics-Unit Policy Optimization，语言单位策略最优化）的方法。这种策略优化算法将“句子”作为粒度，旨在为万亿参数模型的稳定训练提供关键支持。通过LPO方法，可以有效地避免传统模型在词元级别的破碎感，同时克服了序列级别的笼统性，从而实现了奖励信号与模型行为在语义层面的精确对齐。

除了Ling-1T，蚂蚁百灵团队还在积极研发面向深度推理的万亿参数大模型Ring-1T，且已于2023年9月30日开源了预览版。这一系列动作凸显了蚂蚁集团在人工智能和深度学习领域的雄心，显示了其不断追求技术创新与突破的决心。

引入如此大规模的模型，对于很多应用场景而言，均具有重要意义。尤其是在金融服务、智能客服、自动化文本处理等领域，Ling-1T的强大推理能力和高准确率将为业务带来显著的提升。

随着Ling-1T的发布，蚂蚁集团期待在更广泛的商业和社会应用中，推动人工智能技术的进步与普及。在产品研发进程中，蚂蚁集团将继续致力于突破更多技术瓶颈，以满足各类用户在智能化服务中的多样化需求。

Ling-1T的发布不仅是蚂蚁技术团队努力的成果，更是推动整个行业发展的重要一环。未来，随着技术的不断演进和应用场景的拓展，这一模型有望发挥出更大的潜力，助力推动数字经济的进一步发展。

蚂蚁集团发布万亿参数的旗舰模型Ling-1T，推理能力实现SOTA表现

精品推荐

相关文章