蚂蚁集团发布万亿参数的旗舰模型Ling-1T,推理能力实现SOTA表现
时间:2025-10-14 00:00
小编:星品数码网
2023年10月9日,蚂蚁集团发布了其最新研发的旗舰语言模型Ling-1T,这一模型的参数规模高达万亿,标志着蚂蚁在人工智能领域的新突破。Ling-1T是蚂蚁百灵团队在Ling 2.0系列基础上推出的首款旗舰产品,代表了目前该团队所开发的最大规模和最强能力的非思考大模型。

在多项复杂推理基准测试中,Ling-1T取得了显著的成果,尤其在有限输出Token条件下,其推理能力达到了当前领域内的SOTA(State-Of-The-Art)表现。例如,在竞赛数学的AIME 25(American Invitation Math Examination 25)中,Ling-1T以平均消耗4000多个Token达到了70.42%的准确率,超过了表现较好的Gemini-2.5-Pro(平均消耗超过5000 Token,准确率70.10%)。
根据官方披露,Ling-1T模型依然沿用了Ling 2.0架构,并在超过20万亿个高质量、具备高推理浓度的语料上进行了预训练。这一模型支持最长达到128K的上下文窗口,极大拓展了模型的理解和推理范围。值得一提的是,Ling-1T采用了“中训练+后训练”的演进式思维链(Evo-CoT),这一创新方法显著提升了模型高效思考和精准推理的能力,使其在执行复杂任务时表现更为优异。
技术上,Ling-1T采用了FP8混合精度训练,这使得其成为目前已知最大规模的使用FP8训练的基座模型。FP8技术的引入为训练过程带来了显著的显存节省,同时允许更灵活的并行切分策略,实现了超过15%的端到端加速。这种优化不仅提高了模型训练的效率,也为后续的实时应用提供了更为强大的支持。
在强化学习的阶段,百灵团队开发了一种名为LPO(Linguistics-Unit Policy Optimization,语言单位策略最优化)的方法。这种策略优化算法将“句子”作为粒度,旨在为万亿参数模型的稳定训练提供关键支持。通过LPO方法,可以有效地避免传统模型在词元级别的破碎感,同时克服了序列级别的笼统性,从而实现了奖励信号与模型行为在语义层面的精确对齐。
除了Ling-1T,蚂蚁百灵团队还在积极研发面向深度推理的万亿参数大模型Ring-1T,且已于2023年9月30日开源了预览版。这一系列动作凸显了蚂蚁集团在人工智能和深度学习领域的雄心,显示了其不断追求技术创新与突破的决心。
引入如此大规模的模型,对于很多应用场景而言,均具有重要意义。尤其是在金融服务、智能客服、自动化文本处理等领域,Ling-1T的强大推理能力和高准确率将为业务带来显著的提升。
随着Ling-1T的发布,蚂蚁集团期待在更广泛的商业和社会应用中,推动人工智能技术的进步与普及。在产品研发进程中,蚂蚁集团将继续致力于突破更多技术瓶颈,以满足各类用户在智能化服务中的多样化需求。
Ling-1T的发布不仅是蚂蚁技术团队努力的成果,更是推动整个行业发展的重要一环。未来,随着技术的不断演进和应用场景的拓展,这一模型有望发挥出更大的潜力,助力推动数字经济的进一步发展。

