云从科技“从容大模型”荣登全球多模态榜首,超越国际顶尖团队
时间:2025-06-01 14:45
小编:小世评选
近日,云从科技凭借其自主研发的从容大模型在全球多模态评测中脱颖而出,荣登国际权威评测OpenCompass的多模态榜首,以80.7分的优异成绩超越了诸如谷歌和OpenAI等国际顶尖团队。这一成就不仅刷新了国内AI模型在国际多模态测评中的最高得分纪录,同时也标志着中国在通用人工智能领域的崭新进步,彰显了中国科技在全球的竞争力与创新潜力。
从容大模型的成功不仅依赖于其出色的技术能力,还与其在多模态学习领域的深入研究分不开。评测过程中,该模型在视觉认知、自然语言理解以及跨领域应用等方面的表现均令人瞩目。特别是在医学健康、艺术设计、数理逻辑等领域,从容大模型取得了令人满意的成果,显示了其在专业应用上的广泛适应能力。
在具体的测评项目中,从容大模型在几乎所有重要领域均表现优异。其在MMBench中文测试、高难度学科综合评测(MMMU)和高阶榜单(MMStar)中均获得了第一名的殊荣。它在复杂场景的文本识别(ocrbench)和开放域问答(MMVet)等关键技术领域也稳居全球前列,有效地突显了其综合能力比国际领先的模型GPT-1高出近5分的优越性。
云从科技的技术突破主要源于其在多模态核心领域的深耕。在从容大模型的研发中,云从科技着重关注通用的视觉语言理解与任务,并通过多模态对齐、高阶建模和长上下文建模等三大核心领域的创新与优化,成功建立起了全球领先的技术壁垒。其自建的高质量基准数据集,涵盖了图文问答、多模态理解和多轮交互等多个任务场景,显著提升了多模态理解及任务指令遵循的表现。
从容大模型还首次实现了DPO(直接偏好优化)与GRPO(生成式奖励优化)的双重对齐技术。这一重大技术创新的核心在于无需依赖传统的奖励模型,即可形成类人化的决策机制。这种优化的模型学习机制,使得从容大模型在复杂问答和多轮对话中展现出了更为出色的智能行为选择能力,充分符合人类的思维模式。
为了应对4K高分辨率图像问答的需求,云从科技针对多模态文档理解(OCR)对模型的图像编码器进行了结构优化,使其能够处理高分辨率图像以及各类文档(如合同、发票等)。该优化不仅支持多模态文档的智能审查、智能解析和智能问答等任务,也为跨页文档分析和多轮对话中的长文本场景提供了支持,能够精准追踪超过3万字的上下文逻辑。
在这一系列创新技术的支持下,从容大模型不仅在多图、跨图场景的图文交错模式以及原生视频模式上实现了全面升级,还能够实现跨图比较、图文组合和多图问答等复杂多模态任务。这一点大幅提升了模型的理解深度与广度,并进一步扩展了其应用领域。
值得一提的是,从容大模型的成功不是孤立的。在多个关键行业中,该模型已通过AI智能体实现规模化落地。例如,某银行与云从科技合作,共同打造了风控合规案防智能,该利用从容大模型的能力,实现了风险识别的自动化及问责标准化,投诉数量降低了超过50%。在电商领域,云从科技与正浩创新合作,基于这一模型推出的智能客服,通过多模态对齐与知识库的精准匹配,问答准确率提高至95%,客服月均效率提升了24%。
云从科技联合创始人姚志强表示:“技术创新最终要服务于社会价值。”他强调,团队将不断探索多模态技术的安全应用模式,以自主创新的AI基础设施,推动全球智能化转型,提供更高效、更包容的技术支撑。随着从容大模型的不断进化,中国的人工智能产业正以坚实的技术基础,开启赋能实体经济的新篇章,为全球科技创新注入新动力。