免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 字节跳动加速布局通用人工智能,秘密研发“世界模型”项目

字节跳动加速布局通用人工智能,秘密研发“世界模型”项目

时间:2025-09-06 23:50

小编:小世评选

近年来,人工智能技术的快速发展吸引了国内外科技公司的广泛关注,而字节跳动作为国内科技巨头之一,正在加速其在通用人工智能领域的布局。根据The Information的报道,字节跳动的核心人工智能团队Seed正在秘密研发一个名为“世界模型”的项目,旨在与谷歌的Genie3和Meta的V-JEPA 2竞争。

“世界模型”项目的核心目标是通过模拟现实环境的规律和人类互动方式,构建一个数字孪生环境。这一模型不仅可以应用于机器人训练和自动驾驶系统的开发,还被视为实现通用人工智能(AGI)的重要路径之一。目前,该项目已进入攻坚阶段,由通义千问的核心成员周畅领导,团队利用抖音/TikTok所积累的海量视频数据以及自研的E-4D技术框架,朝着虚拟世界模拟和机器人训练等前沿领域迈进。

字节跳动的“世界模型”项目的独特之处在于,它将深度融合抖音日均超过10亿次的视频流数据。这些数据涵盖了多维度的动态信息,包括人物行为、物体运动和场景交互,为训练模型提供了接近真实世界的素材库。值得一提的是,最近开源的EX-4D技术成为该项目的关键支撑。这项技术能够将单目视频转化为4D多视角场景,打破了传统单帧图像处理的局限,为实现时空连续性的环境建模奠定了基础。

全球AI竞赛正进入新阶段,面对技术创新的挑战,字节跳动在AI领域的布局表现得相对“低调”。以“世界模型”为例,谷歌的Genie3凭借其“分钟级场景连贯性”以及“文本驱动事件修改”的功能已经占据了一定的市场份额。其720P分辨率和24帧每秒的生成能力,以及支持物理引擎自主学习的特性,正在游戏开发和机器人训练领域引发一场技术变革。同时,Meta的V-JEPA 2也通过独特的联合嵌入预测架构,实现了物理推理能力的突破,通过超过100万小时的视频训练构建的预测模型,让机器人动作规划效率提升到同类产品的30倍。

面对这些科技巨头强势进入这一领域,字节跳动的新模型在保持其短视频数据处理优势的同时,还需突破物理仿真与长时程一致性等技术瓶颈。为了保持竞争力,字节跳动需要不断探索和创新,以提供更加前沿和实用的技术解决方案。

从战略层面来看,字节跳动的“世界模型”布局与其核心业务形成了深度的协同关系。抖音/TikTok积累的超过20亿用户行为数据为模型构建提供了一个独特的人物交互训练集。如果该公司能够有效结合旗下的PICO设备以及其他智能家居产品,未来或可实现虚实融合的交互场景,从而持续巩固其在移动互联网时代的终端优势和市场地位。

字节跳动在进行人工智能技术布局时,结合其自身的内容和社交网络特性,能够更好地吸引和留住用户。这种将技术创新与用户体验结合的方法,能够为其开辟出一条独特的人工智能生态。

字节跳动加速布局通用人工智能的“世界模型”项目,不仅是对当前全球技术趋势的响应,更是其进行自我革新和市场竞争的重要一步。在未来的竞争中,字节跳动如何在技术创新、用户体验和市场扩展等多方面取得突破,将直接影响其在AI领域的布局成果和市场表现。

随着技术的进步和全球竞争的加剧,字节跳动在通用人工智能领域的努力,或为其未来的发展注入新的动力。在这个充满机遇和挑战的时代,只有不断追求技术创新,才能在人工智能赛道上立于不败之地。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多