英伟达推出NVIDIA TensorRT for RTX，提升AI推理速度达50%

时间：2025-07-20 06:20

小编：星品数码网

在人工智能和深度学习迅速发展的今天，推理速度的提升对推动技术进步至关重要。英伟达于5月20日宣布推出其最新的NVIDIA TensorRT for RTX，这一新工具将为GeForce RTX全系列显卡提供一种强大的AI推理加速框架，支持Windows 11系统，进一步提升AI推理的效率和性能。

TensorRT for RTX的推出，标志着英伟达在优化AI计算方面迈出了重要一步。该框架的性能相较于传统的DirectML方案高出近两倍，意味着开发者能够在使用TensorRT进行推理时获得显著的性能改善。这种提升对于AI应用的响应速度和处理能力有着直接的积极影响，将帮助开发者在构建以AI为中心的应用时，节省时间并提高效率。

根据官方发布的技术细节，TensorRT原生兼容Windows ML框架，特别是在ComfyUI应用中的表现尤为突出，其相较于DirectML的性能提升达到两倍。其他应用的性能提升也表现不俗，在1.5到1.7倍之间，显示了TensorRT广泛的适用性和优化潜力。

除了显著提升速度之外，TensorRT还支持即时的GPU专属优化，这意味着在推理过程中，用户的GPU资源能够被高效利用，确保系统的整体运作效率。推理库文件的体积也缩小至原有的1/8，这对于存储和管理推理库提供了极大的便利。减小的文件体积将使得开发者在部署和更新过程中更加轻松，并有助于更快速地实现产品上线。

英伟达官方透露，目前已经为超过150个AI SDK提供了支持，并且承诺将在本月推出5个全新的ISV集成。这些集成将包含多种工具和，能够进一步丰富开发者的选择，降低技术门槛，为更多的开发团队提供便利。

新推出的集成工具包括：

1. LM Studio：通过最新的CUDA，性能提升达到30%。

2. Topaz Video AI：实现GenAI视频加速CUDA，助力视频创作和处理领域的AI应用。

3. 哔哩哔哩（Bilibili）：结合NVIDIA Broadcast Effects，提升视频内容创作者的工作效率。

4. AutoDesk VRED：借助DLSS 4技术，增强3D可视化和渲染能力。

5. Chaos Enscape：同样利用DLSS 4，提升设计和建筑可视化的效果。

英伟达强调，当前AI PC软件生态环境要求开发者在广泛的硬件支持与高性能优化之间做出艰难的选择。而Windows ML推理框架通过ONNX Runtime进行构建，与不同硬件厂商优化的AI执行层进行了无缝衔接。对于RTX显卡，Windows ML会自动调用TensorRT for RTX，完成最高性能的快速部署。这一系统的智能选择，极大地方便了开发者，减少了复杂的手动操作，使得AI应用的开发和应用变得更加高效和灵活。

NVIDIA TensorRT for RTX的推出将会是一场技术革命，对于希望充分利用AI技术的开发者和企业而言，意味着更快的推理速度和更高的性能。这不仅将帮助现有的AI应用获得更新，还将激发创新，推动新的应用场景和产品的诞生。随着英伟达不断推进AI技术的边界，我们有理由期待，未来的AI应用将更加高效，更易于接入，并且拥有更强大的功能。

如同英伟达所言，AI正在重塑各行各业的未来，而TensorRT for RTX将是这一转变的重要力量。借助先进的技术和生态系统，开发者将能够更加专注于创新和创意，而不是局限于技术的实现层面，进一步加速AI的发展进程。

英伟达推出NVIDIA TensorRT for RTX，提升AI推理速度达50%

精品推荐

相关文章