NVIDIA® TensorRT™ 是NVIDIA开发的一款专门用于高性能深度学习推理的软件开发套件(SDK)。它是专为NVIDIA GPU设计的推理优化器和运行时库,能够显著提升深度学习模型在生产环境中的推理性能。
# 使用pip安装Python包
pip install tensorrt
# 或者从源码构建
git clone -b main https://github.com/nvidia/TensorRT TensorRT
cd TensorRT
git submodule update --init --recursive
# 构建Docker镜像
./docker/build.sh --file docker/ubuntu-20.04.Dockerfile --tag tensorrt-ubuntu20.04-cuda12.9
# 启动构建容器
./docker/launch.sh --tag tensorrt-ubuntu20.04-cuda12.9 --gpus all
此仓库包含TensorRT的开源组件,主要包括:
NVIDIA TensorRT是一个成熟、高性能的深度学习推理优化平台,为开发者提供了从模型优化到部署的完整解决方案。其强大的优化能力、丰富的功能特性以及完善的生态支持,使其成为AI应用部署的首选工具之一。无论是边缘计算还是数据中心部署,TensorRT都能帮助开发者实现最佳的推理性能和效率。