NVIDIA® TensorRT™ 是 NVIDIA 開發的一款專門用於高性能深度學習推理的軟體開發套件 (SDK)。它是專為 NVIDIA GPU 設計的推理優化器和執行時庫,能夠顯著提升深度學習模型在生產環境中的推理性能。
# 使用 pip 安裝 Python 包
pip install tensorrt
# 或者從源碼構建
git clone -b main https://github.com/nvidia/TensorRT TensorRT
cd TensorRT
git submodule update --init --recursive
# 构建 Docker 镜像
./docker/build.sh --file docker/ubuntu-20.04.Dockerfile --tag tensorrt-ubuntu20.04-cuda12.9
# 启动构建容器
./docker/launch.sh --tag tensorrt-ubuntu20.04-cuda12.9 --gpus all
此倉庫包含 TensorRT 的開源組件,主要包括:
NVIDIA TensorRT 是一個成熟、高性能的深度學習推理優化平台,為開發者提供了從模型優化到部署的完整解決方案。其強大的優化能力、豐富的功能特性以及完善的生態支援,使其成為 AI 應用部署的首選工具之一。無論是邊緣計算還是數據中心部署,TensorRT 都能幫助開發者實現最佳的推理性能和效率。