NVIDIA® TensorRT™ は、NVIDIAが開発した、高性能な深層学習推論専用のソフトウェア開発キット(SDK)です。NVIDIA GPU向けに設計された推論オプティマイザーおよびランタイムライブラリであり、深層学習モデルの生産環境における推論性能を大幅に向上させます。
# pipを使用してPythonパッケージをインストール
pip install tensorrt
# またはソースコードから構築
git clone -b main https://github.com/nvidia/TensorRT TensorRT
cd TensorRT
git submodule update --init --recursive
# Dockerイメージを構築
./docker/build.sh --file docker/ubuntu-20.04.Dockerfile --tag tensorrt-ubuntu20.04-cuda12.9
# 構築コンテナを起動
./docker/launch.sh --tag tensorrt-ubuntu20.04-cuda12.9 --gpus all
このリポジトリには、TensorRTのオープンソースコンポーネントが含まれており、主に以下が含まれます。
NVIDIA TensorRTは、成熟した高性能な深層学習推論最適化プラットフォームであり、開発者にモデル最適化からデプロイまでの完全なソリューションを提供します。その強力な最適化能力、豊富な機能特性、および充実したエコシステムサポートにより、AIアプリケーションのデプロイにおける最適なツールの一つとなっています。エッジコンピューティングでもデータセンターデプロイでも、TensorRTは開発者が最高の推論性能と効率を実現するのに役立ちます。