NVIDIA® TensorRT™는 NVIDIA에서 개발한 고성능 딥러닝 추론을 위한 소프트웨어 개발 키트(SDK)입니다. NVIDIA GPU용으로 설계된 추론 최적화 도구 및 런타임 라이브러리로, 프로덕션 환경에서 딥러닝 모델의 추론 성능을 크게 향상시킬 수 있습니다.
# pip를 사용하여 Python 패키지 설치
pip install tensorrt
# 또는 소스 코드에서 빌드
git clone -b main https://github.com/nvidia/TensorRT TensorRT
cd TensorRT
git submodule update --init --recursive
# Docker 이미지 구축
./docker/build.sh --file docker/ubuntu-20.04.Dockerfile --tag tensorrt-ubuntu20.04-cuda12.9
# 구축 컨테이너 시작
./docker/launch.sh --tag tensorrt-ubuntu20.04-cuda12.9 --gpus all
이 저장소에는 TensorRT의 오픈 소스 구성 요소가 포함되어 있으며, 주요 내용은 다음과 같습니다.
NVIDIA TensorRT는 성숙하고 고성능의 딥러닝 추론 최적화 플랫폼으로, 개발자에게 모델 최적화부터 배포까지 완벽한 솔루션을 제공합니다. 강력한 최적화 기능, 풍부한 기능 및 완벽한 생태계 지원을 통해 AI 응용 프로그램 배포를 위한 최고의 도구 중 하나입니다. 엣지 컴퓨팅이든 데이터 센터 배포이든 TensorRT는 개발자가 최적의 추론 성능과 효율성을 달성하도록 지원합니다.