FastDeploy는 바이두 파들플로우(PaddlePaddle) 팀에서 오픈 소스로 공개한 딥러닝 모델 배포 툴킷으로, 개발자에게 사용하기 쉽고 고성능의 AI 모델 배포 솔루션을 제공하는 데 중점을 둡니다. 이 프로젝트는 딥러닝 모델의 훈련부터 생산 환경 배포까지의 기술 장벽을 낮추고, 다양한 플랫폼과 다양한 모델 유형을 지원하는 것을 목표로 합니다.
프로젝트 주소: https://github.com/PaddlePaddle/FastDeploy
대규모 모델 배포(2.0 버전) 대상:
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/fastdeploy:2.0.0.0-alpha
# PaddlePaddle nightly 버전 설치
python -m pip install --pre paddlepaddle-gpu -i https://www.paddlepaddle.org.cn/packages/nightly/cu126/
# FastDeploy 컴파일
cd FastDeploy
bash build.sh
# 설치
pip install dist/fastdeploy-2.0.0a0-py3-none-any.whl
# 모델 다운로드
wget https://fastdeploy.bj.bcebos.com/llm/models/Qwen2-7B-Instruct.tar.gz && tar xvf Qwen2-7B-Instruct.tar.gz
# 서비스 시작
python -m fastdeploy.entrypoints.openai.api_server --model ./Qwen2-7B-Instruct --port 8188 --tensor-parallel-size 1
curl -X POST "http://0.0.0.0:8188/v1/chat/completions" \
-H "Content-Type: application/json" \
-d '{
"messages": [
{"role": "user", "content": "안녕하세요, 당신의 이름은 무엇입니까?"}
]
}'
FastDeploy는 바이두 파들플로우 생태계의 중요한 구성 요소로서, 업계 최고의 AI 모델 배포 솔루션을 구축하는 데 전념하고 있습니다. 지속적인 기술 혁신과 커뮤니티 구축을 통해 개발자에게 모델 훈련부터 생산 배포까지의 완벽한 툴체인을 제공하여 AI 기술의 보급과 응용을 촉진합니다.