FastDeploy 是由百度飛槳(PaddlePaddle)團隊開源的深度學習模型部署工具包,專注於為開發者提供簡單易用、高性能的 AI 模型部署解決方案。該項目旨在降低深度學習模型從訓練到生產環境部署的技術門檻,支持多種平台和多種模型類型。
項目地址: https://github.com/PaddlePaddle/FastDeploy
針對大模型部署(2.0 版本):
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/fastdeploy:2.0.0.0-alpha
# 安裝 PaddlePaddle nightly 版本
python -m pip install --pre paddlepaddle-gpu -i https://www.paddlepaddle.org.cn/packages/nightly/cu126/
# 編譯 FastDeploy
cd FastDeploy
bash build.sh
# 安裝
pip install dist/fastdeploy-2.0.0a0-py3-none-any.whl
# 下載模型
wget https://fastdeploy.bj.bcebos.com/llm/models/Qwen2-7B-Instruct.tar.gz && tar xvf Qwen2-7B-Instruct.tar.gz
# 啟動服務
python -m fastdeploy.entrypoints.openai.api_server --model ./Qwen2-7B-Instruct --port 8188 --tensor-parallel-size 1
curl -X POST "http://0.0.0.0:8188/v1/chat/completions" \
-H "Content-Type: application/json" \
-d '{
"messages": [
{"role": "user", "content": "你好,你的名字是什麼?"}
]
}'
FastDeploy 作為百度飛槳生態的重要組成部分,致力於打造業界領先的 AI 模型部署解決方案。通過持續的技術創新和社區建設,為開發者提供從模型訓練到生產部署的完整工具鏈,推動 AI 技術的普及和應用。