FastDeploy 是由百度飞桨(PaddlePaddle)团队开源的深度学习模型部署工具包,专注于为开发者提供简单易用、高性能的AI模型部署解决方案。该项目旨在降低深度学习模型从训练到生产环境部署的技术门槛,支持多种平台和多种模型类型。
项目地址: https://github.com/PaddlePaddle/FastDeploy
针对大模型部署(2.0版本):
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/fastdeploy:2.0.0.0-alpha
# 安装PaddlePaddle nightly版本
python -m pip install --pre paddlepaddle-gpu -i https://www.paddlepaddle.org.cn/packages/nightly/cu126/
# 编译FastDeploy
cd FastDeploy
bash build.sh
# 安装
pip install dist/fastdeploy-2.0.0a0-py3-none-any.whl
# 下载模型
wget https://fastdeploy.bj.bcebos.com/llm/models/Qwen2-7B-Instruct.tar.gz && tar xvf Qwen2-7B-Instruct.tar.gz
# 启动服务
python -m fastdeploy.entrypoints.openai.api_server --model ./Qwen2-7B-Instruct --port 8188 --tensor-parallel-size 1
curl -X POST "http://0.0.0.0:8188/v1/chat/completions" \
-H "Content-Type: application/json" \
-d '{
"messages": [
{"role": "user", "content": "你好,你的名字是什么?"}
]
}'
FastDeploy作为百度飞桨生态的重要组成部分,致力于打造业界领先的AI模型部署解决方案。通过持续的技术创新和社区建设,为开发者提供从模型训练到生产部署的完整工具链,推动AI技术的普及和应用。