Home
Login

FLUX.1 是 Black Forest Labs 開發的先進文本到圖像生成 AI 模型,支持高品質圖像生成和編輯

Apache-2.0Python 23.2kblack-forest-labsflux Last Updated: 2025-07-01

FLUX.1 項目詳細介紹

項目概述

FLUX.1是由Black Forest Labs開發的最先進的文本到圖像生成AI模型系列。這個GitHub倉庫提供了FLUX.1模型的官方推理代碼,讓用戶能夠運行圖像生成和編輯功能。

核心特性

模型架構

  • 基礎架構: 基於整流流變換器(Rectified Flow Transformer)塊
  • 參數規模: 擴展到120億參數
  • 技術創新: 採用潛在對抗擴散蒸餾技術訓練

模型版本

FLUX.1提供多個版本以滿足不同需求:

  1. FLUX.1 [schnell]

    • 快速版本,僅需1-4步即可生成高品質圖像
    • 使用Apache-2.0許可證發布
    • 支持個人、科研和商業用途
  2. FLUX.1 [dev]

    • 開發版本,提供更高的生成質量
    • 適合開發者進行研究和實驗
  3. FLUX.1 [pro]

    • 專業版本,提供最高性能
    • 支持4MP圖像生成
    • 包含原始模式以獲得更真實的效果

功能特點

  • 文本到圖像生成: 根據文本描述生成高品質圖像
  • 圖像編輯: 支持局部編輯和生成式修改
  • 文本處理: 改進的排版生成能力
  • 統一模型: 單一模型支持多種生成和編輯任務
  • 角色一致性: 支持迭代工作流程並保持角色一致性

安裝與使用

基礎安裝

cd $HOME && git clone https://github.com/black-forest-labs/flux
cd $HOME/flux
python3.10 -m venv .venv
source .venv/bin/activate
pip install -e ".[all]"

TensorRT支持安裝

如果需要TensorRT支持,需要使用NVIDIA的PyTorch鏡像:

cd $HOME && git clone https://github.com/black-forest-labs/flux
enroot import 'docker://$oauthtoken@nvcr.io#nvidia/pytorch:25.01-py3'
enroot create -n pti2501 nvidia+pytorch+25.01-py3.sqsh
enroot start --rw -m ${PWD}/flux:/workspace/flux -r pti2501
cd flux
pip install -e ".[tensorrt]" --extra-index-url https://pypi.nvidia.com

API使用

Python介面

from flux.api import ImageRequest

# 創建API請求
request = ImageRequest("A beautiful beach", name="flux.1.1-pro")
# 或使用API密鑰: request = ImageRequest("A beautiful beach", name="flux.1.1-pro", api_key="your_key_here")

# 獲取結果URL
request.url
# -> https:<...>/sample.jpg

# 獲取圖像字節數據
request.bytes
# -> b"..." bytes for the generated image

# 保存到本地
request.save("outputs/api.jpg")

# 獲取PIL圖像對象
request.image
# -> a PIL image

命令行介面

# 獲取生成圖像的URL
$ python -m flux.api --prompt="A beautiful beach" url
https:<...>/sample.jpg

# 生成並保存結果
$ python -m flux.api --prompt="A beautiful beach" save outputs/api

# 直接顯示圖像
$ python -m flux.api --prompt="A beautiful beach" image show

API服務

Black Forest Labs提供了完整的API服務:

API密鑰配置

export BFL_API_KEY=<your_key_here>

或在代碼中直接提供:

api_key="your_key_here"

技術優勢

  1. 高品質輸出: 生成的圖像質量達到行業領先水平
  2. 精確提示跟隨: 能夠準確理解和執行複雜的文本提示
  3. 多樣化輸出: 支持各種風格和主題的圖像生成
  4. 快速推理: schnell版本可在極少步驟內完成生成
  5. 靈活部署: 支持本地部署和雲端API調用

相關資源

總結

FLUX.1代表了當前文本到圖像生成技術的最高水平,通過其先進的架構設計和多版本策略,為從研究人員到商業用戶的各類用戶提供了強大而靈活的圖像生成解決方案。無論是追求速度的快速原型開發,還是需要最高質量的專業應用,FLUX.1都能提供相應的解決方案。

Star History Chart