Home
Login

FLUX.1是Black Forest Labs开发的先进文本到图像生成AI模型,支持高质量图像生成和编辑

Apache-2.0Python 23.2kblack-forest-labsflux Last Updated: 2025-07-01

FLUX.1 项目详细介绍

项目概述

FLUX.1是由Black Forest Labs开发的最先进的文本到图像生成AI模型系列。这个GitHub仓库提供了FLUX.1模型的官方推理代码,让用户能够运行图像生成和编辑功能。

核心特性

模型架构

  • 基础架构: 基于整流流变换器(Rectified Flow Transformer)块
  • 参数规模: 扩展到120亿参数
  • 技术创新: 采用潜在对抗扩散蒸馏技术训练

模型版本

FLUX.1提供多个版本以满足不同需求:

  1. FLUX.1 [schnell]

    • 快速版本,仅需1-4步即可生成高质量图像
    • 使用Apache-2.0许可证发布
    • 支持个人、科研和商业用途
  2. FLUX.1 [dev]

    • 开发版本,提供更高的生成质量
    • 适合开发者进行研究和实验
  3. FLUX.1 [pro]

    • 专业版本,提供最高性能
    • 支持4MP图像生成
    • 包含原始模式以获得更真实的效果

功能特点

  • 文本到图像生成: 根据文本描述生成高质量图像
  • 图像编辑: 支持局部编辑和生成式修改
  • 文本处理: 改进的排版生成能力
  • 统一模型: 单一模型支持多种生成和编辑任务
  • 角色一致性: 支持迭代工作流程并保持角色一致性

安装与使用

基础安装

cd $HOME && git clone https://github.com/black-forest-labs/flux
cd $HOME/flux
python3.10 -m venv .venv
source .venv/bin/activate
pip install -e ".[all]"

TensorRT支持安装

如果需要TensorRT支持,需要使用NVIDIA的PyTorch镜像:

cd $HOME && git clone https://github.com/black-forest-labs/flux
enroot import 'docker://$oauthtoken@nvcr.io#nvidia/pytorch:25.01-py3'
enroot create -n pti2501 nvidia+pytorch+25.01-py3.sqsh
enroot start --rw -m ${PWD}/flux:/workspace/flux -r pti2501
cd flux
pip install -e ".[tensorrt]" --extra-index-url https://pypi.nvidia.com

API使用

Python接口

from flux.api import ImageRequest

# 创建API请求
request = ImageRequest("A beautiful beach", name="flux.1.1-pro")
# 或使用API密钥: request = ImageRequest("A beautiful beach", name="flux.1.1-pro", api_key="your_key_here")

# 获取结果URL
request.url
# -> https:<...>/sample.jpg

# 获取图像字节数据
request.bytes
# -> b"..." bytes for the generated image

# 保存到本地
request.save("outputs/api.jpg")

# 获取PIL图像对象
request.image
# -> a PIL image

命令行接口

# 获取生成图像的URL
$ python -m flux.api --prompt="A beautiful beach" url
https:<...>/sample.jpg

# 生成并保存结果
$ python -m flux.api --prompt="A beautiful beach" save outputs/api

# 直接显示图像
$ python -m flux.api --prompt="A beautiful beach" image show

API服务

Black Forest Labs提供了完整的API服务:

API密钥配置

export BFL_API_KEY=<your_key_here>

或在代码中直接提供:

api_key="your_key_here"

技术优势

  1. 高质量输出: 生成的图像质量达到行业领先水平
  2. 精确提示跟随: 能够准确理解和执行复杂的文本提示
  3. 多样化输出: 支持各种风格和主题的图像生成
  4. 快速推理: schnell版本可在极少步骤内完成生成
  5. 灵活部署: 支持本地部署和云端API调用

相关资源

总结

FLUX.1代表了当前文本到图像生成技术的最高水平,通过其先进的架构设计和多版本策略,为从研究人员到商业用户的各类用户提供了强大而灵活的图像生成解决方案。无论是追求速度的快速原型开发,还是需要最高质量的专业应用,FLUX.1都能提供相应的解决方案。

Star History Chart