Stability AIの生成モデルライブラリは、画像生成、動画生成、多視点合成など、様々な高度なAI生成モデルを提供するオープンソースプロジェクトです。このプロジェクトはモジュール設計を採用し、多様な拡散モデルの学習と推論をサポートします。
instantiate_from_config()
関数を呼び出してサブモジュールを構築および組み合わせます。LatentDiffusion
から DiffusionEngine
にリファクタリング。GeneralConditioner
クラスがすべてのタイプの条件入力を処理します。denoiser_weighting.py
)denoiser_scaling.py
)sigma_sampling.py
)git clone https://github.com/Stability-AI/generative-models.git
cd generative-models
# 仮想環境の作成
python3 -m venv .pt2
source .pt2/bin/activate
# 依存関係のインストール
pip3 install -r requirements/pt2.txt
pip3 install .
pip3 install -e git+https://github.com/Stability-AI/datapipelines.git@main#egg=sdata
# モデルの重みを checkpoints/ フォルダにダウンロード
# Streamlitデモの実行
streamlit run scripts/demo/sampling.py --server.port <your_port>
# SVDモデルのダウンロード
# 簡単な動画サンプリングの実行
python scripts/sampling/simple_video_sample.py --input_path <path/to/image.png>
# SV3D_u (軌道動画)
python scripts/sampling/simple_video_sample.py --input_path <path/to/image.png> --version sv3d_u
# SV3D_p (指定カメラパス)
python scripts/sampling/simple_video_sample.py --input_path <path/to/image.png> --version sv3d_p --elevations_deg 10.0
python scripts/sampling/simple_video_sample_4d.py --input_path assets/sv4d_videos/test_video1.mp4 --output_folder outputs/sv4d
# MNIST条件付き生成学習
python main.py --base configs/example_training/toy/mnist_cond.yaml
# テキストから画像への学習
python main.py --base configs/example_training/txt2img-clipl.yaml
example = {
"jpg": x,
"txt": "a beautiful image"
}
プロジェクトでは、invisible-watermarkライブラリを使用して、生成された画像に不可視のウォーターマークを埋め込みます。
# ウォーターマーク検出環境のインストール
python -m venv .detect
source .detect/bin/activate
pip install "numpy>=1.17" "PyWavelets>=1.1.1" "opencv-python>=4.1.0.25"
pip install --no-deps invisible-watermark
# ウォーターマークの検出
python scripts/demo/detect.py <filename>
このプロジェクトは、現在の生成AI分野における最先端技術を代表し、研究者と開発者に生成AI技術を探求し応用するための強力なツールを提供します。