画像のディテールを維持するための技術的ソリューション
ディフュージョン・トランスフォーマーで起こりうる細部のぼやけには、次のような対策がある:
- VAEエンハンスメントの有効化正しい積載を確認する安全センサーファイル(335MB)の中で、この変分自己エンコーダーは、高周波のディテールを再構成する。
models/step1xディレクトリ - 世代ステップ数の制御で
run_inference.py追加スクリプト--num_inference_steps 50パラメータ(デフォルトは30ステップ)を使用すると、20%の計算時間が長くなりますが、髪やテクスチャなどの細部が大幅に改善されます。 - 後処理プログラム公式に推奨されているリアル・エスガン超解像再構成を実行し、追加コマンドでインストールできる:
pip install realesrgan
実験データによると、VAEと50ステップ推論の組み合わせにより、1024×1024画像のPSNRが3.2dB向上した。
この答えは記事から得たものである。Step1X-Edit:自然言語指示による画像編集のためのオープンソースツールについて































