Technische Lösungen zur Erhaltung des Bildausschnitts
Die folgenden Maßnahmen können ergriffen werden, um die Unschärfe von Details zu vermeiden, die bei Diffusionstransformatoren auftreten kann:
- VAE-Erweiterung aktivierenSicherstellen der korrekten Beladungvae.safetensorsDatei (335MB) rekonstruiert dieser Variations-Selbstkodierer hochfrequente Details, die in die Datenbank eingefügt werden müssen.
models/step1xVerzeichnis (auf der Festplatte des Computers) - Steuerung der Anzahl der Generierungsschritte: in
run_inference.pySkript zum Hinzufügen--num_inference_steps 50(Standardwert 30 Schritte), was die 20%-Berechnungszeit erhöht, aber die Details der Haare, Textur usw. deutlich verbessert. - Nachbearbeitungsprogramm: Verwenden Sie das offiziell empfohleneReal-ESRGANFührt eine Super-Resolution-Rekonstruktion durch, die mit zusätzlichen Befehlen installiert werden kann:
pip install realesrgan
Experimentelle Daten zeigen, dass die Kombination von VAE und 50-Schritt-Inferenz den PSNR-Wert von 1024×1024 Bildern um 3,2 dB verbessert.
Diese Antwort stammt aus dem ArtikelStep1X-Edit: Ein Open-Source-Tool für die Bearbeitung von Bildern mit Anweisungen in natürlicher SpracheDie































