Der Erzeugungsprozess kann in drei Phasen unterteilt werden:
1. die Vorbereitung der Eingabe
- Wählen Sie ein Frontalporträt (JPEG/PNG) mit einer Auflösung von 512×512 oder höher
- Platzieren Sie das Bild in der
input_image/
Akte (Papier) - beabsichtigen
dataset.json
Kameraprofil (siehe PanoHead Anleitung zum Zuschneiden)
2. ausführende Argumentation
- Wechseln Sie in das Code-Verzeichnis:
cd diffportrait360_release/code
- Führen Sie das Skript aus:
bash inference.sh
- ControlNet aktivieren (optional): Ändern Sie das Skript, um die
--use_controlnet
Parameter
3. die Verarbeitung der Ergebnisse
- Die Ausgabe enthält eine Abfolge von Mehrwinkelansichten (die standardmäßig in der Datei
output/
) - Erhalten Sie eine .nerf-Modelldatei, die mit Tools wie NeRFStudio gerendert werden kann.
- Bildsequenzen können mit Tools wie FFmpeg in Videos umgewandelt werden
Bei benutzerdefinierten Daten müssen Sie sicherstellen, dass die Kameraparameter genau sind, und es wird empfohlen, die vom Projekt bereitgestellten Testdaten (einschließlich mehr als 1000 echter Porträts) als Referenzstandard zu verwenden.
Diese Antwort stammt aus dem ArtikelDiffPortrait360: Erzeugen von 360-Grad-Kopfansichten aus einem einzigen PorträtDie