テキストから3Dワールド生成プロセス重要なステップは3つある:
1. キューの準備
例えば、"A medieval castle in the sunshine, surrounded by a moat"(陽光に照らされた、堀に囲まれた中世の城)など。複雑な修飾語は避け、英語と中国語の両方のプロンプトに対応しましょう。
2. パノラマ画像の生成
コア生成コマンドを実行する:python3 demo_panogen.py --prompt "阳光下的中世纪城堡" --output_path test_results/castle
生成されたパノラマは指定したディレクトリのpanorama.pngファイルに保存されます。
3. 3Dシーンの作成
パノラマによるセマンティックレイヤリングを用いた3Dモデルの生成:CUDA_VISIBLE_DEVICES=0 python3 demo_scenegen.py --image_path test_results/castle/panorama.png --labels_fg1 castle --labels_fg2 river --classes outdoor --output_path test_results/castle
labels_fg1/2パラメータは、レイヤー化される前景オブジェクト(城や川など)を指定し、-classesは屋内と屋外のシーンを区別する。
完成した3Dモデルは3つの使い方.obj/.glbをBlenderにエクスポートして編集したり、Unity/Unrealエンジンに直接インポートすることもできます。キューワードから対話可能なシーンまで、全プロセスで約30~60分かかります(A100グラフィックカード)。
この答えは記事から得たものである。HunyuanWorld-1.0: テキストや画像からインタラクティブな360°3D世界を生成について
































