コマンドラインからMIDI-3Dを使用するには、2つの重要な段階があります:
ステージ1:セグメンテーション図の作成
以下のコマンドを実行する(漫画風画像の例):
python -m scripts.grounding_sam --image assets/example_data/Cartoon-Style/04_rgb.png --labels "lamp sofa table dog" --output ./segmentation.png- パラメータの説明
– -イメージ入力画像パス
– -ラベルオブジェクト名のスペース区切りリスト
– -出力生成されたセグメンテーションマップが保存される場所
ステージ2:3Dシーン生成
中核推論スクリプトを使用する:
python -m scripts.inference_midi --rgb 00_rgb.png --seg 00_seg.png --output-dir "./output" --do-image-padding- 上級者向けのヒント
- 追加-画像パディングを行うエッジオブジェクト生成の品質を最適化するパラメータ
- 出力ディレクトリは、ファイルの上書きを避けるためにタイムスタンプ付きのサブフォルダを自動的に生成します。
典型的な生成時間は約40~60秒で、プロセステストには公式に提供されたサンプルデータを優先的に使用することが推奨される。
この答えは記事から得たものである。MIDI-3D: 1枚の画像からマルチオブジェクトの3Dシーンを高速生成するオープンソースツールについて































