通过命令行使用 MIDI-3D 包含两个关键阶段:
阶段一:生成分割图
执行以下命令(以卡通风格图片为例):
python -m scripts.grounding_sam --image assets/example_data/Cartoon-Style/04_rgb.png --labels "lamp sofa table dog" --output ./segmentation.png
- パラメータの説明
– –image:输入图片路径
– –labels:空格分隔的物体名称列表
– –output:生成的分割图保存位置
阶段二:3D场景生成
使用核心推理脚本:
python -m scripts.inference_midi --rgb 00_rgb.png --seg 00_seg.png --output-dir "./output" --do-image-padding
- 上級者向けのヒント
– 添加–do-image-padding参数可优化边缘物体生成质量
– 输出目录会自动生成含时间戳的子文件夹,避免文件覆盖
典型生成耗时约40-60秒,建议优先使用官方提供的示例数据进行流程测试。
この答えは記事から得たものである。MIDI-3D: 1枚の画像からマルチオブジェクトの3Dシーンを高速生成するオープンソースツールについて