テキストを使用して3Dモデルを生成するには、以下のような段階的なプロセスが必要です:
- text-to-graphicsモジュールのインストール::
HunyuanDiTのテキストをhuggingface-cli経由でダウンロードし、テキスト記述を2D概念図に変換するイメージモデルに変換。 - 画像を生成するための変換::
HunyuanDiTPipelineを呼び出し、テキスト入力(例:'かわいいウサギ')を処理し、テーマに対応する参照画像を出力する。 - ベースモデルの生成::
Hunyuan3DDiTFlowMatchingPipelineを使用して、2D画像を3D幾何学構造に変換する場合、num_inference_stepsを30ステップ以上に設定することをお勧めします。 - 保存と最適化::
モデルを.glbフォーマットでエクスポートした後、テクスチャを使用してモデル強化の詳細を生成し続けることを選択できます。
キーコードの例:image = t2i('a cute rabbit')mesh = i23d(image, num_inference_steps=30)[0]mesh.export('output.glb')
この方法はコンセプト作りに適しており、生成にかかる時間は約1~3分です(モデルのバージョンやハードウェアによって異なります)。より正確な結果を得るためには、短い説明的フレーズから実験を始め、徐々に詳細な語彙を増やしていくことをお勧めします。
この答えは記事から得たものである。Hunyuan3D-2: テンセントのオープンソース高解像度3Dモデル生成ツールについて































