作戦準備
まず、以下の必要なファイルをダウンロードしてください:
- ベースモデルの重量
- ビジョン・コンバーターのモデル重量
- H-ロラ ウエイトを理解する
- フュージョン層の重み
パラメータ設定
修正com_infer.shスクリプトのパス変数:
- MODEL_NAME_OR_PATH: ベースモデルのパス
- VIT_PATH: ビジョン・トランスフォーマー・パス
- HLORA_PATH: H-LoRAウェイトパス
- FUSION_LAYER_PATH: フュージョンレイヤーパス
実施方法
- スクリプトで実行:
bash com_infer.sh - またはPythonコマンドを直接実行する:
python3 com_infer.pyすべてのパラメータを設定する
パラメータの説明
データ型(FP16)、H-LoRAパラメータ(r=64、alpha=128)などを調整しながら、問題のテキストと画像のパスを指定する必要がある。
この答えは記事から得たものである。HealthGPT:医療画像解析と診断Q&Aを支援する医療ビッグモデルについて































