インストールの準備
最初にPython 3.9の環境を設定する必要があり、仮想環境を管理するためにcondaを使用することをお勧めします。
インストール手順
- クローン倉庫ターミナルで実行
git clone https://github.com/OpenGVLab/InternVL.gitをクリックし、カタログに入る。 - 仮想環境の構築使用
conda create -n internvl python=3.9 -y環境づくり - 基本的な依存関係のインストール走る
pip install -r requirements.txtコアライブラリのインストール
オプション
- 取り付けフラッシュ・アテンション推論を加速させる:
pip install flash-attn==2.3.6 - MMDeployをインストールします:
mim install mmdeploy
マルチモーダル対話の活用
モデル(例:InternVL2_5-8B)をダウンロードした後、マルチモーダル対話のために以下のコードを使用することができます:
from lmdeploy import pipeline
from lmdeploy.vl import load_image
model = 'OpenGVLab/InternVL2_5-8B'
image = load_image('tiger.jpeg')
pipe = pipeline(model)
response = pipe(('描述这张图片', image))
print(response.text)
ほら
8Bモデルは約16GBのGPUメモリーを必要とし、高解像度の画像を処理する場合はさらに多くのリソースが必要になる場合がある。
この答えは記事から得たものである。InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデルについて































