インストールの準備
首先需要配置Python 3.9环境,建议使用conda管理虚拟环境。
インストール手順
- クローン倉庫ターミナルで実行
git clone https://github.com/OpenGVLab/InternVL.git
をクリックし、カタログに入る。 - 仮想環境の構築使用
conda create -n internvl python=3.9 -y
環境づくり - 基本的な依存関係のインストール走る
pip install -r requirements.txt
コアライブラリのインストール
オプション
- 取り付けFlash-Attention以加速推理:
pip install flash-attn==2.3.6
- 安装MMDeploy用于生产部署:
mim install mmdeploy
多模态对话使用
下载模型(如InternVL2_5-8B)后,可以使用以下代码进行多模态对话:
from lmdeploy import pipeline
from lmdeploy.vl import load_image
model = 'OpenGVLab/InternVL2_5-8B'
image = load_image('tiger.jpeg')
pipe = pipeline(model)
response = pipe(('描述这张图片', image))
print(response.text)
ほら
8B模型约需16GB GPU内存,处理高分辨率图像时可能需要更多资源。
この答えは記事から得たものである。InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデルについて