Preparação para a instalação
Primeiro, você precisa configurar seu ambiente Python 3.9, e é recomendável usar o conda para gerenciar seu ambiente virtual.
Etapas de instalação
- armazém de clonesExecute-o no terminal
git clone https://github.com/OpenGVLab/InternVL.gite insira o catálogo - Criação de um ambiente virtual: Uso
conda create -n internvl python=3.9 -yCriando o ambiente - Instalação de dependências básicas: Executar
pip install -r requirements.txtInstalação das bibliotecas principais
Montagem opcional
- montagemFlash-Attentionpara acelerar o raciocínio:
pip install flash-attn==2.3.6 - Instale o MMDeploy para a implantação de produção:
mim install mmdeploy
Uso de diálogo multimodal
Depois de fazer o download do modelo (por exemplo, InternVL2_5-8B), você pode usar o seguinte código para o diálogo multimodal:
from lmdeploy import pipeline
from lmdeploy.vl import load_image
model = 'OpenGVLab/InternVL2_5-8B'
image = load_image('tiger.jpeg')
pipe = pipeline(model)
response = pipe(('描述这张图片', image))
print(response.text)
advertência
O modelo 8B requer aproximadamente 16 GB de memória da GPU, e mais recursos podem ser necessários ao processar imagens de alta resolução.
Essa resposta foi extraída do artigoInternVL: grandes modelos multimodais de código aberto para processamento de imagens, vídeos e textosO































