Preparação ambiental
Os seguintes preparativos são necessários para instalar o VLM-R1:
- Ambiente PythonRecomenda-se criar um ambiente virtual para o Python 3.10 usando o Anaconda
- projeto de clonagemUse o git clone para obter o repositório VLM-R1.
- Instalação de dependênciasO projeto fornece um script setup.sh para instalar automaticamente as dependências necessárias.
Etapas detalhadas de instalação
- Crie um ambiente especializado por meio do conda: conda create -n vlm-r1 python=3.10
- Ambiente de ativação: conda activate vlm-r1
- Clonar o projeto: git clone https://github.com/om-ai-lab/VLM-R1.git
- Vá para o diretório do projeto: cd VLM-R1
- Execute o script de configuração: bash setup.sh
O script setup.sh instala automaticamente as seguintes dependências principais:
- Estrutura de aprendizagem profunda PyTorch
- Biblioteca de Transformers
- Outras bibliotecas Python necessárias
advertência
A GPU NVIDIA é recomendada para obter o melhor desempenho. Se o modo CPU for usado, poderá ocorrer um gargalo no desempenho.
Essa resposta foi extraída do artigoVLM-R1: um modelo de linguagem visual para localizar alvos de imagem por meio de linguagem naturalO































