Guia de instalação e implantação do Tarsier
O Tarsier é adequado para usuários com alguma formação técnica, como desenvolvedores e pesquisadores. O processo de instalação é descrito em detalhes a seguir:
Preparação ambiental
- Garantir que o Python 3.9 ou superior
- Recomenda-se que você use o conda para criar um ambiente virtual:
conda create -n tarsier python=3.9
conda activate tarsier
Download e instalação do modelo
- Clonagem do Project Warehouse:
git clone https://github.com/bytedance/tarsier.git - Mudar para a ramificação Tarsier2:
git checkout tarsier2 - Execute o script de instalação para instalar as dependências:
bash setup.sh - (Opcional) Para usuários de GPU, instale o PyTorch com suporte a CUDA:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118 - Faça o download dos pesos dos modelos do Hugging Face:
huggingface-cli download omni-research/Tarsier2-7b
Verificar a instalação
Execute um script de teste rápido para confirmar que a instalação foi bem-sucedida:
python3 -m tasks.inference_quick_start --model_name_or_path path/to/Tarsier2-7b --input_path assets/videos/coffee.gif
Essa resposta foi extraída do artigoTarsier: um modelo de compreensão de vídeo de código aberto para gerar descrições de vídeo de alta qualidadeO




























