As etapas principais a seguir precisam ser concluídas para instalar o SpeechGPT 2.0-preview:
- Repositório de código clone::
git clone https://github.com/OpenMOSS/SpeechGPT-2.0-preview.git
cd SpeechGPT-2.0-preview - Download dos pesos do modelo(o git-lfs precisa ser pré-instalado):
git lfs install
git clone https://huggingface.co/fnlp/SpeechGPT-2.0-preview-Codec
git clone https://huggingface.co/fnlp/SpeechGPT-2.0-preview-7B - Configuração do ambiente Python::
pip3 install -r requirements.txt
pip3 install flash-attn==2.7.3 --no-build-isolation - Iniciando a demonstração do Gradio::
python3 demo_gradio.py --codec_ckpt_path SpeechGPT-2.0-preview-Codec/sg2_codec_ckpt.pkl --model_path SpeechGPT-2.0-preview-7B/
Todo o processo requer um ambiente Python 3.8+, uma placa de vídeo NVIDIA (recomenda-se ≥24 GB de RAM) e uma conexão estável com a Internet. A primeira execução fará o download automático das dependências e poderá levar muito tempo.
Essa resposta foi extraída do artigoSpeechGPT 2.0-preview: um macromodelo de diálogo de fala antropomórfico de ponta a ponta para interação em tempo realO































