As etapas a seguir são necessárias para instalar o realtime-transcription-fastrtc:
Preparação do ambiente do sistema
- Certifique-se de que o Python ≥3.10 esteja instalado
- Instale o ffmpeg para processamento de áudio (macOS via brew, Linux via apt, Windows requer configuração manual)
- A aceleração de GPU (MPS ou CUDA) é recomendada; a CPU pode ser executada, mas com desempenho inferior
Processo de implantação do projeto
- Armazém de Clonagem:
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- Criação de ambientes virtuais: a ferramenta uv é recomendada (ou o método pip tradicional)
- Dependências de instalação: executar
uv pip install -r requirements.txt
ou o comando pip correspondente
- Arquivo Configuration.env: defina UI_MODE, APP_MODE, MODEL_ID e outros parâmetros importantes
Descrição da configuração da chave
- UI_MODE:: gradio (interface simples) ou fastapi (interface personalizável)
- MODELO_IDDescrição: openai/whisper-large-v3-turbo é usado por padrão e pode ser substituído por outros modelos de Hugging Face.
- PORTOPorta de execução do serviço, padrão 7860
- Certifique-se de que o Python ≥3.10 esteja instalado
- Instale o ffmpeg para processamento de áudio (macOS via brew, Linux via apt, Windows requer configuração manual)
- A aceleração de GPU (MPS ou CUDA) é recomendada; a CPU pode ser executada, mas com desempenho inferior
Processo de implantação do projeto
- Armazém de Clonagem:
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- Criação de ambientes virtuais: a ferramenta uv é recomendada (ou o método pip tradicional)
- Dependências de instalação: executar
uv pip install -r requirements.txt
ou o comando pip correspondente
- Arquivo Configuration.env: defina UI_MODE, APP_MODE, MODEL_ID e outros parâmetros importantes
Descrição da configuração da chave
- UI_MODE:: gradio (interface simples) ou fastapi (interface personalizável)
- MODELO_IDDescrição: openai/whisper-large-v3-turbo é usado por padrão e pode ser substituído por outros modelos de Hugging Face.
- PORTOPorta de execução do serviço, padrão 7860
- Armazém de Clonagem:
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- Criação de ambientes virtuais: a ferramenta uv é recomendada (ou o método pip tradicional)
- Dependências de instalação: executar
uv pip install -r requirements.txt
ou o comando pip correspondente - Arquivo Configuration.env: defina UI_MODE, APP_MODE, MODEL_ID e outros parâmetros importantes
Descrição da configuração da chave
- UI_MODE:: gradio (interface simples) ou fastapi (interface personalizável)
- MODELO_IDDescrição: openai/whisper-large-v3-turbo é usado por padrão e pode ser substituído por outros modelos de Hugging Face.
- PORTOPorta de execução do serviço, padrão 7860
- UI_MODE:: gradio (interface simples) ou fastapi (interface personalizável)
- MODELO_IDDescrição: openai/whisper-large-v3-turbo é usado por padrão e pode ser substituído por outros modelos de Hugging Face.
- PORTOPorta de execução do serviço, padrão 7860
Após concluir a configuração, execute o comandopython main.py
Inicie o serviço e use-o acessando a URL exibida no terminal por meio de um navegador.
Essa resposta foi extraída do artigoFerramenta de código aberto para conversão de fala em texto em tempo realO