Programa técnico para integração de sistemas de conferência
Para fazer a interface da ferramenta com um sistema de conferência de nível empresarial, como o Zoom/Teams, são recomendados três métodos de integração:
- Soluções de plug-in para navegadores::
- Capturando o áudio da guia com a API de extensão do Chrome
- Interação com serviços de transcrição locais via WebSocket
- As legendas de saída são injetadas na página por meio de CSS
- Ciclo de desenvolvimento: 1-2 semanas
- Roteamento de áudio em nível de sistema(São necessários privilégios de administrador):
- Configuração da placa de som virtual VB-Cable no Windows
- Roteamento de áudio com o BlackHole para macOS
- Capturando o áudio do sistema com o Python-sounddevice
- Ciclo de desenvolvimento: 3 a 5 dias
- Integração profunda em nível de API::
- Interface com APIs de software de conferência (por exemplo, Zoom SDK)
- Obtenção do fluxo de áudio bruto (RTP/RTCP)
- Desenvolvimento de gateways WebRTC personalizados
- Ciclo de desenvolvimento: 4 a 6 semanas
Validar rapidamente as recomendações:
1. instalar o cabo de áudio virtual
2. saída do software de conferência para a entrada CABLE
3. item definido como dispositivo de entrada CABLE Output
Os testes mostraram que a latência do esquema pode ser controlada em até 800 ms, com precisão comparável à entrada direta do microfone.
Essa resposta foi extraída do artigoFerramenta de código aberto para conversão de fala em texto em tempo realO
































