Usar uma CDN para trazer o vosk-browser é a forma mais rápida de integração, dividida nas etapas a seguir:
- Apresentando os scriptsNo arquivo HTML<head>talvez<body>Adicione um link de CDN ao
<script src=’https://cdn.jsdelivr.net/npm/vosk-browser@0.0.5/dist/vosk.js’></script> - Modelos de carregamentoFaça o download do zip .tar.gz para o idioma correspondente no repositório oficial do modelo (por exemplo, https://ccoreilly.github.io/vosk-browser/models/)
- Inicialização::
1. carregamento assíncrono de arquivos de modelo por meio do Vosk.createModel()
2. criar instâncias do AudioContext e do reconhecedor
3. chame getUserMedia para obter privilégios de microfone.
4. criar um pipeline de transferência de dados de áudio por meio do createTransferer
Observação: a versão mais recente é a 0.0.8. Recomenda-se verificar se há atualizações pelo jsDelivr. Os modelos pequenos em inglês (por exemplo, vosk-model-small-en-us) têm cerca de 50 MB, adequados para testes rápidos.
Essa resposta foi extraída do artigoVosk-Browser: ferramenta de reconhecimento de fala executada em um navegadorO