Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

O Easy-Voice-Toolkit é um kit de ferramentas versátil baseado no Projeto de Fala de Código Aberto que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva, conforme necessário, ou usá-las sequencialmente para converter gradualmente arquivos de áudio brutos em modelos de fala ideais. O kit de ferramentas é compatível com a implantação local e os usuários podem fazer o download de um pacote de instalação leve ou de um pacote portátil para uso.

 

Easy Voice Toolkit:本地部署的AI语音工具箱-1

 

 

Lista de funções

  • processamento de áudio

Easy Voice Toolkit:本地部署的AI语音工具箱-1

 

  • reconhecimento de fala

Easy Voice Toolkit:本地部署的AI语音工具箱-1

 

  • transcrição de voz

Easy Voice Toolkit:本地部署的AI语音工具箱-1

 

  • Criação de conjunto de dados (conversão de SRT e divisão de WAV)

Easy Voice Toolkit:本地部署的AI语音工具箱-1

 

  • treinamento de modelos

Easy Voice Toolkit:本地部署的AI语音工具箱-1

 

  • síntese de fala

Easy Voice Toolkit:本地部署的AI语音工具箱-1

 

Usando a Ajuda

Processo de instalação:

  1. Download do instalador levePacotes pequenos que contêm instruções de instalação, mas não contêm as dependências e os modelos de ambiente necessários.
  2. Download do estojo de transporte pronto para usoPacote grande com todas as dependências de ambiente e várias predefinições de modelo, baixe e descompacte para usar.

本地部署 – 用户安装:

  1. Faça o download do pacote de instalação leve ou do pacote portátil pronto para uso.
  2. Descompacte o arquivo baixado.
  3. estar em movimento .exe ou seu atalho.

本地部署 – 开发者设置环境:

  1. Certifique-se de que o Python 3.8 ou posterior esteja instalado.
  2. Clonagem do Project Warehouse:
    git clone https://github.com/Spr-Aachen/Easy-Voice-Toolkit.git
    
  3. Mude para o diretório do projeto:
    cd Easy-Voice-Toolkit
    
  4. Instalar dependências:
    pip install -r requirements.txt
    
  5. Instale as dependências da GUI:
    pip install pyside6 QEasyWidgets pywin32==300 psutil pynvml darkdetect PyGithub
    
  6. Executar o programa:
    python Run.py
    

Fluxo de operação funcional:

  1. processamento de áudioImportar o arquivo de áudio, selecionar as ferramentas de processamento desejadas (por exemplo, redução de ruído, edição, etc.), aplicar o processamento e salvar o resultado.
  2. reconhecimento de falaImportar o arquivo de áudio, selecionar o modelo de reconhecimento de fala, executar o reconhecimento e exportar os resultados do texto.
  3. transcrição de vozImportar o arquivo de áudio, selecionar a ferramenta de transcrição, executar a transcrição e exportar o arquivo de legenda (por exemplo, SRT).
  4. Produção de conjuntos de dadosImportar arquivos de áudio, selecionar a ferramenta de criação de conjunto de dados e realizar a conversão SRT ou a divisão WAV para gerar um conjunto de dados de treinamento.
  5. treinamento de modelosImportar o conjunto de dados de treinamento, selecionar a ferramenta de treinamento do modelo, configurar os parâmetros de treinamento, executar o treinamento e salvar o modelo.
  6. transcrição fonéticaImportar arquivos de áudio, selecionar a ferramenta de conversão de voz, configurar os parâmetros de conversão, executar a conversão e salvar o resultado.

advertência

  • Atualmente, a interface da interface do usuário é compatível apenas com sistemas Windows.
  • Garanta uma conexão estável com a Internet durante o download e o uso.
  • Se você tiver problemas, consulte as instruções e as perguntas frequentes no repositório do projeto.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil