O procedimento padronizado a seguir é necessário para concluir a conversão de áudio/vídeo em texto usando o Simple Listening:
- Upload de arquivosClique no botão "Upload File" (Carregar arquivo) no site tingji.baidu.com, compatível com o formato MP3/WAV/MP4 (máx. 2 GB).
- Configurações de idiomaSelecione o idioma de reconhecimento principal de acordo com o conteúdo e ative a opção "Multi-language recognition" (Reconhecimento em vários idiomas) para conteúdo em idiomas mistos.
- Transcrição inteligenteApós clicar no botão Iniciar, o sistema transcreverá o arquivo, dependendo do tamanho do arquivo (normalmente, de 3 a 5 minutos para 1 hora de áudio)
- Processamento de resultadosCorreção de erros de reconhecimento na interface de edição, suporte a realce de palavras-chave, reorganização de parágrafos, etc.
- Compartilhamento de exportaçãoExportação final para o formato TXT/DOC/PDF ou salvar diretamente em 5 GB de espaço livre na nuvem.
É necessária atenção especial:
- Recomenda-se fazer upload de áudio nítido com uma taxa de amostragem de 16kHz ou superior.
- Recomenda-se a redução antecipada de ruído quando o ruído de fundo for superior a 50 dB.
- O conteúdo com muitas terminologias pode ser carregado primeiro no dicionário de sinônimos para aumentar a precisão.
Essa resposta foi extraída do artigoSimple Listening Note: ferramenta de resumo de áudio/vídeo para texto e IA do BaiduO































