Sistema de gerenciamento de terminologia configurável
Para documentos técnicos, cursos acadêmicos e outros conteúdos profissionais, a KrillinAI desenvolveu um sistema de substituição de termos baseado em mecanismos de regras. O fluxo de trabalho do sistema inclui:
- Fase de pré-carregamento: criação da tabela de mapeamento de terminologia por meio do arquivo de configuração config.toml
- Fase de processamento: inserção do módulo de substituição de terminologia no pipeline de tradução
- Fase de validação: uso de um algoritmo de verificação para garantir que a substituição de termos não afete a estrutura sintática da frase
Exemplos práticos mostram que, na tradução de vídeos médicos, o sistema pode converter com precisão "CT" em "tomografia computadorizada" e ajustar automaticamente o uso de artigos (por exemplo, a/an em inglês). Os desenvolvedores usaram um algoritmo de correspondência bidirecional:
- A correspondência direta prioriza termos completos (por exemplo, "AI model" → "Artificial Intelligence model").
- Correspondência reversa para lidar com alterações de raiz (por exemplo, "models" → "modelling")
O recurso oferece suporte à configuração de expressões regulares para lidar com regras de substituição mais complexas. O sistema reconhece mais de 200 termos de alta frequência no campo da ciência e tecnologia por padrão, que podem ser expandidos infinitamente pelo usuário por meio de dicionários personalizados.
Essa resposta foi extraída do artigoKrillinAIO