O Sensitive-lexicon oferece aos desenvolvedores flexibilidade na seleção de algoritmos. Dependendo dos requisitos de desempenho, é possível escolher entre a correspondência de expressões regulares básicas ou implementações eficientes de DFA/árvore Trie. As expressões regulares são adequadas para cenários com pequenos volumes de texto, enquanto as árvores DFA e Trie são mais adequadas para ambientes de produção altamente simultâneos.
A escolha do algoritmo afeta diretamente a eficiência da filtragem: a expressão regular é simples e fácil de implementar, mas o desempenho é baixo; a complexidade do tempo de correspondência do algoritmo DFA é proporcional ao comprimento do texto a ser correspondido, independentemente do tamanho do tesauro; a árvore Trie também é altamente eficiente e oferece suporte à correspondência de prefixos. O documento do projeto fornece orientação para o algoritmo, mas não limita a implementação específica; os desenvolvedores podem ser otimizados livremente de acordo com os cenários comerciais.
Essa resposta foi extraída do artigoSensitive-lexicon: um dicionário de sinônimos continuamente atualizado para palavras sensíveis em chinêsO