O Sensitive-lexicon é um projeto de thesaurus chinês sensível de código aberto, fornecido em formato de arquivo de texto simples (.txt), que inclui dezenas de milhares de palavras. Seu principal objetivo é ajudar os desenvolvedores e gerentes de conteúdo a integrar rapidamente recursos de auditoria de texto em aplicativos ou sites, como filtragem de conteúdo político, pornográfico, violento e outros conteúdos sensíveis. O projeto atualiza continuamente o tesauro por meio do mecanismo de contribuição da comunidade e oferece suporte à correspondência eficiente por meio de DFA, árvore Trie e outros algoritmos, apresentando um formato comum e abertura e transparência.
Essa resposta foi extraída do artigoSensitive-lexicon: um dicionário de sinônimos continuamente atualizado para palavras sensíveis em chinêsO