O Sensitive-lexicon é um projeto de léxico sensível chinês de código aberto que fornece uma lista de dezenas de milhares de palavras em um arquivo de texto simples. O léxico abrange política, pornografia, violência e outras áreas sensíveis do mainstream, e é continuamente atualizado por meio de contribuições da comunidade. O objetivo do projeto é ajudar os desenvolvedores e gerentes de conteúdo a integrar rapidamente a funcionalidade básica de revisão de texto.
Os recursos incluem ampla cobertura de vocabulário, atualizações orientadas pela comunidade, facilidade de integração e uso de várias implementações. Por ser um arquivo de texto simples, ele é altamente compatível e pode ser lido por qualquer linguagem de programação e estrutura, além de oferecer suporte a algoritmos como DFA, árvores Trie ou expressões regulares para filtragem de conteúdo.
Essa resposta foi extraída do artigoSensitive-lexicon: um dicionário de sinônimos continuamente atualizado para palavras sensíveis em chinêsO