Sensitive-lexicon ist ein quelloffenes chinesisches Lexikonprojekt für sensible Begriffe, das eine Liste von Zehntausenden von Wörtern in einer einfachen Textdatei enthält. Das Lexikon deckt Politik, Pornografie, Gewalt und andere sensible Bereiche ab und wird durch Beiträge der Gemeinschaft ständig aktualisiert. Das Projekt zielt darauf ab, Entwicklern und Content-Managern dabei zu helfen, schnell grundlegende Textüberprüfungsfunktionen zu integrieren.
Zu den Merkmalen gehören die umfassende Abdeckung des Vokabulars, von der Gemeinschaft betriebene Aktualisierungen, einfache Integration und die Verwendung mehrerer Implementierungen. Da es sich um eine reine Textdatei handelt, ist sie in hohem Maße kompatibel und kann von jeder Programmiersprache und jedem Framework gelesen werden. Sie unterstützt Algorithmen wie DFA, Trie-Bäume oder reguläre Ausdrücke zur Filterung von Inhalten.
Diese Antwort stammt aus dem ArtikelSensitiv-Lexikon: ein ständig aktualisierter Thesaurus für chinesische sensible WörterDie