Sensitive-lexiconは、プレーンテキストファイル(.txt)形式で提供されるオープンソースの中国の機密シソーラスプロジェクトであり、数万語を含んでいる。このプロジェクトの主な目的は、開発者やコンテンツ管理者が、政治的、ポルノ、暴力的、その他のセンシティブなコンテンツをフィルタリングするようなテキスト監査機能を、アプリケーションやウェブサイトに素早く統合できるようにすることである。このプロジェクトは、コミュニティへの投稿メカニズムを通じてシソーラスを継続的に更新し、DFA、トライツリー、その他のアルゴリズムによる効率的なマッチングをサポートしています。
この答えは記事から得たものである。Sensitive-lexicon: 継続的に更新される中国語敏感語シソーラスについて