3層の情報フィルタリング防御システム
契約/医療などの機密性の高いシナリオでは、以下の保護手段を設定することを推奨する:
| 保護レベル | 操作方法 | 効果の説明 |
|---|---|---|
| メタデータ脱感作 | ingest_file(..., rules=[{"type":"metadata_extraction", "schema":{"patient_id":"redact"}}]) |
18桁のIDカードなどのフィールドを***に自動置き換え |
| コンテンツクリーニング | ルールの追加
{"type":"natural_language",
"prompt":"删除所有电话号码和邮箱"}
|
NLPに基づくPII情報の特定と削除 |
| アクセス制御 | あるstart_server.pyイネーブル--auth-tokenパラメトリック |
APIコールにJWTトークンを持たせる |
注:1) ビデオ処理には、以下の追加呼び出しが必要です。enable_face_blur=True 2) 監査ログは定期的に使用する必要があるexport_audit_log()バックアップ
この答えは記事から得たものである。Morphik Core:マルチモーダルデータ処理のためのオープンソースRAGプラットフォームについて































