3層の情報フィルタリング防御システム
契約/医療などの機密性の高いシナリオでは、以下の保護手段を設定することを推奨する:
保護レベル | 操作方法 | 効果の説明 |
---|---|---|
メタデータ脱感作 | ingest_file(..., rules=[{"type":"metadata_extraction", "schema":{"patient_id":"redact"}}]) |
18桁のIDカードなどのフィールドを***に自動置き換え |
コンテンツクリーニング | ルールの追加
{"type":"natural_language", "prompt":"删除所有电话号码和邮箱"} |
NLPに基づくPII情報の特定と削除 |
アクセス制御 | あるstart_server.py イネーブル--auth-token パラメトリック |
APIコールにJWTトークンを持たせる |
注:1) ビデオ処理には、以下の追加呼び出しが必要です。enable_face_blur=True
2) 監査ログは定期的に使用する必要があるexport_audit_log()
バックアップ
この答えは記事から得たものである。Morphik Core:マルチモーダルデータ処理のためのオープンソースRAGプラットフォームについて