三级信息过滤防御体系
针对合同/医疗等敏感场景,建议配置以下防护措施:
防护层级 | 操作方法 | 效果说明 |
---|---|---|
元数据脱敏 | ingest_file(..., rules=[{"type":"metadata_extraction", "schema":{"patient_id":"redact"}}]) |
自动替换18位身份证等字段为*** |
内容清洗 | 添加规则
{"type":"natural_language", "prompt":"删除所有电话号码和邮箱"} |
基于NLP识别并清除PII信息 |
访问控制 | 在start_server.py 中启用--auth-token 参数 |
强制API调用需携带JWT令牌 |
注意事项:1)视频处理需额外调用enable_face_blur=True
2)审计日志需定期用export_audit_log()
备份。
本答案来源于文章《Morphik Core:处理多模态数据的开源 RAG 平台》