安全防护方案
利用SDK的Guardrails机制建立三级防护:
- 事前检查层:
- 使用
@input_guardrail
装饰器创建预检函数 - 通过专用智能体(如
guardrail_agent
)分析输入敏感度 - 定义
Pydantic
模型规范检查输出格式
- 使用
- 过程控制层:
- 设置
tripwire_triggered
阈值触发中断 - 针对高风险操作(如数学计算)返回
403
状态码
- 设置
- 事后审计层:
- 结合
Tracing
功能记录完整交互日志 - 对触发的guardrail事件进行标记存储
- 结合
实施示例:创建数学作业检测守卫时,建议设置reasoning
字段说明拦截原因,既阻止请求又提升用户体验。
本答案来源于文章《OpenAI Agents SDK:搭建多智能体协作工作流的Python框架》