promptfooによるレッドチームテストは、主に以下のステップで構成される:
- レッドチームのテスト環境を初期化する順序によって
npx promptfoo@latest redteam initテストフレームワークの作成 - テストシナリオの設定PII漏洩、プロンプトインジェクション、その他のセキュリティ脆弱性など、生成されたコンフィギュレーションファイルで検出されるリスクのタイプを定義します。
- テストケースの準備幅広い攻撃ベクトルをカバーするために、標的となるキューと入力サンプルを記述する。
- テストを実行するレッドチーム・テスト・コマンドを実行し、自動スキャンを開始する。
- 分析生成された詳細なレポートを調べて、モデルのセキュリティ上の弱点を特定する。
プロンプトフーのレッドチームテスト機能は、以下の主要なリスクを検出します:
- 個人を特定できる情報(PII)の偶発的な開示
- 安全でない工具の使用
- クロスセッションのデータ漏洩リスク
- 直接・間接プロンプト・インジェクション脆弱性
すべてのテストはローカルで実行されるため、機密データが漏れることはない。
この答えは記事から得たものである。プロンプトフー:安全で信頼性の高いLLMアプリケーションテストツールの提供について































