O teste de equipe vermelha com o promptfoo consiste nas seguintes etapas principais:
- Inicialização do ambiente de teste da equipe vermelha: por ordem
npx promptfoo@latest redteam initCriação de uma estrutura de teste - Configuração de cenários de testeDefinir o tipo de risco a ser detectado no arquivo de configuração gerado, como vazamento de PII, injeção imediata e outras vulnerabilidades de segurança
- Preparação de casos de testeEscreva dicas direcionadas e amostras de entrada para cobrir uma ampla gama de possíveis vetores de ataque
- executar um testeExecute o comando red team test para iniciar a varredura automatizada
- análiseExamine os relatórios detalhados gerados para identificar os pontos fracos de segurança no modelo
O recurso Red Team Testing do Promptfoo detecta os seguintes riscos principais:
- Divulgação acidental de informações de identificação pessoal (PII)
- Uso inseguro de ferramentas
- Risco de violação de dados entre sessões
- Vulnerabilidades de injeção direta e indireta de prompts
Todos os testes são executados localmente, garantindo que não haja vazamento de dados confidenciais.
Essa resposta foi extraída do artigoPromptfoo: fornecendo uma ferramenta de teste de aplicativos LLM segura e confiávelO































