Pular para o conteúdo principal

🟢 Defesa do Tipo Sanduíche

A defesa do tipo sanduíche1 consiste em colocar a entrada do usuário entre dois prompts. Tome o seguinte prompt como exemplo:

Traduza o seguinte para o francês: {{user_input}}

Ele pode ser aprimorado com a defesa de sanduíche:

Traduza o seguinte para o francês:

{{user_input}} Lembre-se de que você está traduzindo o texto acima para o francês.

Essa defesa deve ser mais segura do que a pós-prompting, mas é conhecida por ser vulnerável a um ataque de dicionário definido. Consulte ataque de dicionário definido para mais informações.


  1. Atualmente, atribuímos a descoberta dessa técnica a Altryne