📄️ 🟢 Introduction
Prompt hacking is a term used to describe a type of attack that exploits the vulnerabilities of %%LLMs|LLM%%, by manipulating their inputs or prompts. Unlike traditional hacking, which typically exploits software vulnerabilities, prompt hacking relies on carefully crafting prompts to deceive the LLM into performing unintended actions.
📄️ 🟢 Inyección de Prompt
La inyección de prompt es una técnica utilizada para secuestrar la salida de un modelo de lenguaje (@branch2022evaluating) (@crothers2022machine) (@goodside2022inject) (@simon2022inject).
📄️ 🟢 Fuga de Prompt
La fuga de prompt es una forma de inyección de prompt en la que se le pide al modelo que genere su propio prompt.
📄️ 🟢 Jailbreaking
El Jailbreaking es un tipo de inyección de prompt, en la cual los prompts intentan pasar por alto las características de seguridad y moderación colocadas en los LLM por sus creadores (@perez2022jailbreak) (@brundage_2022) (@wang2022jailbreak).
🗃️ 🟢 Defensive Measures
9 items
🗃️ 🟢 Offensive Measures
8 items