📄️ 🟢 Вступ
Злом запиту — це термін, який використовується для опису типу атаки, який використовує вразливі місця %%LLMs|LLM%%, маніпулюючи їхніми вхідними даними або запитами. На відміну від традиційного злому, який зазвичай використовує вразливості програмного забезпечення, злом запиту покладається на ретельно розроблені підказки, щоб змусити ВММ виконати ненавмисні дії.
📄️ 🟢 Введення запитів
Введення запитів – це процес викрадення результату мовної моделі (@branch2022evaluating)(@crothers2022machine)(@goodside2022inject)(@simon2022inject). Це дозволяє хакеру змусити систему сказати все, що їм потрібно.
📄️ 🟢 Витік запиту
Витік запиту — це форма введення запиту, в якій модель просять видати свій власний запит.
📄️ 🟢Джейлбрейкінг
Джейлбрейкінг – це процес, у якому використовується впровадження запиту, щоб спеціально обійти безпеку і модерування функції, розміщені на ВММ їх розробниками (@perez2022jailbreak)(@brundage_2022)(@wang2022jailbreak). Джейлбрейкінг зазвичай стосується чат-ботів, в які успішно впровадили запити та які зараз перебувають у стані, коли користувач може поставити будь-яке запитання, яке забажає.
🗃️ 🟢 Defensive Measures
9 елемент|9 елементи|9 елементів
🗃️ 🟢 Offensive Measures
8 елемент|8 елементи|8 елементів