Перейти до основного вмісту

🔓 Злом запиту

Хакерство, але для інженерії запитів

📄️ 🟢 Вступ

Злом запиту — це термін, який використовується для опису типу атаки, який використовує вразливі місця %%LLMs|LLM%%, маніпулюючи їхніми вхідними даними або запитами. На відміну від традиційного злому, який зазвичай використовує вразливості програмного забезпечення, злом запиту покладається на ретельно розроблені підказки, щоб змусити ВММ виконати ненавмисні дії.

📄️ 🟢Джейлбрейкінг

Джейлбрейкінг – це процес, у якому використовується впровадження запиту, щоб спеціально обійти безпеку і модерування функції, розміщені на ВММ їх розробниками (@perez2022jailbreak)(@brundage_2022)(@wang2022jailbreak). Джейлбрейкінг зазвичай стосується чат-ботів, в які успішно впровадили запити та які зараз перебувають у стані, коли користувач може поставити будь-яке запитання, яке забажає.