Skip to main content

๐ŸŸข Penyaringan Kata / Frasa (Filtering)

Filtering adalah teknik umum untuk mencegah peretasan prompt1. Ada beberapa jenis filtrasi, tetapi ide dasarnya adalah memeriksa kata-kata dan frasa dalam prompt awal atau keluaran yang harus diblokir. Anda dapat menggunakan daftar blokir atau daftar izin untuk tujuan ini2. Blocklist adalah daftar kata-kata dan frasa yang harus diblokir, dan allowlist adalah daftar kata-kata dan frasa yang harus diizinkan.


  1. Kang, D., Li, X., Stoica, I., Guestrin, C., Zaharia, M., & Hashimoto, T. (2023). Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks. โ†ฉ
  2. Selvi, J. (2022). Exploring Prompt Injection Attacks. https://research.nccgroup.com/2022/12/05/exploring-prompt-injection-attacks/ โ†ฉ