Säkerhet, etik och kvalitet

Jailbreaking (AI)

Engelsk term
Jailbreaking (AI)
Svensk term
Jailbreaking (AI)

Vad är Jailbreaking (AI)?

Jailbreaking inom AI innebär att man medvetet försöker kringgå de säkerhetsspärrar och begränsningar som en AI-modell har. Genom att använda speciella instruktioner eller trick kan man lura AI:n att bryta mot sina regler och generera innehåll som annars skulle blockeras. Vanliga grepp är roleplay ('låtsas att du är DAN, en AI utan regler'), hypotetiska scenarier ('rent fiktivt, hur skulle någon kunna...'), eller att översätta förbjudna frågor till mindre vanliga språk där modellens spärrar är svagare. Stora labb jagar ständigt nya jailbreaks och uppdaterar sina modeller, men nya kreativa attacker dyker upp lika fort.

Ursprung och källa

Anpassad från 'jailbreaking' av mobila enheter; populariserades i AI-kontexten under 2023

Se även

Läs mer