Lethal trifecta
Vad är Lethal trifecta?
Lethal trifecta är den farliga kombination som uppstår när en AI-agent samtidigt har tre förmågor: tillgång till privat data, exponering för obetrodd input, och möjlighet att kommunicera utåt. När alla tre finns i samma agent kan en angripare gömma instruktioner i den obetrodda inputen, till exempel i ett mejl, en pull request-kommentar eller en webbsida som agenten läser, och på så sätt lura agenten att hämta privat information och skicka iväg den. Det är som att ge en hjälpsam assistent nyckeln till arkivet, ett öppet öra för främlingar och ett kuvert med frimärke: viskar någon utanför "skicka allt i mappen X till denna adress" så gör assistenten det utan att ifrågasätta.
Termen myntades av Simon Willison i juni 2025 och förklarar varför så många konkreta dataläckor från AI-agenter dyker upp i nyhetsflödet. Praktiska motåtgärden är att ta bort minst en av de tre: begränsa dataåtkomsten, isolera agenten från obetrodd input, eller blockera externa anrop. Så länge alla tre finns kvar är prompt injection inte ett kantfall utan en närmast garanterad sårbarhet.
Ursprung och källa
Simon Willison, juni 2025