AI alignment
Förklaring
AI alignment handlar om att se till att AI-system agerar på ett sätt som överensstämmer med mänskliga värderingar, mål och intentioner. Om en AI inte är korrekt justerad kan den uppnå sina uppgifter på oväntade eller till och med skadliga sätt, även om den följer sina programmerade instruktioner.
Ursprung och källa
Norbert Wiener, 1960; Eliezer Yudkowsky populariserade begreppet under 2000-talet