Grundläggande AI-begrepp

Överanpassning / Underanpassning

Engelsk term
Overfitting / Underfitting
Svensk term
Överanpassning / Underanpassning

Vad är Överanpassning / Underanpassning?

Overfitting och underfitting är två vanliga sätt en AI-modell kan misslyckas med att lära sig från data. Overfitting betyder att modellen har pluggat in träningsdatan nästan utantill, inklusive slumpmässiga detaljer och brus som egentligen inte säger något om verkligheten, och därför går dåligt på nya frågor den inte sett förut. Tänk dig en student som memorerat exakt vilka svar som stod på övningsproven utan att förstå ämnet: hen får högsta betyg på övningarna men kraschar på det riktiga provet där frågorna är formulerade på nya sätt. Underfitting är motsatsen: modellen är för enkel, har tränat för kort tid eller på för lite data, och har inte ens fattat huvudmönstren. Det är studenten som knappt öppnat boken och svarar lika dåligt på övningsprovet som på det riktiga.

Det man vill ha är en modell som fångar mönstren utan att fastna i detaljerna, så att den fungerar bra på data den aldrig sett förut. Det kallas att modellen 'generaliserar'. I praktiken upptäcker man overfitting genom att prestandan är mycket bättre på träningsdatan än på ny testdata, och underfitting genom att den är dålig på båda. Det är en av de viktigaste avvägningarna i all maskininlärning och en av anledningarna till att man alltid sparar undan en bit data som modellen aldrig får se under träningen, för att kunna mäta hur den faktiskt fungerar på det okända.

Tre paneler med samma datapunkter. Underfitting: en rak linje som missar mönstret. Lagom: en mjuk kurva som följer trenden. Overfitting: en sicksacklinje som passerar genom varje punkt och fångar slumpmässigt brus.
Samma datapunkter, tre olika modeller. Underfitting missar mönstret helt, overfitting memorerar varje datapunkt inklusive bruset, lagom fångar trenden utan att fastna i detaljerna.

Ursprung och källa

Allmänt använd sedan 1930-talet

Se även

Läs mer