Överanpassning / Underanpassning
Vad är Överanpassning / Underanpassning?
Overfitting och underfitting är två vanliga sätt en AI-modell kan misslyckas med att lära sig från data. Overfitting betyder att modellen har pluggat in träningsdatan nästan utantill, inklusive slumpmässiga detaljer och brus som egentligen inte säger något om verkligheten, och därför går dåligt på nya frågor den inte sett förut. Tänk dig en student som memorerat exakt vilka svar som stod på övningsproven utan att förstå ämnet: hen får högsta betyg på övningarna men kraschar på det riktiga provet där frågorna är formulerade på nya sätt. Underfitting är motsatsen: modellen är för enkel, har tränat för kort tid eller på för lite data, och har inte ens fattat huvudmönstren. Det är studenten som knappt öppnat boken och svarar lika dåligt på övningsprovet som på det riktiga.
Det man vill ha är en modell som fångar mönstren utan att fastna i detaljerna, så att den fungerar bra på data den aldrig sett förut. Det kallas att modellen 'generaliserar'. I praktiken upptäcker man overfitting genom att prestandan är mycket bättre på träningsdatan än på ny testdata, och underfitting genom att den är dålig på båda. Det är en av de viktigaste avvägningarna i all maskininlärning och en av anledningarna till att man alltid sparar undan en bit data som modellen aldrig får se under träningen, för att kunna mäta hur den faktiskt fungerar på det okända.
Ursprung och källa
Allmänt använd sedan 1930-talet