En statistisk modell

SALSA är en regressionsmodell som tar hänsyn till vissa bakgrundsfaktorer. Ett modellberäknat resultat beräknas för respektive resultatmått andel elever som uppnått kunskapskraven och genomsnittligt meritvärde, vilket ger två regressionsmodeller.

Bakgrundsfaktorerna utgörs av föräldrarnas genomsnittliga utbildningsnivå, andel nyinvandrade elever samt andelen pojkar. Bakgrundsfaktorerna förklarar en del av variationen i skolornas resultat.

Till och med SALSA 2012 var utländsk bakgrund representerad i SALSA genom andel elever som är födda utomlands samt andel elever vars föräldrar är födda utomlands. Det illustreras som modell 1 för åren 1998-2012. I SALSA 2013 och 2014 ändrades utländsk bakgrund till att vara andel nyinvandrade elever. Det illustreras som modell 2 för åren 2013 och 2014. I SALSA 2015 och 2017 ingår elever med okänd bakgrund i kategorin nyinvandrade elever, vilket illustreras som modell 3. Före 2015 var elever med okänd medräknade som svensk bakgrund då de utgjorde en liten andel. Elever med okänd bakgrund saknar uppgift om personnummer om de tex inte har blivit folkbokförda i Sverige. I SALSA 2016 var elever med okänd bakgrund exkluderade från sammanställningen, illustrerat som modell 4. Skälet till det var att i möjligaste mån minska risken för missvisande jämförelser över tid samt mellan skolor. För mer information läs berörda rapporter samt analysstöd och PM om slutbetyg för läsåret 2015/16. I SALSA ingår samtliga elever som avslutat årskurs 9 oavsett om de har uppgift om personnummer eller inte, med undantag för SALSA 2016.

Från och med SALSA 2015 har ett genomsnittligt meritvärde utökats till att vara max 17 ämnen, istället för 16 ämnen som tidigare. Den förändringen har genomförts i och med att elever som har godkänt betyg i moderna språk som språkval kan lägga till det till övriga 16 godkända ämnen i ansökan till gymnasiet från och med året 2014. Resultatmåttet andel elever som uppnått kunskapskraven är elever som har godkända betyg, A-E, i samtliga ämnen. Innan året 2013, med den tidigare betygsskalan G/VG/MVG, benämndes det som andel elever som nått målen. Respektive modell 1, 2, 3 och 4 består i sin tur av två modeller, det vill säga en för var och en av resultatmåtten andel elever som uppnått kunskapskraven och genomsnittligt meritvärde.

Regressionsmodellerna ger standardiserade koefficienter som visar hur mycket respektive bakgrundsfaktor påverkar betygsresultatet, när övriga bakgrundsfaktorer hålls konstanta. Koefficienterna tillsammans skattar skolornas resultat i modellen.

Hur mycket påverkar bakgrundsfaktorerna?

I modellen är det skolor med hög andel elever med högutbildade föräldrar som har högre sannolikhet för goda betygsresultat i årskurs 9. Motsatt effekt har skolor med hög andel elever som är nyinvandrade de senaste fyra åren eller har okänd bakgrund, vilka har svagare betygsresultat i årskurs 9. Det uppskattas även hur bra modellen är som helhet, dvs. hur stor del av variationen i betygsresultatet som förklaras av bakgrundsfaktorerna.

I figur 1 illustreras hur stor påverkan varje bakgrundsvariabel har på den beroende variabeln genomsnittligt meritvärde, i modellen och över tid. Det visas med hjälp av standardiserade regressionskoefficienter. En standardiserad regressionskoefficient anger hur många standardavvikelser den beroende variabeln ändras för varje ändring av en standardavvikelse i den förklarande variabeln.

Figur 1. SALSA och effekten av bakgrundsfaktorer på det genomsnittliga meritvärdet, för skolor åren 2000–2017. Genomsnittligt meritvärde beräknas för max 16 ämnen till och med 2014 respektive max 17 ämnen från och med 2015.

Standardiserade regressionskoefficienter

Figuren visar att bakgrundsvariabeln högutbildade föräldrar har haft störst positiv påverkan på den beroende variabeln genomsnittligt meritvärde sedan 2000. Det stämmer överens med motsvarande analys för den beroende variabeln andel elever som uppnått kunskapskraven för lägst godkänt betyg. Näst störst påverkan har andelen elever som är nyinvandrade alternativt kombinerat med dem som har okänd bakgrund, tillika den tidigare faktorn födda utomlands. Den påverkan är istället negativ och inte alls lika stor.

Figur 2 är en uppskattning av hur bra modellerna är som helhet över tid. Det är justerade förklaringsgrader som visar hur stor del av variationen i betygsresultatet som förklaras av bakgrundsfaktorerna.

Figur 2. SALSA och den justerade förklaringsgraden i respektive modell; genomsnittligt meritvärde och andel elever som uppnått kunskapskraven i alla ämnen. För skolor åren 2000–2015. Modell 1 (1998–2012), modell 2 (2013–2014), modell 3 (2015 och 2017) samt modell 4 (2016).

Justerad förklaringsgrad

I figuren ses att den justerade förklaringsgraden har ökat sedan året 1998 för både genomsnittligt meritvärde och andel elever som uppnått kunskapskraven i alla ämnen, oavsett förändringar i bakgrundsvariablerna. Förändringen av bakgrundsvariabeln utländsk bakgrund i modell 2 respektive modell 3 har också stärkt den justerade förklaringsgraden. Det betyder att oavsett vilket betygsresultat förklarar alla bakgrundsvariabler mer av variansen för varje år sedan året 1998. Modellresultaten för både genomsnittligt meritvärde respektive andel elever som uppnått kunskapskraven i alla ämnen har dessutom närmat sig varandra. Året 2015 förklarar respektive modell lika mycket av variansen. Året 2016 är förklaringsgraderna för de två resultatmodellerna fortsatt lika men de har sjunkit sedan tidigare läsår men är samtidigt i linje med åren innan 2015. Det ska ännu en gång noteras att populationen till viss del är annorlunda i modell 4 då elever som har okänd bakgrund inte ingår i beräkningen av SALSA. Förklaringsgraden i SALSA 2017 för de två resultatmodellerna är fortsatt lika och har stigit till strax under 70 procent.

De bakgrundsfaktorer som ingår i den statistiska modellen året 2017 för genomsnittligt meritvärde förklarar 70 % av variationen i skolors resultat medan 30 % av variationen beror på andra faktorer. SALSA baserat på betygsresultaten året 1998 hade förklaringsgraden 43 procent. Modellen för andelen som uppnått kunskapskraven förklarar 68 % av variationen i skolors resultat året 2017. Motsvarande förklaringsgrad 1997/98 var 13 %.

Senast granskad: 2017-12-19
Innehållsansvar: Avdelningen för analys