Cronbachs alfa
Van Wikipedia, de vrije encyclopedie
Cronbachs α (alfa) is een maat voor de betrouwbaarheid van psychometrische tests of van vragenlijsten.[1] De waarde van is een schatting voor de ondergrens van de betrouwbaarheid van de betrokken test. Om een schatting te bepalen van de betrouwbaarheid van een test zijn ten minste twee testafnames nodig. Op basis van één testafname kan Cronbachs berekend worden om zo een schatting van de ondergrens te verkrijgen. Cronbachs hangt af van het aantal items of vragen in de test, de gemiddelde covariantie tussen de items en de spreiding van de somscore.[2]
Cronbachs is ontwikkeld door Lee Cronbach, die hem in 1951 voor het eerst gebruikte. Andere, verwante maten zijn de Kuder-Richardson Formule 20, kortweg KR-20, en lambda-2 van Guttman.
Cronbachs kan waarden aannemen van minus oneindig tot 1 (waarbij wordt opgemerkt dat alleen positieve waarden zinvol zijn). Als vuistregel wordt vaak gehanteerd dat een test of onderzoeksvragenlijst bruikbaar is bij een van 0,70 of hoger, hoewel de gebruiken verschillen per onderzoeksdiscipline. Intelligentietests hebben vaak een hogere waarde voor dan tests voor attitude of persoonlijkheid.
In de psychologie en sociologie wordt Cronbachs frequent toegepast, maar ook in andere wetenschappen is het een belangrijke maat.
Om duidelijk te maken dat Cronbachs een schatting is van de betrouwbaarheid die is gebaseerd op louter één testafname, wordt ook wel gezegd dat Cronbachs een schatting is van de interne consistentie van een instrument. Deze term wordt helaas vaak verkeerd begrepen, namelijk als indicator van constructvaliditeit of dimensionaliteit. Clustering van items is echter niet terug te zien in de waarde van , omdat er bij de berekening van gebruik wordt gemaakt van de gemiddelde covariantie. Mede daarom is het geen goede maat voor dimensionaliteit/factor structuur. Een hoge waarde van impliceert dus niet noodzakelijkerwijs dat de test enkel één construct meet. Daarom raden verschillende auteurs aan om de term interne consistentie te vermijden. Als men een uitspraak wil doen over de dimensionaliteit van een test, is het beter om factoranalyse of item respons theorie[3] te gebruiken.
Definitie
Samenvatten
Perspectief
In de klassieke testtheorie wordt de score op een test bepaald als het totaal van de scores op afzonderlijke items:
De score op item wordt daarin opgevat als de som van de true score en een storingsterm, de error score, :
daarin zijn de true score en de error score ongecorreleerd, en ook worden de error scores van de verschillende items als ongecorreleerd beschouwd. Bovendien is de verwachte error score 0:
De variantie van de totale score kan uiteengelegd worden in:
De onbetrouwbaarheid in de testscore vindt z'n oorzaak in de varianties van de true scores en de error scores. Daarom kan de betrouwbaarheid worden afgemeten aan:
Deze parameter is maximaal gelijk aan . Zie ter illustratie Voorbeeld 1. Ter normering wordt de betrouwbaarheid daarom gedefinieerd als:
De waarde van de betrouwbaarheid is maximaal 1 en naar beneden onbegrensd. Het is deze parameter waarvan Cronbachs een schatting geeft.
- ,
daarin stellen de verschillende respectievelijk de steekproefvarianties voor van de totale score en de scores op de items .
Als de score is van testpersoon op item en er zijn testpersonen, dan zijn de benodigde formules:
waarin
de gemiddelde score op item is, en
waarin
de testscore van testpersoon is.
Voorbeeld
Een eenvoudig getallenvoorbeeld demonstreert de berekeningen. In de tabel staan van 3 items () de itemscores van 5 testpersonen () en als rijsom de testscores .
item | 1 | 2 | 3 | rijsom |
---|---|---|---|---|
itemscore | testscore | |||
testpersoon | ||||
1 | 4 | 3 | 5 | 12 |
2 | 2 | 0 | 3 | 5 |
3 | 1 | 1 | 2 | 4 |
4 | 3 | 2 | 4 | 9 |
5 | 4 | 2 | 3 | 9 |
variantie | 10,70 | |||
variantie | 1,7 | 1,3 | 1,3 | 4,30 |
In de onderste rijen staat de variantie van de 5 testscores en de 3 varianties van de itemscores met hun totaal . Voor berekenen we dan:
Gestandaardiseerde items
Samenvatten
Perspectief
Als de items gestandaardiseerd zijn, dat wil zeggen met variantie 1, kan de betrouwbaarheid geschreven worden als:
Als schatter kan dan gebruikt worden:
Hierin staat voor de gemiddelde onderlinge steekproefcorrelatie tussen de items.
Gebruik
Wikiwand - on
Seamless Wikipedia browsing. On steroids.