Hoofdcomponentenanalyse

Hoofdcomponentenanalyse, of principale-componentenanalyse (afkorting: PCA), is een multivariate analysemethode in de statistiek om een grote hoeveelheid gegevens te beschrijven met een kleiner aantal relevante grootheden, de hoofdcomponenten of principale componenten.

Hoofdcomponentenanalyse werd in 1901 uitgevonden door Karl Pearson.^[1]

Men spreekt van datareductie, hoewel strikt genomen de gegevens niet gereduceerd zijn, maar alleen de beschrijving ervan. Als hoofdcomponenten berekent de methode de eigenvectoren van de covariantiematrix van de gegevens en kiest daaruit de belangrijkste. Deze eigenvectoren zijn de hoofdassen van de ellipsoïde die door de covariantiematrix wordt beschreven en die min of meer de "puntenwolk" van de data voorstelt.

Hoofdcomponentenanalyse is bruikbaar als eerste stap bij een factoranalyse om het maximale aantal en de aard van de factoren te bepalen.^[2]

Verwante methoden zijn correspondentieanalyse (CA) of "reciprocal averaging" (RA) en de canonische vormen van hoofdcomponentenanalyse en correspondentieanalyse: redundantieanalyse (RDA) en canonische correspondentieanalyse (CCA).^[3]

[1]

[2]

[3]