Top Qs
Tijdlijn
Chat
Perspectief

Hoofdcomponentenanalyse

Van Wikipedia, de vrije encyclopedie

Remove ads

Hoofdcomponentenanalyse, of principale-componentenanalyse (afkorting: PCA), is een multivariate analysemethode in de statistiek om een grote hoeveelheid gegevens te beschrijven met een kleiner aantal relevante grootheden, de hoofdcomponenten of principale componenten.

Hoofdcomponentenanalyse werd in 1901 uitgevonden door Karl Pearson.[1]

Men spreekt van datareductie, hoewel strikt genomen de gegevens niet gereduceerd zijn, maar alleen de beschrijving ervan. Als hoofdcomponenten berekent de methode de eigenvectoren van de covariantiematrix van de gegevens en kiest daaruit de belangrijkste. Deze eigenvectoren zijn de hoofdassen van de ellipsoïde die door de covariantiematrix wordt beschreven en die min of meer de "puntenwolk" van de data voorstelt.

Hoofdcomponentenanalyse is bruikbaar als eerste stap bij een factoranalyse om het maximale aantal en de aard van de factoren te bepalen.[2]

Verwante methoden zijn correspondentieanalyse (CA) of "reciprocal averaging" (RA) en de canonische vormen van hoofdcomponentenanalyse en correspondentieanalyse: redundantieanalyse (RDA) en canonische correspondentieanalyse (CCA).[3]

Remove ads

Berekeningen

Uitgangspunt van de hoofdcomponentenanalyse is de covariantiematrix C van de gegevens. Deze matrix heeft niet-negatieve eigenwaarden.

De hoofdcomponenten zijn de orthogonale eigenvectoren van deze matrix. De eigenwaarden en bijhorende eigenvectoren kunnen bepaald worden met behulp van standaardtechnieken uit de matrixrekening. De hoofdcomponenten worden gerangschikt naar belangrijkheid volgens de bijbehorende eigenwaarden.

Er is sprake van datareductie wanneer slechts een deel van de hoofdcomponenten nodig is om de variatie in de data voldoende te verklaren.

Remove ads

Voorbeeld

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads