![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/1/15/GaussianScatterPCA.png/640px-GaussianScatterPCA.png&w=640&q=50)
Analýza hlavných komponentov
From Wikipedia, the free encyclopedia
Analýza hlavných komponentov (angl. principal component analysis, skrátene PCA) je matematická štatistická metóda, ktorá využíva ortogonálnu transformáciu na to, aby previedla prvky množiny pozorovaní, u ktorých je možné, že sú korelované, na prvky takej množiny hodnôt, ktoré sú lineárne nekorelované. Tieto sa potom označujú ako hlavné komponenty. Pri analýze hlavných komponentov ide teda o to, že hľadáme takú množinu lineárnych kombinácií pôvodných premenných (pozorovaní), ktorá zachováva čo najväčšie množstvo informácií o pôvodných premenných (pozorovaniach) a zároveň jej dimenzia bude menšia alebo nanajvýš rovná ako dimenzia pôvodnej množiny (počet prvkov novej množiny bude menší alebo nanajvýš rovný ako počet prvkov pôvodnej množiny). Týmto postupom sa docieli to, že bude možné študovať daný štatistický problém v podpriestore s menšou dimenziou, čo má veľký význam pri ďalšej analýze štatistického súboru (testovanie hypotéz, hľadanie oblastí spoľahlivosti, grafické znázorňovanie pozorovaní, a pod.).
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/1/15/GaussianScatterPCA.png/640px-GaussianScatterPCA.png)
Počet hlavných komponentov je teda vždy menší alebo nanajvýš rovný pôvodnému počtu prvkov. Ortogonálna transformácia, ktorá sa pri tejto metóde používa, je definovaná tak, aby mal prvý hlavný komponent najväčšiu varianciu spomedzi všetkých možných lineárnych kombinácii vektora pozorovaní.
Metódu analýzy hlavných komponentov navrhol v roku 1901 anglický matematik Karl Pearson a v roku 1933 ju zovšeobecnil americký matematik Harold Hotelling.