En İyi Sorular
Zaman Çizelgesi
Sohbet
Bakış Açıları
Temel bileşen analizi
Vikipedi'den, özgür ansiklopediden
Remove ads
İstatistikte, temel bileşen analizi (TBA), çok boyutlu uzaydaki bir verinin daha düşük boyutlu bir uzaya izdüşümünü, varyansı maksimize edecek şekilde bulma yöntemidir.[1] Uzayda bir noktalar kümesi için, tüm noktalara ortalama uzaklığı en az olan "en uygun doğru" seçilir. Daha sonra bu doğruya dik olanlar arasından yine en uygun doğru seçilerek, bu adımlar, yeni bir boyutun varyansı belirli bir eşiğin altına inene kadar tekrarlanır. Bu sürecin sonunda elde edilen doğrular, bir doğrusal uzayın tabanlarını oluşturur. Bu taban vektörlerine temel bileşen denir. Verinin temel bileşenleri birbirinden bağımsız olur.

Bu kavram bazen orijinal terimin kısaltması olan PCA (İngilizce: Principal component analysis) olarak da anılır.
TBA'nın ana kullanım amaçları keşifsel veri analizi[2] yapmak ve kestirimsel modeller[3] oluşturmaktır. Genetikte, iki nüfus arasındaki yakınlığı ve benzerliği görselleştirmek için kullanılır.
Remove ads
Temel bileşen analizi, 1901 yılında Karl Pearson tarafından geliştirilen ve daha sonra 1930'larda Harold Hotelling tarafından genişletilen bir tekniktir.[4] TBA, istatistik ve makine öğrenmesi alanlarında yaygın olarak kullanılır ve veri indirgeme, görüntü işleme, yüz tanıma, genetik analiz gibi birçok alanda uygulanır.
TBA, doğrusal cebir ve istatistiksel kavramlara dayanmaktadır. Temel bileşenler, verinin kovaryans matrisinin özvektörleridir. Bu özvektörler, veri setinin en büyük varyansını açıklayan doğrultulardır. İlk temel bileşen, veri setinin en büyük varyansını kapsar ve her bir sonraki bileşen, bir önceki bileşene dik olacak şekilde, kalan en büyük varyansı kapsar.
- Keşifsel Veri Analizi: TBA, veri setindeki önemli desenleri ve ilişkileri ortaya çıkarmak için kullanılır.[5]
- Boyut İndirgeme: Yüksek boyutlu veri setlerinin boyutunu azaltarak, veri işleme ve görselleştirme işlemlerini kolaylaştırır.
- Görüntü İşleme: TBA, görüntülerin sıkıştırılması ve yüz tanıma sistemlerinde kullanılır.[6]
- Genetik Analiz: Genetik verilerde, popülasyonlar arası farklılıkları ve benzerlikleri incelemek için kullanılır.
- Finans: Portföy optimizasyonu ve risk yönetimi gibi finansal uygulamalarda kullanılır.
Avantajları:
- Boyut indirgeme ile hesaplama maliyetini düşürür.
- Verideki önemli desenleri ortaya çıkarır.
- Gürültüyü azaltarak model performansını artırabilir.
Dezavantajları:
- Yalnızca doğrusal ilişkileri yakalayabilir.
- Veri normalleştirilmediğinde, sonuçlar yanıltıcı olabilir.
- TBA'nın sonuçları, verinin ölçüm birimlerine duyarlıdır.[7]
TBA, genellikle şu adımlarla hesaplanır:
- Veri Standardizasyonu: Verinin ortalaması çıkarılır ve verinin varyansı ile ölçeklendirilir.
- Kovaryans Matrisinin Hesaplanması: Verinin kovaryans matrisi hesaplanır.
- Özdeğer ve Özvektörlerin Bulunması: Kovaryans matrisinin özdeğerleri ve özvektörleri hesaplanır.
- Yeni Öz Uzayına Dönüşüm: Veriler, seçilen özvektörlerle yeni bir alt uzaya projekte edilir.
Remove ads
Kaynakça
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads