Top-Fragen
Zeitleiste
Chat
Kontext
Partieller Korrelationskoeffizient
Aus Wikipedia, der freien Enzyklopädie
Remove ads
Der partielle Korrelationskoeffizient kontrolliert den Einfluss einer oder mehrerer Störfaktoren.
Remove ads
Definition
Zusammenfassung
Kontext
Eine Korrelation zwischen zwei statistischen Variablen (oder Merkmalen) und kann unter Umständen auf den Einfluss, die eine dritte Variable (ein Störfaktor) auf beide Variablen hat, zurückgehen. Um die Korrelation zwischen und zu messen, die verbleibt, wenn der Einfluss von eliminiert ist, gibt es das Konzept der partiellen Korrelation[1][2][3] (auch Partialkorrelation genannt).
Theoretischer partieller Korrelationskoeffizient
Für drei Zufallsvariablen und mit gemeinsamer Wahrscheinlichkeitsverteilung seien , und die paarweisen theoretischen Korrelationskoeffizienten. Dann ist
die theoretische partielle Korrelation der Zufallsvariablen und bzgl. der Zufallsvariablen (oder mit Elimination des Effekts der Zufallsvariablen ). Der Koeffizient heißt auch (theoretischer) partieller Korrelationskoeffizient. Eine häufige Notation ist .
Empirischer partieller Korrelationskoeffizient
Für beobachtete Werte für von drei Variablen und seien , und die paarweisen empirischen Korrelationskoeffizienten. Dann ist
die empirische partielle Korrelation der Variablen und bzgl. der Variablen (oder mit Elimination des Effekts der Variablen ). Der Koeffizient heißt auch (empirischer) partieller Korrelationskoeffizient. Eine häufige Notation ist .
In Zusammenhängen, bei denen klar ist, ob ein theoretischer oder ein empirischer Koeffizient gemeint ist, wird einfach von dem partiellen Korrelationskoeffizienten gesprochen.
Partieller Korrelationskoeffizient höherer Ordnung
Beim partielle Korrelationskoeffizient wird der Einfluss von mehr als einer Störvariable herausgerechnet.
Remove ads
Eigenschaften
- Ein partieller Korrelationskoeffizient hat Werte im Intervall .
- Im Fall gilt .
- Im Fall gilt .
- Der partielle Korrelationskoeffizient stimmt unter bestimmten Bedingungen (jedoch nicht im Allgemeinen) mit der bedingten Korrelation überein[4].
Remove ads
Theoretischer Hintergrund
- Für die Zufallsvariablen , und können die linearen Regressionen von auf ,
- und von auf ,
- gebildet werden. Die zugehörigen Residualvariablen (Regressionsreste)
- enthalten diejenigen Anteile der Variablen und , die nicht durch einen linearen Zusammenhang mit erklärt werden können. Es gilt dann
- Diese Darstellung zeigt:
- Der partielle Korrelationskoeffizient ist ein gewöhnlicher Korrelationskoeffizient der Residualvariablen und und hat damit die Eigenschaften eines gewöhnlichen Korrelationskoeffizienten.
- Die Ausschaltung des Einflusses der Variablen erfolgt durch lineare Regressionen, so dass nichtlineare Einflüsse von nur teilweise erfasst werden oder unentdeckt bleiben.
- Eine Verallgemeinerung des Konzeptes auf mehrere Einflussfaktoren ist möglich, indem die linearen Einfachregressionen auf die Variable durch multiple lineare Regressionen auf mehrere Variablen ersetzt werden und dann die Korrelationen der resultierenden Residualvariablen betrachtet werden.
- Für beobachtete Werte , , seien
- die geschätzten Werte aus linearen Regressionen von auf bzw. von auf nach der Methode der kleinsten Quadrate. Für die empirische Korrelation der Regressionsreste
- gilt dann
Remove ads
Inferenzstatistischer Zusammenhang
Im inferenzstatistischen Kontext repräsentiert die gemeinsame Wahrscheinlichkeitsverteilung von die Verteilung der drei Merkmale in der Grundgesamtheit und beschreibt die (unbekannte) partielle Korrelation in der Grundgesamtheit.
Die beobachteten Werte für werden als realisierte Werte von stochastisch unabhängigen und identisch verteilten Zufallsvektoren für aufgefasst, die jeweils die Wahrscheinlichkeitsverteilung von besitzen.
In diesem Zusammenhang sind die aus den beobachteten Werten berechneten empirischen Korrelationskoeffizienten , und Schätzwerte für die Korrelationskoeffizienten , und und der empirische partielle Korrelationskoeffizient ist ein Schätzwert für den unbekannten Grundgesamtheitsparamter .
Remove ads
Beispiel
In einer Firma werden zufällig Mitarbeiter ausgewählt und die Körpergröße bestimmt. Zudem muss jeder Befragte sein Einkommen angeben. Das Ergebnis der Untersuchung ist, dass Körpergröße und Einkommen positiv korrelieren, also größere Personen auch mehr verdienen. Bei einer genaueren Untersuchung stellt sich jedoch heraus, dass der Zusammenhang auf die Drittvariable Geschlecht zurückgeführt werden kann. Frauen sind im Durchschnitt kleiner als Männer, verdienen aber auch oftmals weniger. Berechnet man nun die Partialkorrelation zwischen Einkommen und Körpergröße unter Kontrolle des Geschlechts, so verschwindet der Zusammenhang. Größere Männer verdienen demnach beispielsweise nicht mehr als kleinere Männer. Dieses Beispiel ist fiktiv und der Zusammenhang in der Realität komplizierter,[5] es kann jedoch die Idee der Partialkorrelation veranschaulichen.
Remove ads
Zeitreihen
Bei Zeitreihen wird die partielle Autokorrelationsfunktion bei Verzögerung definiert als
Remove ads
Erweiterung
Der partielle Korrelationskoeffizient kann auch für Rangkorrelationskoeffizienten berechnet werden[6].
Einzelnachweise
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads