Correllación
From Wikipedia, the free encyclopedia
Remove ads
En probabilidá y estadística, la correllación indica la fuercia y la direición d'una rellación llinial y proporcionalidad ente dos variables estadístiques. Considérase que dos variables cuantitatives tán correllacionaes cuando los valores d'una d'elles varien sistemáticamente con al respective de los valores homónimos de la otra: si tenemos dos variables (A y B) esiste correllación ente elles si al menguar los valores d'A facer tamién los de B y viceversa. La correllación ente dos variables nun implica, por sigo mesma, nenguna rellación de causalidá (Vease cum hoc ergo propter hoc).
Remove ads
Fuercia, sentíu y forma de la correllación
La rellación ente dos variables cuantitatives queda representada por aciu la llinia de meyor axuste, trazada a partir de la nube de puntos. Los principales componentes elementales d'una llinia d'axuste y, poro, d'una correllación, son la fuercia, el sentíu y la forma:
- La fuercia estrema según el casu, mide'l grau en que la llinia representa a la nube de puntos: si la nube ye estrecha y allargada, representar por una llinia recta, lo qu'indica que la rellación ye fuerte; si la nube de puntos tien un enclín elípticu o circular, la rellación ye débil.
- El sentíu mide la variación de los valores de B con al respective de A: si al crecer los valores d'A facer los de B, la rellación ye direuta (pendiente positiva); si al crecer los valores d'A mengüen los de B, la rellación ye inversa (pendiente negativa).
- La forma establez el tipu de llinia que define'l meyor axuste: la llinia recta, la curva monotónica o la curva non monotónica
Remove ads
Coeficientes de correllación
Esisten diversos coeficientes que miden el grau de correllación, afechos a la naturaleza de los datos. El más conocíu ye'l coeficiente de correllación de Pearson (introducíu en realidá por Francis Galton), que se llogra estremando la covarianza de dos variables ente'l productu de les sos esviaciones estándar. Otros coeficientes son:
- Coeficiente de correllación de Spearman
- Correllación de Kendall
- Correllación canónica
- Coeficiente de Correllación Intraclase
- Coeficiente de Correllación Biserial
- Correllación Poliserial
- Correllación Tetracórica
- Correllación Policórica
- Correllación de Kendall
- Correllación de Jaspen
- Correllación de Fechner
Interpretación xeométrica
Daos los valores muestrales de dos variables aleatories y , que pueden ser consideraes como vectores nun espaciu a n dimensiones, pueden construyise los "vectores centraos" como:
y .
El cosenu del ángulu alfa ente estos vectores ye dau pola fórmula siguiente:
Pos ye'l coeficiente de correllación muestral de Pearson. El coeficiente de correllación ye'l cosenu del ángulu ente dambos vectores centraos:
- Si r = 1, l'ángulu °, dambos vectores son colineales (paralelos).
- Si r = 0, l'ángulu °, dambos vectores son ortogonales.
- Si r =-1, l'ángulu °, dambos vectores son colineales de direición opuestu.
Más xeneralmente: .
De xacíu, dende'l puntu vista xeométricu, nun falamos de correllación llinial: el coeficiente de correllación tien siempres un sentíu, cualesquier sía'l so valor ente -1 y 1. Infórmanos de manera precisa, non tantu sobre'l grau de dependencia ente les variables, sinón sobre la so distancia angular na hiperesfera a n dimensiones.
La Iconografía de les correllaciones ye un métodu d'analís multidimensional que reposa nesta idea. La correllación llinial dase cuando nuna nube de puntos atópense o se distribúin alredor d'una recta.
La fórmula de correllación pa dos series distintes con ciertu desfase "k", ta dada pola fórmula:
Distribución del coeficiente de correllación
El coeficiente de correllación muestral o analíticu d'una muestra ye de fechu una variable aleatoria, eso significa que si repitimos un esperimentu o consideramos distintes muestres van llograse valores distintos y por tanto'l coeficiente de correllación muestral calculáu a partir d'elles va tener valores llixeramente distintos. Pa muestres grandes la variación en dichu coeficiente va ser menor que pa muestres pequeñes. R. A. Fisher foi'l primeru en determinar la distribución de probabilidá pal coeficiente de correllación.
Si los dos variables aleatories que trata de rellacionase vienen de una distribución gaussiana bivariante entós el coeficiente de correllación r sigue una distribución de probabilidá dada por:[1][2]
onde:
- ye la distribución gamma
- ye la función gaussiana hiperxeométrica.
Nótese que'l valor esperáu del coeficiente de correllación muestral r ye:
por tanto, r ye estimador sesgado de . Puede llograse un estimador averáu non sesgado resolviendo la ecuación:
pa
Anque, la solución:
ye subóptima. Puede llograse un estimador sesgado con mínima varianza pa grandes valores de n, con sesgu d'orde buscando'l máximu de la espresión:
, i.e.
Nel casu especial de que , la distribución orixinal pue ser reescrita como:
onde ye la función beta.
Remove ads
Referencies
Enllaces esternos
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads