Correlación
De Wikipedia, la enciclopedia encyclopedia
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y la proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación entre ellas si al disminuir los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (Véase cum hoc ergo propter hoc). Por ejemplo, los ingresos y gastos de una familia, la producción y ventas de una fábrica, los gastos en publicidad y beneficios de una empresa.
Una relación funcional se expresa mediante una función matemática. Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma: pY=f(X)
Las correlaciones son útiles porque pueden indicar una relación predictiva que puede explotarse en la práctica. Por ejemplo, una compañía eléctrica puede producir menos electricidad en un día templado basándose en la correlación entre la demanda de electricidad y el tiempo. En este ejemplo, existe una relación causal, porque el tiempo extremo hace que la gente utilice más electricidad para calefacción o refrigeración. Sin embargo, en general, la presencia de una correlación no es suficiente para inferir la presencia de una relación causal (es decir, correlación no implica causalidad).
Formalmente, las variables aleatorias son dependientes si no satisfacen una propiedad matemática de independencia probabilística. En lenguaje informal, correlación es sinónimo de dependencia. Sin embargo, cuando se utiliza en un sentido técnico, la correlación se refiere a cualquiera de varios tipos específicos de operaciones matemáticas entre las variables probadas y sus respectivos valores esperados. Esencialmente, la correlación es la medida de cómo dos o más variables están relacionadas entre sí. Existen varios coeficientes de correlación, a menudo denotados o , que miden el grado de correlación. El más común de ellos es el Coeficiente de correlación de Pearson, que sólo es sensible a una relación lineal entre dos variables (que puede estar presente incluso cuando una variable es una función no lineal de la otra). Otros coeficientes de correlación - como el correlación de rangos de Spearman - se han desarrollado para ser más robustos que el de Pearson, es decir, más sensibles a las relaciones no lineales.[1][2][3] Información mutua también puede aplicarse para medir la dependencia entre dos variables.