From Wikipedia, the free encyclopedia
En estadística, l'analís de la regresión ye un procesu estadísticu pa envalorar les rellaciones ente variables. Inclúi munches téuniques pal modeláu y analís de diverses variables, cuando l'atención centrar na rellación ente una variable dependiente y una o más variables independientes (o predictoras). Más específicamente, l'analís de regresión ayuda a entender cómo'l valor de la variable dependiente varia al camudar el valor d'una de les variables independientes, calteniendo'l valor de les otres variables independientes fixes. Más comúnmente, l'analís de regresión envalora la esperanza condicional de la variable dependiente daes les variables independientes - esto ye, el valor permediu de la variable dependiente cuando s'afiten les variables independientes. Con menor frecuencia, l'atención centrar nun cuantil, o otru parámetru de llocalización de la distribución condicional de la variable dependiente daes les variables independientes. En tolos casos, l'oxetivu de la estimación ye una función de les variables independientes llamada la función de regresión. Nel analís de regresión, tamién ye d'interés carauterizar la variación de la variable dependiente en redol a la función de regresión, que puede ser descrita por una distribución de probabilidá.
L'analís de regresión ye llargamente utilizáu pa la predicción y previsión, onde'l so usu tien superposición sustancial nel campu d'aprendizaxe automáticu. L'analís de regresión utilízase tamién pa entender cualos de les variables independientes tán rellacionaes cola variable dependiente, y esplorar les formes d'estes rellaciones. En circunstancies llindaes, l'analís de regresión puede utilizase pa inferir rellaciones causales ente les variables independientes y dependientes. Sicasí, esto puede llevar a ilusiones o rellaciones falses, polo que s'encamienta procuru,[1] por casu, la correllación nun implica causalidá.
Munches téuniques fueron desenvueltes pa llevar a cabu l'analís de regresión. Métodos familiares tales como la regresión llinial y la regresión por cuadraos mínimos ordinarios son paramétricos, en que la función de regresión definir en términos d'un númberu finito de parámetros desconocíos que s'envaloren a partir de los datos. La regresión non paramétrica referir a les téuniques que dexen que la función de regresión consista nun conxuntu específicu de funciones, que puede ser de dimensión infinita.
El desempeñu de los métodos d'analises de regresión na práutica depende de la forma del procesu de xeneración de datos, y cómo se rellaciona col métodu de regresión que s'utiliza. Puesto que la forma verdadera del procesu de xeneración de datos xeneralmente nun se conoz, l'analís de regresión depende de cutiu hasta ciertu puntu de faer camientos alrodiu de esti procesu. Estos supuestos son dacuando comprobables si una cantidá abonda de datos ta disponible. Los modelos de regresión pa la predicción son frecuentemente útiles anque los supuestos sían violaos moderamente, anque nun pueden funcionar de manera óptima. Sicasí, en munches aplicaciones, sobremanera con pequeños efeutos o les cuestiones de causalidá sobre la base de datos observacionales, los métodos de regresión pueden dar resultaos engañoses.[2][3]
La primer forma de regresión foi'l métodu de mínimos cuadraos, que foi publicáu por Legendre en 1805,[4] y por Gauss en 1809.[5] Legendre y Gauss aplicaron el métodu pal problema de determinar, a partir d'observaciones astronómiques, les órbites de los cuerpos alredor del Sol (principalmente cometes, pero tamién más tarde los entós recién descubiertos planetes menores). Gauss publicó un desarrollu posterior de la teoría de los mínimos cuadraos en 1821,[6] incluyendo una versión del teorema de Gauss-Markov.
El términu "regresión" foi acuñáu por Francis Galton nel sieglu XIX pa describir un fenómenu biolóxicu. El fenómenu foi que los altores de los descendientes d'ancestros altos tienden a tornar escontra baxo, escontra un permediu normal (un fenómenu conocíu como regresión escontra la media ).[7][8] Pa Galton, la regresión namái tenía esti significáu biolóxicu,[9][10] pero'l so trabayu foi estendíu más tarde por Udny Yule y Karl Pearson a un contestu estadísticu más xeneral.[11][12] Na obra de Yule y Pearson, la distribución conxunta de la variable respuesta y les variables esplicatives supónse que ye Gaussiana. Esti camientu foi debilitada por Ronald Fisher nes sos obres de 1922 y 1925.[13][14][15] Fisher supón que la distribución condicional de la variable respuesta ye Gaussiana, pero la distribución conxunta non necesariu que lo sía. A esti respectu, l'asunción de Fisher ta más cerca de la formulación de Gauss de 1821.
Nos años 1950 y 1960, los economistes utilizaron calculadores electromecániques pa calcular les regresiones. Antes de 1970, dacuando tomaba hasta 24 hores pa recibir el resultáu d'una regresión.[16]
Los métodos de regresión siguen siendo una área d'investigación activa. Nes últimes décades, nuevos métodos fueron desenvueltos pa regresión robusta, regresión qu'implica respuestes correlacionadas, tales como series de tiempu y les curves de crecedera, regresión na que los predictores (variable independiente) o les variables de respuesta son curves, imáxenes, gráficos y otros oxetos de datos complexos, métodos de regresión qu'acepten dellos tipos de datos faltantes, regresión non paramétrica, métodos de regresión bayesianos, regresión na que les variables predictoras son midíes con error, regresión con más variables predictoras qu'observaciones y la inferencia causal con regresión.
Daes dos variables (Y: variable dependiente; X: independiente) tratar d'atopar una función simple (llinial) de X que nos dexe averar Y por aciu: Ŷ = a + bX
Asina, nel exemplu de Pearson: Ŷ = 85 cm + 0,5X
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.