Dada no disponible
From Wikipedia, the free encyclopedia
En estadística, una dada no disponible[1] o valor no disponible (en anglès missing data) ocorre quan no hi ha cap valor guardat per a una variable d'una observació. Les dades no disponibles apareixen freqüentment i poden tenir un efecte significatiu sobre les conclusions extretes a partir de les dades.
Una dada no disponible pot ocórrer a causa d'una no-resposta, és a dir, si no es proveeix informació per un o diversos ítems de la unitat. Alguns ítems són més sensibles a no obtenir resposta que altres (per exemple, ítems sobre temes privats com els ingressos o la religió). Un altre tipus de dada disponible és la causada per l'abandonament (dropout) quan s'estudia un subjecte al llarg del temps: en aquest cas, una dada no disponible ocorre quan el participant abandona abans que l'estudi acabi i, per tant, li manquen una o més dades. Finalment, alguns valors no disponibles poden ser causats per l'investigador: per exemple, si la recopilació de dades no es du a terme correctament o es cometen errors en l'entrada de dades.[2] Àrees on apareixen dades no disponibles sovint són les d'economia, sociologia i ciències polítiques a causa que els governs no informes d'algunes estadístiques.[3]
Es poden utilitzar models gràfics per descriure els mecanismes de dades no disponibles en detall.[4][5]