Limitaciones de soluciones comunes a los que faltan datos

Un artículo anterior discutió algunas de las causas de la falta de datos y algunas de las consecuencias del análisis de los casos sólo completos. Este boletín se discutirán algunas otras maneras comunes de tratar con datos faltantes, con un análisis de sus ventajas y desventajas.

Análisis de casos disponibles (eliminación por pares) calcula cada paso del análisis por separado utilizando los casos que tienen datos disponibles para ese paso. Por lo tanto, un caso con datos faltantes en una variable se utilizará sólo en medidas que no impliquen esa variable. La ventaja es que el tamaño de la muestra para cada análisis individual es generalmente mayor que con análisis completo caso, pero los resultados son imparcial sólo si los datos son MCAR. También puede conducir a problemas matemáticos en el cálculo de las estimaciones de algunos parámetros, y no se recomienda.

La mayoría de los otros métodos implican la imputación, reemplazando los valores perdidos con una estimación, a continuación, analizar el conjunto como si los valores imputados datos completos eran los valores observados reales. Hay muchas maneras de elegir una estimación. Los siguientes son métodos comunes:

* La media: la media de los valores observados para esa variable
* Sustitución: el valor de un nuevo individuo que no fue seleccionado para estar en la muestra
* Hot cubierta: un valor elegido al azar de un individuo que tiene valores similares en otras variables
* cubierta fría: un valor elegido sistemáticamente de una persona que tiene valores similares de otras variables
* Regresión: el valor predicho obtenido por regresión de la falta variable sobre otras variables
regresión * estocástico: el valor predicho a partir de una regresión más un valor residual al azar
* interpolación y extrapolación:.. un valor estimado de otras observaciones del mismo individuo

imputación es popular porque es conceptualmente simple y debido a que la muestra resultante tiene el mismo número de observaciones como el conjunto de datos completo. Puede ser muy tentador cuando el análisis de casos completos elimina una gran parte del conjunto de datos. Pero tiene limitaciones. Algunos métodos de imputación resultan en estimaciones de los parámetros sesgados, como medios y correlaciones, a menos que los datos son MCAR. El sesgo es a menudo peor que con el análisis completo de los casos, sobre todo para la imputación media. La extensión de la polarización depende de muchos factores, incluyendo el mecanismo de los datos que faltan, la proporción de los datos que falta, y la información disponible en el conjunto de datos
.

Además, todos estos métodos de imputación subestiman los errores estándar . Desde las observaciones imputados son en sí mismas estimaciones, sus valores han correspondientes error aleatorio. A pesar de esto, los valores imputados son tratados como observaciones reales en los análisis. La fuente adicional de error se ignora, lo que resulta en demasiado pequeños errores estándar y demasiado pequeños los valores de p. Además, aunque la imputación es conceptualmente simple, por lo general es difícil de hacer bien en la práctica. Por lo tanto, estos métodos de imputación no son satisfactorios en la mayoría de las circunstancias

Dos métodos alternativos mantienen el tamaño de la muestra completa y pueden dar lugar a estimaciones imparciales de los parámetros y errores estándar para ignorables datos que faltan:. Imputación múltiple y la estimación de máxima verosimilitud. Estas técnicas están disponibles en el software estadístico común. Boletines posteriores se describen estos métodos y discutir su disponibilidad en los paquetes de software Restaurant  .;

consulta de trabajo

  1. ¿Qué es la tecnología Voip
  2. ¿Le falta su negocio o hace que su negocio funcione usted?
  3. La mejor manera de recoger el Outstanding Deudas Comerciales
  4. Preguntas que debe hacer al contratar un Roofer
  5. Una estafa de Carbón: El siguiente escollo para una coalición ya fracturado
  6. Cómo contratar a un Consultor de Plan de Negocios
  7. Diseño Web para un sitio Web Profesional
  8. ¿Qué debe usted utilizar: Plan de Negocios, propuesta o estrategia de marketing
  9. Sobrevivir Tiempo del impuesto 2.012
  10. ¿Estás listo para jugar el juego?
  11. Pintura Paredes exteriores
  12. Los peligros de daños de agua
  13. Convertir Tráfico de Facebook para más negocios
  14. Generaciones iniciativa a través de servicio de Call Center
  15. Los populares redes sociales más y quién está sobre ellos
  16. Instituto de Agricultura en la India es uno de los cursos más populares
  17. Alquiler de Oficinas Ejecutivas: Haciendo camino para la expansión de negocios
  18. ¿Es usted un profesional Desempleado ventas?
  19. Concierge Servicios En Londres Pone de negocios y de ocio los viajes al At Ease
  20. Almacenamiento adecuado es esencial