Soluciones recomendadas a falta de datos

Hay dos métodos para hacer frente a los datos que faltan que se han convertido en la corriente principal disponibles software estadístico en los últimos años. Estos dos métodos son vastas mejoras sobre los enfoques tradicionales, como se describe en las limitaciones de los enfoques comunes para datos faltantes. En este artículo se describen estos dos métodos.

Tanto de los métodos descritos aquí requieren que el mecanismo de datos faltantes es ignorable, es decir, no se relaciona con los valores perdidos (ver Missing Mecanismos de datos). Si el mecanismo es ignorable, dando como resultado estimaciones (es decir, los parámetros de regresión y errores estándar) será imparcial, sin pérdida de potencia.

El primer método es Imputación múltiple (MI). Al igual que los métodos de imputación discutidos en limitaciones a enfoques comunes de información faltante, imputación múltiple rellena estimaciones para los datos que faltan. Sin embargo, para capturar la incertidumbre en las estimaciones, MI imputa los valores varias veces. Debido a que utiliza un método de imputación con error incorporado, las estimaciones múltiples deben ser similares, pero no idénticos. El resultado es de múltiples conjuntos de datos con valores idénticos para todos los valores no perdidos y valores ligeramente diferentes para los valores imputados en cada conjunto de datos. El análisis estadístico de interés, tal como ANOVA o regresión logística, se lleva a cabo por separado en cada conjunto de datos, y los resultados se combinan entonces. Debido a la variación en los valores imputados, también debe haber variación en las estimaciones de los parámetros, que conduce a estimaciones apropiadas de los errores estándar y los valores de p apropiados.

Imputación múltiple está disponible en SAS, S-Plus, y Solas. En SAS, PROC MI crea los múltiples conjuntos de datos, que luego pueden ser fácilmente analizados por separado utilizando procedimientos estadísticos estándar. PROC MIANALYZE entonces combinar los resultados de estos análisis por separado. Joe Schafer en Penn State ha desarrollado cuatro bibliotecas S-Plus para múltiples imputar, datos mixtos, y paneles normales, categóricas. Él ha hecho la biblioteca de datos normales disponibles como un paquete independiente gratuita llamada norma. Imputación múltiple también está disponible en Solas, pero sus algoritmos han sido cuestionados como no apropiado, y no podemos recomendar su uso en este momento.

El segundo método consiste en analizar los datos incompletos, completos establecidos utilizando la estimación de máxima verosimilitud. Este método no imputa ningún dato, sino que utiliza todos los datos observados para cada caso para calcular estimaciones de máxima verosimilitud. La estimación de máxima verosimilitud de un parámetro es el valor del parámetro que es más probable que han dado lugar a los datos observados. Cuando faltan datos, podemos factorizar la función de verosimilitud. La probabilidad se calcula por separado para los casos con datos completos sobre algunas variables y los que tienen datos completos sobre todas las variables. Estos dos probabilidades son entonces maximizan juntos para encontrar las estimaciones. Al igual que la imputación múltiple, este método da estimaciones de los parámetros imparciales y los errores estándar. Una ventaja es que no requiere de la cuidadosa selección de las variables utilizadas para imputar valores que Imputación múltiple requiere. Es, sin embargo, limitada a los modelos lineales.

El análisis de los datos incompletos, completos establecidos utilizando la estimación de máxima verosimilitud está disponible en AMOS. AMOS es un paquete de modelos de ecuaciones estructurales, pero puede ejecutar múltiples modelos de regresión lineal. AMOS es fácil de usar y ahora está integrado en SPSS, pero no va a producir gráficos de residuos, estadísticas de influencia, y otra salida típica de los paquetes de regresión. El valor faltante paquete de análisis en SPSS hará algunas estimaciones de máxima verosimilitud muy limitadas para los medios y correlaciones única

Referencias:.
Schafer, J. Software para Imputación múltiple
Hox, JJ (1999) Una revisión de software actual para la Entrega de Datos que faltan, Kwantitatieve Methoden, 62, 123-138.
Allison, P. (2000). Imputación múltiple de datos que faltan: un cuento aleccionador, métodos sociológicos e Investigación, 28, trescientos uno-trescientos nueve Hotel ..

consulta de trabajo

  1. Distribuidores de Cleveland: razones por Concesionarios son las Excelente elección
  2. Papel blanco libre que ofrece información sobre cómo ahorrar dinero en la etiqueta del producto Im…
  3. Cómo Snatch fracaso comercial de las fauces de la victoria
  4. ¿Dónde está mi copywriter independiente
  5. Hacer un plan de buena validación maestro
  6. Cómo generar una lista agente de seguros de la calidad
  7. ¿Por qué los automovilistas que comparen la cubierta avería del coche están mejor en el largo pl…
  8. ¿Su negocio realmente necesidad de tener tarjetas de crédito?
  9. Encontrar el proveedor de cuenta mercantil Derecho Con estas preguntas Wise
  10. Herramientas de Marketing en Internet
  11. El dominio de la línea de tiempo Project Management Consulting
  12. El uso de generadores de imanes permanentes para ahorrar en costos de electricidad
  13. Silla de ruedas eléctrica Riep los beneficios de la ciencia
  14. Sobornos éticas: 10 sorteos Dispositivos Cliente atracción más eficaces
  15. Consejos sobre Comenzando Reino Unido Anónimas
  16. Para la seguridad de cerrajería Woodbridge viene primero
  17. Beneficios de la externalización de TI Soluciones
  18. Rápida Información Enfoque de Farmville
  19. ¿Qué hacer cuando la red de la empresa es hackeado
  20. Obtener más al vender WebSites