Tecnología

Inicio

Cómo utilizar un Chi Cuadrado

Dos preguntas clave en muchos tipos de investigación son: si dos variables están correlacionadas, y si es así, la fuerza (o importancia) de esa relación. ¿Existe una correlación significativa, por ejemplo, entre el género o etnia y la afiliación política? La prueba de chi-cuadrado es un método ampliamente utilizado para medir si existe una relación significativa entre dos variables nominales o categóricas, como el género y la afiliación política.

Instrucciones

1 Comience con una hipótesis antes de empezar el análisis de datos. Una hipótesis común en mucha investigación es que no existe una correlación entre las dos variables de interés. El chi (rima con "mis") mide el nivel cuadrados de la desviación de una hipótesis dada. Cuanto mayor sea el estadístico chi-cuadrado, el menos bien la hipótesis ajusta a los datos. Por ejemplo, supongamos que estamos ante un conjunto de datos que pidió a 125 votantes registrados (65 mujeres y 60 hombres) de su afiliación a un partido político (demócrata o republicano). Supongamos que se conoce de la investigación anterior que el 55 por ciento de los votantes se identificaron como demócratas. Nuestra hipótesis de trabajo es que este 55 por ciento se distribuirá en partes iguales entre hombres y mujeres.

2 Calcular los valores esperados en base a su modelo planteado la hipótesis de su afiliación política por género. Sobre la base de 125 electores, esperamos que el 55 por ciento (69 electores) se identifican como demócratas. Por género, esperamos que 36 mujeres y 33 hombres van a expresar una preferencia por el Partido Demócrata, dejando a 29 mujeres y 27 hombres que favorecen al Partido Republicano. Organizar los datos en una matriz de 2 por 2 (dos filas y dos columnas). Deje afiliación a un partido sea las variables de columna y de género sean las variables de fila.

3 Compara los valores reales de los datos con los valores esperados se estima en el paso 2. Para este ejemplo, digamos que entre las 65 mujeres, 44 por ciento se identificaron como demócratas y 21 republicanos, mientras que 36 hombres afirmaron una afiliación Democrática y 24 prefirieron el Partido republicano.

4 Calcula el estadístico chi-cuadrado, que es la suma de las diferencias al cuadrado entre los valores observados y esperados (también conocidos como los residuales), dividido por los valores esperados. Lo necesitará para las cuatro combinaciones posibles de género y afiliación política especificada en el modelo. Si está utilizando una computadora, muchos programas estadísticos y hojas de cálculo pueden calcular el estadístico chi-cuadrado para usted. En nuestro ejemplo, la suma de las diferencias al cuadrado dividido por valores esperados es 4,59.

5 Determinar si el estadístico chi-cuadrado calculado en el paso 4 es estadísticamente significativa. Para ello, necesita saber dos cosas: los grados de libertad y el nivel de significación. Grados de libertad es el número de filas de la tabla menos uno, multiplicado por el número de columnas menos uno. El nivel de significación se refiere a la probabilidad de que la correlación observada puede haber ocurrido por casualidad. Muchos investigadores prefieren un nivel de significancia de .05, lo que significa que sólo hay un 5 por ciento de probabilidad de que la relación observada es pura casualidad. En nuestro ejemplo, tenemos solamente 1 grado de libertad. Usando su libro de estadística (por lo general en el apéndice), buscar el valor de chi-cuadrado que corresponde al nivel de significación y los grados de libertad. Para nuestro ejemplo, el valor de chi-cuadrado para 1 grado de libertad y nivel de significación 0,05 es 3,84. Nuestro valor de 4,59 es mayor, es decir, hay una relación estadísticamente significativa entre el género y la afiliación política, con las mujeres que son significativamente más propensos a identificarse como demócratas.

Consejos y advertencias

  • Recuerde que la significación estadística no es el mismo que el significado sustantivo. Los valores de Chi-cuadrado indican la probabilidad de que una relación observada entre dos variables nominales podría haber ocurrido simplemente por casualidad.