El estadístico chi-cuadrado (χ2) es una medida de
divergencia entre la distribución de sus datos y una distribución esperada o
hipotética de su elección.
La prueba del χ2 se usa
para variables de distintos niveles de medición, incluyendo las de menor nivel,
que son las nominales. Sirve para determinar si los datos obtenidos de una sola
muestra presentan variaciones estadísticamente significativas respecto de la
hipótesis nula.
EXISTEN
VARIOS TIPOS DE PRUEBAS DE CHI-CUADRADO:
- Prueba de χ2 de bondad de ajuste
Utilice este análisis para probar qué tan bien una muestra de datos
categóricos se ajusta a una distribución teórica.
Por ejemplo, usted puede
comprobar si un dado es justo, lanzando el dado muchas veces y utilizando una
prueba de χ2
de bondad
de ajuste para determinar si los resultados siguen una distribución uniforme. En
este caso, el estadístico χ2 cuantifica qué tanto varía la distribución observada de conteos con
respecto a la distribución hipotética.
- Pruebas de χ2 de asociación e independencia
Los cálculos para estas pruebas son iguales, pero la pregunta que se
está tratando de contestar puede ser diferente.
- Prueba de asociación: utilice una prueba de asociación para determinar si una variable está asociada a otra variable. Por ejemplo, determine si las ventas de diferentes colores de automóviles dependen de la ciudad donde se venden.
- Prueba de independencia: utilice una prueba de independencia para determinar si el valor observado de una variable depende del valor observado de otra variable. Por ejemplo, determine si el hecho de que una persona vote por un candidato no depende del sexo del elector.
PRINCIPALES APLICACIONES DE LA CHI‐CUADRADO
Al analizar en una población un carácter
cualitativo o cuantitativo el estudio resulta muy tedioso por el gran número de
elementos del que consta la población.
Generalmente, se
examina una muestra tomada de la población, lo que lleva a tener una serie de
datos, y ver hasta qué punto la muestra se pude considerar perteneciente a una
distribución teórica conocida.
Siempre existirán
desviaciones entre la distribución empírica u observada y la distribución teórica. Se plantea la
cuestión de saber si estas desviaciones son debidas al azar o al haber tomado
una distribución teórica inadecuada.
OBSERVACIONES DE LA APLICACIÓN
- El test de la χ2 se puede aplicar en situaciones donde se desea decidir si una serie de datos (observaciones) se ajusta o no a una función teórica previamente determinada (Binomial, Poisson, Normal, etc.)
- Es necesario que las frecuencias esperadas de las distintas modalidades no sea inferior a cinco. Si alguna modalidad tiene una frecuencia esperada menor que cinco se agrupan dos o más modalidades contiguas en una sola hasta conseguir que la frecuencia esperada sea mayor que cinco.
- Los grados de libertad de la χ2 dependen del número de parámetros que se necesitan hallar para obtener las frecuencias esperadas.
Las condiciones
necesarias para aplicar el test de la χ2 exige que al menos el 80% de los
valores esperados de las celdas sean mayores que 5. Cuando esto no ocurre hay que agrupar
modalidades contiguas en una sola hasta lograr que la nueva frecuencia sea
mayor que cinco. Esta condición, si bien en la práctica suele permitirse que
una de ellas tenga frecuencias esperadas ligeramente por debajo de 5.