CHI CUADRADO 1

CHI CUADRADO 1 gy Aalcxanderguacal ‘benpa,1R I S, 2016 12 pagcs TEMA: DISTRIBUCIÓN CHI-CUADRADO DE PEARSON DEFINICION: En estadística, la distribución de Pearson, llamada también ji cuadrada o Chi cuadrada , nos permite calcular la probabilidad de obtener resultados que únicamente por efecto del azar se desvíen de las expectativas en la magnitud observada si el modelo es correcto, también es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria.

PROPIEDADES DE-L CHI-CUADRADO La X2 no toma valores negativos, es cero o positiva. La X? no es simétrica; esta sesgada hacia la derecha, con la condición de que a mayor tamaño de muestra (mayor número de grados de libertad se hará menos ses ada y tiende a la Swipe to page normalidad. La media de la distrib asi como la varianza de libertad LA DISTRIBUCION CH PACE 1 or12 ió. á det o s grados de libertad doble de los grados La distribución Chi-Cuadrado es una de las distribuciones más usadas en la estadística aplicada.

Para facilitar su empleo, existen tablas que permiten hallar las áreas que son probabilidades, asociadas a intervalos limitados por valores determinados de Y. La distribución Chl-Cuadrado , es en toda una familia de distribuciones por lo que, existe una distribución Chi-Cuadrado para cada grado de libertad. Son muy importantes pues son la base de las metodologías inferenciales, tal tales como intervalos de confianza y pruebas de hipótesis. Sean variables independientes que siguen una distribución N (0,1).

Sea X una nueva variable definida según: En este caso, se dice X se distribuye como una CHI-CIJADRADO, con n grados de libertad, que representamos como: Su función de densidad de probabilidad: Y se dice que sigue la distribución Chi- Cuadrado con k grados de ibertad, en forma abreviada: La meda y la vananza de la distribución son: La función de distribución CHI tienen importantes variaciones de acuerdo con los grados de libertad y del tamaño muestral (menor tamaño muestral y mayor tamaño muestral respectivamente), En consecuencia, si tenemos variable aleatoria independientes, donde cada , se tiene: La distribución Chi muestra su importancia cuando queremos determinar la variabilidad (sin signo) de cantidades que se distribuyen en torno a un valor central siguiendo un mecanismo normal. PRUEBAS DE CHI – CUADRADO

Corresponde a las distribuciones no paramétricas, siendo una de las más utilizadas por primera vez por Helmert en 1875 y descubierto en 1900 por Karl Pearson. En 1934, en el caso de tablas de contingencia de ropuesta la aplicación de la corrección por continui atendiendo la sugerencia distribución normal, se utiliza en todos aquellos en que el experimento ofrece dos resultados posibles; cuando se presentan más de dos resultados debe aplicarse la prueba de Chi-cuadrado. Un ejemplo típico de distrlbución normal, lo constituye el lanzamiento de una moneda con posibilidades de que parezca ara o sello, y las de Chi-Cuadrado estarán aplicada en el lanzamiento de un dado con seis caras posibles, numeradas del 1 al 6.

Esta prueba se denomina J- cuadrado, derivada de la letra mayúscula J que se escribe X y que se lee Chi; el cuadrado se debe a que la suma de las diferencias entre los valores observados y esperados será igual a 0, por lo tanto se hace necesano elevarlos al cuadrado, para cuantificar la dlferencia. Para realizar una prueba de Chi-cuadrado, el primer paso es comparar el número de individuos observados en cada categoría con los números esperados considerando el tamaño e la muestra y el modelo propuesto. Las desviaciones son elevadas al cuadrado y divididas por los valores esperados, lo cual proporciona un valor de Chi-cuadrado. Se utiliza el número de individuos y no las proporciones, toma en consideración el tamaño de la muestra.

La fórmula para es como se indica a continuación: Se puede observar en la formula anterior, que mientras mayor sea la coincidencia entre las frecuencias observadas y la esperadas, menor será el valor Chi-cuadrado. Si , significa que hay una completa concordancia entre las frecuencias observadas y las sperada V , significa que hay una completa concordancia entre las frecuencias observadas y las esperadas. La curva que constituye una excelente aproximación a la distribución Chl-cuadrado, está dada por la siguiente ecuación: Donde v es el número de grados de libertad de la variable y C es una constante que depende de V elegida de tal forma, que el área bajo la curva sea igual a uno. Los grados de libertad son el número de categorías o clases variables independientes que existe.

Generalmente, esto es igual a uno menos el número total de clases. Para la aplicación de la prueba de Chi-cuadrado, se debe proceder así, prmero: se formula la hipótesis, en seguida establecemos las diferencias entre las frecuencias obseNadas y las esperadas, se eleva cada diferencial al cuadrado y se divide a cada una de ellas por su frecuencia teórica o esperada, y finalmente se duma de esta manera nos resulta el valor de , calculada siendo: El paso final en la aplicación de la prueba de Chi-cuadrado es buscar el valor de Chi-cuadrado y los grados de libertad en una tabla o grafica como las que se presentan a continuación y determinar el valor de la probabilidad.

Este valor es la probabilidad de que el azar por sí mismo pudiera ser responsable de una desviación tan grande o mayor que la observada, si la hipótesis es correcta Si la probabilidad es alta se considera que los datos están de acuerdo con el modelo, lo cual no prueba que el modelo sea correcto, sino que simplemente no se puede demost 40F el modelo, lo cual no prueba que el modelo sea correcto, sino que simplemente no se puede demostrar que sea Incorrecto. Si la probabilidad es baja, la desviación no es debida al azar y se considera que los datos no respaldan el modelo. La prueba Chi cuadrado requiere la comparación del con el . Si el valor estadístico de prueba es menor que el valor tabular, la hipótesis nula es aceptada, caso contrario, es rechazada. Nota: Un valor estadístico de menor que el valor crítico o igual a él se considera como prueba de la variación casual en donde es aceptada.

Estas pruebas no pertenecen propiamente a la estadística paramétrica pues no establecen suposiciones restrictivas al tipo de variables que admiten, ni en lo que refiere a su distribución de probabilidad ni en los valores y/o el conocimiento de sus parámetros. Se aplican en dos situaciones básicas: Cuando queremos comprobar si una variable, cuya descripción parece adecuada, tiene una determinada función de probabilidad. La prueba correspondiente se llama Chi-cuadrado de ajuste. Cuando queremos averiguar si dos variables (o dos vías de clasificaclón) son independientes estadísticamente. En este caso la prueba que aplicaremos ser la Chi-cuadrado de independencia o Chi-cuadrado de contingencia. Teorema (Cochran).

Sean con distribución la variable aleatoria independiente, entonces: La función Chi-cuadrado es igual a la función normal elevada al uadrado. Esto es, el producto de dos distribuciones de Gauss es una s OF V a la función normal elevada al cuadrado. Esto es, el producto de dos distribuciones de Gauss es una distribución de Chi-cuadrado. Si de una población normal, o aproximadamente normal, se extraen muestras aleatorias e independientes, y se le calcula el estadígrafo X2 usando el valor muestral de la varianza y el poblacional. ASÍ, la relación entre la varianza de la muestra y la varianza de la población está determinada por la distribución Chi- Cuadrado siempre y cuando la población de la cual se toman los alores de la muestra se encuentre normalmente distribuida.

Y aquí debemos tener especial cuidado, pues la distribución Chi- Cuadrado es sumamente sensible a la suposición de que la población esta normalmente distribuida y por ejemplo construir intervalos de confianza para estimar una vananza poblacional, puede que los resultados no sean correctos dependiendo de si la población no está normalmente distribuida. La distribución Chi-Cuadrado, es la razón que existe entre la varianza de la muestra multiplicada por lo grados de libertad y la varianza de la población. Es decir: El termino grados de libertad (gl) se refiere al número de observaciones independientes para una fuente de variación menos el número de parámetros independientes estimado al calcular la variación. para la distribución Chi- cuadrado , los grados de libertad vienen dados por , por lo tanto, la formula anterior quedaría expresada como: En donde: Número de elementos de la muestra. Numero de grado 6 OF V anterior quedaría expresada como: Numero de grados de libertad.

Varianza de la muestra. Varianza de la población. Al igual que la t-Student, el valor total del área bajo la curva es gual a la unidad, pero la diferencia principal es que esta no es simétrica respecto al origen, sino que se extiende desde 0 hasta + porque no puede ser negativa. A medida que los grados de libertad aumentan, la curva cambia de forma y sus valores se han tabulado en el anexo de tablas estadísticas, donde se muestran los valores del área bajo la curva, para los principales valores de X2, a la derecha de éste. O sea, se muestra la zona de rechazo para diferentes niveles de significación y de grados de libertad, lo cuales var[an entre 1 y 100.

Más allá, conviene usar directamente la función de Gauss. INTERVALOS DE CONFIANZA PARA LA DISTRIBUCION CHI- CUADRADO. Como se hizo con la distribución normal y con la distribución de Student, podemos definir los intem•alos y límites de confianza 95%, 99%, u otros usando la tabla de la distribución Chi- Cuadrado en el Tabla 1. De este modo estimar, dentro de límites especificados, la desviación típica de la población en términos de una desviación típica muestral s. Por ejemplo, si y son los valores (llamados valores críticos) para los que el del área esta en cada cola de la distribución, entonces el intervalo de confianza 95% es

Del cual vemos que se estima que estaría en el intervalo con el intervalo de confianza 95% es Con el 95% de confianza. Otros intervalos de confianza se hallan de forma parecida. Los valores y representa, respectivamente, los valores 2,5 y 97,5 percentil. GRADOS DE LIBERTAD Los grados de libertad de un estadístico calculado sobre un conjunto de datos se refieren al número de cantidades independientes que se necesitan en su cálculo, menos el número de restricciones que ligan a las observaciones y el estadístico. El número de grados de libertad del estadístico Chi-Cuadrado se alcula de la siguiente forma: Los grados de libertad de la columna son el número de filas (categorías) menos 1, o bien r-l .

Los grados de libertad de cada fila es igual al número de columnas o (muestras) menos 1, o bien El efecto neto es que el número de grados de libertad para la tabla es el producto de (número de filas -1) por (número de columnas -1), o bien, (r-l ) (k-l), por lo tanto con 2 filas y 4 columnas, los grados de libertad son (2-1) (4-1)=3. RELACIÓN CON OTRAS DISTRIBUCIONES. La Chi cuadrado es una distribución binomial inversa cuyo coeficiente de variabilidad es 10. , esta tiene un intervalo de confianza de 2. 3 grados en la escala de desviaciones estándar. Posee una distribución de Poisson elevada la cual asciende a 56. 5 m Eq en los tres primeros cuartiles de la recta.

Para k=2 la distribución es una distribución exponencial. La prueba de Chi-cuadrado es una prueba no par la distribución es una distribución exponencial. La prueba de Chi-cuadrado es una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar. También se utiliza para probar la independencia de dos muestras entre sí, mediante la presentación de los datos en tablas de contingencia. La fórmula que da el estadístico es la siguiente: Los grados de libertad nos vienen dados por: gl- (r-l)(k-l).

Donde r es el número de filas y k el de columnas. Criterio de decisión: Se acepta HO cuando . En caso contrario se rechaza. Donde C] representa el valor proporcionado por las tablas, segun el nivel de significación elegido. Cuanto más se aproxima a cero el valor de Chi-cuadrado, más ajustadas están ambas distribuciones. CORRECCION DE YATES La corrección de Yates se aplica a la prueba Chi-cuadrado cuando la frecuencia de las observaciones en alguna de las celdas es menor de 10. La Chi-cuadrado corregida: Donde: En general, se aplica la corrección de Yates o también corrección por continuidad cuando aproximamos una variable discreta a una distribución continua.

La corrección consiste en añadir y substraer a la variable or ejemplo, obtener 3 caras al lanzar una moned ida discreta (nominal) la distribución binomial. Mientras que si la aproximáramos a la distribución normal, su valor oscilará entre 2,5 y 3,5. Tabla 1: Tabla de valores percentiles para la distribución Chi- Cuadrado. EJEMPLOS DE LA DISTRIBUCION CHI-CUADRADO EXPERIMENTO GENÉTICO DE MENDEL Mendel tenía arvejas con dos tipos de tegumento, rugoso y liso y, segun su hipótesis, en cruzamientos realizados entre ciertos tipos de plantas, el esperaba que aparecieran en la descendencia de dichos cruzamientos, arvejas de tegumento liso y rugoso en la proporción 3:1.

Supongamos que en un experimento en el cual se obtiene una descendencia compuesta por 400 semillas, un genetista encuentra 285 semillas de tegumento liso y 1 1 5, de tegumento ugoso. ¿Sería razonable, con a = 0. 05, pensar que esa proporción observada no está demasiado alejada de la proporción 3:1 dictada por la ley de Méndel? Análisis La frecuencia esperada o teórica de los dos tipos de tegumentos era 3:1, es decir, 3 semillas de tegumento liso por cada semilla de tegumento rugoso. Calculando dicha proporción para las 400 semillas serán (teg. liso), y (teg. rug. ). Se trata de comprobar si los datos se ajustan a una distribución concreta, por lo cual utilizamos el método de Test o prueba de bondad de ajuste o significancia). 2