viernes, 13 de diciembre de 2013

PRUEBA DE EVALUACION FINAL

                                                               EXAMEN FINAL

miércoles, 4 de diciembre de 2013

TEMA 3 DISTRIBUCION JI CUADRADO (Chi cuadrada)





                                         
                                        DISTRIBUCIÓN CHI2 CUADRADO DE PEARSON

Si (X1,X2,...,Xn) son n variables aleatorias normales independientes de media 0 y varianza 1, la variable definida como

se dice que tiene una distribución CHI con n grados de libertad. Su función de densidad es
 
siendo la función gamma de Euler, con P>0. La función de distribución viene dada por

La media de esta distribución es E(X)=n y su varianza V(X)=2n. Esta distribución es básica en un determinado número de pruebas no paramétricas.

Si consideramos una variable aleatoria Z~N(0,1), la variable aleatoria X=Z2 se distribuye según una ley de probabilidad distribución CHI con un grado de libertad

Si tenemos n variable aleatoria independientes Zi~N(0,1), la suma de sus cuadrados respectivos es una distribución CHI con n grados de libertad,
 

La media y varianza de esta variable son respectivamente, E(X)=n y V(X)=2n

Ejemplo, El espesor de un semiconductor se controla mediante la variación estándar no mayor a s=0.60 mm. Para mantener controlado el proceso se toman muestras aleatoriamente de tamaño de 20 unidades, y se considera que el sistema está fuera de control cuando la probabilidad de que s2 tome valor mayor o igual al valor de la muestra observado es que es 0.01. Que se puede concluir si s=0.84mm?

Solución. Existe fuera de control si  con n=20 y s=0.60, excede
Entonces,
Por tanto, el sistema está fuera de control

La función de distribución CHI tienen importantes variaciones de acuerdo con los grados de libertad y del tamaño muestral (menor tamaño muestral y mayor tamaño muestral respectivamente),



En consecuencia, si tenemos X1,..,Xn, variable aleatoria independientes, donde cada
, se tiene

La distribución Chi muestra su importancia cuando queremos determinar la variabilidad (sin signo) de cantidades que se distribuyen en torno a un valor central siguiendo un mecanismo normal.

Teorema (Cochran). Sean X1,…,Xn con distribución N(m,s), la variable aleatoria independiente, entonces


La función Chi-cuadrado es igual a la función normal elevada al cuadrado. Esto es, el producto de dos distribuciones de Gauss es una distribución de Chi-cuadrado. Si de una población normal, o aproximadamente normal, se extraen muestras aleatorias e independientes, y se le calcula el estadígrafo χ2 usando el valor muestral de la varianza y el poblacional con:

Esta función matemática está caracterizada por el valor del número de grados de libertad υ=n-1 (donde n es el tamaño muestral). Al igual que la t-Student, el valor total del área bajo la curva es igual a la unidad, pero la diferencia principal es que esta no es simétrica respecto al origen, sino que se extiende desde 0 hasta + ∞ porque no puede ser negativa.


A medida que los grados de libertad aumentan, la curva cambia de forma y sus valores se han tabulado en el anexo de tablas estadísticas, donde se muestran los valores del área bajo la curva, para los principales valores de χ2, a la derecha de éste. O sea, se muestra la zona de rechazo para diferentes niveles de significación y de grados de libertad, lo cuales varían entre 1 y 100. Más allá, conviene usar directamente la función de Gauss.

Para cada grado de libertad hay una tabla de valores que pueden obtenerse variando el nivel de significación, parecida a la de Gauss. El problema de calcular los valores críticos, para un nivel de confianza dado, se resuelve de dos maneras: usando computadoras para resolver los cálculos, y la otra más común, usando tablas resumidas, en forma análoga a la vista para el modelo de t-Student. La distribución de χ2 se usa principalmente para analizar dispersiones. Se compara la dispersión muestral expresada a través de sus cuadrados medios contra la dispersión poblacional cuantificada a través de la varianza (σ2).

Existen otros criterios, como el de Thonks, que usa un error relativo admisible máximo, y se calcula como un cuarto del rango de los valores normales de referencia, dividido por el valor medio de dicho intervalo (referido a la magnitud clínica en cuestión y expresado en porcentajes). También se emplea a este modelo para realizar la llamada prueba de chi-cuadrado en las comparaciones de frecuencias observadas contra las frecuencias esperadas, con datos de recuento. Más adelante se desarrolla mejor este tema, lo mismo que su  so para testear la independencia de dos o más factores en una Tabla de Contingencia.

En la industria farmacéutica se la usa para analizar la dispersión de los componentes de los productos terminados. Todo remedio fabricado debe cumplir estrictas normas de calidad, generalmente referidas al contenido en peso de sus principales componentes. Se usan dos límites: el superior e inferior, dentro de los cuales se los debe mantener controlados. Este rango de valores define la dispersión máxima admisible y lo ideal es que la dispersión de los productos terminados sea bastante inferior a dicho rango. Ese control de la dispersión es muy similar al explicado más arriba, para los bioquímicos.

Ejemplo. Un bioquímico sospecha que su micro-centrífuga no mantiene constante su velocidad mientras trabaja, lo cual le da una variabilidad indeseada en sus determinaciones. Para controlarla, consigue un tacómetro regulado y mide cada minuto la velocidad durante 10 minutos. Los resultados fueron: una velocidad promedio en las 10 mediciones de 3098 rpm con una desviación de 100,4 rpm. Testear para un error relativo máximo del 2% o menos, si la centrífuga es estable.


La desviación estándar es smax=2%*3098=62 rpm, luego,
H0: smax≤62 rpm
H1: smax≥62 rpm

 

De la Tabla de valores críticos surge: χ20,99;9=21,666 y χ20,991;9=27,877. Por lo tanto, el bioquímico ha encontrado una muy fuerte evidencia que la velocidad del equipo oscila en forma indeseada, tal como sospechaba. Y deberá ajustarlo si desea disminuir la variabilidad de sus mediciones. Los resultados fueron muy significativos χ2 = 23,6

Ejemplo. Un farmacéutico Jefe del Dpto. Control de Calidad en una industria alimenticia, descubre que en su proceso de producción el contenido de ciclamato en su línea de mermeladas dietéticas varía en forma indeseada. Sospechando que se trata de una falla en el dosificador, decide tomar 10 muestras seguidas del mismo. Encuentra un promedio de 20 gramos con una desviación de 8 gramos. Si en su protocolo de fabricación la variación máxima permitida es del 3%, determinar si el dosificador debe ser corregido.
El desviación estándar aceptable es: smáx = 3% de 20 g = 6 g. Luego:
H0:smáx ≤6 g.: el dosificador funciona correctamente
H1:smáx > 6 g.: el dosificador debe ser cambiado


De la Tabla de valores críticos surge: c20,95;9=16,9. Por lo tanto, el farmacéutico no ha encontrado evidencia que respalde sus sospechas. Sin embargo, el valor hallado es muy cercano al  crítico, por lo que le convendría hacer más pruebas.

En estadística, la distribución Chi-cuadrado, también denominada Chi-cuadrado de Pearson, es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria:

Donde Zi son variables de distribución normal, N(0,1) o de media cero y varianza uno.

Se suele usar la denominada prueba Chi-cuadrado como test de independencia y como test de bondad de ajuste. La función de densidad Chi-cuadrado es

Γ es la función gamma. La función de distribución es

donde γ(k,z) es la función gamma incompleta.

El valor esperado y la varianza de una variable aleatoria X con distribución Chi-cuadrada son
E[X] = k         V[X] = 2k

La distribución Chi-cuadrado tiene muchas aplicaciones en inferencia estadística, por ejemplo en el test Chi-cuadrado y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t-Student, y participa en todos los problemas de análisis de varianza, por su papel en la distribución F-Snedecor, que es la distribución del cociente de dos variables aleatorias de distribución Chi-cuadrado e independientes.

 

Relación con otras distribuciones. La Chi cuadrado es una distribución binomial inversa cuyo coeficiente de variabilidad es 10.1, esta tiene un intervalo de confianza de 2.3 grados en la escala de desviaciones estándar. Posee una distribución de Poisson elevada la cual asciende a 56.5 m Eq en los tres primeros cuartiles de la recta. Para k=2 la distribución es una distribución exponencial.


La prueba de Chi-cuadrado es una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar. También se utiliza para probar la independencia de dos muestras entre sí, mediante la presentación de los datos en tablas de contingencia. La fórmula que da el estadístico es la siguiente:

Los grados de libertad nos vienen dados por: gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas.

Criterio de decisión: Se acepta H0 cuando . En caso contrario se rechaza. Donde a representa el valor proporcionado por las tablas, según el nivel de significación elegido. Cuanto más se aproxima a cero el valor de Chi-cuadrado, más ajustadas están ambas distribuciones.

CORRECCIÓN DE YATES

La corrección de Yates se aplica a la prueba Chi-cuadrado cuando la frecuencia de las observaciones en alguna de las celdas es menor de 10. La Chi-cuadrado corregida:

En general, se aplica la corrección de Yates o también corrección por continuidad cuando aproximamos una variable discreta a una distribución continua. La corrección consiste en añadir y substraer 0,5 a la variable en cuestión. Por ejemplo, obtener 3 caras al lanzar una moneda es una medida discreta (nominal) que se ajusta a la distribución binomial. Mientras que si la aproximáramos a la distribución normal, su valor oscilará entre 2,5 y 3,5.

DISTRIBUCIÓN F SNEDECOR O F-FISHER

Si U y V son dos variables aleatorias independientes que tienen distribución Chi Cuadrada con n1 y n2 grados de libertad, respectivamente, entonces, la variable aleatoria
 tiene función de distribución F-Snedecor
Que es la llamada función de distribución F-Snedecor o F-Fisher con n1 y n2 grados de libertad

Ejemplo, Un valor de f con 6 y 10 grados de libertad para un área de 0.95 a la derecha es,
f0.95,6,10=1/(f0.05,10,6)=1/4.06=0.246

Si de dos poblaciones normales, o aproximadamente normales, se extraen dos muestras aleatorias e independientes, y a cada una se le calcula su respectiva varianza, el cociente de ambos valores  (con F>1, esto es, siempre se coloca el más grande como numerador) tendrá una distribución de Fisher, cuyos valores críticos fueron obtenidos por W. Snedecor en una tabla que se caracteriza por tener dos grados de libertad: el correspondiente al numerador υ1=n1-1 y el del denominador υ2=n2-1. Programas de computación permiten calcular los valores críticos respectivos


En las Tablas se presenta una hoja para cada nivel de confianza, se eligen los más apropiados como: 95% ; 97,5% ; 99% ; 99,5% y 99,9%. Como siempre, el área total bajo la curva es la unidad y se extiende desde 0 a + ∞. La forma es muy parecida a la Chi-cuadrado. se muestran tres casos, con diferentes grados de libertad, y se marca el valor de  F=2,5 con una ,línea punteada vertical.

El principal uso de esta función es el Análisis de Varianza, que se verá más adelante, y es para cuando se necesita comparar más de dos medias muéstrales a la vez. En estos casos la idea es detectar si el efecto de uno o más tratamientos afecta a las muestras testeadas. En cambio, cuando se tiene el caso de dos muestras, la idea es testear si hay homocedasticidad en las dos poblaciones en estudio. Una vez verificado este supuesto, se puede avanzar más verificando si hay diferencia entre las medias muéstrales, y así verificar si ambas muestras tienen igual media y varianza, porque eso significa que en realidad provienen de la misma población normal. Eso probaría que no hay efecto de un tratamiento si se lo compara con un placebo, o que dos técnicas de laboratorio son equivalentes.

Si el experimento no verifica esto, entonces se deberá elegir el caso que presente menor varianza, para tener menor variabilidad en las mediciones. En Genética se puede verificar si una generación de crías es más variable en un carácter que la de sus padres. En Sistemática se puede testear si dos poblaciones locales tienen la misma variabilidad. En Bioquímica y Farmacia el uso más frecuente es comparar el error casual de mediciones de laboratorio, al introducir algún efecto o cambiar el método de medición. En el caso de testear si dos técnicas de laboratorio tienen igual dispersión, o bien, para elegir aquella con mayor precisión, conviene pensar el problema como la incidencia de un factor en estudio en lugar de dos técnicas totalmente diferentes entre sí. Por ejemplo, se trata de una misma práctica, pero se usan dos espectrofotómetros diferentes, y se trata de determinar si la modificación de la varianza se debe al uso de un aparato diferente. El factor acá sería: tipo de espectros.

También se puede estudiar la incidencia del factor humano, realizando las mismas mediciones a dos personas diferentes. De esa forma se puede imaginar que las dos muestras provienen de diferentes poblaciones, o que el efecto del factor analizado no es despreciable cuando se rechaza la hipótesis nula. En la figura se muestra el caso de dos poblaciones. En el caso (a) ambas poblaciones tienen la misma media, pero por efecto del error casual sus varianzas son diferentes. Si esta diferencia es significativa, resulta evidenciada por el Modelo de Fisher que permite la comparación de ambas.

En el caso (b) hay un error sistemático que desplaza la media, pero sus varianzas permanecen iguales. Es lo mismo que sumar una constante a todos los valores; ocurre un desplazamiento hacia la derecha. t-Student se usa para detectar esto cuando se hace el test de comparación de dos medias independientes. Como se verá más adelante, se puede construir todo un bagaje de métodos para efectuar un Control de Calidad interno en un laboratorio de medición clínica. Por ahora, basta decir que se puede controlar la exactitud con los modelos de t-Student y la precisión con los de Chi-cuadrado y Fisher.

Con esto se pueden comenzar a controlar y calibrar los sistemas de medición. Las limitaciones de todo esto son dos: la primera es que se puede estudiar el efecto del factor analizado en solo dos muestras y no en más de dos. La segunda es que si la calidad se entiende como exactitud y precisión, solo se pueden emplear estos modelos para magnitudes de tipo cuantitativas como las de la Química Clínica, pero no en magnitudes cualitativas como las usuales en Microbiología, Bacteriología, Micología, etc. En magnitudes cuantitativas, por calidad se entiende precisión y exactitud, en lugar de la capacidad de una prueba clínica para diagnosticar. Sin embargo, a pesar de estas limitaciones sigue siendo una herramienta sencilla y poderosa de control.

Para poder aplicar este modelo se deben tener en cuenta los requisitos siguientes:
-    Las muestras fueron extraídas de una población normal o aproximadamente normal.
-    La selección de las muestras se hizo en forma aleatoria.
-    Las muestras son independientes entre sí.

Ejemplo, El jefe de un laboratorio se encuentra con una técnica de medición fuera del control estadístico. Para investigar las causas decide investigar si el factor humano tiene incidencia, y toma una muestra de suero cualquiera la divide en 20 alícuotas. Luego elige 10 de ellas al azar y se las entrega al laboratorista 1 para que haga las determinaciones; las restantes las encomienda al laboratorista 2 para que las mida. Los resultados obtenidos son: s12=2,4 es la varianza obtenida por el laborista, 1 y s22=0,8 para el otro. Decidir si hay diferencia en dispersión entre ambos.
H0:
H1:
El estadígrafo es

Como se trata de un ensayo de dos colas, para un nivel del 95% de confianza, se busca en las tablas para: υ12=n1-1=9 grados de libertad, mientras que α = 0,025 para el límite inferior y α = 0,975 para el superior. Estos valores son F0,975;(9,9) = 4,03.

Luego, para calcular el valor no tabulado α = 0,025 se aprovecha una propiedad que tiene la función F usando la inversa: F0,025;(9,9) =1/F0,975; (9,9) =1/4,03 = 0,248 Como el valor hallado F=3 cae dentro de la zona de aceptación, no hay evidencia significativa como para decir que el factor humano tiene incidencia en la dispersión de las mediciones.

La distribución F de Snedecor aparece en los contrastes asociados a comparaciones entre las varianzas de dos poblaciones normales. Si (X1,X2,...,Xm) y (Z1,Z2,...,Zn) son m+n variables aleatorias normales independientes de media m=0 y varianza s2, la variable

tiene una distribución Fm,n-Snedecor de m y n grados de libertad. Su función de densidad es

con x > 0, siendo la función gamma de Euler con P>0. Finalmente, la función de distribución viene dada por

y sus momentos por la media y la varianza son

Definiéndole de otra manera, sean variables aleatorias independientes, entonces,

sigue una distribución de probabilidad F-Snedecor, con (n,m) grados de libertad. Obsérvese que Fn,m≠Fm,n


Es claro que la distribución F-Snedecor no es simétrica, pues sólo tienen densidad de probabilidad distinta de cero, y además


















DISTRIBUCION JI-CUADRADA (X2)


En realidad la distribución ji-cuadrada es la distribución muestral de s2. O sea que si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X2. Si se elige una muestra de tamaño n de una población normal con varianza Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif, el estadístico:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image933.gif
Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada está dado por:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image934.gif
Donde n es el tamaño de la muestra, s2 la varianza muestral y Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gifla varianza de la población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente expresión:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image935.gif
Propiedades de las distribuciones ji-cuadrada
  1. Los valores de X2 son mayores o iguales que 0.
  2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número infinito de distribuciones X2.
  3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
  4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha.
  5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
  6. El valor modal de una distribución X2 se da en el valor (n-3).
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-2).
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image936.gif
La función de densidad de la distribución X2 esta dada por:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image937.gifpara x>0
La tabla que se utilizará para estos apuntes es la del libro de probabilidad y estadística de Walpole, la cual da valores críticos Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1192.gif(gl) para veinte valores especiales de Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif. Para denotar el valor crítico de una distribución X2 con gl grados de libertad se usa el símbolo Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1193.gif(gl); este valor crítico determina a su derecha un área de Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gifbajo la curva X2 y sobre el eje horizontal. Por ejemplo para encontrar X20.05 (6) en la tabla se localiza 6 gl en el lado izquierdo y Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1244.gifa lo largo del lado superior de la misma tabla.
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1245.gif
Cálculo de Probabilidad
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber cómo se va a comportar la varianza o desviación estándar en una muestra que proviene de una distribución normal.
Ejemplos:
  1. Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos en una ciudad grande forman una distribución normal con una desviación estándar Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gif=1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2.
Solución:
Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image939.gif
El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se encuentra que a este valor le corresponde un área a la derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s2>2)
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image940.gif
  1. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1246.gif
, tenga una varianza muestral:
  1. Mayor que 9.1
  2. Entre 3.462 y 10.745
Solución.
  1. Primero se procederá a calcular el valor de la ji-cuadrada:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image941.gif
Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha de 0.05. Por lo que la P(s2 >9.1) = 0.05
  1. Se calcularán dos valores de ji-cuadrada:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image942.gify Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image943.gif
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el área de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la P(3.462 Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1243.gifs2 Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1243.gif10.745) = 0.94
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image944.gif
Estimación de la Varianza
Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image934.gif
Al despejar esta fórmula la varianza poblacional nos queda:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image945.gif
Los valores de X2 dependerán de nivel de confianza que se quiera al cual le llamamosDescripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1247.gif. Si nos ubicamos en la gráfica se tiene:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image946.gif
Ejemplos:
  1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compañía, suponga una población normal.
Solución:
Primero se calcula la desviación estándar de la muestra:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image947.gif
Al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.
Para obtener un intervalo de confianza de 95% se elige un Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05. Después con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image948.gif
Se puede observar en la gráfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza es:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image949.gif
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image950.gif
Graficamente:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image951.gif
Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. La interpretación quedaría similar a nuestros temas anteriores referentes a estimación. Con un nivel de confianza del 95% se sabe que la varianza de la población de los pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.

  1. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los resultados que producen muestras estándar. En un estudio de la cantidad de calcio en el agua potable, el cual se efectúa como parte del control de calidad, se analizó seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por millón fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la población para este estándar, usando un nivel de confianza del 90%.
Solución:
Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obteniéndose dos resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Entonces el intervalo de confianza está dado por:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image952.gify Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image953.gif
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image954.gif
En la mayoría de los casos se tiene el problema de desconocer la varianza o desviación estándar de la población, en donde las distribuciones son normales. Si se desea probar una hipótesis acerca de la varianza se puede hacer utilizando las medidas estadísticas con las que se construyó el intervalo de confianzaDescripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif, esto es con la distribución Ji- cuadrada.
Ejemplos:
  1. Una compañía que produce una parte maquinada para un motor, afirma que tiene una varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes dio una varianza de muestra s2 = 0.0003. Si se supone que las medidas del diámetro se distribuyen en forma normal, ¿hay evidencia para refutar lo que afirma el proveedor? Use Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05.
Solución:
Como en todos los ensayos de hipótesis que se han realizado anteriormente el procedimiento es el mismo. Después de que se identifican los datos, se plantea la hipótesis para determinar el tipo de ensayo.
Datos:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif= 0.0002
n = 10
s2 = 0.0003
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05
Ensayo de hipótesis:
Ho; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif= 0.0002
H1; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif> 0.0002
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image955.gif
Regla de decisión:
Si X2RDescripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1243.gif 16.919 no se rechaza Ho.
Si X2R>16.919 se rechaza Ho.
Cálculos:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image956.gif
Justificación y decisión:
Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y se concluye con un nivel de significancia de 0.05 que no se puede refutar la afirmación del proveedor.
Este ejercicio se puede aprovechar para calcular el valor de P. En la tabla se busca el valor de 13.5 en el renglón de 9 grados de libertad. Interpolando entre 0.10 y 0.20 se obtiene un valor de P de 0.1484.
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image957.gif
  1. El contenido de azúcar del almíbar de los duraznos enlatados tiene una distribución normal, donde se cree que la varianza es Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif= 18 mg2. Se toma una muestra de 10 latas dieron una desviación estándar de 4.8 mg. ¿Muestran estos datos suficiente evidencia para decir que la varianza ha cambiado?. Use un Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05 y calcule el valor de P.
Solución:
Datos:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif= 18
n = 10
s = 4.8
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05
Ensayo de hipótesis:
Ho; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gif= 18
H1; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1174.gifDescripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1178.gif18
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image958.gif
Regla de decisión:
Si 2.7Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1243.gif X2RDescripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1243.gif 19.023 no se rechaza Ho.
Si X2R<2.7 ó si X2R>19.023 se rechaza Ho.
Cálculos:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image959.gif
Justificación y decisión:
Como 11.52 está entre 2.7 y 19.023, no se rechaza Ho, y se concluye con un nivel de significancia de 0.05 que la varianza del contenido de azúcar del almíbar no ha cambiado, esto es es de 18 mg2.
Si recordamos al principio de este tema se dijo que la media de la distribución ji-cuadrada es (n-1), por lo tanto la media de este ejercicio es de 9. Como el valor real de X2R = 11.52 este número se encuentra a la derecha de la media, lo cual quiere decir que el valor de P/2 será el área a la derecha del valor de X2R. Al buscar el valor de 11.52 en la tabla se obtiene un área de 0.2423, por lo tanto P/2 = 0.2423 y P= (2)(0.2423) = 0.4846
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image960.gif
  1. Experiencia anterior indica que el tiempo que se requiere para que los estudiantes de último año de preparatoria completen una prueba estandarizada es una variable aletoria normal con una desviación estándar de seis minutos. Se toma una muestra aleatoria de 20 estudiantes de último año de preparatoria y se obtiene una desviación estándar de 4.51. ¿Muestran estos datos suficiente evidencia para decir que la desviación estándar disminuyó?. Utilice el valor de P para su decisión.
Solución:
Datos:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gif= 6
n = 20
s = 4.51
Ensayo de hipótesis:
Ho; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gif= 6
H1; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gif< 6
Cálculos:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image961.gif
Para obtener el valor de P, se busca en la tabla el 10.735 con 19 grados de libertad, y el área que se encuentra es la que está a la derecha de este valor. Como la media de esta distribución ji-cuadrada es de 19, por lo tanto el valor de 10.735 queda a la izquierda de la media. El valor de P es de 0.07, y con esto se puede concluir que si hubiéramos utilizado un nivel de significancia de 0.10, se rechaza Ho y se concluye que la desviación estándar disminuyo, pero si se utiliza un valor de Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05, entonces no se rechaza Ho y se concluiría que la desviación estándar no disminuyó. La decisión depende del error tipo I que esté dispuesto a tolerar el investigador.
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image962.gif
El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán algunos ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de la distribución Ji-cuadrada.
  1. Se tiene un ensayo de hipótesis unilateral derecho, con n=20 y Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1179.gif= 0.05
Ho; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gif= 0.10
H1; Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1176.gif> 0.10
Se quiere calcular el error tipo II ó Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1180.gifsi las desviaciones estándar verdaderas fueran de 0.12 y 0.14.
Solución:
Para poder calcular el error tipo II, primero se debe encontrar el valor de la varianza muestral límite, esto es s2L, para poder calcular los valores de X2 y posteriormente calcular el área. Al buscar en la tabla X2(0.05,19)=30.144, este valor se sustituirá en la formula. Al despejar de la fórmula original de X2 se obtiene:
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image963.gif
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image964.gif
  1. Encontrar el error tipo II para el ejercicio 2 de esta sección, en donde el ensayo es bilateral pues se quiere ver si la varianza del contenido de azúcar en el almíbar de los duraznos ha cambiado. Suponga una varianza real de 20 y 26.

Solución:
Como este es un ensayo bilateral se tendrán dos valores de s2L. Los cuales se calcularán utilizando las ji-cuadradas límites que eran de de 2.7 y 19.023.
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image965.gif
y
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image966.gif
Estos dos valores se utilizarán para calcular las nuevas ji-cuadradas para calcular el valor de Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image1180.gif.
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image967.gif
Descripción: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image968.gif