Loading documents preview...
Un generador de números aleatorios usado para obtener 100 números en el intervalo (0,1). Los números generados están resumidos en la tabla siguiente: Nº generados
Intervalo* 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
* intervalos semiabiertos ( , ]
114 100 99 98 111 104 106 95 92 81 1000
Aceptaría usted la hipótesis que este generador está trabajando como debe; esto es, podemos pensar que los números generados constituyen una muestra aleatoria de una distribución uniforme en (0,1)
sto es, podemos pensar ión uniforme en (0,1)
Chi cuadrado Nº Intervalo* generados 0 menor o igual a 0 0.0 0.1 114 0.1 0.2 100 0.2 0.3 99 0.3 0.4 98 0.4 0.5 111 0.5 0.6 104 0.6 0.7 106 0.7 0.8 95 0.8 0.9 92 0.9 1.0 81 mayor que 1 0 * intervalos semiabiertos1000 ( , ]
fi 0 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0 1
2 n * fi (FO - FE) /FE
0 100 100 100 100 100 100 100 100 100 100 0
0 1.96 0.00 0.01 0.04 1.21 0.16 0.36 0.25 0.64 3.61 0 8.24
X: números generados Ho X ~ U(0,1) H1 X no se distribuye U(0,1) Bajo el supuesto de que Ho es verdadera Ei = n fi f(x)=1 / (b-a)= 1 P(0 < x ≤ 0,1)= integral de 0 a 0,1 dx = 0,1 como es una distribución uniforme 0,1 se mantiene constante y por lo tanto n * fi también Supuestos Todas las frecuencias esperadas son >5
FO: frecuencias observadas (en este caso número de generad FE: frecuencias esperadas (en este caso n * fi ) chi cuadrado calculado es 8,24 grados de libertad g.l.= g.l.= con región crítica: Se rechaza Ho si: Región crítica
Buscando en la tabla X2 de 0,95 con 2 g.l. se obtiene: 16,92 es el valor crítico. La región crítica son todos los valores mayores o iguales a él. Conclusión estadística Respuesta al problema
con valor p
frecuencias observadas (en este caso número de generadores=
recuencias esperadas (en este caso n * fi )
uadrado calculado es 8,24 Nº clases-Nº parámetros a estimar-1 k-p-1 10 - 0 - 1 = 9
chi cuadrado calculado es mayor que chi cuadrado de 1 menos alpha con k menos p menos 1 grado de libertad.
cando en la tabla X2 de 0,95 con 2 g.l. se obtiene: 16.92 2 es el valor crítico. La región crítica son todos los valores
Chi cuadrado calculado NO pertenece a la región crítica por lo tanto NO se rechaza la hipótesis nula Los números aleatorios generados constituyen una m.a. de distribución uniforme (0,1)
valor p = P( X2 9 > 8,24) valor p = 1- P( X2 9 < 8,24) valor p = 1-0,41 valor p = 0,59 > 0,05 (nivel de significancia) Conclusión estadística
Chi cuadrado calculado NO pertenece a la por lo tanto NO se rechaza la hipótesis nu Respuesta al problema Los números aleatorios generados constit distribución uniforme (0,1)
obs el 0,41 se obtiene interpolando con los val para chi cuadrado con 9 grados de liberta 4.17 8.24 4.68
0.1 X 0.9
14,68 - 4,17 8,24- 4,17
=
Chi cuadrado calculado NO pertenece a la región crítica por lo tanto NO se rechaza la hipótesis nula Los números aleatorios generados constituyen una m.a. de distribución uniforme (0,1) el 0,41 se obtiene interpolando con los valores de la tabla para chi cuadrado con 9 grados de libertad
0,9 - 0,1 X - 0,1
Una muestra de 200 adultos de más de 60 años. Se clasificó de acuerdo a su educación y al número de hijos de cada uno de ellos. Educación Primaria Secundaria Universitaria
0 a 1 14 19 12
Número de Hijos 2a3 37 42 17
más de 3 32 17 10
¿Se puede decir que el número de hijos es independiente del nivel de educación de los padres? Use alpha 0,05 y enuncie claramente sus hipótesis.
grados de libertad Número de Hijos Educación
0 a 1
Primaria Secundaria Universitaria Totales
14 19 12 45
2 a 3 más de 3 Totales 37 42 17 96
32 17 10 59
83 78 39 200
Frecuencias Esperadas Número de Hijos Educación 0 a 1 2 a 3 más de 3 Primaria 18.7 39.8 24.5 Secundaria 17.6 37.4 23.0 Universitaria 8.8 18.7 11.5 Supuestos
(Nº columnas-1)(Nº filas-1) g.l.= (3-1)*(3-1) g.l.= 4
Se rechaza Ho si:
Región crítica
con región crítica: Buscando en la tabla X2 de 0,95 con 4 g.l. se obtiene: 9,49 es el valor crítico. La región crítica son todos los valores mayores o iguales a él.
Todas las frecuencias esperadas son >5
X nº de hijos Y nivel educacional de los padres Ho eX es INDEPENDIENTE de Y H1 X es DEPENDIENTE Y Estadístico de prueba:
Chi cuadrado calculado
7.46
Conclusión estadística
Chi cuadrado calculado NO pertenece a l por lo tanto NO se rechaza la hipótesis nul
Respueta al problema
el nº de hijos es INDEPENDIENTEdel nivel o las variables nº de hijos y niv educ de los
º columnas-1)(Nº filas-1)
5 con 4 g.l. se obtiene: 9.49 ón crítica son todos los valores
hi cuadrado calculado NO pertenece a la región crítica r lo tanto NO se rechaza la hipótesis nula
nº de hijos es INDEPENDIENTEdel nivel de educación de los padres as variables nº de hijos y niv educ de los padres no están asociadas.
con valor p valor p = P( X2 4 > 7,46) valor p = 1- P( X2 4 < 7,46) valor p = 1- ¿? valor p = ¿? > 0,05 (nivel de significancia)
Conclusión estadística las conclusiones son las mismas obtendas p Respuesta al problema región crítica
obs el ¿? se obtiene interpolando con los valores para chi cuadrado con 9 grados de libertad 1.064 7.46 7.78
0.1 X 0.9
7,78 - 1,064
=
7,46- 1,064
clusiones son las mismas obtendas para la
e obtiene interpolando con los valores de la tabla hi cuadrado con 9 grados de libertad
0,9 - 0,1 X - 0,1
Una muestra aleatoria de 90 adultos se clasifica de acuerdo al sexo de los individuos y el número de horas que ven televisión durante una semana.
más de 20 hrs. menos de 20 hrs.
hombre 12 27
mujer 29 19
Utilice un nivel de significación 0.01 y pruebe la hipótesis de que el tiempo utilizado para ver TV es independiente del sexo.
género Nº de horas que ve TV
hombre
mujer
Totales
más de 20 hrs. menos de 20 hrs.
12 27
29 19
41
Totales
39
48
Frecuencias Esperadas Nº de horas que ve TV
más de 20 hrs. menos de 20 hrs.
Ho H1
46 87
Chi cuadrado calculado
grados de libertad
7.59
(Nº columnas-1)(Nº filas-1) g.l.= (2-1)*(2-1) g.l.= 1
Se rechaza Ho si:
género
hombre
mujer
18.4
22.6
20.6
25.4
X sexo Y nº de horas que ven TV en una semana X es INDEPENDIENTE de Y X es DEPENDIENTE Y
Región crítica
con región crítica: Buscando en la tabla X2 de 0,99 con 1 g.l. se obtiene: que es el valor crítico. La región crítica son todos los valores mayores o iguales a él.
Estadístico de prueba: Conclusión estadística
Chi cuadrado calculado pertenece a por lo tanto se rechaza la hipótesis n
Respueta al problema
el nº de horas semanales que ve TV el nº de horas semanales que ve TV
º columnas-1)(Nº filas-1)
99 con 1 g.l. se obtiene: 6.63 ón crítica son todos los valores
hi cuadrado calculado pertenece a la región crítica r lo tanto se rechaza la hipótesis nula
nº de horas semanales que ve TV DEPENDIENTE del género nº de horas semanales que ve TV está asociado al género
con valor p valor p = P( X2 1 > 7,59) valor p = 1- P( X2 1 < 7,59) valor p = 1- ¿? valor p = ¿? < 0,01 (nivel de significancia) Conclusión estadística
las conclusiones son las mismas obtendas para la
Respuesta al problema región crítica
obs el ¿? se obtiene interpolando con los valores de la para chi cuadrado con 9 grados de libertad 6.63 7.59 7.88
0.99 X 0.995
7,88 - 6,63 7,59- 6,63
=
0,995 - 0,99 X - 0,99
mismas obtendas para la
ando con los valores de la tabla grados de libertad
Luego de dos años de trabajar en una estación donde pesan camiones, Juan José piensa que el peso por camión en toneladas normal con media siete toneladas. Con el objeto de probar su suposición, reunió los soguientes datos registrando el peso de ca en la estación y los tabuló de la siguiente manera:
a) JJ aplicó una prueba de bondad de ajuste a estos datos. ¿A qué conclusión llegará sobre la distribución de los pesos de los Use un nivel de significancia de 0,10 b) Determine un intervalo de confianza del 95% para el peso promedio de estos camiones? Peso del Camión 4 6 6 8 8 9 más de 9
Frecuencia observada 20 14 18 8
que el peso por camión en toneladas sigue una distribución ntes datos registrando el peso de cada camión que entra
e la distribución de los pesos de los camiones?
Frecuencia Peso del 2 marca observada marca *frec Camión <
4
4 6 8 >
6 8 9 9
0 5 7 8.5 11
20 14 18 8
500.0 686.0 1300.5 968.0
Z
pi*
2 Frec.Esp. X calculado n*pi (FO - FE)2/FE
-1.02
0.1528
0.153
9.17
9.168
-0.34 0.34 0.68 0.68
0.3664 0.6336 0.7527 0.7527
0.214 0.267 0.119 0.247
12.81 16.04 7.14 14.84
4.030 0.259 16.499 3.152
1
60
33.11
60
3454.5 8.58 varianza Luego la desviación estándar es: 2.93
*los valores no calzan igual que en las tablas porque los valores de Z aquí están con todos decimales para estimar la varianza se puede utilizar una de estas dos expresiones ç
la segunda es más fácil al realizar cálculos a mano. como debemios obtener una estimación del parámetro supondremos, sólo para este efecto, que tiene amplitud 2 como los dos primeros y por lo tanto la marca de clase es 11
con valor p valor p = P( X2 3 > 33,11)
X: peso de un camión, en toneladas Ho X ~ N( 7 , sigma2 ) H1 X no se distribuye N( 7 , sigma2 )
valor p = 1- P( X2 3 < 33,11) valor p = 1-0,99999 valor p =0,0000001 < 0,1 (nivel de significancia
chi cuadrado calculado es 33,1 Conclusión estadística grados de libertad
Nº clases-Nº parámetros a estimar-1 g.l.= k-p-1 g.l.= 5 - 1 - 1 = 3
con región crítica: Se rechaza Ho si:
chi cuadrado calculado es mayor que chi cuadrado de 1 menos alpha con k menos p menos 1 grado de libertad.
Buscando en la tabla X2 de 0,90 con 3 g.l. se obtiene: que es el valor crítico. La región crítica son todos los valores mayores o iguales a él. Conclusión estadística
Respuesta al problema
6.25
Chi cuadrado calculado pertenece a la región crítica por lo tanto se rechaza la hipótesis nula Respuesta al problema el peso de los camiones en toneladas no sigue una distribución distribución normal con media 7
p = P( X2 3 > 33,11) p = 1- P( X2 3 < 33,11) p =0,0000001 < 0,1 (nivel de significancia) Chi cuadrado calculado pertenece a la región crítica por lo tanto se rechaza la hipótesis nula el peso de los camiones en toneladas no sigue una distribución distribución normal con media 7
Un estudio que se realizó con 84 personas referente a la revelación entre la cantidad de violencia vista en la TV y la edad del te produjo los siguientes resultados: a) ¿indican los datos que ver violencia en la TV depende de la edad del telvidente? Use alpha 0,05 b) Aceptaría usted que la edad de las personas constituyen una m.a. de una población normal? (edad máxima 80 años), alpha Edad Grado de Violencia en la TV poca mucha
16 - 34
35 - 54
55 ó más
8 18
12 15
21 7
en la TV y la edad del televidente
máxima 80 años), alpha 0,01
grados de libertad Edad Grado de Violencia en la TV poca mucha Totales
16 - 34
35 - 54
55 ó más
Totales
8 18 26
12 15 27
21 7 28
41 40 81
(Nº columnas-1)(Nº filas-1) g.l.= (3-1)*(2-1) g.l.= 2
Se rechaza Ho si:
Región crítica Frecuencias Esperadas Grado de Edad Violencia en la 16 - 34 35 - 54 TV Primaria 13.2 13.7 Secundaria 12.8 13.3 Supuestos
Ho H1
55 ó más 14.2 13.8
Todas las frecuencias esperadas son >5
con región crítica:
Buscando en la tabla X2 de 0,95 con 2 g.l. se obtiene: 9,49 es el valor crítico. La región crítica son todos los valores mayores o iguales a él.
X ver violencia en TV Y edad
Conclusión estadística
Chi cuadrado calculado pertene por lo tanto se rechaza la hipóte
X es INDEPENDIENTE de Y X es DEPENDIENTE Y
Respueta al problema
ver violencia en la TV está asoc o ver violencia en la TV depende
Estadístico de prueba:
Chi cuadrado calculado
11.2
º columnas-1)(Nº filas-1)
5 con 2 g.l. se obtiene: 5.99 ón crítica son todos los valores
hi cuadrado calculado pertenece a la región crítica r lo tanto se rechaza la hipótesis nula
r violencia en la TV está asociado a la edad ver violencia en la TV depende de la edad
La tabla de frecuencia siguiente refleja datos de las ventas diarias durante 200 días, con alpha 0,05, ¿parecen seguir las ventas a) con parámetros media = 120 días y desviacion estándar = 20? b) con ambos parámetros desconocidos.
Ventas 20 60 80 100 120 140 160 180
60 80 100 120 140 160 180 200
Frecuencia 7 22 46 42 42 18 11 12
parecen seguir las ventas una distribución normal?
Ventas menos 20 20 60 60 80 80 100 100 120 120 140 140 160 160 180 180 200 mas 200
marca F.O. 20 0 40 7 70 22 90 46 110 42 130 42 150 18 170 11 190 12 0 200
marca*frec 0 280 1540 4140 4620 5460 2700 1870 2280 0 22890 114.5 promedio
(Xi-Xbarra)2*frec 0 38799.6175 43467.655 27498.915 831.705 10155.705 22748.445 33943.8275 68493.63 0 245939.5 1235.9 varianza
Z -2.69 -1.55 -0.98 -0.41 0.16 0.73 1.30 1.86 2.43 2.43
0.0036 0.0607 0.1636 0.3405 0.5627 0.7663 0.9025 0.9689 0.9925 0.9925
Ho Las ventas se distribuyen normal con media 114.5 y varianza 1235.9 H1 Las ventas no se distribuyen normal con media 114.5 y varianza 1235.9 G LIBERTAD= 8-2-1=5 VALOR CRITICO= 11.05 Como chi cuadrado calculado (14.51) es mayor que el valor critico,(11.05), se rechaza la hipotesis nula de normalidad con media 114.5, varianza 1235.9 Ho Las ventas se distribuyen normal con media 120 y desviación estándar 20 H1 Las ventas no se distribuyen normal con media 120 y desviación estándar 20 Ventas menos 20 20 60 60 80 80 100 100 120 120 140 140 160 160 180 180 200 mas 200
marca F.O. 20 0 40 7 70 22 90 46 110 42 130 42 150 18 170 11 190 12 0 200
Z -5.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00 4.00
0.0000 0.0013 0.0228 0.1587 0.5000 0.8413 0.9772 0.9987 1.0000 1.0000
pi F.E. n*pi 0.00000 0.00 0.00135 0.27 0.02140 4.28 0.13591 27.18 0.34134 68.27 0.34134 68.27 0.13591 27.18 0.02140 4.28 0.00132 0.26 0.0000 0.01 1.0000 200
G LIBERTAD= 4-1=3 VALOR CRITICO= 7.815 Como chi cuadrado calculado (83.36) es mayor que el valor critico,(7.815), se rechaza la hipotesis nula de normalidad con media 114.5, varianza 1235.9
pi F.E. n*pi 0.00361 0.72 0.05710 11.42 0.10285 20.57 0.17697 35.39 0.22220 44.44 0.20360 40.72 0.13614 27.23 0.06642 13.28 0.02364 4.73 0.0075 1.50 0.9889 197.7830
F.O.
F.E.
(FO - FE)2/FE
7 22 46 42 42 18 11 12
12.14 20.6 35.4 44.4 40.7 27.2 13.3 6.2
2.177 0.099 3.179 0.134 0.040 3.127 0.393 5.361
200
200
14.51
Todas las frecuencias esperadas deben ser >5, como no ocurre con todas se fusionan categorías
haza la hipotesis nula de
F.O.
F.E.
(FO - FE)2/FE
75 42 42 41
31.46 68.3 68.3 31.5
60.253 10.108 10.108 2.892
200
199
83.36
haza la hipotesis nula de
Se condujo una encuesta aleatoria entre los ciudadanos en edad de votar para determinar si existía alguna relación entre la afiliación partidista y la opinión respecto al control de armas. Se obtuvo la información de la siguiente tabla para alpha 0,01 ¿existe alguna relación para creer que existe una dependencia entre la opinión y la afiliación partidista?ç Partido democracia republicano Independientes
a favor 38 30 32
en contra 29 42 59
sin decisión 7 7 4
si existía alguna relación entre la siguiente tabla para alpha 0,01 n partidista?ç
Partido
a favor
en contra
sin decisión
Totales
democracia
38
29
7
74
g.l.=
republicano Independientes Totales
30 32 100
42 59 130
7 4 18
79 95 248
g.l.=
sin decisión 5.4 5.7 6.9 18
Totales 74 79 95 248
Partido democracia republicano Independientes Totales Supuestos
Frecuencias Esperadas a favor en contra 29.8 38.8 31.9 41.4 38.3 49.8 100 130
Todas las frecuencias esperadas son >5
X Partido Y :Opinión Ho: X es INDEPENDIENTE de Y H1: X es DEPENDIENTE Y Chi cuadrado calculado
grados de libertad
con región crítica:
Buscando en la tabla X2 de 0,95 con 4 g.l. se ob 9,49 es el valor crítico. La región crítica son todo mayores o iguales a él. Conclusión estadística
Respueta al problema 9.55
(Nº columnas-1)(Nº filas-
con valor p valor p = P( X2 4 > 9,55)
(Nº columnas-1)(Nº filas-1)
valor p = 1- P( X2 4 < 9,55) valor p = 1- ¿? valor p = ¿? > 0,05 (nivel de significancia)
(3-1)*(3-1) 4
Conclusión estadística Respuesta al problema
obs
tabla X2 de 0,95 con 4 g.l. se obtiene: crítico. La región crítica son todos los valores
9.49
Chi cuadrado calculado Pertenece a la región crítica por lo tanto se rechaza la hipótesis nula La opinión es DEPENDIENTE del partido
,05 (nivel de significancia) las conclusiones son las mismas obtendas para la región crítica
el ¿? se obtiene interpolando con los valores de la tabla para chi cuadrado con 4 grados de libertad 9.49 9.55 11.14 11,14-9,49 9,55-9,49
0.95 X 0.975 = 0,975-0,95 X - 0,95
La tabla siguiente presenta la información de 34 años respecto al número de accidentes laborales que ocurren por año en una ind
Nº de accidentes en un año frecuencia
0
1
2
3
4
5
6
7
8 Total
2
7
3
4
2
6
5
1
4
34
a) pruebe que estos datos provienen de una población Poisson. Use alpha 0,01 b) Suponiendo que estos valores corresponden a los valores observados de una variable Poisson (µ) b1) estime la probabilidad de que ocurra a lo sumo 1 accidnete al año b2) Construya un intervalo de confianza del 90% para µ
identes laborales que ocurren por año en una industria.
variable Poisson (µ)
Ho el nº de accidentes laborales se distribuye poisson (mu) H1 el nº de accidentes laborales no se distribuye poisson (mu) mu gorro 3.882352941
X
F.O.
frec
X
Obs
p(x)
0 1 2 3 4 5 6 7 8 TOTAL
2 7 3 4 2 6 5 1 4 34
0 7 6 12 8 30 30 7 32 132
0 1 2 3 4 5 6 7 >=8 TOTAL
2 7 3 4 2 6 5 1 4 34
0.0206 0.0800 0.1553 0.2009 0.1950 0.1514 0.0980 0.0543 0.0444 1.0
Esp supuestos 0.70 2.72 5.28 6.83 6.63 5.15 3.33 1.85 1.51 34.0
8.70 6.83 6.63 5.15 6.69
Colapsar Obs categorias
<=2 3 4 5 >=6
12 4 2 6 10
34
Todas las frecuencias esperadas deben ser >5,
como no ocurre con todas se fusionan categorías Después de colapsar quedaron 5 categorías Por lo tanto los grados de libertad son (5-1-1) porque además se estimó un parámetro X2 3 , 0.99 =11.34 Como 7.4389 < X2 3 , 0.99 = 11.34 X2 C = NO se rechaza la hipótesis nula El número de accidentes laborales que ocurren por año en una industria no se ditribuyen poisson (mu)
p(x)
Esp
(Oi - Ei)2/Ei
0.2559 0.2009 0.1950 0.1514 0.1968
8.6990 6.8317 6.6308 5.1486 6.6899
1.2526 1.1737 3.2340 0.1408 1.6378
1.0000
34.0
7.4389 Chi calculado
peradas deben ser >5,
das se fusionan categorías
Se llevaron registros del intervalo entre fallas sucesivas del sistema de acondicionamiento de aire en un avión a reacción Boein si el sistema de acondicionamiento tiene una tasa constante de falla, entonces los intervalos entre fallas sucesivas deben tener distribución exponencial. Los intervalos observados, en horas, entre fallas sucesivas, son las siguientes. 23 246 71
261 21 11
87 42 14
7 20 11
120 5 16
14 12 90
62 120 1
47 11 16
¿Siguen estos datos una distribución exponencial a nivel de significación de 5%?
225 3 52
71 14 95
en un avión a reacción Boeing 720. fallas sucesivas deben tener una
F.OBS 1 3 5 7 11 11 11 12 14 14 14 16 16 20 21 23 42 47 52 62 71 71 87 90 95 120 120 225 246 261
0 44 88 132 176 220
44 88 132 176 220 264
17 6 4 0 0 3 30
F.ESP
Fobs
22 374 0.5055 15.1656 66 396 0.2500 7.4991 110 440 0.1264 3.7909 154 0 0.0639 1.9164 198 0 0.0323 0.9688 242 0.0167 0.5007 1210 0.9947 29.8414
17 6 7
Frec.Esp. n*pi 15.1656 7.4991 7.1767
X2 calculado (FO - FE)2/FE 0.222 0.300 0.004
29.8414
0.526
Promedio=64,5 lambda gorro = 1/64,5 =0,016 Ho: Los tiempos entre fallas se distribuyen exponencial con parametro 0.016 H1: Los tiempos entre fallas no se distribuyen exponencial con parametro 0.016 chi cuadrado calculado es ,526 grados de libertad g.l.= 3-1-1 g.l.= 1 con región crítica: Se rechaza Ho si: chi cuadrado calculado es mayor que chi cuadrado de 1 menos alpha con k menos p menos 1 grado de libertad. Buscando en la tabla X2 de 0,95 con 1 g.l. se obtiene:3,84 que es el valor crítico. La región crítica son todos los valores mayores o iguales a él. Conclusión estadística Chi cuadrado calculado no pertenece a la región crítica por lo tanto no se rechaza la hipótesis nula Los tiempos entre fallas se distribuyen exponencial con parametro 0.016 Respuesta al problema
con valor p valor p = P( X2 1 > 0,526) valor p = 1- P( X2 1 < 0,526 ) valor p >0.1 tiempos entre fallas se distribuyen exponencial con parametro 0.016 RespuestaLos al problema
Se trata de una distribución continua y por lo tanto hay que construir intervalos porque las probabilidades no se pueden calcular para valores puntuales entonces calculando el número de intervalos (5,5) y la amplitud con la fórmula 1+3,22 log(n) )procedimiento del primer apunte)