Loading documents preview...
INSTITUTO TECNOLOGICO SUPERIORES DE ZAMORA
ESTASDISTICA INFERENCIAL 2
TRABAJO 1
UNIDAD 1
PROFESORA: ING.ANDREA LETICIA HERNANDEZ MARISCAL
EQUIPO: GUTIERREZ AMEZCUA BRAULIO ANTONIO GARCIA ZAMBRANO JOSE LUIS RAZO RIOS MAURICIO MIGUEL GUTIERREZ GARCIA JOSE ALFREDO GUTIERREZ VEGA FRANCISCO SANCHEZ VAZQUEZ CARLOS ALBERTO
GRUPO: 4B pág. 1
I.I
DE
ESTUDIOS
04/03/2019
“REGRESIÓN LINEAL SIMPLE”
1.- Se aplica un examen de colocación de matemáticas a todos los estudiantes de nuevo ingreso en una universidad pequeña. Se negará la inscripción al curso regular de matemáticas a los estudiantes que obtengan menos de 35 puntos y se les enviara a clases de regularización. Se registraron los resultados del examen de colocación y las calificaciones finales de 20 estudiantes que tomaron el curso regular. a) Ecuación de la regresión b) Predicción del valor de 𝑦 para el primer valor de 𝑥. c) Coeficiente de correlación (𝑟 y 𝑟 2 ) d) Diagrama de dispersión con regresión. e) Intervalos de confianza para la predicción del 95% f) Prueba de Hipótesis
pág. 2
a) Ecuación de la regresión 𝑌 = 32.5 + 0.471(𝑥) b) Predicción del valor de y para el primer valor de x. 𝑦̂ = 32.5 + 0.471(50) 𝑦̂ = 32.5 + 23.5 𝑦̂ = 56.05
pág. 3
c) Coeficiente de correlación (𝑟 y 𝑟 2 ):
𝑟 =0.453513352 𝑟 2 =0.20567436
Y 100 90 80 70 60 50 40 30 20 10 0
Y
0
20
40
60
80
100
d) Diagrama de dispersión con regresión. e) Intervalos de confianza para la predicción del 95%.
Intervalo de confianza para 𝑦 dado un valor de 𝑥.
N.C.= 95% 𝛼 = 5% = 0.05 𝛼⁄ = 0.025 ; 1 − 0.025 = 0.975 2 𝑛 − 2 = 18
𝑡𝛼⁄2,𝑛−2 = 𝑡0.025,18 =
Error estándar de estimación:
74,725 − 32.5(1,173) − 0.471(67,690) 𝑆𝑦 ∙ 𝑥 = √ 18 𝑆𝑦 ∙ 𝑥 = pág. 4
I.
56.0591 ± 2.101(16.1747)√
1 20
+
(50−55.5) 2 67100−
(1110) 2 20
56.0591 ± 8.0062 L.I.=56.0591 − 8.0062 = 48.0531 L.S.=56.0591 + 8.0062 = 64.0653 II.
48.9931 ± 2.101(16.1747)√
1 20
+
(35−55.5) 2 67100−
(1110) 2 20
48.9931 ± 12.0856 L.I.=48.9931 − 12.0856 = 36.9081 L.S=48.9931 + 12.0856 = 61.0787 III.
51.3484 ± 2.101(16.1747)√
1 20
+
(40−55.5) 2 67100−
(1110) 2 20
51.3484 ± 10.4035 L.I=51.3484 − 10.4035 = 40.9454 L.S.= 51.3484 + 10.4035 = 61.7519 IV.
58.4144 ± 2.101(16.1747)√
1 20
+
(55−55.5) 2 67100−
(1110) 2 20
58.4144 ± 7.6022 L.I.=58.4144 − 7.6022 = 50.8124 L.S.=58.4144 + 7.6022 = 66.0166 V.
63.1251 ± 2.101(16.1747)√
1 20
+
(65−55.5) 2 67100−
(1110) 2 20
63.1251 ± 8.7584 L.I.=63.1251 − 8.7584 = 54.3671 L.S=63.1251 + 8.7584 = 71.8835 VI.
60.7697 ± 2.101(16.1747)√
1 20
+
(60−55.5) 2 67100−
(1110) 2 20
60.7697 ± 7.8738 L.I.=60.7697 − 7.8738 = 52.8967 pág. 5
L.S.= 60.7697 + 7.8738 = 68.6435 VII.
74.9017±2.101(16.1747)√
1
20
+
(90−55.5) 2 (1110) 2 20
67100−
74.9017 ± 17.5467 L.I.=74.9017 − 17.5467 = 57.3550 L.S.=74.9017 + 17.5467 = 92.4477 VIII.
70.1910 ± 2.101(16.1747)√
1 20
+
(80−55.5) 2 67100−
(1110) 2 20
70.1910 ± 13.5607 L.I.=70.1910 − 13.5607 = 56.6303 L.S.=70.1910 + 13.5607 = 83.751
Prueba de Hipótesis
1. Planteamiento de la hipótesis. 𝐻0 : 𝛽 = ∅ 𝐻1 : 𝛽 ≠ ∅ 2. Calcular el estadístico de prueba.
𝐹0=4.66073143963473
pág. 6
3. Regla de decisión
Si 𝐹0 > 𝐹𝛼,1,𝑛−2
Se rechaza 𝐻0
Sustitución:
𝐹0.025,1,18=4.41 4.66 > 4.41
4. Conclusión Con un Nivel de Confianza del 95% Se rechaza la 𝐻0 ∴ se toma como verdadera la 𝐻1 la cual indica que es ≠ ∅ por lo que hay 𝑅𝐿𝑆 mostrando que si negará la inscripción al curso regular de matemáticas a los estudiantes que obtengan menos de 35 puntos.
2.- A continuación se presentan las observaciones registradas del producto de una reacción química tomadas a temperaturas diferentes:
A) Ecuación de regresión Y (%) = 61.5 + 0.114 X (°C)
B) Valor de coeficiente de correlación 𝒓 Y 𝒓𝟐 𝑟=
pág. 7
𝑛(∑𝑋𝑌) − (∑𝑋)(∑𝑌) √[𝑛(∑𝑋 2 ) − (∑𝑋)2 ][𝑛(∑𝑌 2 ) − (∑𝑌)²]
𝑟 =0.9751
𝑟2= 0.951
C) Intervalo de confianza para la predicción N.C. 95 % ∑(𝑦 − 𝑦 ′ )2 𝑆𝑦𝑥 = √ 𝑛−2 | 𝑆𝑦𝑥 = 1.57467
1 𝑌 ′ ± 𝑡𝛼⁄2 , 𝑛 − 2 . 𝑆𝑦𝑥 √ + 𝑛
(𝑥 − 𝑥̅ )2 (∑ 𝑥)2 ∑ 𝑥2 − 𝑛
N.C=95% 5%= 0.05 𝛼 2
= 0.025
n-2= 10 𝑡𝛼⁄2 , 𝑛 − 2 = 2.228 𝑆𝑦𝑥 = 1.57467 𝑋̅= 225
X (°C)
pág. 8
LIM. INFERIOR
LIM. SUPERIOR
150
76.9054
80.2946
200
83.1906
85.4094
250
88.8906
91.1094
300
94.0054
97.3946
D) PRUEBA DE HIPOTESIS 1.- Planteamiento de la hipótesis: H0= 𝛽 = ∅ Hi= 𝛽 ≠ ∅
2.- Calcular el estadístico de la prueba Fuente
Suma de
Grados de
Cuadrados
cuadrados
libertad
medios
Regresión
486.21
1
486.21
Error R
24.80
10
2.48
Total
511.01
11
F
196.08
3.-Regla de decisión F0.05, 1, 10 = 4.96 Si Fo > F∝,1, n-2 Se rechaza H0 196.08 > 4.96 4.- Conclusión Con un nivel de confianza del 95% se rechaza H 0, por lo tanto se toma como verdadera Hi, demostrando que la temperatura (°C) si influye en la reacción química.
E) DIAGRAMA DE DISPERSIÓN
pág. 9
“REGRESIÓN LINEAL MULTIPLE”
3.- En Applied Spectroscopy se estudiaron las propiedades de reflectancia infrarroja de un líquido viscoso que se utiliza como lubricante en la industria electrónica. El experimento que se diseñó consistió en medir el efecto de frecuencia de banda, x1, y el espesor de película, x2, sobre la densidad óptica, y, usando un espectrómetro infrarrojo Pekín-Elmer Modelo 621. (Fuente: Pacansky, J., England, C. D. y Wattman, R., 1986).
pág. 10
1.- Ecuación de regresión 𝑌 =∝ +𝛽1 (×1 ) + 𝛽2 (×2 ) + ⋯ + 𝛽𝑘 ×𝑘 Y = - 3.37 + 0.00362 x1 + 0.948 x2
2.- Predicción de Y para el primer valor (X) 𝑌´ = 𝛼 + 𝛽1 ∗×1 + 𝛽2 ∗×2 + ⋯ + 𝛽𝑘 ×𝑘 Y´= -3.37+0.0036(740) + 0.948(1.10) Y´= 0.3368 3.- Valor del coeficiente de correlación 𝑹 𝒚 𝑹𝟐 𝑅=
R-cuad.
(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦) √[𝑛(∑ 𝑥 2 ) −][𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2 ]
= 79.1%
𝑅 2 = √79.1 = 6,256.81% 4.- Prueba de hipótesis 1.- Planteamiento de la hipótesis: 𝐻𝑜: 𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑘 = 0 𝐻1 ≠ 𝛽1 ≠ 𝛽2 ≠ 𝛽3 ≠ ⋯ ≠ 𝛽𝑘 ≠ 0 2.- Calcular el estadístico de prueba: Análisis de varianza:
pág. 11
Fuente
GL
SC
MC
F
Regresión
2
0.64754
0.32377
11.34
Error residual 6
0.17126
0.02854
Total
8
0.81880
3.- Regla de decisión: 𝑓𝛼 , 𝑘, 𝑛 − 𝑘 − 1 𝑓∝ = 0.05, 𝑘 = 2, 𝑛 − 𝑘 − 1 = 6 = 5.14
Si 𝐹𝑜 > 𝑓∝ 𝑘, 𝑛 − 1 11.34 > 5.14
4.- Conclusión: Con un N.C. de 95% se tiene evidencia para rechazar 𝐻𝑜 , y se toma como verdadero 𝐻1 que me indica que el lubricante que se utilizó para 𝑥1 =medir el efecto de frecuencia de banda, 𝑥2 =espesor de película, 𝑌=densidad óptica, por lo que se tiene regresión mostrando la densidad óptica sobre 𝑥1 y 𝑥2 . 4.- Se realizó un experimento para estudiar el tamaño de los calamares consumidos por tiburones y atunes. Las variables regresoras son características de la boca del calamar. Los datos del estudio son los siguientes:
pág. 12
1.-La ecuación regresión es: y = - 6.44 + 1.77 x1 - 3.66 x2 + 2.41 x3 + 5.40 x4 + 14.6 x5
2.-Predicción de y para el primer valor de x en la tabla: 𝑦 , = - 6.44 + 1.77 (1.31) - 3.66 (1.07) + 2.41 (0.44) + 5.40 (0.75) + 14.6 (0.35) 𝑦 , = 2.1829 3.- Valor de 𝑹 y 𝑹𝟐 R-cuad = 96.3% R= √96.3 = 9.8132
4.- Prueba de hipótesis 1.-planteamiento de la hipótesis: 𝐻𝑂 = 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 0 𝐻1 ≠ 𝛽1 ≠ 𝛽2 ≠ 𝛽3 ≠ 𝛽4 ≠ 𝛽5 ≠ 0
2.-Calcular es estadístico de la prueba: Análisis de varianza Fuente Regresion Error residual Total
GL 5 16 21
SC 207.961 7.964 215.925
MC 41.592 0.498
F 83.56
3.-Regla decisión:
de
𝑓𝛼 , 𝑘, 𝑛 − 𝑘 − 1 𝑠𝑖 𝑓0 > 𝑓𝛼 , 𝑘, 𝑛 − 𝑘 − 1 𝑓0.05 , 5,16 = 2.85 83.56 > 2.85 Se rechaza 𝐻0 4.-Conclusion: Con un nivel de confianza del 95% se rechaza 𝐻0 y se toma como verdadera la 𝐻1 por lo tanto si hay regresión y relación entre el tamaño de los calamares consumidos por tiburones y atunes. pág. 13
5.- Con el fin de determinar la relación entre la calificación de su desempeño laboral (y) y las calificaciones en cuatro exámenes, el departamento de personal de cierta empresa industrial realizo un estudio en el que participaron 12 sujetos. Los datos son los siguientes:
Ecuación de regresión: Y= 3.32 + 0.421 𝑋1 – 0.296 𝑋2 + 0.016 𝑋3 + 0.125 𝑋4 Predicción de Y para el primer valor de x Y´= 3.32 + 0.421(56.5) – 0.296(71.0) + 0.016(38.5) + 0.125(43.0) Y´= 11.9535
pág. 14
Valor del coeficiente de correlación: 𝑅 2 = 0.939
93.9%
𝑅=√0.939 = 0.9690
96.9%
Prueba de hipótesis
1.- Planteamiento de la hipótesis: HO: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 0 HI:𝛽1 ≠ 𝛽2 ≠ 𝛽3 ≠ 𝛽4 ≠ 0
2.- Calcular el estadístico de prueba: FO: 26.94
FUENTE
GRADOS DE SUMA
DE CUADRADOS F
LIBERTAD
CUADRADOS MEDIOS
REGRESION
4
160.936
40.234
ERROR
7
10.453
1.493
TOTAL
11
171.389
26.94
3.- Regla de decisión: F0.05, 4,7= 4.12 Si FO > 𝛼, 𝑘. 𝑛 − 𝑘 − 1
se rechaza HO
26.94 >4.12
4.- Conclusión: Con un N.C de 95% se rechaza HO por lo tanto se toma como verdadera HI que indica que es diferente de cero por lo que muestra que si hay RLM por lo tanto las calificaciones de desempeño laboral influye en el resultado de los exámenes.
pág. 15
6.- La resistencia a la tracción de una unión de alambre es una característica importante. La siguiente tabla brinda información sobre la resistencia a la tracción y, la altura del molde x1, la altura del perno, x2, la altura del lazo, x3, la longitud del alambre, x4, el ancho de la unión sobre el molde, x5 el ancho del molde sobre el perno, x6, (Datos tomados de Myers, Montgomery y Anderson-Cook, 2019).
La ecuación de regresión es: y = 3.14 + 0.644 x1 - 0.010 x2 + 0.505 x3 - 0.120 x4 - 2.46 x5 + 1.50 x6 Predicción de y para el valor de x:
pág. 16
y = 3.14 + 0.644 (5.2) - 0.010 (19.6) + 0.505 (29.6) - 0.120 (94.9) - 2.46 (2.1) + 1.50 (2.3)
Y= -6.8112 R Cudrada= 71.18 R = 8.43
Planteamiento de hipótesis: Paso 1.-
Ho: B1 = B2 = B3 = B4 = B5 = B6 = 0 H1: B1 ≠ B2 ≠ B3 ≠ B4 ≠ B5 ≠ B6 ≠ 0
Paso 2.Calcular el estadístico: Fuente
GL
SC
MC
F
Regresión
6
23.6286
3.9381
4.93
Error
12
9.5924
0.7994
Total
18
33.2211
Paso 3.Si Fα, k, n-k-1 Si 4.93 >0.05, 6,19-6 -1 =12 Si 4.93 >3.00 se Rechaza Ho.
Paso 4.Con un N.C. 95% hay evidencia suficiente para rechazar Ho .·. se toma como verdadera Hi, que indica que si hay relación entre la resistencia a la tracción (y1) y la altura del molde (x1), la altura del perno (x2), la altura del lazo (x3), la longitud del alambre (x4), el ancho de la unión sobre el molde (x5) y el ancho del molde sobre el perno (x6) ya que β ≠ 0.
pág. 17
pág. 18