Loading documents preview...
ESTIMACIÓN DE PARÁMETROS y TAMAÑO DE MUESTRA ES U T I L I ZA R U N A M E D I DA D E U N A M U ES T R A ( U N ESTA DÍSTICO) PA R A I N F E R I R E L VA LO R D E L A CO R R ES P O N D I E N T E M E D I DA D E L A P O B L A C I Ó N ( PARÁ METRO) ; E N ES T E P RO C ES O, E L ES TA D Í S T I CO S E CO N V I E RT E E N ESTI MA DOR .
JOEL A. PATIÑO DE LOS SANTOS
1
➢Las poblaciones son descriptas mediante sus parámetros. ➢Para variables cuantitativas, las poblaciones son descritas mediante µ y σ (Media o promedio y Desviación Estándar) ➢Para variables cualitativas, las poblaciones son descriptas mediante p (Proporción o porcentaje %). ➢Si los valores de los parámetros son desconocidos, podemos estimarlos en base a muestras y esperamos que sean una buena aproximación al valor exacto de la población.
JOEL A. PATIÑO DE LOS SANTOS
2
◦ Estimación Puntual: se calcula un valor simple a partir de la muestra a fin de estimar el parámetro, es decir, Un solo número que se utiliza para estimar los parámetros de la población. ◦ Estimación por Intervalo de Confianza: se calculan dos números para crear un rango de valores que se espera contenga al parámetro con una cierta probabilidad o nivel de confianza, es decir, Un rango de valores dentro del cual es posible se encuentre el verdadero parámetro de la población. JOEL A. PATIÑO DE LOS SANTOS
3
◦ ◦ ◦ ◦ ◦
CONCEPTOS A SABER: Población Muestra Muestreo Parámetro ◦
POBLACIÓN
◦ Estadístico o Estadígrafo ◦
MUESTRA
JOEL A. PATIÑO DE LOS SANTOS
4
Promedio (Media) =
σ𝑥 𝜇 = 𝑋ത = 𝑁
𝑥 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 Proporciones o Porcentaje = 𝑃 = 𝑝 = = 𝑛 𝑇𝑜𝑡𝑎𝑙 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
JOEL A. PATIÑO DE LOS SANTOS
5
Nivel de Confianza La probabilidad asociada con la confianza que el verdadero parámetro se encuentre dentro del intervalo establecido. Intervalo de Confianza El rango de estimación determinado dentro del cual se debe encontrar el verdadero parámetro de la población.
RELACION ENTRE NIVEL E INTERVALO DE CONFIANZA A mayor nivel de confianza más grande será el tamaño del intervalo determinado pero menor será el nivel de precisión de la estimación realizada.
JOEL A. PATIÑO DE LOS SANTOS
Nivel Conf.
Valor Z
90%
1.645
95%
1.96
98%
2.33
99%
2.58
6
𝜎 𝑋ത ± 𝑍 ∗ 𝑛
𝑷∗𝑸 𝒑±𝒁∗ 𝒏 JOEL A. PATIÑO DE LOS SANTOS
7
CON TAMAÑO DE LA POBLACIÓN DESCONOCIDA
Nivel de Confianza
𝜎 𝑋ത ± 𝑍 ∗ 𝑛 Promedio de la muestra
Desviación estándar poblacional
Muestra Nivel de Confianza
𝑷∗𝑸 𝒑±𝒁∗ 𝒏
Probabilidad de Éxito Probabilidad de Fracaso Muestra
Proporción de la muestra 𝑥 𝑝= 𝑛 JOEL A. PATIÑO DE LOS SANTOS
8
CON TAMAÑO DE LA POBLACIÓN CONOCIDA FACTOR DE CORRECCIÓN
𝜎 𝑵−𝒏 𝑋ത ± 𝑍 ∗ ∗ 𝑵−𝟏 𝑛 Promedio de la muestra
Tamaño de la población
Tamaño de la población
𝑷∗𝑸 𝒑±𝒁∗ ∗ 𝒏 Proporción de la muestra 𝑥 𝑝= 𝑛 JOEL A. PATIÑO DE LOS SANTOS
𝑵−𝒏 𝑵−𝟏 FACTOR DE CORRECCIÓN 9
CON TAMAÑO DE LA POBLACIÓN DESCONOCIDA Bob Nale es propietario de Nale’s Quick Fill. A Bob le gustaría estimar la cantidad de galones de gasolina que vendió. Suponga que la cantidad de galones vendidos tiende a seguir una distribución normal, con una desviación estándar de 2.30 galones. De acuerdo con sus registros, selecciona una muestra aleatoria de 60 ventas y descubre que la cantidad media de galones vendidos es de 8.60. Establezca un intervalo de confianza de 99% de la media poblacional.
𝑫𝒂𝒕𝒐𝒔 𝒏 = 𝟔𝟎 ഥ = 𝟖. 𝟔𝟎 𝑿 𝝈 = 𝟐. 𝟑𝟎 𝑵𝑪 = 𝟗𝟗% → 𝒁 = 𝟐. 𝟓𝟖 Como NO se conoce el tamaño de la población utilizamos:
𝑋ത ± 𝑍 ∗
𝜎 𝑛
JOEL A. PATIÑO DE LOS SANTOS
8.60 ± 2.58 ∗
2.30
60 2.30 8.60 ± 2.58 ∗ 7.75 8.60 ± 2.58 ∗ 0.30 8.60 ± 0.77
𝐿𝑖 = 8.60 – 0.77 = 7.83 𝐿𝑠 = 8.60 + 0.77 = 𝟗. 𝟑𝟕 Interpretación: A un 99% de confianza el promedio de galones de combustible vendidos a todos los clientes está entre 7.83 y 9.37 galones.
10
CON TAMAÑO DE LA POBLACIÓN CONOCIDA Bob Nale es propietario de Nale’s Quick Fill. A Bob le gustaría estimar la cantidad de galones de gasolina que vendió. Suponga que la cantidad de galones vendidos tiende a seguir una distribución normal, con una desviación estándar de 2.30 galones. De acuerdo con sus registros, selecciona una muestra aleatoria de 60 ventas y descubre que la cantidad media de galones vendidos es de 8.60. Asumir población de 250 ventas.
𝑫𝒂𝒕𝒐𝒔 2.30 250 − 60 𝒏 = 𝟔𝟎 8.60 ± 2.58 ∗ ∗ ഥ = 𝟖. 𝟔𝟎 250 − 1 𝑿 60 𝝈 = 𝟐. 𝟑𝟎 2.30 190 𝑵 = 𝟐𝟓𝟎 8.60 ± 2.58 ∗ ∗ 𝑵𝑪 = 𝟗𝟗% → 𝒁 = 𝟐. 𝟓𝟖 7.75 249 Como SE conoce el tamaño de la población utilizamos:
8.60 ± 2.58 ∗ 0.30 ∗ 0.7631 8.60 ± 0.77 ∗ 0.87 8.60 ± 0.67
𝜎 𝑵 − 𝒏 𝐿𝑖 = 8.60 − 0.67 = 𝟕. 𝟗𝟑 𝑋ത ± 𝑍 ∗ ∗ 𝑵 − 𝟏 𝐿𝑠 = 8.60 + 0.67 = 𝟗. 𝟐𝟕 𝑛 Interpretación: A un 99% de confianza el promedio de galones de combustible vendidos a todos los clientes está entre 7.93 y 9.27 galones. JOEL A. PATIÑO DE LOS SANTOS
11
CON TAMAÑO DE LA POBLACIÓN DESCONOCIDA Desde siempre, la proporción de adultos mayores de 24 años que fuman ha sido de 0.30. Hace poco se publicó y transmitió por radio y televisión mucha información de que el tabaquismo no beneficia a la salud. Una muestra de 500 adultos reveló que sólo 25% de los entrevistados fumaba. Construya el intervalo de confianza de 98% de la proporción de adultos que fuma actualmente. ¿Estaría de acuerdo en que la proporción es inferior a 30%?
𝑫𝒂𝒕𝒐𝒔 𝒏 = 𝟓𝟎𝟎 𝒑 = 𝟎. 𝟐𝟓 𝒒 = 𝟏 − 𝒑 = 𝟎. 𝟕𝟓 𝑵𝑪 = 𝟗𝟖% → 𝒁 = 𝟐. 𝟑𝟑 Como NO se conoce el tamaño de la población utilizamos:
𝑷∗𝑸 𝒑±𝒁∗ 𝒏
0.25 ± 2.33 ∗
0.25 ∗ 0.75 500
0.25 ± 2.33 ∗
0.1875 500
0.25 ± 2.33 ∗ 0.000375 0.25 ± 2.33 ∗ 0.0194 0.25 ± 0.0451 𝐿𝑖 = 0.25 − 0.045 = 𝟎. 𝟐𝟎𝟓 𝐿𝑠 = 0.25 + 0.045 = 𝟎. 𝟐𝟗𝟓 𝑬𝒏𝒕𝒓𝒆 𝟐𝟎. 𝟓% 𝒚 𝟐𝟗. 𝟓%
Interpretación: A un 98% de confianza se puede asegurar que la proporción de adultos mayores de 24 años que fuman es inferior a 30%. JOEL A. PATIÑO DE LOS SANTOS
12
CON TAMAÑO DE LA POBLACIÓN CONOCIDA Tomando en cuenta el ejemplo anterior, pero conociendo el tamaño de la población (N=1000). Construya el intervalo de confianza de 98% de la proporción de adultos que fuma actualmente. ¿Estaría de acuerdo en que la proporción es inferior a 30%?
𝑫𝒂𝒕𝒐𝒔 0.25 ∗ 0.75 𝟏𝟎𝟎𝟎 − 𝟓𝟎𝟎 0.25 ± 2.33 ∗ ∗ 500 𝟏𝟎𝟎𝟎 − 𝟏 𝒏 = 𝟓𝟎𝟎 𝒑 = 𝟎. 𝟐𝟓 0.1875 𝟓𝟎𝟎 0.25 ± 2.33 ∗ ∗ 𝒒 = 𝟏 − 𝒑 = 𝟎. 𝟕𝟓 500 𝟗𝟗𝟗 𝑵𝑪 = 𝟗𝟖% → 𝒁 = 𝟐. 𝟑𝟑 0.25 ± 2.33 ∗ 0.000375 ∗ 𝟎. 𝟓𝟎𝟎𝟓 Como Se conoce el tamaño de la población 0.25 ± 2.33 ∗ 0.0194 ∗ 0.7075 utilizamos: 0.25 ± 0.032 𝑷∗𝑸 𝑵 − 𝒏 𝐿𝑖 = 0.25 − 0.032 = 𝟎. 𝟐𝟏𝟖 𝒑±𝒁∗ ∗ 𝒏 𝑵 − 𝟏 𝐿𝑠 = 0.25 + 0.032 = 𝟎. 𝟐𝟖𝟐 𝑬𝒏𝒕𝒓𝒆 𝟐𝟏. 𝟖% 𝒚 𝟐𝟖. 𝟐% Interpretación: A un 98% de confianza se puede asegurar que la proporción de adultos mayores de 24 años EN LA POBLACIÓN que fuman es inferior a 30%. JOEL A. PATIÑO DE LOS SANTOS
13
Que tamaño debe tener nuestra muestra?
Nivel de precisión (error máximo)
Nivel de Confianza
JOEL A. PATIÑO DE LOS SANTOS
Variabilidad del error
14
CON TAMAÑO DE LA POBLACIÓN DESCONOCIDA Nivel de Confianza
Desviación estándar poblacional
𝑍2 ∗ 𝜎 2 𝑛𝑜 = 𝑒2 Tamaño de muestra
Precisión deseada o error máximo
Nivel de Confianza
𝒁𝟐 ∗ 𝑷 ∗ 𝑸 𝒏𝒐 = 𝒆𝟐 Tamaño de muestra
JOEL A. PATIÑO DE LOS SANTOS
Probabilidad de Éxito Probabilidad de Fracaso
Precisión deseada o error máximo 15
CON TAMAÑO DE LA POBLACIÓN CONOCIDA Tamaño muestra inicial
𝑛0 𝑛= 𝑛𝑜 − 1 1+ 𝑁
Tamaño de muestra
Tamaño de población
Esta fórmula se puede utilizar tanto como para la media como para la proporción. JOEL A. PATIÑO DE LOS SANTOS
16
PARA ESTIMAR UNA MEDIA O PROMEDIO
2
2
1.96 ∗ 3 Un investigador quiere conocer el tiempo 𝑫𝒂𝒕𝒐𝒔 𝑛𝑜 = 12 de reacción en una tarea de 𝝈=𝟑 discriminación (en la que hay que elegir 𝒆=𝟏 3.8416 ∗ 9 entre dos alternativas de respuesta). La 𝑵𝑪 = 𝟗𝟓% → 𝒁 = 𝟏. 𝟗𝟔 𝑛𝑜 = 1 variable tiempo de reacción en la tarea 34.57 de discriminación se distribuye Como se conoce el 𝑛𝑜 = = 34.57 1 normalmente en la población con σ = 3. tamaño de la población Decide realizar una estimación por 𝒏𝒐 ≅ 𝟑𝟓 𝒑𝒆𝒓𝒔𝒐𝒏𝒂𝒔. utilizamos: intervalo del parámetro μ desconocido Si la población fuera 𝑍2 ∗ 𝜎 2 (el tiempo de reacción medio en la tarea 𝑛𝑜 = de 250 personas de discriminación de la población) y fija 2 𝑒 un error de estimación máximo de 1 𝒏𝟎 𝟑𝟒. 𝟓𝟕 𝟑𝟒. 𝟓𝟕 segundo para un nivel de confianza del 𝒏 = = = = 𝟑𝟎. 𝟒𝟖 𝒏𝒐 − 𝟏 𝟑𝟒. 𝟓𝟕 − 𝟏 𝟏. 𝟏𝟑𝟒𝟑 95%. ¿Cuál debe ser el tamaño de la 𝟏+ 𝑵 𝟏+ 𝟐𝟓𝟎 muestra para estimar la media μ? 𝒏 ≅ 𝟑𝟏 𝒑𝒆𝒓𝒔𝒐𝒏𝒂𝒔. JOEL A. PATIÑO DE LOS SANTOS
17
PARA ESTIMAR UNA PROPORCIÓN
2
1.645 ∗ 0.3 ∗ 0.7 Las encuestas anteriores revelan que 𝑫𝒂𝒕𝒐𝒔 𝑛𝑜 = 0.052 30% de los turistas que van a Las Vegas a 𝑷 = 𝟑𝟎% = 𝟎. 𝟑 jugar durante el fin de semana gasta más Q = 1 – P = 1 - 0.3 = 0.7 2.706025 ∗ 0.21 𝑛 = de $1,000 cada uno. La gerencia desea 𝒆 = 𝟓% = 𝟎. 𝟎𝟓 𝑜 0.0025 actualizar este porcentaje. 𝑵𝑪 = 𝟗𝟎% → 𝒁 = 𝟏. 𝟔𝟒𝟓 0.5683 𝑛𝑜 = = 227.3 El nuevo estudio utilizará el nivel de 0.0025 Como se conoce el confianza de 90%. El estimador estará a 𝒏𝒐 ≅ 𝟐𝟐𝟖 𝑻𝒖𝒓𝒊𝒔𝒕𝒂𝒔. tamaño de la población menos de 5% de la proporción de la utilizamos: población. ¿Cuál es el tamaño necesario Si la población fuera 2∗𝑃∗𝑄 𝑍 de la muestra? de 400 turistas
𝑛𝑜 =
𝒏=
𝑒2
𝒏𝟎 𝟐𝟐𝟕. 𝟑 𝟐𝟐𝟕. 𝟑 = = = 𝟏𝟒𝟓. 𝟐 𝒏𝒐 − 𝟏 𝟐𝟐𝟕. 𝟑 − 𝟏 𝟏. 𝟓𝟔𝟓𝟕𝟓 𝟏+ 𝟏+ 𝑵 𝟒𝟎𝟎
𝒏 ≅ 𝟏𝟒𝟔 𝑻𝒖𝒓𝒊𝒔𝒕𝒂𝒔. JOEL A. PATIÑO DE LOS SANTOS
18
JOEL A. PATIÑO DE LOS SANTOS
19