Estadistica Inferencial.

  • Uploaded by: SanthosUhm
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Estadistica Inferencial. as PDF for free.

More details

  • Words: 6,172
  • Pages: 28
Loading documents preview...
TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Instituto Tecnológico Superior de Coatzacoalcos División de Ingeniería Industrial Agosto-Diciembre 2017 Nombre del Alumno:

Vicente

Apellido Paterno

Santos

Juan Manuel.

Apellido Materno

Nombre(s)

Estadística inferencial. _______________-

No. Control: Fecha de inicio:

16082114

Semestre:

Agost-16

Nombre del Docente:

Juan

Apellido Paterno

3

Fecha de término: López Apellido Materno

1

Grupo

E

Dic-09 Diego Antonio. Nombre(s)

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Presentación. Se plantea como una asignatura básica de la Carrera de Ingeniería en Logística e Industrial y común a la mayor parte de las Ingenierías. o Proporciona los elementos básicos para hacer análisis a partir del estadístico de la muestra y conceptos de la estimación estadística. o Permite establecer inferencias sobre una población, conclusiones a partir de la información que arrojan las pruebas de hipótesis. o A partir de las pruebas de bondad de ajuste, se establece el nivel de aplicabilidad de los conceptos del análisis estadístico.

2

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Objetivos Generales del Curso. Comprender los métodos estadísticos para inferir los parámetros de la población a partir de una muestra de interés de estudio. • Determinar los intervalos de confianza referentes a la muestra de interés para inferir el valor de los parámetros de la población de partida. • Validar por pruebas de hipótesis, alguna medida de interés en la muestra, y la inferencia en la población de estudio las medidas de: especificación, dimensiones en calidad, tolerancia, prueba destructiva o no destructiva de materiales, empaques o embalajes, etc. • Determinar mediante las pruebas de bondad de ajuste el nivel de validez de los modelos en los fenómenos logísticos que se presenten en la práctica profesional, su comportamiento y control normado.

3

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Índice. Unidad II. Estimación. 2.1. Introducción.

6

2.2. Características de un estimador.

7

2.3. Estimación puntual.

8

2.4. Estimación por intervalos.

9

2.4.1 Intervalo de confianza para la media.

11

2.4.2 Intervalo de confianza para la diferencias de medias.

12

2.4.3 Intervalos de confianza para la proporción.

14

2.4.4 Intervalos de confianza para la proporción.

16

2.4.5 Intervalo de confianza para la varianza.

17

2.4.6 Intervalos de confianza para la relación de varianzas.

18

2.5 Determinación del tamaño de muestra.

19

2.5.1 Basado en la medida de la población.

21

2.5.2 Basado en la proporción de la población.

21

2.5.3 Basado en la diferencia entre las medias de la población.

23

4

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Unidad 2. “Estimación” En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra.

5

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

2.1 Introducción. Se denomina muestreo al proceso por el que generamos las muestras. Una muestra es una parte (un subconjunto) de la población, y se desea que la muestra sea lo más representativa posible de la población de la que procede. Sin embargo, por muy cuidadosa que sea la selección de la muestra difícilmente será una representación exacta de la población. Esto significa que su tendencia central, variabilidad, etc., aproximarán las de la población, pero habrá cierta diferencia, que interesa sea lo menor posible. Un concepto clave de muestreo es el de representatividad: Los procedimientos de muestreo tienen por objeto generar muestras lo más representativas posible de las poblaciones dados los objetivos de la investigación y las circunstancias que afectan al muestreo. Desde un punto de vista aplicado, se denomina muestreo el proceso de selección de la muestra o muestras a utilizar para la investigación. Esto supone generar una o pocas muestras. Actualmente es de interés la selección de muestras para la simulación informática de los procesos de muestreo, particularmente para la obtención de distribuciones muestrales. En estos casos el número de muestras generadas puede ser muy grande (10.000, 80.000, o más) y el procedimiento de muestreo se realiza informáticamente y con procedimientos específicos. Desde un punto de vista teórico, el concepto de muestreo es fundamental para la Inferencia Estadística. El hecho de que las muestras no sean exactamente representativas de las poblaciones significa que las inferencias presentan cierto margen de incertidumbre. Para cuantificarlo y definir técnicas inferenciales es necesario conocer cómo se comportan los estadísticos obtenidos en las muestras, esto es, cómo son las distribuciones muestrales de los estadísticos habitualmente utilizados para la inferencia. Las muestras singulares generadas para investigación con sujetos suelen utilizarse para obtener algunos estadísticos (Media, proporción, cuasivarianza, etc.) con los que se realiza el proceso de inferencia. En cambio, las muestras simuladas por ordenador suelen ser utilizadas para obtener distribuciones muestrales y realizar inferencia. Esto es de interés cuando se dan circunstancias especiales que no aconsejan utilizar los procedimientos habituales. Las distribuciones muestrales son las distribuciones de estadísticos de muestras que pertenecen a la misma población. Por ejemplo, la distribución muestral de la Media es la distribución de las Medias de muestras de un mismo tamaño extraídas de la misma población.

6

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

2.2 Características de un estimador 1) Sesgo. Se dice que un estimador es insesgado si la Media de la distribución del estimador es igual al parámetro. Estimadores insesgados son la Media muestral (estimador de la Media de la población) y la Varianza (estimador de la Varianza de la población) Ejemplo: En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la media poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana de la población es igual a 5y la Media de las Medianas es igual a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado. La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con la Varianza

En un muestreo de 1000 muestras (n=25) en que la Varianza de la población es igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la Cuasivarianza

La Media de las Varianzas muéstrales es igual a 9.5, esto es, coincide con la Varianza de la población ya que la Cuasivarianza es un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro cuanto mayor es n (tamaño de la muestra). Ejemplo En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:

7

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo valor que la Media de la población. 3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza de la distribución muestral del estimador es menor a la del otro estimador. Cuanto menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la muestra aproxime al parámetro poblacional. Ejemplo La Varianza de la distribución muestral de la Media en un muestreo aleatorio (número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que la Media es un estimador más eficiente que la Mediana).

2.3 Estimación puntual. En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n.1 La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos métodos que se usan en función de las características y propósitos del estudio: 

Estimación puntual  Método de los momentos;  Método de la máxima verosimilitud;  Método de los mínimos cuadrados;  Estimación por intervalos.  Estimación bayesiana. Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla media de los individuos. Lo más importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mínima) Estimación puntual. Sea X una variable poblacional con distribución Fθ , siendo θ desconocido. El problema de estimación puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar el estadístico T(X1, ..., Xn) que mejor estime el parámetro θ. Una vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimación puntual de θ, T(x1, ..., xn) = ˆ θ . 8

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Vemos a continuación dos métodos para obtener la estimación puntual de un parámetro: método de los momentos y método de máxima verosimilitud. Método de los momentos: consiste en igualar momentos poblacionales a momentos muestrales. Deberemos tener tantas igualdades como parámetros a estimar. Momento poblacional de orden r αr = E(Xr) Momento muestral de orden r ar = Xn i=1 Xr i n Método de máxima verosimilitud: consiste en tomar como valor del parámetro aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra seleccionada de una población con distribución Fθ o densidad fθ(x), la probabilidad de que ocurra una realización x1, ..., xn viene dada por: Lθ(x1, ..., xn) = Yn i=1 fθ(xi) A Lθ(x1, ..., xn) se le llama función de verosimilitud.(credibilidad de la muestra observada). Buscamos entonces el valor de θ que maximice la función de verosimilud, y al valor obtenido se le llama estimación por máxima verosimilitud de θ. Nota: si la variable X es discreta, en lugar de fθ(xi ) consideramos la función masa de probabilidad pθ(xi). Ejemplo 7.1: Sea X → N(µ, σ), con µ desconocido. Seleccionada una más. X1, ..., Xn, con realización x1, ..., xn, estimamos el parámetro µ por ambos métodos. Según el método de los momentos: E(X) = Xn i=1 Xi n = − X, y al ser µ = E(X) se obtiene que ˆ µ = − x. Por el método de máxima verosimilitud: Lµ(x1, ..., xn) = Yn i=1 fµ(xi ) = = Yn i=1 1 √ 2πσ e −(xi−µ) 2 2σ Estimación por Intervalos de confianza 109 y maximizamos en µ tal función; en este caso resulta más fácil maximizar su logaritmo: lnLµ(x1, ..., xn) = − 1 2σ 2 Xn i=1 (xi − µ) 2 − n ln( √ 2πσ) ∂ ∂µ lnLµ(x1, ..., xn) = 1 σ 2 Xn i=1 (xi − µ) = n − x − nµ σ 2 = 0 ⇐⇒ ˆ µ = −

2.4 Estimación por intervalos La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes consideraciones: a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades de ocurrencia de los estadísticos muestrales. b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad de que el estimador se halle dentro de los intervalos de la distribución muestral. c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de confianza".

9

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Ejemplo Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal, y resulta:

La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas como Excel). Seguidamente generamos una muestra de la población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En consecuencia, si hacemos un muestreo con un número grande de muestras observamos que el 95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es denominado nivel de confianza. Si queremos establecer un intervalo de confianza en que el % de veces que m se 10

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

halle dentro del intervalo sea igual al 99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas como Excel), y son los valores cuya función de probabilidad es igual a 0.995 y 0.005 respectivamente).

2.4.1 intervalo de confianza para la media de una distribución. Dada una variable aleatoria con distribución Normal N(μ, σ), el objetivo es la construcción de un intervalo de confianza para el parámetro μ, basado en una muestra de tamaño n de la variable. Desde el punto de vista didáctico hemos de considerar dos posibilidades sobre la desviación típica de la variable: que sea conocida o que sea desconocida y tengamos que estimarla a partir de la muestra. El caso de σ conocida, ya comentado anteriormente, no pasa de ser un caso académico con poca aplicación en la práctica, sin embargo es útil desde del punto de vista didáctico.

Caso de varianza conocida Dada una muestra X1, ..., Xn, el estadístico

se distribuye según una Normal estándar. Por tanto, aplicando el método del pivote podemos construir la expresión

donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad de α/2, de la que se deduce el intervalo de confianza 11

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Puede repasarse la construcción más detallada. Caso de varianza desconocida Dada una muestra X1, ..., Xn, el estadístico

se distribuye según una t de Student de n − 1 grados de libertad. Por tanto, y siguiendo pasos similares a los del apartado anterior, el intervalo de confianza resultante es

Donde tα/2 es el valor de una distribución t de Student con n − 1 grados de libertad que deja a su derecha una probabilidad de α/2. Con el programa siguiente podemos calcular el intervalo de confianza para la media de una distribución Normal con desviación típica desconocida.

2.4.2 intervalo de confianza para la diferencia de medias. Caso de varianza desconocida y común Supondremos la existencia de dos poblaciones sobre las que una variable determinada sigue una distribución Normal con idéntica varianza en las dos. Sobre la población 1, la variable sigue una distribución N(µ1, σ) y, sobre la población 2, sigue una distribución N(µ2, σ). Igualmente supondremos que disponemos de 12

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

dos muestras aleatorias independientes, una para cada población, de tamaños muestrales n1 y n2 respectivamente. El objetivo es construir un intervalo de confianza, con nivel de confianza (1 − α) · 100 %, para la diferencia de medias µ1 − µ2 El método se basa en la construcción de una nueva variable D, definida como la diferencia de las medias muestrales para cada población

Esta variable, bajo la hipótesis de independencia de las muestras, sigue una distribución Normal de esperanza µ1 − µ2 y de varianza

La estimación conjunta, a partir de las dos muestras, de la varianza común viene dada por la expresión

Y, utilizando la propiedad de que la variable

Sigue una distribución χ2 con n1 + n2 − 2 grados de libertad, podemos construir un estadístico pivote que siga una distribución t de Student y que nos proporciona la fórmula siguiente para el intervalo de confianza para la diferencia de medias: 13

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Donde tα/2 es el valor de una distribución t de Student con n1 + n2 − 2 grados de libertad que deja a su derecha una probabilidad de α/2.

2.4.3 intervalos de confianza para la proporción. Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la construcción de un intervalo de confianza para el parámetro p, basada en una observación de la variable que ha dado como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y consideramos el número de veces que ocurre el suceso que define la variable al repetir el experimento n veces en condiciones de independencia. Existen dos alternativas a la hora de construir un intervalo de confianza para p: 

Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal.



Utilizar un método exacto.

Aproximación asintótica Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la mayoría de textos de estadística. Se basa en la aproximación

Que, trasladada a la frecuencia relativa, resulta

Tomando como estadístico pivote

14

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una variable discreta a una continua, se obtiene el intervalo de confianza asintótico:

Donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100 %. Las condiciones generalmente aceptadas para considerar válida la aproximación asintótica anterior son:

El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la validez de la aproximación utilizada. Una información más general sobre los intervalos de confianza asintóticos puede encontrase aquí.

Intervalo exacto Aun cuando las condiciones anteriores no se verifiquen, es posible la construcción de un intervalo exacto, válido siempre pero algo más complicado en los cálculos. Es posible demostrar que un intervalo exacto para el parámetro p viene dado por los valores siguientes:

Donde Fα/2,a,b es el valor de una distribución F de Fisher-Snedecor con a y b grados de libertad que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100 %. 15

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Una justificación de los intervalos de confianza exactos para distribuciones discretas puede encontrarse aquí. En el programa siguiente se pueden calcular los intervalos de confianza asintótico y, si n es menor de 100, también el exacto para una proporción

2.4.4 intervalos de confianza para la diferencia de proporciones. Los límites para el intervalo de una diferencia de proporciones correspondientes a dos muestras independientes son:

Donde el símbolo zα/2 es el mismo valor crítico que antes,(Z > zα/2) = α/2, y corresponde a un intervalo de confianza 1 − α %. Este intervalo puede utilizarse de manera alternativa al contraste de hipótesis para decidir (con nivel de significación α %) si hay igualdad de los dos grupos. Se decidirá por la igualdad de los grupos si el valor 0 queda incluido en cualquier posición en el intervalo. Aunque se haga el contraste de dos proporciones, en primer lugar, es aconsejable obtener el intervalo de confianza de la diferencia de medias, si éste ha resultado significativo, puesto que ayudará a interpretar si existe significación aplicada además de la estadística. Si se dispone de alguna información previa y sólo quiere calcularse alguno de los dos intervalos unilaterales, bastará sustituir zα/2 por zα y descartar el límite superior o inferior del intervalo según el caso. Por ejemplo, el intervalo unilateral derecho corresponde a:

16

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

2.4.5 intervalos de confianza para la varianza. Dada una variable aleatoria con distribución Normal N (μ; σ), el objetivo es la construcción de un intervalo de confianza para el parámetro σ, basado en una muestra de tamaño n de la variable. A partir del estadístico

La fórmula para el intervalo de confianza, con nivel de confianza 1 − α es la siguiente

Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1 grados de libertad que deja a su derecha una probabilidad de α/2. Por ejemplo, dados los datos siguientes: 

Distribución poblacional: Normal



Tamaño de muestra: 10



Confianza deseada para el intervalo: 95 %



Varianza muestra corregida: 38,5

Un intervalo de confianza al 95 % para la varianza de la distribución viene dado por:

17

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Que resulta, finalmente

2.4.6 intervalo de confianza para la relación de varianzas. Supondremos la existencia de dos poblaciones sobre las que una determinada variable sigue una distribución Normal. Sobre la población 1 la variable sigue una distribución N (µ1, σ1) y sobre la población 2 sigue una distribución N (µ2, σ2). Igualmente supondremos que disponemos de dos muestras aleatorias independientes, una para cada población, de tamaños muestrales n1 y n2 respectivamente. El objetivo es construir un intervalo de confianza, confianza (1 − α) · 100 %, para el cociente de varianzas

con nivel

de

El estadístico pivote utilizado es

Que sigue una distribución F de Fisher con n1 − 1 y n2 − 1 grados de libertad. El intervalo de confianza que resulta es

Donde Fα/2 es el valor de una distribución F de Fisher-Snedecor con n1 − 1 y n2 − 1 grados de libertad que deja a su derecha una probabilidad de α/2. 18

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

2.5 determinación del tamaño de tamaño de muestra. 1. Estimar un parámetro determinado con el nivel de confianza deseado. 2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mínimo de garantía. 3. Reducir costes o aumentar la rapidez del estudio. Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño adecuado de la muestra tendría como objetivo su factibilidad. Así: 1. Si el número de sujetos es insuficiente habría que modificar los criterios de selección, solicitar la colaboración de otros centros o ampliar el período de reclutamiento. Los estudios con tamaños muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusión errónea de que no existe tal diferencia. 2. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista económico y humano. Además es poco ético al someter a más individuos a una intervención que puede ser menos eficaz o incluso perjudicial. El tamaño de una muestra es el número de individuos que contiene. Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente: N: es el tamaño de la población o universo (número total de posibles encuestados). Zα: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de Zα se obtienen de la tabla de la distribución normal estándar N (0,1). Los valores de Zα más utilizados y sus niveles de confianza son:

Valor de Zα

1.28 1.65 1.69 1.75 1.81 1.88 1.96

Nivel de confianza 80% 90% 91% 92% 93% 94% 95%

19

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

(Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la fórmula Zα=1.96) e: es el error muestral deseado, en tanto por ciento. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la población y el que obtendríamos si preguntáramos al total de ella. Ejemplos: Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas. Ejemplo 2: si hacemos una encuesta de satisfacción a los empleados con un error muestral del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarán. Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estará en el intervalo 52-58% (55% +/- 3%). p: proporción de individuos que poseen en la población la característica de estudio. Este dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opción más segura. q: proporción de individuos que no poseen esa característica, es decir, es 1p. n: tamaño de la muestra (número de encuestas que vamos a hacer). Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o esté más libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos. Otra fórmula para calcular el tamaño de la muestra es: Dónde: n = el tamaño de la muestra. N = tamaño de la población. Desviación estándar de la población, que generalmente cuando no se tiene su valor, suele utilizarse un valor estimado a ojo o a partir de una pequeña muestra o muestra piloto. Para ser conservador (prudente), mejor errar estimando por exceso que por defecto. Zα: Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,64 (como más usual) o en relación al 99% de confianza equivale 2,33, valor que queda a criterio del encuestador. 20

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.

2.5.1 Basado en la media de la población. El intervalo de confianza, para la media de una población, con un nivel de confianza de 1- α, siendo X la media de una muestra de tamaño n y σ la desviación típica de la población, es:

El error máximo de estimación es:

Cuanto mayor sea el tamaño de la muestra, n, menor es el error. Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error. Tamaño de la muestra

Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra. Si disminuimos el error, tenemos que aumentar el tamaño de la muestra.

2.5.2 Basado en la proporción de la población. En poblaciones dicotómicas con una proporción de éxitos el estimador puntual del parámetro es la proporción muestral de éxitos, p, que coincide con la media de la muestra cuando se codifica como 1 la característica que se considera como éxito y 0 la que se considera no éxito. A partir de un tamaño muestral moderadamente grande el estadístico p tiene una distribución aproximadamente normal. El intervalo de confianza para la proporción poblacional está centrado en la proporción muestral; siendo sus límites superior e inferior

donde z /2 es el valor crítico correspondiente al grado 21

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

de confianza 1la proporción.

de la distribución normal tipificada y

es el error típico de

Para obtener el intervalo de confianza y contrastar hipótesis sobre la proporción una alternativa consiste en tratar a la proporción como la media poblacional de una variable dicotómica codificada como se ha descrito anteriormente (éxito=1, no éxito=0) y la secuencia es: 

Para el intervalo de confianza:

Analizar Estadísticos Descriptivos Explorar 

Para contrastar la hipótesis nula

Analizar Comparar medias Prueba T para una muestra Utilizando este criterio los resultados numéricos no coinciden exactamente con los que se obtendrían aplicando la expresión del error típico de la proporción; no obstante la discrepancia es despreciable si el número de observaciones es suficientemente grande. Otras alternativas para realizar este contraste son de naturaleza no paramétrica.

22

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

2.5.3 Basado en la diferencia de medias poblacional. En ocasiones interesa definir un intervalo de valores tal que permita establecer cuáles son los valores mínimo y máximo aceptables para la diferencia entre las medias de dos poblaciones. Pueden darse dos situaciones según las muestras sean o no independientes; siendo en ambos casos condición necesaria que las poblaciones de origen sean normales o aproximadamente normales: 

MUESTRAS INDEPENDIENTES

Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de confianza para la diferencia de medias poblacionales está centrado en la diferencia de las medias muéstrales, siendo sus límites superior e inferior:

t /2 es el valor crítico correspondiente al grado de confianza 1- de la distribución t de Student con n1+ n2-2 grados de libertad y es una estimación de la desviación típica común a ambas poblaciones obtenida a partir de las varianzas de las dos muestras. En la práctica si n1 y n2 son moderadamente grandes, el valor crítico t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la distribución normal. Si las varianzas poblacionales no pueden suponerse iguales los límites del intervalo de confianza son:

El valor crítico t /2 corresponde a una distribución t cuyos grados de libertad se calculan en base a ambos tamaños muéstrales y a las desviaciones típicas de cada grupo según la corrección propuesta por Dixon y Massey:

23

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Cuestionario. 1^ ¿Cuáles son las características de la estimación? R= Sesgo, consistencia y eficiencia

2^ ¿Cuándo se dice que un estimador es insesgado? R= Si la medida de distribución del estimador es igual al parámetro

3^ ¿Cuándo es consistente un estimador? R= Si aproxima el valor del parámetro cuando mayor es n.

4^ ¿A qué se refiere la eficiencia? R= Diremos que un estimador es más eficiente que otro si la varianza de la distribución muestral del estimador es menor a la del otro estimador

5^ ¿Qué es la estimación puntual? R= Conjunto de técnicas que da valor aproximado de un parámetro a partir de los datos proporcionados por una muestra

6^ ¿Cómo está dividida la estimación? R= Estimación puntual Estimación por intervalos Estimación bayesiana

7^ ¿En qué consiste la estimación por intervalos? R= La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable se encuentre el parámetro

8^ ¿Cuál es el objetivo de una variable aleatoria con distribución normal? R= El objetivo es la construcción de un intervalo de confianza para el parámetro μ, basado en una muestra de tamaño n de la variable.

24

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

9^ ¿Cuál es el objetivo de una variable aleatoria con distribución binominal? R= El objetivo es la construcción de un intervalo de confianza para el parámetro p, basada en una observación de la variable que ha dado como valor x.

10^ Menciona las dos alternativas para construir un intervalo de confianza 

Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal.



Utilizar un método exacto.

11^ ¿Qué es la aproximación asintonica? Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la mayoría de textos de estadística. Se basa en la aproximación

12^ pasos para la determinación del tamaño de una muestra 4. Estimar un parámetro determinado con el nivel de confianza deseado. 5. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mínimo de garantía. 6. Reducir costes o aumentar la rapidez del estudio.

13^ ¿Cómo identificas el tamaño de una muestra? R= es el número de individuos que contiene

14^ ¿Qué es una proporción dicotómica con una proporción? R= es la proporción muestral de éxitos, p, que coincide con la media de la muestra cuando se codifica como 1 la característica que se considera como éxito y 0 la que se considera no éxito

15^ ¿Qué es el muestreo? R= al proceso por el que generamos las muestras. Una muestra es una parte (un subconjunto) de la población, y se desea que la muestra sea lo más representativa posible de la población de la que procede.

25

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

USO DE LOS SISTEMAS INTERNACIONALES DE MEDIDA El Sistema Internacional de Unidades es la forma actual del sistema métrico decimal y establece las unidades que deben ser utilizadas internacionalmente. Fue creado por el Comité Internacional de Pesos y Medidas con sede en Francia. El Sistema Internacional de Unidades consta de siete unidades básicas. Son las que se utilizan para expresar las magnitudes físicas consideradas básicas a partir de las cuales se determinan las demás. Una magnitud física es una propiedad o cualidad medible de un sistema físico, es decir, a la que se le pueden asignar distintos valores como resultado de una medición. Las magnitudes físicas se miden usando un patrón que tenga bien definida esa magnitud, y tomando como unidad la cantidad de esa propiedad que posea el objeto patrón. Por ejemplo, se considera que el patrón principal de longitud es el metro en el Sistema Internacional de Unidades. Magnitud física Símbolo básica dimensional

Unidad básica

Símbolo de la unidad

Observaciones

Longitud

L

metro

m

Se define fijando el valor de la velocidad de la luz en el vacío.

Tiempo

T

segundo

s

Se define fijando el valor de la frecuencia de la transición hiperfina del átomo de cesio.

Masa

M

kilogramo

kg

Es la masa del «cilindro patrón» custodiado en la Oficina Internacional de Pesos y Medidas, en Sèvres, Francia. Equivale a la masa que ocupa un litro de agua pura a 14’5 °C o 286’75 K.

Intensidad de corriente eléctrica

I

amperio

A

Se define fijando el valor de constante magnética.

Temperatura

Θ

kelvin

K

Se define fijando el valor de la temperatura termodinámica del punto triple del agua.

Cantidad de sustancia

N

mol

mol

Se define fijando el valor de la masa molar del átomo de 12C a 12 gramos/mol. Véase también número de Avogadro.

Intensidad luminosa

J

candela

cd

Véanse también conceptos relacionados: lumen, lux e iluminación física.

26

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

También establece muchas magnitudes derivadas, que no necesitan de un patrón, por estar compuestas de magnitudes fundamentales. Magnitud física

Nombre de la unidad

Símbolo de la unidad

Expresada en unidades derivadas

Frecuencia

Hercio

Hz

s-1

Fuerza

Newton

N

m·kg·s-2

Presión

Pascal

Pa

N·m-2

m-1·kg·s-2

Energía, trabajo, calor

Julio

J

N·m

m2·kg·s-2

Potencia

Vatio

W

J·s-1

m2·kg·s-3

Intensidad eléctrica

Amperio

A

C·s-1

Flujo luminoso

Lumen

lm

cd·sr

Luminosidad

Lux

lx

lm·m-2

Área

Metro cuadrado

m2

Volumen

Metro cúbico

m3

Ejemplo de múltiplo y submúltiplo El metro es la unidad básica del Sistema Internacional de Unidades Múltiplos del metro: Yottametro (Ym): 1024 metros Zettametro (Zm): 1021 metros Exámetro (Em): 1018 metros Petámetro (Pm): 1015 metros Terámetro (Tm): 1012 metros Gigámetro (Gm): 109 metros Megámetro (Mm): 106 metros Miriámetro (Mam): 104 metros Kilómetro (km): 103 metros Hectómetro (hm): 102 metros Decámetro (dam): 101 metros Submúltiplos del metro: Decímetro (dm): 10-1 metros

27

Expresada en unidades básicas

cd·sr·m-2

TECNOLÓGICO NACIONAL DE MÉXICO Instituto Tecnológico Superior de Coatzacoalcos

Centímetro (cm): 10-2 metros Milímetro (mm): 10-3 metros Micrómetro (µm): 10-6 metros Nanómetro (nm): 10-9 metros Angstrom (Å): 10-10 metros Picómetro (pm): 10-12 metros Femtómetro o fermi (fm): 10-15 metros Attómetro (am): 10-18 metros Zeptómetro (zm): 10-21 metros Yoctómetro (ym): 10-24 metros Sistema inglés de medidas Sistema náutico 1 grado de latitud

20 leguas náuticas

60 millas náuticas

1 legua náutica

3 millas náuticas

30,375 cables 3 037,5 fathoms

1 milla náutica

11,256 cables

1 012,5 fathoms

2 025 yardas 6 075 pies

1 cable

100 fathoms

200 yardas

600 pies

1 fathom (brazas inglesas)

2 yardas

6 pies

1 yarda 3 pies Sistema estadounidense de agrimensura 1 Milla de agrimensura = 5.280 pies de agrimensura

28

607,5 cables 60 750 fathoms 6 075 yardas

121 500 yardas 18 225 pies

364 500 pies

Related Documents


More Documents from "Rosita Rodriguez"

Estadistica Inferencial.
February 2021 2