Contraste De Hipotesis

  • Uploaded by: winfer90
  • 0
  • 0
  • January 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Contraste De Hipotesis as PDF for free.

More details

  • Words: 3,758
  • Pages: 13
Loading documents preview...
TEMA 3: CONTRASTE DE HIPÓTESIS PARÁMETRICO

0. INTRODUCCIÓN Continuando dentro del contexto general de la inferencia estadística, vamos a exponer el contraste o test de hipótesis estadísticas que aparece muy relacionado con la estimación por intervalos, desarrollada en el capítulo anterior. Los intervalos de confianza se utilizan para estimar parámetros y los contrastes o test de hipótesis para tomar decisiones acerca de características poblacionales. La teoría del contraste de hipótesis estadísticas fue introducida inicialmente por Fisher y desarrollada por Neyman y Pearson, siendo considerablemente extendida y generalizada en los últimos años. Una hipótesis estadística es cualquier afirmación, verdadera o falsa, sobre alguna característica desconocida de la población. Si la hipótesis se refiere al valor de un parámetro desconocido θ de la población, diremos que se trata de un contraste paramétrico, pero si la hipótesis se refiere a la forma que tiene la función de cuantía o de densidad f(x; θ) de la población, entonces hablaremos de contraste no paramétrico. Así pues, supongamos una población que sigue una distribución N(5, σ), en donde el parámetro σ es desconocido y hacemos una hipótesis acerca del posible valor del parámetro desconocido, desviación típica, σ=2; entonces estaríamos en un contraste paramétrico. Sin embargo, si no conocemos la forma de la población, o sea, no sabemos si sigue una distribución normal, binomial, exponencial, etc. entonces formularíamos la hipótesis de que esa población tiene una distribución de tipo normal, binomial, exponencial, etc. diciendo por tanto que se trata de un contraste no paramétrico. En este capítulo nos vamos a referir a contrastes paramétricos y dejaremos los contrastes no paramétricos para un capítulo posterior. Por ello admitimos que es conocida la forma funcional de la función de cuantía o de densidad de la población, f(x; θ), en donde θ es un parámetro desconocido, que toma valores dentro del espacio paramétrico Ω, el cual contiene, al menos dos puntos. Para el planteamiento general del contraste de hipótesis paramétrico, partimos de una población cuya función de cuantía o de densidad f(x; θ) depende de un parámetro θ desconocido, que toma valores dentro de un espacio paramétrico Ω. Formulamos una hipótesis que consiste en hacer θ=  0 y con la ayuda de una muestra aleatoria ( X 1 , X 2 ,..., X n ) procedente de la población, obtenemos el estimador puntual θ( X 1 , X 2 ,..., X n ) que es utilizado para inferir o determinar si la hipótesis formulada, que el valor θ=  0 , es aceptada.

1

1. TIPOS DE HIPÓTESIS En el apartado anterior hablábamos en general de hipótesis estadísticas, pero como aquí nos vamos a referir sólo a los contrastes paramétricos podemos precisar más y las llamamos hipótesis paramétricas, que son afirmaciones verdaderas o falsas, sobre el valor del parámetro θ desconocido. Consideremos dos tipos de hipótesis: * Hipótesis simples. * Hipótesis compuestas. Diremos que una hipótesis es simple si se refiere a un solo valor del parámetro, es decir a un solo punto del espacio paramétrico, quedando totalmente especificada la forma de la función de cuantía o de densidad de la población al conocer ese valor del parámetro. Si la hipótesis no se refiere a un punto del espacio paramétrico o valor del parámetro, sino que se refiere a una región del espacio paramétrico, diremos que se trata de una hipótesis compuesta. En el contraste de hipótesis estadísticas siempre se acepta, provisionalmente, una hipótesis como verdadera, que es la hipótesis nula H 0 , y que es sometida a comprobación experimental frente a otra hipótesis H1 . Como complementaria que llamaremos hipótesis alternativa consecuencia de la comprobación experimental, la hipótesis nula H 0 podrá seguir siendo aceptada como verdadera o, por el contrario, tendremos que rechazarla y aceptar como verdadera la hipótesis alternativa H1 . La especificación apropiada de la hipótesis nula y alternativa depende de la naturaleza propia del problema en cuestión, así pues, las formas básicas de establecer las hipótesis sobre el parámetro θ son las siguientes: I

H o :   0

2

H1 :    0 II

H o :   0 H1 :    0

II I

H o :   0 H1 :    0

I V

H o : 1     2 H1 :   1 ó  > 2

Las hipótesis deben ser formuladas de tal manera que sean mutuamente excluyentes y complementarias. Los contrastes de la formas I y IV son de dos colas o bilaterales y los contrastes de las formas II y III son de una sola cola o unilaterales, pues las hipótesis alternativas correspondientes están formuladas por ambos lados o por uno solamente. 2. REGIÓN CRÍTICA Y REGIÓN DE ACEPTACIÓN La región crítica está constituida por el conjunto de muestras para las cuales se rechaza la hipótesis nula H 0 . La región de aceptación está constituida por el conjunto de muestras para las cuales se acepta la hipótesis nula H 0 . El valor o valores que separan la región crítica de la región de aceptación reciben el nombre de valor o valores críticos. Cuando el contraste es de la forma I o IV, o sea, bilateral, estas regiones serán del tipo de las indicadas en el siguiente gráfico: Región crítica Región de aceptación Región crítica (Rechazar H 0 ) (Aceptar H 0 ) (Rechazar H 0 ) C C C ← |---------------------------|-----------------------------------------------------|---------------------------| → ↑ ↑ |----- - - - - --Valores críticos---------------| Si el contraste es de forma II, es decir, unilateral a la izquierda, estas regiones serán del tipo de las indicadas en el siguiente gráfico:

3

Región crítica Región de aceptación (Rechazar H 0 ) (Aceptar H 0 ) C C ← |---------------------------------------|--------------------------------------------------------------------| → ↑ Valor crítico Análogamente, si el contraste es de forma III, es decir, unilateral a la derecha, entonces las regiones son del tipo a las indicadas en el gráfico siguiente: Región de aceptación Región crítica (Aceptar H 0 )

(Rechazar

H0 ) C C ←|------------------------------------------------------------------------|---------------------------------|→ ↑ Valor crítico

Luego un contraste o test de hipótesis será un método que selecciona una región crítica C y que es capaz de averiguar si la muestra ( x1 , x2 , x3 ,..., xn ) está o no en C. 3. ERRORES DE TIPO I, DE TIPO II Y POTENCIA DEL CONTRASTE. En todo problema de decisión, cuando tenemos que elegir entre varias alternativas o decisiones existe la posibilidad o riesgo de equivocarnos cometiendo los correspondientes errores. Así pues, en el contraste de hipótesis, basándonos en la información proporcionada por la muestra, tenemos que decidir si aceptamos la hipótesis nula H 0 o si la rechazamos. La decisión siempre la hacemos sobre la hipótesis nula, existiendo un riesgo de equivocarnos que nos llevará a los errores de tipo I y de tipo II. Existen cuatro resultados posibles de nuestra decisión sobre la hipótesis nula, dos de ellos no nos llevan a ningún tipo de error y los otros dos dan lugar a los errores de tipo I y de tipo II. En efecto, la tabla siguiente nos muestra los cuatro posibles resultados: Estados de la naturaleza

4

Decisión Aceptamos H0 Rechazamos H0

H 0 es verdadera Decisión correcta No hay error Error de tipo I 

H 0 es falsa Error de tipo II  Decisión correcta No hay error

Si la hipótesis nula H 0 es verdadera (columna 1), podemos aceptar H 0 o rechazar H 0 basándonos en la información proporcionada por la muestra. Si aceptamos H 0 cuando es verdadera, la decisión es correcta y no hay error. Si rechazamos H 0 cuando es verdadera, hemos cometido un error, que se llama error de tipo I. Si la hipótesis nula H 0 es falsa (columna 2), podemos aceptar H 0 o rechazar H 0 basándonos en la información muestral. Si aceptamos H 0 cuando es falsa, hemos cometido un error, que se llama error de tipo II. Si rechazamos la hipótesis nula H 0 cuando es falsa, la decisión es correcta y no hay error. Es necesario dar una medida de la posibilidad o del riesgo de cometer estos dos tipos de errores. Estas medidas son probabilidades y las notaremos por α y β, siendo:

 = Riesgo de error de tipo I = P (Error de tipo I) = P (Rechazar H 0 / H 0 es cierta)  =Riesgo de error de tipo II = P (Error de tipo II)=P (Aceptar H 0 / H 0 es falsa) Si los errores de tipo I y de tipo II son nulos, α=β=0, entonces decimos que el test o contraste es ideal. Cuando estudiamos los intervalos de confianza, decíamos que 1-α era el nivel de confianza, y ahora podemos decir que representa el complemento de la P(error de tipo I), siempre y cuando el test sea bilateral, es decir: Nivel de confianza = 1-α =1-P(error de tipo I)=P(aceptar H 0 / H 0 es cierta) Otro concepto fundamental es el de potencia del test o del contraste: 1-β, que indica el poder o potencia que tiene el contraste para reconocer correctamente que la hipótesis nula es falsa y por tanto sería rechazada. Así pues, siempre desearemos un contraste con una potencia grande , próxima a la unidad, o lo que es igual, un valor de β muy pequeño cuando H 0 es falsa.

5

La relación entre α y β según la decisión de aceptar o rechazar la hipótesis nula H 0 , viene dada en la siguiente tabla, que representa el mismo problema de decisión que la anterior, con la única diferencia de que aquí identificamos la probabilidad asociada a cada una de las cuatro casillas de la tabla: Estados de la naturaleza Decisión Aceptamos H0 Rechazamos H0

H 0 es verdadera 1-  Nivel de confianza



4. FASES EN CONTRASTE O TEST DE HIPÓTESIS

H 0 es falsa

 1-  Potencia del contraste

A REALIZAR UN

En un contraste de hipótesis nos podemos encontrar con varios parámetros poblacionales, con diferentes maneras de formular las hipótesis, con muchos tests estadísticos diferentes y diversas distribuciones de probabilidad que pueden ser incluidas en un contraste de hipótesis, no siendo fácil el catalogar todos los posibles contrastes. Sin embargo sí existe un procedimiento, similar, aplicables a las diferentes situaciones. Este procedimiento se resume en los siguientes pasos:

1. Formular la hipótesis nula H 0 y la hipótesis alternativa H1 en términos estadísticos. En todo problema de contraste de hipótesis se deben especificar claramente las dos hipótesis. En la práctica, generalmente, conviene formular la hipótesis nula como una hipótesis simple y la hipótesis alternativa como una hipótesis compuesta, aunque no es necesario hacerlo así, pues también se pueden formular las hipótesis de cualquiera de las maneras que ya conocemos. En cualquiera de los casos las hipótesis deben ser mutuamente excluyentes, y deben ser formuladas de tal manera que el verdadero valor del parámetro poblacional esté incluido en la hipótesis alternativa, no siendo posible que no esté incluido en ninguna y ambas hipótesis sean falsas.

6

2. Determinar el test estadístico o estadístico de prueba apropiado. En este caso se ha de obtener un estadístico apropiado que se utilizará para rechazar o aceptar la hipótesis nula H 0 y que recibe el nombre de test estadístico o estadístico de prueba. El test estadístico seleccionado debe satisfacer las siguientes condiciones: - Su función de probabilidad debe ser conocida cuando se supone que la hipótesis nula es cierta. - Debe contener el valor del parámetro que está siendo contrastado. - Los restantes términos que intervienen deben ser conocidos o se pueden calcular a partir de la muestra.

3. Seleccionar el nivel de significación α. Es deseable que α tome el menor valor posible para tener una menor probabilidad de rechazar una hipótesis nula H 0 cuando es cierta. El valor del nivel de significación α, indica la importancia o significado que el investigador atribuye a las consecuencias asociadas rechazando incorrectamente la hipótesis nula H 0 .

4. Determinar la región crítica o región de rechazo El conocimiento de la región crítica nos permitirá decidir si se acepta o rechaza la hipótesis nula H 0 , en función del valor del estadístico de prueba elegido y del valor de significación α fijado. Así pues, es importante especificar, antes de seleccionar la muestra, cual será el valor exacto del test estadístico que nos llevará a aceptar o rechazar la hipótesis nula H 0 ; determinando así la región crítica o región de rechazo y la región de aceptación.

5. Seleccionar aleatoriamente la muestra y calcular el valor del estadístico de prueba o test estadístico. Después de seleccionada, de manera aleatoria, la muestra, se ha de ver si la muestra obtenida cae en la región crítica o en la región de aceptación. Es decir, a partir de las observaciones se calcula el valor del test estadístico o estadístico de prueba y se vería si el

7

valor de este estadístico cae en la región crítica o en la región de aceptación.

6. Dar la regla de decisión y su interpretación. Si el valor calculado del test estadístico o estadístico de prueba cae dentro de la región crítica, entonces la hipótesis nula H 0 se rechaza, y si el valor calculado cae dentro de la región de aceptación, entonces se acepta la hipótesis nula H 0 . Por último, hay que resumir e interpretar la decisión, de aceptar o rechazar H 0 en términos del problema original, es decir, utilizando el lenguaje del planteamiento del problema, pues los resultados de los contrastes de hipótesis en el mundo de la economía, de la empresa o de las ciencias sociales en general, frecuentemente se presentan para ser utilizados por personas con pocos conocimientos estadísticos. 5. CONTRASTES SOBRE LA MEDIA DE UNA POBLACIÓN N(μ,σ) CON σ CONOCIDA Supongamos una población N(μ,σ), en donde σ es conocida, y mediante una muestra aleatoria simple de tamaño n, ( x1 , x2 , x3 ,..., xn ) , y un nivel de significación α dado, queremos realizar los siguientes contrastes: 1.

 H 0 :    0    H1 :   0

2.

 H 0 :    0    H1 :   0

3.

 H 0 :    0    H1 :   0

 H 0 :    0   H1 :   0

1. Contraste de 

La regla de decisión será: x  0 - Rechazamos H 0 si: zexp   <  z / 2 n

ó

zexp 

x  0 >  z / 2  n

8

- Aceptamos H 0 si :

 z / 2  zexp  z / 2

La regla de decisión también la podemos formular en función de la región crítica o de la región de aceptación, así pues, si calculamos la media x correspondiente a la muestra aleatoria de tamaño n, entonces:

   , 0  z / 2  Si x   0  z / 2 n n 

aceptamos H 0 .

   , 0  z / 2  Si x   0  z / 2 n n 

rechazamos H 0 .

 H 0 :    0   H1 :   0

2. Contraste de 

La regla de decisión será: x  0 - Rechazamos H 0 si: zexp   > z / 2 n x  0  z / 2 - Aceptamos H 0 si: zexp   n  H 0 :    0   H1 :   0

3. Contraste de 

La regla de decisión será: x  0 - Rechazamos H 0 si: zexp   <- z / 2 n x  0  - z / 2 - Aceptamos H 0 si: zexp   n

9

6. CONTRASTES SOBRE LA MEDIA DE UNA POBLACIÓN N(μ,σ) CON σ DESCONOCIDA En esta sección, consideramos de nuevo el problema de una muestra aleatoria simple ( x1 , x2 , x3 ,..., xn ) procedente de una población N(μ,σ), en donde σ es desconocida y, con un nivel de significación α dado, queremos realizar los siguientes contrastes: 1.

 H 0 :    0    H1 :   0

2.

 H 0 :    0    H1 :   0

3.

 H 0 :    0    H1 :   0

Utilizando el estadístico de prueba:

texp 

x  0 se tendrán los siguientes s n

contrastes: 1) Contraste de

 H 0 :    0    H1 :   0

- Se rechaza H 0 si: texp  t / 2 ó - Se acepta H 0 si: t / 2  texp  t / 2

texp  t / 2

 H 0 :    0   H1 :   0

2) Contraste de 

- Se rechaza H 0 si: texp  t - Se acepta H 0 si: texp  t

 H 0 :    0   H1 :   0

3) Contraste de 

- Se rechaza H 0 si: texp  t - Se acepta H 0 si: texp  t 10

7. CONTRASTES SOBRE LA PROPORCIÓN POBLACIONAL

Utilizando el estadístico z zexp 

µp  p 0

p0  1  p0  / n

, se pueden formular los

siguientes contrastes:

 H 0 : p  p 0   H1 : p  p0

1. Contraste de: 

Se acepta H 0 si:  z / 2  zexp  z / 2

 H 0 : p  p 0   H1 : p  p0

2. Contraste de: 

Se acepta H 0 si:

zexp   z

 H 0 : p  p 0   H1 : p  p0

3. Contraste de: 

Se acepta H 0 si: siendo z

zexp  z

P  Z  z    ó

P  Z  z   1  

EJERCICIOS

11

1. La cotización de las acciones de un banco durante el año 1995 se ha observado que se distribuye normalmente con σ=800 ptas. Se selecciona una media aleatoria de la cotización alcanzada en 100 días, obteniendo como cotización media x=18.800 ptas. y queremos contrastar la hipótesis de que a la vista del valor que toma la media de la muestra, nosotros creemos que la cotización media de esa acción es μ=19.000 ptas. Utilizaremos como nivel de significación α=0,05. 2. Una empresa de automóviles está estudiando las mejoras que ha incluido en la nueva generación. Hasta ahora, los Km. que uno de estos automóviles podía recorrer (uso normal) sin que fueran necesarias reparaciones importantes seguía una N (220,15) (Miles de km.). Las mejoras parecen haber surtido efecto, puesto que con 100 automóviles de la nueva generación se ha obtenido una x =225 sin ningún tipo de problema grave. Suponiendo que la desviación típica se ha mantenido: a) Plantea un test para contrastar la hipótesis de que las mejoras no han surtido efecto o incluso que han empeorado la situación, frente a que sí han surtido efecto, como parecen indicar los datos. Si se concluyera que la media sigue igual o incluso bajó, y sin embargo esta conclusión fuera falsa, ¿cómo se llama el error cometido? b) Con un nivel de significación del 1% ¿a qué conclusión se llega? 3. Se sabe que la edad de los aspirantes a un puesto de trabajo en un determinado organismo oficial es una variable normal con desviación típica igual a 5. Se observa una muestra de 125 personas que se presentan a una prueba para optar a un puesto de trabajo en el citado organismo, obteniéndose una media igual a 22,3 años: a) ¿Se puede afirmar, con un nivel de significación del 5%, que es igual a 21 la edad media de los que optan a un puesto de trabajo en el organismo oficial? b) ¿Se puede afirmar, si el nivel de significación es del 1%, que dicha edad media es menor o igual que 22? 4. El número de vehículos que llegan a una gasolinera, se sabe, por observaciones anteriores, que sigue una distribución normal pero no conocemos ni la media ni la desviación típica. Con el fin de contrastar la hipótesis de que el número medio de vehículos que acceden a esa gasolinera es de 21 cada 15 minutos, seleccionamos una media aleatoria de 30 períodos de tiempo de 15 minutos, obteniendo de media: x =18,73 y varianza s²=16,202. Se pide realizar el contraste correspondiente al nivel de significación α=0,02.

12

5. El peso neto escurrido de un determinado tipo de conserva en lata es una varianza aleatoria distribuida normalmente. Las normas de envasado de esa planta conservera exigen que el peso neto medio escurrido sea menor o igual de 150 g. Con el fin de detectar si el lote fabricado presenta diferencia significativa con respecto a ese valor, se toma una muestra aleatoria de 15 latas y se obtiene que x =151,234 y s=4,072. Contrastar al nivel de significación del 10%. 6. El Ayuntamiento de una ciudad afirma que el 65% de los accidentes juveniles de los fines de semana son debidos al alcohol. Un investigador decide contrastar dicha hipótesis al nivel de significación 1%, para lo cual toma una muestra formada por 35 accidentes y observa que 24 de ellos han sido debido al alcohol. ¿Qué podemos decir sobre la afirmación del Ayuntamiento? 7. Un entrenador asegura que sus jugadores en los entrenamientos encestan más del 92% de los tiros libres. Con el fin de contrastar esta afirmación se ha elegido aleatoriamente una muestra de 60 lanzamientos, de los que 42 han entrado en la canasta. Estos resultados ¿ponen en duda al entrenador o no? (α=0,1) 8. Una empresa dedicada a la fabricación de lámparas de bajo consumo cuando realiza sus ventas, anuncia que como máximo hay un 1% de defectuosas. Para contrastar esa hipótesis H 0 : p ≤ 0,01 frente a H1 : p > 0,01 se selecciona una muestra aleatoria de 300 lámparas y se observa que han aparecido 6 defectuosas. Con un nivel de significación del 8% deseamos saber si debemos aceptar la hipótesis del fabricante.

13

Related Documents

Contraste De Hipotesis
January 2021 1
Contraste De Hipotesis
January 2021 1
03_prueba De Hipotesis
February 2021 0
Prueba De Hipotesis 12
January 2021 0
Prueba De Hipotesis
March 2021 0

More Documents from "Santiago Segura"

Contraste De Hipotesis
January 2021 1