Correlacion Y Regresion.doc

  • Uploaded by: Estefani RL
  • 0
  • 0
  • March 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Correlacion Y Regresion.doc as PDF for free.

More details

  • Words: 1,813
  • Pages: 12
Loading documents preview...
Correlación y Regresión 1. Correlación.- La correlación explica la variación de una variable por la variación de otras involucradas en una ecuación de regresión. Coeficiente de correlación.- Es el estadístico que permite medir el grado de asociación de dos variables linealmente relacionados.

1.1.



Para una muestra: r

S xy



S x SY

( x  x)( y  y ) xy  n x y  nS x S y nS x S y

También: r

nxy  xy ( nx  (x) 2 )(ny 2  (y ) 2 ) 2

Siendo: Sx 

( x  x ) n

x

x n

Sy 

( y  y ) n

y

y n

Valores de r entre 1 y -1 describen grados de asociación r = 0 son independientes 1.2.

Coeficiente de Determinación.- Es el porcentaje de la variación total de la variable dependiente Y, que es explicada por la variable independiente X.

Ejemplo: Si para Y  a  bX y r 2  0.85 entonces 85% de la variable Y es explicada por X y el 15% es debido a errores y otras variables no consideradas.

2. Regresión.-

2.1.

Análisis de Regresión.Pasos:

  

Selección de una función de relación correlativa simple o múltiple, lineal o no lineal. Estimación del grado de correlación r y r 2 Prueba de significación de los estadísticos, prueba t: -

Plantea la hipótesis H 0 :   0 y H a :   0 .

-

Cálculo del t calculado (tc) donde t c 

-

de valores. Cálculo de t tabular (tt) el cual se obtiene de tablas  n: # pares de valores; α = 1 – Probabilidad, y V=n–1

-

Decisión:

r n2 1 r2

; n = número de pares

2

2.2.

tc  tt

Se acepta   0 no hay correlación

tc  tt

Se acepta   0 existe correlación

Regresión Lineal.Es el modelo más simple y común, esta basado en la suposición de que dos variables se relacionan en forma lineal. Como ejemplo se puede mencionar:    

Caudales y precipitación de una misma cuenca Precipitación de una estación, con precipitación de otra estación Caudal de una estación con caudal de otra estación Precipitación con la altitud de una cuenca

Este hecho nos permite correlacionar estas variables para completar datos o extender un registro.

Ecuación de Regresión.- La ecuación general de la ecuación de regresión lineal es: y  a  bx

Donde: X = Variable independiente, variable conocida Y = Variable dependiente; variable que se trata de predecir a = Valor de Y cuando X = 0 b = Cantidad de cambio de Y asociada a un cambio de X. Estimación de parámetros.siguientes ecuaciones:

los parámetros se calculan con las 2

a

y i xi  xi yi xi

b 2.3.

2

nxi  (xi ) 2 n x i y i   x i  y i 2

n x i  (  x i ) 2

Regresión Múltiple.Esta técnica, se utiliza cuando la variable dependiente y, es función de dos o más variables independientes x1, x2, x3,…, xm. y  a 0  a1 x1  a 2 x 2  a 3 x 3  ...  a m x m

Donde: n = Número de variables independientes a0, a1, a2,…,am = parámetros a estimar p = m+1 = número de parámetros Estimación de Parámetros.Para estimar los parámetros deberemos solucionar las siguientes ecuaciones: y  a 0 n  a1x1  a 2 x 2  a 3 x3  .......  a m x m 2

x1 y  a 0 x1  a1x1  a 2 x1 x 2  a3 x1 x3  .......  a m x1 x m 2

x 2 y  a 0 x 2  a1x1 x 2  a 2 x 2  a3 x 2 x3  .......  a m x 2 x m .

.

.

.

.

.

x m y  a 0 x m  a1x1 x m  a 2 x 2 x m  a 3 x3 x m  .......  a m x m

2

Al solucionar estas ecuaciones se obtienen los parámetros requeridos. Error estándar del estimado para regresión múltiple.Es la medida de dispersión que se calcula con la siguiente ecuación: Se 

 ( y  y) n p

2



e

2

n p

Donde: Se = error estándar del estimado y = valores muéstrales (experimentales) de la variable dependiente y  a 0  a1 x1  a 2 x 2  .....  a m x m

= valores estimados de la variable dependiente con ecuación de regresión e = y - y = error entre el valor observad y estimado de la variable dependiente. n = número de grupos de la muestra p = m+1 = número de parámetros a estimar a partir de la muestra n – p = grados de libertad Coeficiente de determinación múltiple.Representa la proporción de la variación total de y que es explicada por las variables involucradas en la ecuación múltiple, se puede calcular a partir de la ecuación. 2

R2  1 R  1 2

Se S2y Se

2

1 2 ( y 2  n y ) n 1

Coeficiente de correlación múltiple.-

El coeficiente de correlación múltiple se puede calcular a partir de las ecuaciones 2

1

S R  (1  2e ) 2 S y R  (1 

Se

2

1 2 ( y 2  n y ) n 1

1

)2

Ejemplo 1.- En una cuenca se tienen dos estaciones de aforo A y B, en las que se midieron los caudales medios mensuales, en m3/s para el año 2005 los que se muestran en la tabla a continuación:

1. Probar si los datos de ambas estaciones de ambas estaciones se correlacionan linealmente 2. Calcular el caudal en la estación B, para un caudal de 800 m3/s en la estación A. Solución.1. Sea la ecuación que correlaciona las variables y  a  bx

Donde: X = caudales de la estación A Y = caudales de la estación B 2. De acuerdo a los datos se tiene n = 12 (número de pares de datos); los cálculos de sus sumatorias, se muestra en la siguiente tabla

3. Calculo de r: r

nxy  xy ( nx  (x) 2 )(ny 2  (y ) 2 ) 2

Sustituyendo valores, resulta: r

12  4151378  8222  3384 (12  9883626  8222 2 )(12  1765436  3384 2 )

r

21993228 22281029.21

r  0.9871 r 2  0.9744

4. Prueba de significación:  

Hipótesis: H0: r = 0 Ha: r ≠ 0 Calculo de tc: tc 

tc 



r n2 1 r2

0.9871 12  2 1  0.9744

tc  19.5093

Cálculo de tt:

De la tabla A.5 del apéndice, para: v = n-2 = 12 – 2 = 10 y una probabilidad del 95% o

 0.05   0.025 2 2

se tiene tt = 2.228 

Criterio de decisión: Como: t c  19.5093  t t  2.228 se rechaza la hipótesis nula siendo r ≠ 0 Entonces existe correlación entre las variables X y Y

5. Cálculo de los parámetros a y b: Cálculo de a.2

a

y i xi  xi yi xi 2

nxi  (xi ) 2

Cálculo de b.-

b

b

n x i y i   x i  y i 2

n x i  (  x i ) 2

12  4151378  8222  3384 12  9883626  8222 2 b  0.4312

6. Ecuación de regresión: y  13.0609  0.4312 X

7. Cálculo del caudal de la estación A, para un caudal de 800 m3/s en la estación B. Sustituyendo valores en la ecuación resulta: y  13.0609  0.4312(800)

y  13.0609  0.4312(800) y  332 m3/s

Ejemplo 2.- Del estudio de una región de Costa Rica, se ha obtenido para 14 subcuencas, el caudal promedio anual (de los caudales máximos anuales) Q, en m3/s, el

área de la cuenca A, en Km2, y la intensidad máxima de precipitación I, en cm./ 24h siendo los resultados los que se muestran en la tabla:

Se desea saber si estas variables se correlacionan linealmente es decir, si se puede establecer el modelo: Q  a 0  a1 A  a 2 I

Se pide: 1. Calcular el intercepto a0, los coeficientes de regresión a1, a2 y definir la ecuación lineal múltiple. 2. Calcular

Q,

caudal estimado para cada conjunto de valores de A e I.

3. Calcular los errores ei = Q -

Q

4. Calcular el error estandar del estimado (Se) 5. Calcular la varianza de la variable dependiente 6. Calcular los coeficientes de determinación y correlación multiple 7. Estimar el valor de Q, si A = 4 Km. e I = 1.5 cm./ 24h

Solución 1. Cálculo de los parámetros:

Q  a

0

n  a1  A  a 2  I

 AQ  a  A  a  A 0

1

2

 a2  A  I

 IQ  a  I  a  A  I  a  I 0

1

2

2

Donde n = 14

Remplazando valores resulta: 304.12  14a 0  21.332a1  34.3a 2 1465.893  21.332a 0  108.7412a1  43.3419a 2 627.8  34.3a 0  43.3419a1  86.99a 2

Desarrollando se tiene a0 =1.656991 a1 = 13.151048 a2 = 0.011194 Siendo la ecuación de regresión múltiple: Q  1.656991  13.151048 A  0.011194 I

2. Utilizando la ecuación para los valores experimentales, se obtienen los valores estimados del caudal, los que se muestran en la columna 4 de la tabla. 3. La diferencia entre el valor experimental y el valor experimentado con la ecuación será el error estos valores se muestran en la tabla

4. De la ecuación , se tiene: Se 

Se 

e

2

n p

171.0983 14  3

Se  3.943906

5. De la ecuación se tiene 2

SQ  2

SQ 

1 n 1

 Q

2

 nQ

2





1 1996.076  14  21.722857 2 14  1

2

S Q  1027.20929

6. Ahora se tiene: R  1 2

Se 2 SQ

2

Se 2  3.943906 2  15.5544 2

S Q  1027.20929



R2  1

15.5544 1027.20929

R 2  0.984858

R  0.9924

7. En la Ecuación Q = 1.656991 + 13.151048 A + 0.011194 I Remplazando Valores A=4 I = 1.5 Q = 1.656991 + 13.151048 x 4 + 0.011194 x 1.5 Q = 54.28 m3 /s

Related Documents


More Documents from "Gilberto B. Capacha"