Loading documents preview...
Cátedra de Análisis Geoestadistico
Docente: Ing. Marcelo Andrés
1A.E.D.
2- A.E.
- Histogramas ( Distribucion , casos atipicos, tendensias) -Uso de Estadisticas descriptiva tendencia central, medidas de dispersion, medidas de forma.
3.Estimación
Ordinario Variograma (semivariograma) Kriging Kriging Universal
ˆ h
n
1 2 Z Z x xh 2n(h) i 1
Kriging Simple Kriging residual Co-Kriging Otros.
- Media , Moda , Mediana - desviacion estandar y varianza - Coeficiente de curtosis, sesgo y γ(h) = Semivarianza variacion. h= distancia - Distribucion Normal n(h) = Número total de pares de datos definidos Autocorrelation Espacial (Ej Indice de Moran) para un distancia definida (lag) Z = valores de la variable para un punto específico Estudio direcional de fenomeno (Anisotropia)
Justificación del Análisis Exploratorio de Datos Espaciales . En la aplicación de la geoestadística es de suma importancia, al igual que en otros procedimientos estadísticos (por ejemplo los modelos ARIMA dentro de la teoría de series de tiempo), el análisis gráfico. La identificación de valores extremos y su ubicación geográfica, la evaluación de la forma de la distribución y el cálculo de medidas de localización, variabilidad y correlación es muy importante para establecer si algunos supuestos necesarios para la aplicación de la teoría geoestadística son válidos o para definir que procedimiento de predicción es el más conveniente. Por ejemplo, la decisión de usar kriging ordinario o kriging universal se fundamenta en identificar si la media es o no constante en la región. El uso de kriging log-normal se basa en un criterio empírico relacionado con la forma asimétrica de la distribución de los datos muestrales. La decisión de emplear cokriging depende de la detección de asociaciones entre las variables.
Objetivos del Análisis Exploratorio de datos: 1) Analizar (mediante herramientas estadísticas simples) la cantidad, la calidad y la ubicación de los datos disponibles. 2) Definir la(s) zona(s) de estudio. Una división del campo en varias sub-zonas puede ser relevante si uno observa cambios abruptos en la distribución espacial de valores, o si la geología del fenómeno lo indica. 3) Anticipar dificultades o problemas que puedan surgir en la fase de estimación local (por ejemplo, presencia de valores atípicos que se destacan de aquellos de los datos vecinos).
1.A.E.D.
Distribución normal Una distribución de probabilidad sigue una distribución normal, cuando la representación gráfica de su función de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y que tiene 2 puntos de inflexión situados a ambos lados de la media y a distancia igual a la desviación estándar, es decir de la forma
•
Tiene una única moda, que coincide con su media y su mediana •
La curva normal es asintótica al eje de abscisas.
•
Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.
•
Cuanto mayor sea la desviación estándar, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución
•
La curtosis es igual a cero (0).
•
El coeficiente de sesgo es igual a cero (0)
Probabilidad de Distribución Normal
Probabilidad de distribución Log -Normal
Conceptos básicos de estadística • Estadística descriptiva: se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio Para analizar los datos usualmente se construyen las tablas de frecuencias y se utilizan: -
La media Mediana Moda
-
Desviación estándar Varianza Coeficiente de variación
-
Coeficiente de curtosis Coeficiente de sesgo
Medidas de tendencia central Medidas de dispersión
Medidas de forma
a. Medidas de tendencia central Intentan identificar el dato más representativo de la distribución del conjunto. Son las siguientes. Media. Se le suele llamar promedio, se define como la suma de los valores de todas las observaciones divididas por el número total de datos. Se denota con µ o X. En su cálculo intervienen todos los datos, por lo tanto, se ven influenciados por la variación de cualquiera de ellos. En particular, es sensible a los valores extremos, pues estos producen grandes modificaciones.
Mediana. Es el valor de la serie de datos que deja la mitad de las observaciones por debajo de ella y la otra mitad por encima, es decir, divide al conjunto de datos en dos partes iguales y se denota por Me. Dado que sólo depende del orden de los datos, tiene la ventaja de que no es sensible a los valores extremos. En datos agrupados se calcula de la siguiente forma. 1. Calcular: n/2 2. La mediana será el valor de la variable cuya frecuencia absoluta acumulada primero iguale o supere a N/2. Este será el intervalo en el que se encuentra la mediana.
Moda. Es el dato que más veces se repite, es decir, aquel dato o rango que presenta mayor frecuencia absoluta. Puede haber más de una moda en una distribución. Se denota por Mo.
b. Medidas de dispersión Las medidas de dispersión indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Nos dan una idea sobre la homogeneidad o que tan agrupado están los datos. Desviación estándar. Indica cuánto tienden a alejarse los valores puntuales de la media. Se suele representar por una S. Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca de la media.
Varianza. Describe la variabilidad de la distribución. Es la medida de la desviación o dispersión de la distribución. Se calcula mediante la ecuación.
Coeficiente de variación. Mide la representatividad de la media. Valores extremos del mismo nos llevarán a concluir que la media no es representativa, es decir, existirán valores entre las observaciones que se separan significativamente de las demás.
c. Medidas de forma Miden el grado de deformación respecto a una curva patrón (distribución normal). Coeficiente de curtosis. Mide el grado de aplastamiento o apuntamiento de la gráfica de la distribución de la variable estadística. Datos concentrados respecto a la media (desviación estándar pequeña) dará una grafica alargada; si los datos están dispersos la gráfica será achatada o aplastada.
Baja concentración
Normal
Alta
Coeficiente de sesgo o asimetría: Evalúa el grado de distorsión o inclinación que adopta la distribución de los datos respecto a su valor promedio tomado como centro de gravedad. El coeficiente de simetría de Pearson es:
Si CS = 0, la distribución es simétrica, en ese caso las desviaciones a la derecha y a la izquierda de la media se compensan. Si CS < 0, la distribución es asimétrica negativa. La mayoría de las observaciones están a la derecha de la proyección de la media. Si CS > 0 la distribución es asimétrica positiva. La mayoría de las observaciones están a la izquierda de la proyección
Tablas de Frecuencias Una forma de presentar ordenadamente un grupo de observaciones, es a través de tablas de distribución de frecuencias. Para construir una tabla de frecuencia se deben ordenar los datos de menor a mayor e incluir los siguientes parámetros.
Frecuencia Absoluta (ni) Frecuencia Relativa (fi)
Frecuencia Absoluta Acumulada (Ni)
Frecuencia Relativa Acumulada (Fi) Numero de clases Amplitud de la clase o intervalo
Es el número de datos que están en un mismo intervalo. Es la frecuencia absoluta dividida por el número total de datos. Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. La última frecuencia absoluta acumulada es igual al número de casos. Es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos. Indica el número de intervalos en que se agruparan los datos. Se obtiene al dividir por dos, la diferencia del valor máximo y mínimo de los datos. Es el promedio de la suma del
En el caso de datos agrupados se deberán determinar el número de intervalos, la amplitud de los mismos y la marca de clase, de la siguiente forma:
(Cesar Perez)
Trabajo practico. Con el fin de que este sea un ejemplo práctico para abordar el análisis geoestadistico con ArcGIS, ilustraremos todo los conceptos con un ejemplo a partir de datos de monitoreo de niveles piezométricos de agua subterránea que se presentan en la tabla siguiente. Para ello se seguirán los siguientes pasos.
Para resumir, los pasos a seguir en el análisis exploratorio de los datos son los siguientes. 1. Organizar los datos de menor a mayor. 2. Calcular la tabla de frecuencia. 3. Realizar el histograma de frecuencias. 4. Calcular los parámetros geoestadístico. 5. Verificación de la normalidad con respecto a la media, moda y mediana. 6. Verificación de la normalidad con respecto a la asimetría horizontal (coeficiente de sesgo). 7. Verificación de la normalidad con respecto al coeficiente de variación. 8. Realización de la transformación de los datos, si es necesario. 9. Recalculo de los parámetros estadísticos y comparación
1.- Resolver con la base de datos entregadas Tabla de frecuencias
No
frecuenci frecuencia frecuencia frecuencia a relativa absoluta absoluta relativa acumulad acumulada a
Marca Interval de o clase
K= a= Marca clase =
2 -Resolver Grafique el histograma de frecuencias: A partir de la tabla anterior se construye el histograma de frecuencias, el cual nos da una idea del comportamiento de los datos.
3- Calcular los parámetros geoestadístico
Parámetro
Datos agrupados
Datos no agrupados
Módulo Geostatistical analyst de ArcGIS
Media Mediana Moda
Desviación estándar
Varianza
Coeficiente de Variación
Curtosis Sesgo o asimetría
Observaciones
Parámetros de validación de Normalidad en los datos. Respecto parámetros de tendencia central. •
Me = Mo= µ ( Su variación máxima entre ellas debe ser de una unidad (1). (Cesar Pérez)
Respecto parámetros de forma En el caso de existir asimetría horizontal , se propone según (Wester-Oliver), lo siguiente: CS = 0 • 0<|CS|<0.5, se acepta la función de distribución de probabilidad como normal, se puede aplicar el método geoestadístico a los datos. 0.5<|CS|<1, es necesario realizar una transformación de datos (normalización) de tipo raíz cuadrada. • |CS|>1, es necesario hacer una transformación de tipo logarítmico (ln o log)
•
Por coeficiente de variación.
Tanto la función de distribución de los datos como la varianza son funciones de la media la cual es altamente sensible a los valores extremos. En consecuencia se debe tener conocimiento de la afectación de estos valores extremos sobre la media, para ello se calcula el coeficiente de variación. En todo caso se debe verificar lo siguiente. Si CV < 100, no hay problema con los valores extremos de los datos Si 100200, se tiene problemas severos con los valores extremos de los datos. Esto es importante, pues en caso de que los valores extremos de los datos afecten a la muestra o a la distribución de los mismos, se deberá analizar si es conveniente eliminarlos en caso que obedezcan a un error en la medición o hacer una transformación de los datos para reducir su influencia en la muestra.
Clase 25Nov
Laboratorios (Resumen) 1.-Distribución normal y log-normal (Ejemplo) 2.- Estudio exploratorio de datos (procedimiento, herramientas de análisis, valores atípicos, etc) 3.- Variograma experimental (cálculo, parámetros, interpretación) Ejemplo (si es que alcanzo) Modelamiento de variogramas + ejemplo 4.- Calculo de Error de Muestras (Intervalos de confianza) 5.- Interpretación de varogramas 6.- Mapas variograficos 7.- Elección de la dirección del calculo variografico (Anisotropía) 8.-Modelamiento de variograma o ajuste del variograma experimental.
K=8 a= 4,17
Marca de clase
frecuencia absoluta
frecuencia absoluta acumulada
frecuencia relativa
frecuencia relativa acumulada
2,0076 6,1776
4,0926
29
29
0,55
0,55
2
6,1776 -10,3476
8,2626
7
36
0,13
0,68
3
10,3476 -14,5176
12,4326
6
42
0,11
0,79
4
14,5176 -18,6876
16,6026
4
46
0,08
0,87
5
18,6876 -22,8576
20,7726
1
47
0,02
0,89
6
22,8576 -27,0276
24,9426
4
51
0,08
0,96
7
27,0276 -31,1976
29,1126
1
52
0,02
0,98
8
31,1976 -35,3676
33,2826
1
53
0,02
1
No
Intervalo
1
35
30
29
25
20
15
10 7 5
6 4
4 1
0
1
1
Resultado de los parámetros Geoestadisticos del A. E D. Parámetro Media Mediana Moda
Datos Datos no Módulo Geostatistical agrupado agrupados analyst de ArcGIS s 9.443 93.776 93.776 4.81 5.869 5.869 4.378 -
Observaciones
Desviación estándar
7.74
8.0421
8.0421
Varianza
6,044
6,4675
6,4675
Coeficiente de Variación
82%
85.8%
85.75%
Curtosis
1.38
1.4709
A la curtosis que calcula ArcGIS se le debe restar 3
Sesgo o asimetría
1.46
1.4773
Necesitamos una trasformación de Normalidad ???? Algunos… -Log-Normal - Raiz Cuadrada
Siempre ???
Repasando lo analizado Se observa la media, la mediana y la moda son diferentes Media = 9.3776 Mediana = 5.869 Moda = 4.378
Diferencia > 1
CS = 1.46, valor mayor que 1, por lo tanto es necesario aplicar una transformación de tipo logarítmico a los datos. • 0<|CS|<0.5, se acepta la función de distribución de probabilidad como normal, se puede aplicar el método geoestadístico a los datos. •0.5<|CS|<1, es necesario realizar una transformación de datos (normalización) de tipo raíz cuadrada. •|CS|>1, es necesario hacer una transformación de tipo logarítmico (ln o log)
V = 85.8 < 100, lo cual indica que no hay problemas con valores extremos. •Si CV < 100, no hay problema con los valores extremos de los datos •Si 100200, se tiene problemas severos con los valores extremos de los datos
Siempre ???
Log-Normal
No
Intervalo Intervalo
Marca de clase
frecuencia absoluta
frecue ncia frecuencia frecuencia relativ absoluta relativa a acumulada acumu lada
1
0,6969
-1,0569
0,88
7
7
0,13
0,13
2
1,0569
-1,4153
1,24
10
17
0,19
0,32
3
1,4153
-1,7737
1,59
10
27
0,19
0,51
4
1,7737
-2,1321
1,95
5
32
0,09
0,6
5
2,1321
-2,4905
2,31
7
39
0,13
0,74
6
2,4905
-2,8489
2,67
6
45
0,11
0,85
7
2,8489
-3,2073
3,03
4
49
0,08
0,92
8
3,2073
-3,5657
3,39
4
53
0,08
1
Concluimos Los datos están dentro de los parámetros para admitir un comportamiento Normal Media = 1.92 Mediana = 1.77 Moda = 1.41 desviación estándar= 0.787 varianza =0.619 Cvariacion = 41% Curtosis=-0.98 sesgo o asimetría =0.34
Mo Me
µ
ASIMETR IA POSITIV A
Softwar e
Geostatistical Analyst explorar
variabilidad de datos examinar tendencias globales
Análisis exploratorio de datos
investigar la autocorrelación y la correlación entre los datos
auto correlación espacial o temporal – dependencia espacial - variograma experimental (analiza la aleatoriedad) Ajuste del variograma (modelo matematico). Estimacion Kriging
Análisis estructural
Las herramientas de análisis en software
ndencias de los datos se ajustan alguna función polinomial
unción Lineal (1er Grado) f(x) = mx + b Función cuadrática (Segundo grado) f(x) = ax2 + bx + c
Función Polinomial (3er grado)
Eliminar Siempre ?
Tendencias Es importante analizar si los datos manifiestan tendencias direccionales que permitan establecer correlaciones en esas direcciones, y formular modelos de comportamiento.
Por que hay tendencia ? Es bueno, malo, no importa?
Para nuestros datos Hidrogeológicos, Existen tendencias direccionales? Esteoeste
NorteSur
Contextualización Donde estamos en el análisis
Sistemáti ca
2.A.E.
Porque la autocorrelation es importante? • Sugiere la presencia de procesos espaciales • Mucho de los análisis estadísticos están basado en el supuesto que los valores de las observaciones en cada unidad de muestreo son independientes unos de otros independientemente de la distancia de separación.
Puntos cercanos Atributos en el espacio pero independientes disimilares en de la distancia atributos
Puntos cercanos en el espacio y similar en atributos
Ref: Alfonso Condal
Isotropía/anisotropía Un medio es denominado isótropo si sus propiedades físicas son idénticas en todas las direcciones. Un sistema será calificado de isótropo si sus propiedades físicas (macroscópicas) son invariantes en relación con una dirección particular, y por lo tanto, si ninguna de ellas posee dependencia direccional. En el caso en que una sola de sus propiedades sea direccional, el sistema cesa de ser isótropo; es anisótropo. Se dirá también que una magnitud física es anisótropa, o isótropa, según que dependa o no de la dirección según la cual se mide. En el sentido primitivo y restringido del término, la isotropía y la anisotropía son propiedades de los cuerpos o conjuntos macroscópicos. En esta acepción general, al ser el tiempo y el espacio magnitudes físicas, y por ello medibles, se habla Fuente: Thérèse Saint-Julien (HYPERGEO) frecuentemente de su isotropía o de su anisotropía.
Anisotropia • Cuando existe alta autocorrelación espacial en una dirección específica mas que en las otras :
• La figura muestra un caso de anisotropía geométrica, el cual es incorporado al modelo variográfico a través de una transformación lineal.
http://zappa.nku.edu/~longa/geomed/modules/geostats_lite/lec/illinois.html
Tolerancia angular
90
135
45
Mapa de Variograma : Es una herramienta que permite determinar las direcciones de anisotropía de la variable en estudio Semivariograma Experimental
La g Modelo Aniso trópico Escala y Estructuras
3
LAG = 20 e Intervalos pequeños = 5
Donde hay
Variogramas • Supuesto estadísticos: Estacionaridad — Media y la varianza no sean función de la localidad muestreada. Estacionaridad de segundo grado (debil) – Varianza es una función de la distancia de separación entre los valores Isotropia— No tendencias direcionales presentes en los datos. Sin embargo siempre se calculan variopgramas direccionales para determinar la tendencia de los datos.
Sin embargo En algunos casos estos no se cumple debido a las tendencias presentes en los datos. En estos casos se sugiere eliminar la tendencia antes del análisis A. R. Condal/ E. Mera/ D. Pech
Anisotropías en el variograma: Generalmente cuando el variograma experimental es calculado en distintas direcciones presenta distintos comportamientos con la variación de la distancia. Anisotropía Geométrica Anisotropía Zonal
Anisotropía Geométrica : Es aquella en la que el variograma en distintas direcciones presenta el mismo sill pero rangos distintos
Menor continuidad espacial en la dirección de menor rango
2,5
2 Variograma
Mayor continuidad espacial en la dirección de mayor rango
3
N-S
1,5
E-O 1
0,5
0 0,0
0,9
2,0
3,0
4,1
5,1
6,2
7,2
Distancia
8,3
9,3 10,4 11,4
3
2,5
Variograma
2
N-S
1,5
E-O 1
0,5
0 0,0
0,9
2,0
3,0
4,1
5,1
6,2
7,2
Distancia
8,3
9,3
10,4 11,4
Anisotropía Zonal : 3,5 3 2,5
Variograma
Es aquella en la que el variograma en distintas direcciones presenta el mismo rango pero diferente sill
2 1,5 1
Presencia de diferentes estructuras
0,5 0 0
0,94 1,99 3,04 4,09 5,14 6,19 7,24 8,29 9,34 10,4 11,4 Distancia
3,5 3
Variograma
2,5 2 1,5 1 0,5 0 0
0,94 1,99 3,04 4,09 5,14 6,19 7,24 8,29 9,34 10,4 11,4 Distancia
El variograma experimental
Es una herramienta que permite analizar el comportamiento espacial de una propiedad o variable sobre una zona dada Ejemplo: Detectar direcciones de anisotropía Zonas de influencia y su extensión (correlación espacial) Variabilidad con la distancia
Variograma Teórico-Definición Continuidad espacial 0,7 0,6
0,4 0,3 0,2 0,1 25
23
21
19
17
15
13
11
Ubicación
0,012 0,01 0,008 0,006 0,004 0,002
Distancia
19
17
15
13
11
9
7
5
3
0 1
Variograma
9
7
5
3
0 1
Variable
0,5
Variograma Teórico-Definición
1
0,12
0,8
0,1
0,6
0,08
Variograma
Variable
Continuidad espacial
0,4 0,2 0 0
5
10
15
20
0,06 0,04 0,02 0
25
0
Ubicación
2
4
6
8
10
Distancia
2
1
1,5
0,8 Variograma
Variable
1 0,5 0 -0,5
1
3
5
7
9
11
13
15
17
19
0,6 0,4 0,2 0
-1
1 Ubicación
2
3
4 Distancia
5
6
7
Variograma Experimental
n
1 2 Z x Z xh ˆ h 2n(h) i 1 γ(h) = Semivarianza h= distancia n(h) = Número total de pares de datos definidos para un distancia definida (lag) Z = valores de la variable para un punto específico
Variograma
1 h E [ Z ( x) Z ( x h)] 2 2
Z x h1
x h1
h1 Detección de características que varían según la dirección y la distancia
Z x
x
h Z x h
xh
Momentos de Una variable regionalizada
V ariogram a
Variograma
Variograma
Distancia
Distancia
1 n 2 ˆ Z x Z xh Variograma (semivariograma) h 2n(h) i 1
El T h e s e m i- v a r io g r a m is semivariograma b a s e dbasado o n m o d e llin en g th e esta q u a r e d ) d if f e r e n c e s de in la( s modelación e z - v a lu e s a s a f u n c t io n lat h diferencias o f t h e d is t a n c e s b de e tw e e n (cuadradas) a ll ovalores f t h e k n o w n zp o in t s . los como una función de la distancia entre los puntos
El variograma experimental - Definido solo a ciertas distancias - Obtener un modelo teórico del variograma experimental Ajustar una función continua (de Giraldo Henao)
En terminos gráficos
Nugget (C0): Es la semivarianza a h = 0 (intercepto en Y). Indica la varianza no explicada debido a efectos de la escala y muestreo Sill (meseta) (C + C0) : La asintota del modelo. Indica la varianza de la variable de estudio Range (Rango) (A) : Distancia a la cual la semivarianza se estabiliza. Indica la extensión de la estructura de los datos. Fuera de este valor los datos vallosdatos ya no presentan autocorrelación.
Para decribir la variables regionalizadas, se calculan los variogramas empíricos y se comparan y ajustan a los modelos teóricos. Son 4 los modelos teóricos comunes: No sill or range
Linear:
γ(d) co bd Exponential:
γ(d) co c[1 exp( d / a )] Spherical:
co c[3d / 2a) (d 3 / 2a 3 )], d a
γ(d)
co c, d a Gaussian:
γ(d) co c[1 exp(d 2 / a 2 )]
Donde: c0 = nugget b = Pendiente de la regresión a = range
A. R. Condal/ E. Mera/ D. Pech
c0+ c = sill
Indica una estructura bien definida
No estructura
Indica que los datos estan estructurados en mas de una escala A. R. Condal/ E. Mera/ D. Pech
Indica que la estructura esta “suavemente”
Comportamiento lineal Indica que para distancias pequeñas, el variograma tiene un comportamiento lineal.
3 2,5 Variograma
Representa variables continuas pero no diferenciables. Así, la propiedad puede cambiar rápidamente de un punto a otro.
3,5
2 1,5 1 0,5 0 Distancia
3,5 3
La variabilidad de la propiedad dependerá de la pendiente de la recta en el origen
2,5 Variograma
Comportamiento lineal
2 1,5 1 0,5 0
0 1 2 3 4 5 6 7 8 9 10 11 Distancia
A mayor pendiente, mayor variabilidad
3 2,5
A menor pendiente, menor variabilidad
Variograma
2 1,5 1 0,5 0 0 1 2 3 4 5 6 7 8 9 10 11 Distancia
Comportamiento Cuadrático
Indica que para distancias pequeñas, el variograma tiene un comportamiento cuadrático.
3 2,5 2 1,5 1 0,5
Distancia
37
34
31
28
25
22
19
16
13
10
7
4
0 1
Variograma
Representa variables sumamente continuas e infinitamente diferenciables. Así, la propiedad NO puede cambiar rápidamente de un punto a otro.
3,5
Comportamiento Híbrido:
8
Variación más suave a distancias cortas
6 Variograma
Variación más fuerte a distancias grandes
7
5 4 3 2
Indica presencia de estructuras actuando a diferentes escalas
1 0 0
1,5
3
4,5
6
7,5
9
10,5 12 13,5 15 16,5 18
Distancia
Comportamiento a grandes distancias :
INDICA LA PRESENCIA DE UNA DERIVA O DRIFT
Variograma
NO TODOS LOS VARIOGRAMAS POSEEN UN RANGO Y UN SILL FINITO
VARIABLE NO ESTACIONARIA Distancia
Abunda nce (% )
Modelos de ajuste variografico Bentos en la costa rocosa de Campeche 100
a)
c)
80 60
b)
40 20 0 0
20 40 60 80 100
Distance (m)
c’) 0.8 0.6 0.4 0.2 0.0 -0.2020406080100 Distance (m)
100 80 60 40 20 0
Brachidontes exustus 1
c) 0.5
1
10
Log Distance (m)
100
0.0d)
La modificación del grano y extensión permite describir la distribución de especies con diferente nivel de precisión La identificación de escalas optimas de observación debe de estar basada en la proporción de la varianza explicada
Brachidontes exustus 3.10 e)
2.33 1.55 = 0.05 m 0.78 Grain Extent = 1 m 0.000.00 0.33 0.67 1.00 3.10 f) 2.33 1.55 = 0.15 m 0.78 Grain Extent = 1 m 0.000.00 0.33 0.67 1.00 3.10 g) 2.33 1.55 = 4.0 m 0.78 Grain Extent = 40.0 m 0.000.00 13.33 26.67 40.00 h) 3.10 2.33 1.55 = 4.0 m 0.78 Grain Extent = 80.0 m 0.000.00 26.67 53.33 80.00
Separation distance (h)
Eje espacial c)
100 80 0 20 60 40 60 40 80 100 20 05 1015 2025 40 20 6 0 8 0 100
T o p o g r a p h y H e t e r o g e n e i t y O r i e n t a t i o n T Teom taplerature
1
0.5
0.0
1
10 100
Log distance (m) A. R. Condal/ E. Mera/ D. Pech Pech et al, in press (ecography)
Practico……
AED O A.ESTRUCTURAL ?? • 3 clúster: Agrupamientos en el espacio ,o cubo de datos • 2 Tencias principales Una cuadratica (roja) y una menos pronunciada que exponencial (azul). 2do y 3er orden. • Los modelos los podemos generar con tendencias o sin aquellas; dependiendo de nuestro interés
AUTOCORRELACION = SEMIVARIOGRAMA EMPIRICO COVARIANZA
ANISOTROPIA DIRECCIONAL
CROSS- COVARIANCE : REPRESENTA PARES DE LOCACIONES ENTRE LOS DATOS
MODELOS DE AJUSTE VARIOGRAFICO
Modelos de Semivarianzas
ESFERICO
EXPONENC IAL
GAUSSIAN O
MODELOS MONOMICOS Indican presencia de NO ESTACIONARIEDAD en alguna dirección
Semana
Fecha
Plan A: Software
Plan B: Sin software
Diciembre
1
2
3
M15
Estudio exploratorio de datos
W16
Análisis variográfico /consultas taller (M.PEREZ)
J17
Estimación de recursos (clase)
V18
Control
M22
Kriging y estimación de recursos
W23
Simulación geoestadística (clase)
J24
Libre USM (calendario)
V25
Feriado
M29
Simulación geoestadística (lab)
Trabajo de lab
W30
Trabajo de lab
/consultas taller (MPEREZ)
J31
Libre USM (calendario)
Enero
4
V1
Feriado
M5
Trabajo de lab
Trabajo de lab
W6
CERTAMEN
J7
Trabajo de lab
Trabajo de lab
V8
Entrega informes (dos talleres)
3.ESTIMACIÓN
Kriging
El problema general de las predicciones Existe siempre un interes en predecir el valor Z en un punto X, Y (Yx,y) dado los valores de Zi, en donde i representa un punto conocido. Pero…. 1. No se tiene información 2. Se conoce información en puntos ? cercanos
A. R. Condal/ E. Mera/ D. Pech
Kriging Los valores no conocidos son calculados empleando los valores circundantes de los puntos de referencia. Los valores circundantes son ponderados antes de predecir el valor del punto no muestreado La ponderación esta basada en la distancia existente entre los puntos de referencia, la el punto que se quiere predecir y el arreglo (estructura) espacial de los puntos de referencia
Kriging esta basado en la téoría de las variables regionalizadas y asume que la variación espacial es estadísticamente homogenea a través de toda la extensión de interes. Esto es que el mismo patrón de variación esta presente en todas los puntos.
Kriging
Kriging produce el mejor estimador lineal (sin tendencia) de los puntos no muestreados siempre y cuando la semivarianza de los datos y el modelo hayan sido previamente modelados.
Tipos de Kringing
Kriging Ordinario Kriging Universal Kriging Simple Kriging residual __________ Co-Kriging Geo-Multivariada _____ Simulation Multipoint. Geo - No Lineal
Kriging • Kriging ordinario: empleado cuando no existen direcciones específicas en las tendencias de los datos. • Kriging universal. Considera direccionalidad de los datos (en sistemas de información geográfica la dereccionalidad es modelada por una constante linear, de segundo o de tercer orden). • kriging puntual : Produces valores para puntos específicos no muestreados. • Kriging en bloques: Produce valores produces para areas. Los valores estimados tienen varianza pequeña debido a que son derivados del promedio de un bloque de puntos de referencia. • Co-kriging: Emplea 2 o mas variables para estimar valores no conocidos en uno de ellos (e.g: composición del suelo y contenido de agua del suelo). A. R. Condal/ E. Mera/ D. Pech
Se pretende estimar el valor del punto 0(65E, 137N), basados en la información de los puntos circundantes (7). La tabla indica las coordenadas (x,y) de los 7 puntos de referencia y la distancia existente entre estos (v) y el punto 0 (punto a estimar). A. R. Condal/ E. Mera/ D. Pech
Variogram model
Covariance function
Parameters: C0 = 0, a = 10, C1 = 10 A. R. Condal/ E. Mera/ D. Pech
To solve for the weights, we multiply both sides by C-1, the inverse of the left-hand side covariance matrix:
A. R. Condal/ E. Mera/ D. Pech
Kriging matrices Matrix de distancia
Covariances se calculan en base a la distancia entre todos los puntos de referencia y el punto de interes :
C(h) = 10 e –0.3|h|
Kriging matrices
A. R. Condal/ E. Mera/ D. Pech
Results Kriging weights:
Estimated value for point 0:
A. R. Condal/ E. Mera/ D. Pech
Tareas de estudio: 1.- Realizar en GS+ y/o Modulo Geoestadistica ArcGIS, el analisis exploratorio de datos, estructural, ajuste varigrafico, estimación Kriging y obtención del mapa modelado. 2.- Realizar en GS+ y/o Modulo Geoestadistica ArcGIS , las tres etapas de análisis de un proceso geoestadistico para los datos entregados por grupos. Fecha de revisión y consultas taller modelamiento de señales WIFI: Miércoles 16. 3.- Estudiar el calculo de estimación Kriging Ordinario, de las ultimas presentaciones de esta presentación.