Curso Geoda. E8 Matrices de peso por distancia.
En una muestra de datos para modelar las relaciones se puede realizar por medio de su distancia o de un numero concreto de posible vecinos. Para la actividad que de hoy ocuparemos datos de estaciones climatológicas de la ciudad de Madrid, España
Empezaremos por cargar nuestros datos, posteriormente haremos un clic sobre el icono en forma de W, que es el gestor de pesos, ya abierto este, lo que haremos a continuación será dar un clic en crear para generar una nueva matriz de pesos, en la ventana que se abre, seleccionamos la variable que funcionará como ID, identificador único de cada una de las observaciones; para ello podemos seleccionar una columna que contenga ese identificador o podríamos seleccionar una variable expresa para ese conjunto de datos.
Seleccionaremos la columna ID que es el identificador de la capa y automáticamente se activan un conjunto de acciones dentro de esta ventana.
Como podemos ver hay dos opciones para determinar las condiciones de vecindad ahora es el turno de seleccionar el concepto de distancia (Distance Weigth).
En el apartado método tenemos:
Banda de distancia, un deslizador que nos permite modificar el valor de distancia y podemos activar o mantener desactivada el inverso de la distancia. En cualquier caso el valor que vemos en el apartado de la distancia los datos están dados en pies, eso debemos de tenerlo en cuenta para nuestros analisis recordemos que un metro es igual a 3.28 pies.
GeoDa computa este valor calculando la distancia existente entre todos los puntos de la muestra, si tenemos valores muy alejados en la muestra, este valor será muy alto. Cabe destacar que el objetivo de GeoDa es que no existe ninguna observación sin ningún vecino. Ten en cuenta esto por si te aparece un mensaje a la hora de crear la matriz de peso por distancia.
Demos clic en crear y guardamos nuestro archivo y automáticamente el programa genera un matriz de pesos de distancia basado en la distancia que definimos.
Ya cargado el archivo de la matriz de pesos, al igual que el video de matrices de continuidad nos muestra un resumen de estadísticas de nuestro fichero.
Ahora demos clic en el mapa de continuidad para observar en el mapa cuales vecinos esta tomando en cuenta para cada entidad según nos vamos desplazando, la observación se ve en contorno rojo.
Si cargamos el gráfico de conectividad se mostraran todas nuestras observaciones a través de unos vectores, si realizamos un zoom veremos con mas detalle las conexiones entre las observaciones.
Ahora haremos nuevamente un fichero de pesos, pero ahora usaremos un valor de distancia más pequeño, guardamos este fichero y cargamos el mapa de conectividad y observamos como se ha reducido el numero de vecinos.
Si miramos el gráfico de conectividad podemos ver como el numero de vecinos se ha reducido, y esto lo podemos ver tambien en el resumen del fichero de pesos
Otra vez haremos un nuevo archivo de pesos, y ahora seleccionamos K-Nearest Neighbors o K Vecinos, en este apartado lo que tenemos que decidir es el número de vecinos que queramos que tenga cada una de las observaciones de la muestra. Así podemos definir el número de vecinos que nos interese, en este caso dejamos el valor de vecinos 5 y damos en crear y guardamos el archivo.
Nos da nuestro resumen del archivo y aquí vemos que el mínimo de vecinos por muestra es 4 y el máximo es 4. Si activamos el mapa de conectividad y nos desplazamos por el mapa viendo cada una de las observaciones, lo que veremos es que las observaciones y vecinos serán lo que hemos pedido que realice el programa, de igual manera si abrimos el mapa de conectividad queda mas claro estas relaciones de vecindad.
Utilizando este método, el de K vecinos conseguimos observaciones que se encuentran muy lejos del resto de observaciones de la muestra tengan de igual modo el número de vecinos que hayamos indicado. En caso contrario nos veríamos obligados para realizar diferentes análisis eliminar las observaciones mas alejados.
Tutorial en video:
Comments