Curso Geoda. E2 Aproximación a exploración de datos: histograma y boxplot.

Hola a todos, bienvenidos a su canal, bienvenidos a sigalt y bienvenidos al episodio 2 del curso de exploración de datos mediante el software GeoDa. Ya en el episodio anterior les mostré como descargar e instalar el programa y un recorrido sobre su interfaz, incluso hasta abrimos un archivo shapefile, si te lo perdiste no te preocupes da clic aquí y te llevara al post anterior. Así que comenzamos.


En este episodio volveremos a cargar el shapefile de ANP y veremos un par de herramientas para realizar una primera aproximación a la exploración de datos. Para ello utilizaremos el histograma y utilizaremos un diagrama de caja o boxplot para analizar algunas de las variables contenidas en el conjunto de datos con el cual vamos a trabajar que es la superficie terrestre de los polígonos de las ANP de México hasta 2022.


Pues vamos a cargar los datos, dando clic en el icono de la carpeta y ahora vamos a buscar en finder la carpeta donde esta las ANP ya encontrada, arrastramos el archivo shapefile, y como vimos en el video anterior se carga las ANP con una simbologia única y se activa todos los iconos que nos ofrece Geoda.


Lo primero que podemos hacer es acceder a la tabla de atributos del conjunto de datos con el que estamos trabajando y podemos ver como existen diferentes columnas que responden a diferentes variables de este conjunto de datos y que son las variables que vamos a analizar a continuación con el histograma y el boxplot.


Histograma

Empezaremos por crear un histograma de una de estas variables, hacemos un clic sobre el icono de histograma, se abre una ventana que nos muestra las diferentes variables numéricas que podemos analizar con el histograma y que están almacenadas lógicamente en la tabla de atributos de la capa que hemos cargado. Seleccionamos por ejemplo la variable superficie terrestre, al realizar un clic sobre la variable superficie terrestre que nos quede resaltada en color azul y un clic en OK automáticamente se muestra un histograma de barras, en el cual en el eje de las x esta la superficie y en el eje de las Y esta la frecuencia.


Una característica de GeoDa es que cuando nos situamos encima en cualquiera de las barras en la parte baja de la ventana de histograma se nos muestra información asociada a cada una de las entidades que se encuentran dentro de esta barra, por ejemplo en la barra dos nos dice el intervalo, el numero de observaciones, el porcentaje que representa sobre el total y la desviación estándar respecto a la media de la superficie terrestre.



Otra opción para ver a que entidades geográficas se corresponde cada una de estas barras de superficie es realizar un clic sobre cada una de las barras del histograma y lo que podemos ver es como al realizar un clic en este caso la primera barra, se nos activa algunos poligonos en el mapa, cuando realizamos un clic de esta segunda barra se selecciona otros polígonos, y podemos hacerlo clic a clic, o bien podemos hacer un solo clic y arrastrar para seleccionar varias barras del histograma a la vez y ver con que entidades geográficas se corresponde .


De este modo con un simple histograma y seleccionando algunas de las barras del histograma ya podemos ver o podemos identificar ciertos patrones espaciales de distribución en este caso de superficie terrestre de las ANP.


Ahora, haciendo clic con el botón derecho sobre una parte del histograma podemos modificar algunos patrones, por ejemplo el numero de intervalos que por default se ponen 7, pero podemos seleccionar 10 intervalos y realizar nuevas selecciones para ver como se distribuyen las superficies de las ANP, ademas podemos guardar la selección para ocuparla como acceso directo si constantemente estaremos ocupando esta selección, o también podemos copiar esta imagen o guardarla para incorporarla dentro de un informe, un estudio un analisis etc. Este es el primer modo de explorar los datos de manera sencilla a través de un histograma y empezar a vislumbrar posibles patrones de distribución de la variables que estén analizando.


Boxplot

La segunda herramienta de exploración de datos que dispone GeoDa y vamos a ver en este video es la herramienta de boxplot, diagrama de caja o diagrama de caja y bigotes. El proceso es similar cuando realizamos un clic sobre el icono de la herramienta nos aparece una ventana con las diferentes variables o columnas de la tabla de atributos que podemos analizar y si dejamos seleccionado superficie terrestre y después clic en ok, automáticamente nos aparece esta nueva ventana con un diagrama de caja y vemos como se distribuyen los datos en función del valor de la variable relativa a la superficie terrestre. Una parte interesante es que tenemos una descripción numérica y estadística de esta variable en la parte baja del diagrama de caja y podemos ver el valor mínimo, máximo etc.




Conclusión

Así pues mediante histogramas y diagramas de caja podemos explorar los datos, diferentes variables, podemos tener diferentes variables representadas en varios diagramas de caja y en varios histogramas, ademas de tener el mapa en el cual vemos la ubicación espacial o la localización geográfica de los polígonos y podemos hacer unas primeras exploraciones seleccionando elementos bien en el histograma o diagramas de caja y ver que estructura o patrón espacial estarían configurando. Pues ahí lo tienes.


Videotutorial: https://www.youtube.com/watch?v=79I9zgYOGU8&t=36s

Featured Posts
Recent Posts