viernes, 15 de junio de 2012

E-Clase de Estadística

Continuamos en la Unidad 3 del programa de Matemática y Estadística, esta unidad se denomina “Estadística descriptiva bivariable”. Como hemos observado, para intentar analizar, explicar y evaluar un fenómeno o proceso geográfico es necesario poder conocer las variables que participan del mismo y además cómo se relacionan entre ellas.
Como ciencia de síntesis, la geografía analiza las conexiones o relaciones entre los fenómenos que se expresan en la superficie terrestre. Estudia las relaciones existentes entre los procesos sociales y naturales, y las transformaciones espaciales que se originan.
De este modo, desde la estadística abordaremos el concepto de correlación. Nos enfocaremos en las relaciones de dos variables y su representación gráfica para analizar su asociación.
Actualmente, existen en el mundo un cúmulo grande de información, día a día se crean nuevos datos espaciales. A través de la estadística podemos analizar e interpretar gran cantidad de datos de un modo eficaz y atractivo.
Te proponemos en esta clase poder reconocer las relaciones entre variables geográficas, expresarlas de modo gráfico y poder interpretarlas.
A continuación podrás conocer a Hans Rosling, un investigador que trabaja con datos espaciales y nos muestra una dimensión interesante de la estadística para analizar la salud de los países del mundo.


1) Lectura de texto sobre Correlación. 

Para iniciarnos en el tema de las relaciones entre variables te proponemos la lectura de las páginas 121-124 del capítulo 8 “Correlación” del libro Introducción a la Estadística para las ciencias sociales. Peña, D. y Romo, J.; 1997, Editorial Mc Graw Hill.
Allí nos encontraremos con la definición del Diagrama de Dispersión, su construcción a partir de las características de las variables. Observá cuándo una variable puede considerarse resultado o efecto de otra y cómo se expresa de modo gráfico en el diagrama.
El texto está acompañado con ejemplos de diagramas de dispersión que muestran diferentes tipos de asociación entre las variables. ¿Cuántos tipos de asociación se pueden observar? 


2) Elementos de un Diagrama de Dispersión.

A continuación te presentaremos los elementos necesarios para constuir un Diagrama de Dispersión.Para comenzar, primero debemos identificar la estructura tripartita de los datos (unidad de análisis, variables, valor de la variable), y luego su posible asociación.
La siguiente tabla nos muestra los datos de población y hogares con líneas de teléfono de departamentos de la provincia de Mendoza para el año 2010. En nuestro caso las unidades de análisis son cada departamento, las variables analizadas son dos variables cuantitativas cuyos valores son el número de habitantes y el número de hogares con línea telefónica respectivamente.


Utilizando la escala de valores de los ejes de las variables (por lo general la variable independiente se representa en el eje horizontal), se localiza los valores de cada variable para cada unidad de análisis. Así, el departamento CAPITAL, tiene 115041 habitantes y 26524 hogares con línea de teléfono. Si trazamos una línea perpendicular al eje en el valor de cada variable podemos localizar el punto que representa al departamento de CAPITAL en el lugar donde se cortar las líneas, tal como se puede observar en la animación siguiente.



Finalmente, una tercera variable está representada en el Diagrama de Dispersión. Si observamos la carta de la provincia y la tabla de datos, notaremos que los departamentos están agrupados por regiones y cada región está identificada con un color. Los puntos (departamentos) del diagrama poseen un color, de este modo se puede reconocer gráficamente a la región que pertenecen e identificar algún patrón común en su comportamiento con respecto a las variables analizadas.
  



Según los tipos de asociación que vimos anteriormente te animás a identificar cuál es el correspondiente a la relación de las variables población y hogares con línea de teléfono.

¿Existe alguna región de la provincia en la que sus departamentos posean un comportamiento relativamente similar? ¿Cuál es?

¿Cuál es la ventaja de comparar individualmente las unidades de análisis? Por ejemplo, si nos enfocamos en el comportamiento de los departamentos CAPITAL y SAN MARTÍN, ¿qué diferencias podrías reconocer? ¿A qué se podría deber?



3) Creación de un diagrama de dispersión en Excel y su línea de tendencia. 


Ahora vamos a crear un diagrama de dispersión utilizando la herramienta Excel. Seguramente lo conocerás, este es un programa de planilla u hoja decálculos, que permite crear tablas datos, realizar cálculos y graficar sus resultados.

Para ello podrás descargar un archivo de Excel con los datos a graficar.

Posteriormente te proponemos observar el siguiente video que muestra cómo realizar el diagrama de dispersión y su línea de tendencia.

Cualquier duda, te sugerimos comunicarte con el equipo de cátedra por medio del correo electrónico.





A partir del Diagrama de Dispersión creado con estos datos:
¿Qué tipo de asociación entre las variables se puede observar? 
¿Qué departamentos tienen la situación más complicada? 
¿Cuáles estarían en la mejor situación? ¿Por qué?



4) Definición de la relación entre variables. Algunas claves para la interpretación. 




Un gráfico de dispersión como el mostrado anteriormente es la forma más sencilla de comprobar la relación entre las dos variables. En él hemos graficado también la tendencia de la distribución, plasmada como una recta que trata de ajustarse a los puntos del gráfico. 
La relación entre dos variables cuantitativas queda representada mediante la línea de mejor ajuste, que es la que esquematiza las condiciones de la nube de puntos y de la relación. Los componentes elementales de una línea de ajuste y por extensión de una relación entre dos variables son:

a) La fuerza.
b) El sentido.
c) La Forma.

La fuerza mide el grado en que la línea representa a la nube de puntos. Si la nube es estrecha y alargada una línea recta representará adecuadamente a la nube de puntos y a la relación y por tanto ésta será fuerte. Si por el contrario, la nube de puntos tiene una tendencia elíptica o circular, una línea recta que trate de representar a la misma será consecuencia de una relación débil y poco representativa, con amplios residuos.


El sentido de la relación se refiere a cómo varían los valores de B con respecto a A. Si al crecer los valores de la variable A lo hacen los de B, será una relación positiva (a valores bajos de A le corresponden valores bajos de B). Si al aumentar A, disminuye B, será una relación negativa (a valores bajos de A le corresponden valores altos de B y viceversa).





La forma establece el tipo de línea a emplear para definir el mejor ajuste. Se pueden emplear tres tipos de líneas: una línea recta, una curva monotónica y una curva no monotónica.

1) En el caso de usar una recta, se admite que existe una proporción entre la diferencia entre dos valores A y la diferencia entre dos valores de B. A ese factor de ajuste entre ambas series se le llama pendiente de la recta, y se asume que es constante a lo largo de toda la recta de ajuste.

2) En el caso de usar una curva monotónica, ese factor de proporción entre las dos variables no es constante a lo largo de toda la recta, y por lo tanto la pendiente de la misma es variable en su recorrido. Se dice entonces que la línea de ajuste es no lineal monotónica, puesto que la línea se ha convertido en curva. Sin embargo, lo que no varía es el sentido de la relación: si la relación es positiva lo será a lo largo de todo el recorrido de la curva y si es negativa, será negativa en toda la curva.


3) Por último, en el caso de usar una curva no monotónica varía tanto la pendiente de la curva como el sentido de la relación, que en unos sectores puede ser positiva (ascendente) y en otros negativa (descendente). 



Con estos elementos ya podemos no solo construir un diagrama de dispersión sino fundamentalmente poder interpretar la relación entre las dos variables representadas gráficamente.

A continuación te proponemos que busques en internet un diagrama de dispersión cuyas variables sean geográficas, y finalmente realices su correspondiente interpretación teniendo en cuenta los elementos anteriormente presentados.
Para ello deberás enviar el link del sitio donde está publicado el diagrama de dispersión a la dirección de correo electrónico de la cátedra, y adjuntarle tu interpretación del mismo.


5) Diagrama de dispersión interactivo. Hacia la animación de los datos. 


En esta última etapa de la clase te proponemos explorar parte del futuro de los gráficos estadísticos, en este caso el diagrama de dispersión interactivo. A continuación podés leer algunas características para configurarlo y utilizar sus herramientas. 



¿Qué posibilidades brinda la interacción y la animación en un diagrama de dispersión? ¿Cómo lo utilizarías en la geografía? Te animás a dar un ejemplo con algunas variables geográficas.



Fuente: Para el pocentaje de población con Necesidades Básicas Insatisfecha del año 2010 se utilizó los datos de la UNCuyo (APP-SDI) elaborado según datos de DEIE. Encuesta de Condiciones de Vida 2009. 
 
Para finalizar, nos volvemos a encontrar con Hans Rosling. En este video nos cuenta cómo a través de un gráfico de dispersión animado se pueden estudiar algunos fenómenos geográficos. 


Hemos llegado al final de esta clase, esperamos que el contenido haya sido claro y te haya gustado. En las siguientes clases continuaremos profundizando las relaciones en los fenómenos geográficos y cómo estas relaciones se pueden analizar desde la estadística. 
 

No hay comentarios:

Publicar un comentario