miércoles, 3 de febrero de 2016

Gráficos de dispersión: Buscando Correlaciones entre los datos

Gráficos de dispersión: visualización de relaciones de datos y valores atípicos


Si ha visto un gráfico con muchos puntos repartidos, es probable que esté viendo un diagrama de dispersión. Los diagramas de dispersión son útiles cuando desea examinar la relación entre dos medidas o valores cuantitativos. ¿Existe una correlación entre ellos y, en caso afirmativo, en qué medida?

Por ejemplo, ¿la altura de una persona se correlaciona con su peso? ¿El tamaño de una casa determina su precio? ¿La temperatura exterior afecta la venta de helados? Todas estas preguntas podrían analizarse utilizando diagramas de dispersión.



En el diagrama de dispersión anterior que compara los gastos de marketing con las ventas, puede ver una correlación positiva entre las dos medidas: en general, cuanto más se gasta en marketing, más se pueden esperar ventas.
Es posible que haya escuchado la frase "correlación no significa causalidad". Cuando encuentra una correlación entre dos puntos de datos, no puede suponer con certeza que un evento causa el otro sin datos y observación adicionales. La correlación entre variables significa que existe una relación, pero la causalidad indica que una realmente causa un cambio en la otra.

Valores atípicos (Outliers)


Incluso cuando se muestra una correlación en un diagrama de dispersión, a veces puede haber valores que difieren de la tendencia, conocidos como valores atípicos.

Los valores atípicos (Outliers) pueden ser interesantes y deben investigarse para que sepa cómo interpretarlos. ¿Son raras excepciones que se pueden ignorar? ¿O una indicación de algo para examinar más de cerca? ¿O tal vez son simplemente errores en la grabación o transcripción? Para estar seguro, examine los datos subyacentes para hacer su determinación.



En el ejemplo anterior, puede ver una correlación positiva general. A medida que aumenta el gasto en marketing, generalmente hay un aumento en las ventas asociadas con él.

Sin embargo, observe el único caso atípico presente, donde el gasto significativo en marketing tuvo un impacto mucho menor en las ventas de lo que cabría esperar. ¿Por qué? En este ejemplo, la ubicación representada por la marca es en una ciudad universitaria. ¿Es posible que el marketing no fuera efectivo para el grupo demográfico estudiantil? Quizás.

Correlación Positiva:


Correlación Negativa:



Datos No Relacionados:




Preguntas que conducen a ver correlaciones


Al decidir si necesita un diagrama de dispersión, considere las siguientes preguntas:

¿Le interesará al usuario si una variable aumenta o disminuye con los cambios en otra variable?
¿El usuario estará interesado en determinar si un cambio en una variable tiene un efecto en otra variable y cuál es ese efecto?
¿Necesitará el usuario saber qué tan cerca una variable sigue los cambios a otra variable?


* Tomado de Tableau Analytics

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.