Manipulación en los gráficos de datos

Manipulación de los gráficos de datos

Si en lugar de leerlo prefieres escucharlo, puedes hacerlo aquí:

Hay una cita atribuida a Winston Churchill, aunque no verificada, que dice «Nunca confío en las estadísticas a menos que las haya manipulado yo mismo». Aunque no hay evidencia sólida de que realmente haya dicho esta frase, sí nos sirve para ilustrar la idea de que las estadísticas y los gráficos pueden ser manipulados para apoyar un argumento en particular.

Vivimos en la era de la información y los datos se han convertido en una herramienta muy poderosa. Pueden ayudarnos a entender el mundo, tomar decisiones informadas y avanzar en nuestro conocimiento en una amplia gama de campos.

Los gráficos son una herramienta poderosa para mostrar estos datos de una forma fácil de entender. Sin embargo, también pueden ser manipulados para engañar o tergiversar la realidad.

La manipulación de los gráficos, el uso de estadísticas engañosas, la descontextualización y la correlación errónea con la causalidad son sólo algunas de las formas en que se puede desinformar con datos.

A veces esto se hace a propósito, para promover una agenda particular; otras veces es el resultado de una falta de habilidades de alfabetización en datos.

Vamos a explorar las formas más habituales de manipulación de las gráficas, con algunos ejemplos para que se entiendan más fácilmente.

Cambio en la escala de los ejes

Una de las formas más comunes de manipulación en los gráficos es el cambio en la escala de los ejes. Si un gráfico no comienza en cero, o si los intervalos en el eje ‘y’ no son uniformes, puede dar la impresión de que las diferencias son mayores de lo que realmente son. Esto puede usarse para exagerar pequeñas diferencias o minimizar grandes disparidades.

Por ejemplo, si un gráfico que muestra los ingresos de una empresa no comienza en cero, puede dar la impresión de que los ingresos han aumentado drásticamente, cuando en realidad el cambio puede haber sido mínimo.

Al examinar una gráfica, presta especial atención a los valores en el eje ‘y’, es decir, el eje vertical. Ten en cuenta que, en ocasiones, los valores de la derecha y la izquierda pueden diferir, por lo que es crucial observar ambos para entender adecuadamente lo que se te está presentando. Si estos valores no aparecen en absoluto, sería conveniente descartar la gráfica directamente, ya que su interpretación podría ser engañosa o inexacta.

Manipulación de los colores y las formas

Otra técnica de manipulación es el uso de colores y formas. Los colores brillantes o las formas más grandes pueden llamar la atención sobre ciertas partes del gráfico, distorsionando la percepción del espectador. Los colores también pueden usarse para provocar ciertas emociones o asociaciones que pueden influir en cómo se interpretan los datos.

Por ejemplo, si un gráfico de barras utiliza barras más anchas para una categoría en particular, puede dar la impresión de que esa categoría es más significativa de lo que realmente es.

Otro ejemplo. Si ponemos determinados valores de una gráfica en rojo ya estamos sesgando la información, ya que casi todo el mundo interpreta este color como peligro o alerta. Esto lo podéis observar en los mapas que representan la temperatura; si los comparáis con mapas de hace unos años veréis que lo que antes se pintaba de un color más pagado hoy se rellena con colores fuertes, por ejemplo, a una misma temperatura, pongamos 30 grados en Madrid, antes se pintaba de un color anaranjado y ahora se muestra como rojo oscuro.

Uso engañoso de gráficos 3D

Los gráficos 3D son otra herramienta que puede ser manipulada. Si bien pueden parecer impresionantes, también pueden distorsionar las proporciones y hacer que las diferencias parezcan mayores o menores de lo que son en realidad.

Por ejemplo, un gráfico de barras 3D puede exagerar las diferencias entre las barras, haciendo que una pequeña diferencia parezca mucho mayor de lo que es realmente.

A menos que haya una razón específica para usar tres dimensiones, un gráfico 2D es a menudo una forma más precisa de representar los datos.

Omisión de datos relevantes

La omisión de datos relevantes es una forma sutil pero poderosa de manipulación. Si un gráfico no incluye todos los datos pertinentes, puede dar una visión sesgada de la realidad. Siempre es importante preguntarse qué datos podrían estar faltando y cómo su inclusión podría cambiar la interpretación de los datos.

Por ejemplo, cuando escuchas las noticias o lees los informes sobre la tasa de empleo en un país, a menudo se discute en términos de la cantidad de personas que están trabajando. Pero ¿alguna vez te has preguntado qué datos se están omitiendo en estas estadísticas? Uno de los más importantes, y a menudo pasado por alto, es el ‘número de horas trabajadas en empresa privada’.

El número de horas trabajadas en empresa privada puede dar una imagen más clara de la realidad económica de una región o un país, ya que puede ayudar a diferenciar entre el empleo a tiempo completo, a tiempo parcial, o el subempleo; a diferenciar el empleo público del empleo en empresa privada; a medir la productividad del país; y en general, al estado real de la economía y los trabajadores.

Limitación de las series temporales

En muchas ocasiones, los gráficos que muestran tendencias a lo largo del tiempo pueden ser manipulados simplemente seleccionando un rango de tiempo limitado o conveniente. Esto puede dar la impresión de una tendencia ascendente o descendente que no existiría si se considerase un rango de tiempo más amplio.

Un caso recurrente que ilustra esta manipulación es la inflación. Frecuentemente, políticos y medios de comunicación se limitan a discutir su valor comparándolo únicamente con el año anterior, sin tomar en consideración que la inflación tiene un efecto acumulativo año tras año. Por lo tanto, para tener una visión más realista de su impacto, sería mucho más apropiado exhibir una serie temporal más extensa.

Ahora ya sabes que cuando te muestren gráficos de series temporales, siempre debes analizar los datos anteriores y posteriores al intervalo que te presentan, especialmente cuando sus efectos sean acumulativos.

Uso de datos promedio sin indicar la variabilidad

Una forma común de manipulación de gráficos es utilizar datos promedio sin indicar la variabilidad.

Por ejemplo, si se representa el salario medio de un grupo de personas, pero no se indica la desviación estándar, se puede dar la impresión de que todos ganan una cantidad similar, cuando en realidad puede haber una gran disparidad entre los salarios más altos y los más bajos.

El ‘promedio’ o ‘media aritmética’ es uno de los términos estadísticos más utilizados y a la vez peor entendidos, y por eso son una de las bases más frecuentes para la manipulación.

Más adelante escribiré otro post sobre los términos estadísticos más habituales, pero de momento quédate con esta idea, siempre que alguien te hable de valores promedio pídele su desviación estándar (ya veremos qué es esto). Si no dan la información o, lo que es muy habitual, no saben ni de qué estás hablando, descarta ese dato.

Gráficos de tarta mal proporcionados

Los diagramas circulares, también llamados gráficos de tarta o pastel, también pueden ser manipulados. Si las secciones del gráfico de tarta no se dibujan proporcionalmente a los porcentajes que representan, puede dar lugar a una visualización incorrecta de los datos.

Por ejemplo, si una empresa quiere minimizar la apariencia de su gasto en un área en particular, puede hacer que esa sección del gráfico de tarta parezca más pequeña de lo que debería ser.

Comparación de datos incomparables

A veces, los gráficos pueden comparar datos que realmente no son comparables.

Por ejemplo, un gráfico podría comparar la cantidad de dinero gastado en diferentes departamentos de una empresa, pero si algunos departamentos tienen más empleados o más recursos que otros, esta comparación puede ser engañosa.

Uso de correlaciones para implicar causalidad

Otra forma común de manipulación gráfica es usar correlaciones para implicar una relación causal.

Por ejemplo, un gráfico podría mostrar que las ventas de helado y las tasas de ahogamiento aumentan al mismo tiempo y sugerir que comer helado causa ahogamientos. En realidad, ambos están correlacionados con una tercera variable: el periodo estival.

Es muy frecuente confundir causalidad con casualidad, y a veces es muy complejo llegar a descubrir si dos o más datos que, aparentemente, están relacionados, tienen una causa común o un efecto entre ellos.

Un ejemplo muy claro lo tenemos en lo siguiente: hay un aumento registrado de la temperatura en múltiples estaciones meteorológica (dato); por otro lado, hay un aumento registrado de la concentración de CO2 en la atmósfera (dato), pero… establecer una relación causal entre ambas es algo mucho más complicado, ya que no conocemos todos los factores que afectan al clima.

Manipulación de las imágenes que acompañan a los gráficos

Incluso las imágenes que acompañan a los gráficos pueden elementos de manipulación.

Por ejemplo, si se utiliza una imagen alarmante junto a un gráfico sobre el cambio climático, puede aumentar la sensación de urgencia o peligro, incluso si los datos en sí mismos no son tan dramáticos.

Conclusión

Recuerda, los gráficos son una herramienta, y como todas las herramientas, pueden ser utilizados para bien o para mal. La próxima vez que veas un gráfico, tómate un momento para analizarlo críticamente. Pregúntate si se está representando la información de manera justa y precisa, y qué podría estar faltando.