Cómo reportar datos de investigación usando diagramas de caja y gráficos de barras

Los gráficos de barra y los diagramas de caja se utilizan a menudo para representar visualmente los datos de investigación. Por lo tanto, es importante entender la diferencia entre los dos. El uso del diagrama de caja frente al  gráfico de barras depende de la naturaleza de los datos y de la interpretación que un investigador quisiera transmitir.

Los diagramas de caja y cómo leerlos

El diagrama de caja se utiliza para trazar la distribución de un conjunto de datos. Los diagramas de caja también se conocen como diagramas de distribución de datos. Estos gráficos codifican cinco características de distribución de datos al mostrarle al lector su posición y longitud. El cuadro abarca desde Q1 (el primer cuartil) hasta Q3 (el tercer cuartil) de la distribución y el rango representa el IQR (rango intercuartil). La mediana está indicada por una línea a través del cuadro. Los “bigotes” en los diagramas de caja se extienden desde Q1 y Q3 hasta los puntos de datos más extremos. A su vez, cada uno de estos valores extremos está representado por una marca. Alternativamente, los valores máximo y mínimo pueden usarse como puntos finales para los “bigotes”.

La lectura de diagramas de caja no es tan compleja como puede parecer. La mediana, representada por una línea que pasa por el cuadro, es la mitad del conjunto de datos. Significa que el 50% de los datos es mayor que la mediana. Los “bigotes” superiores representan los valores superiores a la mediana. Los valores atípicos son puntos arriba del “bigote” superior. Una interpretación similar se aplica a los “bigotes” inferiores y los diagramas de caja de valores atípicos también pueden representar los sesgos en el conjunto de datos. La posición de la mediana en el cuadro muestra la cantidad de datos que se encuentran por encima o por debajo.

Créditos de la imagen: Nathan Yau de Datos que fluyen

Gráficos de barras y cómo leerlos

Los gráficos de barras están diseñados para representar variables categóricas y son adecuados para los conteos. Los gráficos de barras muestran y comparan la frecuencia, el número u otras medidas (por ejemplo, la media) para diferentes categorías de datos. Sin embargo, los datos continuos de las investigaciones de laboratorio, estudios en humanos y estudios en animales a menudo se representan mediante gráficos de barras. Los gráficos de barras son gráficos comúnmente utilizados porque son fáciles de interpretar y de crear. Son útiles para mostrar categorías nominales u ordinales. Las categorías ordinales son datos que se clasifican (por ejemplo, de muy buena a muy mala), mientras que los datos nominales representan datos cualitativos o descriptivos (por ejemplo, país de nacimiento, materia estudiada en la universidad). Existen diferentes tipos de gráficos de barras, tales como gráficos de barras horizontales, gráficos de barras agrupadas y gráficos de barras apiladas. Los investigadores deben crear sus gráficos observando algunas reglas para representar sus ilustraciones de una manera clara y efectiva.

La interpretación de los gráficos de barras comienza con la observación de la altura de la barra contra el valor correspondiente en el eje y. Las diferencias en las alturas de las barras se pueden determinar por referencia al eje y. El segundo paso es comparar las agrupaciones de las barras. Algunos gráficos de barras pueden tener barras agrupadas en categorías. En este caso, compare las barras dentro de los grupos para comprender cómo se compara cada conjunto de datos dentro de una subcategoría con otros conjuntos de datos. Además, también puede verificar el rango restando el valor más bajo (indicado por la barra más corta) del valor más alto (indicado por la barra más larga).

¿Cuál debería usar?

¿Qué tipo de datos representará? ¿Cómo quiere representar sus datos? Es necesario responder a estas preguntas antes de elegir entre los dos.

Algunos autores argumentan que los gráficos de barras no deben usarse, mientras que otros afirman que deben surgir nuevos formatos para representar datos. Los gráficos de barras agrupados son útiles para mostrar los presupuestos de dos hogares, por ejemplo. Un uso común de los gráficos de barras es mostrar la proporción de un valor con respecto a otro.

Por otro lado, los diagramas de caja son útiles para trazar varios conjuntos de datos de fuentes independientes. Un ejemplo incluye puntajes de prueba entre diferentes universidades, cambios en los datos (antes y después) debido a un proceso, o datos de diferentes máquinas que fabrican el mismo producto. Los diagramas de caja son buenas maneras de representar la distribución de sus datos, especialmente si desea mostrar otros valores además de la media.

La presentación de sus datos de investigación

Es sencillo una vez que decida qué tipo de gráfico se adapta mejor a sus datos. Por ejemplo, si sus datos están sesgados, se puede usar un diagrama de caja. Su lector podrá notar si los datos están sesgados hacia la izquierda o hacia la derecha, dependiendo de la longitud de la barra por encima y por debajo de la línea media. Los datos de ANOVA también se pueden mostrar utilizando un diagrama de caja.  Si sus datos son principalmente descriptivos y desea mostrar proporciones, entonces su mejor apuesta es un gráfico de barras.

Cualquiera que sea la forma que elija, es importante comprender la utilidad de estos gráficos. El análisis de sus datos de investigación es la parte principal de su investigación ¡Infórmelo de manera efectiva! ¡Háganos saber qué piensa acerca del uso de la gráfica de caja y el cuadro de caja cuando informa sus resultados!

X

Has agotado tus artículos gratuitos.

Suscríbete de forma gratuita para obtener acceso ilimitado a todos nuestros recursos sobre redacción de investigaciones y publicaciones académicas, incluyendo:

  • +100 Artículos de nuestro blog
  • +50 Seminarios Online
  • +10 Podcasts especializados
  • +10 Libros electrónicos
  • +10 Checklists
  • +50 Infografías