Представляйте данные исследования с использованием блочных диаграмм и гистограмм
Гистограммы и блочные диаграммы часто используются для визуального представления данных исследований. Поэтому важно понимать разницу между ними. Использование блочной диаграммы или гистограммы зависит от характера данных и интерпретации, которую исследователь хотел бы предоставить.
Блочные диаграммы и как их читать
Блочная диаграмма используется для построения графика распределения данных. Блочные диаграммы также называются диаграммами размаха. Эти графики кодируют пять характеристик распределения данных, показывая читателю их положение и длину. Блок варьирует от Q1 (первый квартиль) распределения до Q3 (третий квартиль) распределения, а диапазон представлен IQR (межквартильный диапазон). Медиана обозначена линией поперек блока. Размахи на блочных диаграммах простираются от Q1 и Q3 до самых крайних точек данных. В свою очередь, каждое из этих выпадающих значений отмечено знаком. Как альтернатива, максимальные и минимальные значения могут быть использованы в качестве конечных точек размаха.
Чтение блочных диаграмм не так сложно, как может показаться. Медиана, представленная линией, проходящей через блок, является серединой набора данных. Это означает, что 50% данных больше медианы. Верхний размах представляет значения выше среднего. Выпадающие значения – это точки над верхним размахом. Аналогичная интерпретация применяется к нижнему размаху и выпадающим значениям. Блочные диаграммы также могут представлять ассиметричные распределения в наборе данных. Положение медианы на блоке показывает, насколько много данных находится над или под ней.
Благодарим за представление изображения: Натан Яу из Flowing Data
Гистограммы и как их читать
Гистограммы предназначены для представления категориальных переменных и подходят для подсчета. Гистограммы отображают и сравнивают частоту, число или другие показатели (например, среднее) для разных категорий данных. Однако непрерывные данные лабораторных исследований, исследований на людях и исследований на животных часто представлены в виде гистограмм. Гистограммы – это часто используемые графики, потому что их легко интерпретировать и просто создавать. Они полезны для отображения номинальных или порядковых категорий. Порядковые категории – это данные, которые ранжируются (например, от очень хорошего до очень плохого), в то время как номинальные данные представляют качественные или описательные данные (например, страна рождения, предмет, изучаемый в университете). Существуют различные типы гистограмм, такие как горизонтальные гистограммы, сгруппированные гистограммы и гистограммы с накоплением. Исследователи должны создавать свои графики, соблюдая несколько правил, чтобы представить свои работы в четкой и эффективной форме.
Интерпретация гистограмм начинается с наблюдения высоты гистограммы относительно соответствующего значения на оси Y. Различия в высотах столбцов можно определить, обратившись к оси Y. Второй шаг – сравнить группировки столбцов. Некоторые гистограммы могут иметь столбцы, сгруппированные в кластеры. В этом случае сравните столбцы внутри кластеров, чтобы понять, как каждый набор данных в подкатегории сравнивается с другими наборами данных. Кроме того, вы также можете проверить диапазон, вычитая самое низкое значение (обозначенное самым коротким столбцом) из наибольшего значения (обозначенного самым длинным столбцом).
Какой из этих графиков следует использовать?
Какой тип данных вы будете представлять? Как вы хотите представить свои данные? Вам нужно ответить на такие вопросы, прежде чем выбирать между этими двумя типами.
Некоторые авторы утверждают, что гистограммы не должны использоваться, в то время как другие утверждают, что должны появиться новые форматы для представления данных. Сгруппированные гистограммы полезны, например, для отображения бюджетов для двух домохозяйств. Одно из распространенных применений гистограмм – показать соотношение одного значения к другому.
С другой стороны, блочные диаграммы полезны для построения различных наборов данных из независимых источников. Пример включает в себя сравнение результатов тестов между различными университетами, изменение данных (до и после) в результате процесса или данные с разных машин, производящих один и тот же продукт. Блочные диаграммы – это хороший способ представить распределение ваших данных, особенно если вы стремитесь показать другие значения помимо среднего.
Связывание данных ваших исследований
Это просто, если вы решите, какой тип графика лучше всего подходит для ваших данных. Например, если ваши данные ассиметричны, можно использовать блочную диаграмму. Ваш читатель сможет определить, смещены ли данные влево или вправо, в зависимости от блока полосы выше и ниже средней линии. Данные из ANOVA также могут быть показаны с помощью блочной диаграммы. Если ваши данные, в основном, носят описательный характер, и вы хотите показать пропорции, то гистограмма – ваш лучший выбор.
Какой бы путь вы ни выбрали, важно понимать полезность этих графиков. Ваш анализ данных исследования является основной частью отчета об исследовании – делайте это эффективно! Дайте нам знать, что вы думаете об использовании блочной диаграммы и гистограммы при представлении результатов!