Квартиль

08.09.2021

Квартиль - это статистический термин, который описывает разделение наблюдений на четыре определенных интервала на основе значений данных и их сравнения со всем набором наблюдений.

Общие сведения о квартилях

Чтобы понять квартиль, важно понимать медианное значение как меру центральной тенденции. Медиана в статистике - это среднее значение набора чисел. Это точка, в которой ровно половина данных находится ниже и выше центрального значения.

Итак, учитывая набор из 13 чисел, медиана будет седьмым числом. Шесть чисел, предшествующих этому значению, являются наименьшими числами в данных, а шесть чисел после медианы - наибольшими числами в данном наборе данных. Поскольку на медианное значение не влияют экстремальные значения или выбросы в распределении, иногда оно предпочтительнее среднего.

Медиана является надежной оценкой местоположения, но ничего не говорит о том, как данные по обе стороны от ее значения распространяются или рассредоточены. Вот где вступает в действие квартиль. Квартиль измеряет разброс значений выше и ниже среднего путем деления распределения на четыре группы.

Ключевые выводы

  • Квартиль измеряет разброс значений выше и ниже среднего путем разделения распределения на четыре группы.
  • Квартиль делит данные на три точки - нижний квартиль, медиана и верхний квартиль - для формирования четырех групп набора данных.
  • Квартили используются для расчета межквартильного размаха, который является мерой изменчивости вокруг медианы.

Как работают квартили

Подобно тому, как медиана делит данные пополам, так что 50% измерения лежат ниже медианы, а 50% - выше него, квартиль разбивает данные на кварталы, так что 25% измерений меньше нижнего квартиля, 50 % меньше медианы, а 75% меньше верхнего квартиля.

Квартиль делит данные на три точки - нижний квартиль, медиана и верхний квартиль - для формирования четырех групп набора данных. Нижний квартиль или первый квартиль обозначается как Q1 и представляет собой среднее число, которое находится между наименьшим значением набора данных и медианой. Второй квартиль, Q2, также является медианным. Верхний или третий квартиль, обозначаемый как Q3, является центральной точкой, которая находится между медианой и наивысшим числом распределения.

Теперь мы можем выделить четыре группы, образованные из квартилей. Первая группа значений содержит наименьшее число до Q1; во вторую группу входит Q1 до медианы; третий набор - это медиана Q3; четвертая категория включает Q3 до самой высокой точки данных всего набора.

Каждый квартиль содержит 25% от общего числа наблюдений. Как правило, данные располагаются от наименьшего к наибольшему:

  1. Первый квартиль: самые низкие 25% чисел.
  2. Второй квартиль: от 25,1% до 50% (до медианы)
  3. Третий квартиль: от 50,1% до 75% (выше медианы)
  4. Четвертый квартиль: самые высокие 25% чисел

Пример квартиля

Предположим, что баллы по математике в классе из 19 учеников в порядке возрастания распределены следующим образом:

  • 59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Сначала отметьте медианное значение Q2, которое в данном случае является 10-м значением: 75.

Q1 - это центральная точка между наименьшей оценкой и медианой. В этом случае Q1 попадает между первым и пятым баллом: 68. (Обратите внимание, что медиана также может быть включена при вычислении Q1 или Q3 для нечетного набора значений. Если бы мы включили медиану по обе стороны от средней точки , то Q1 будет средним значением между первым и 10-м баллами, которое представляет собой среднее значение пятого и шестого баллов - (пятое + шестое) / 2 = (68 + 69) / 2 = 68,5).

Q3 - это среднее значение между Q2 и наивысшим баллом: 84. (Или, если вы включите медиану, Q3 = (82 + 84) / 2 = 83).

Теперь, когда у нас есть квартили, давайте интерпретируем их числа. Оценка 68 (Q1) представляет первый квартиль и 25-й процентиль. 68 - это медиана нижней половины оценки, установленной в доступных данных, то есть медиана оценок от 59 до 75.

Q1 говорит нам, что 25% оценок ниже 68 и 75% оценок класса выше. Q2 (медиана) является 50-м процентилем и показывает, что 50% оценок меньше 75, а 50% оценок выше 75. Наконец, Q3, 75-й процентиль, показывает, что 25% оценок являются больше и 75% меньше 84.

Особые соображения

Если точка данных для Q1 дальше от медианы, чем Q3 от медианы, то мы можем сказать, что существует больший разброс среди меньших значений набора данных, чем среди больших значений. Та же логика применяется, если Q3 дальше от Q2, чем Q1 от медианы.

В качестве альтернативы, если имеется четное количество точек данных, медиана будет средним из двух средних чисел. В нашем примере выше, если бы у нас было 20 студентов вместо 19, медиана их оценок будет средним арифметическим 10-го и 11-го чисел.

Квартили используются для расчета межквартильного размаха, который является мерой изменчивости вокруг медианы. Межквартильный диапазон рассчитывается просто как разница между первым и третьим квартилями: Q3 – Q1. Фактически, это диапазон средней половины данных, который показывает, насколько разбросаны данные.

Для больших наборов данных в Microsoft Excel есть функция КВАРТИЛЬ для вычисления квартилей.

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!