Стандартная ошибка и доверительные интервалы

08.09.2021

Цели обучения:вы узнаете о стандартной ошибке среднего, стандартной ошибке пропорции, эталонных диапазонах и доверительных интервалах. Предыдущие разделы касались оценки статистики. В этом разделе рассматривается, насколько точными могут быть эти оценки. Теперь прочтите текст ресурса ниже.

Текст ресурса

Стандартная ошибка среднего

Серия выборок, взятых из одной популяции, не будет идентична. Они будут показывать случайные отклонения от одного к другому, причем отклонения могут быть незначительными или значительными. Например, серия образцов температуры тела здоровых людей будет показывать очень небольшие отклонения от одного к другому, но различия между образцами систолического артериального давления будут значительными. Таким образом, вариация между выборками частично зависит от степени вариации в совокупности, из которой они взяты. Более того, общеизвестно, что небольшая выборка является гораздо менее надежным ориентиром для совокупности, из которой она была взята, чем большая выборка. Другими словами, чем больше людей включено в выборку, тем больше вероятность того, что выборка будет точно представлять совокупность,при условии, что для построения выборки используется случайный процесс. Следствием этого является то, что если две или более выборки взяты из генеральной совокупности, то чем они больше, тем больше вероятность того, что они будут похожи друг на друга - опять же, при условии, что соблюдается метод случайной выборки. Таким образом, различия между выборками частично зависят также от размера выборки. Если мы возьмем серию выборок и вычислим среднее значение наблюдений в каждой, у нас будет серия средних.Если мы возьмем серию выборок и вычислим среднее значение наблюдений в каждой, у нас будет ряд средних.Если мы возьмем серию выборок и вычислим среднее значение наблюдений в каждой, у нас будет серия средних.

Эти средние обычно следуют нормальному распределению, и они часто так и поступают, даже если наблюдения, из которых они были получены, не соответствуют. Это можно доказать математически и известно как «Центральная предельная теорема». Ряд средних значений, как и ряд наблюдений в каждой выборке, имеет стандартное отклонение. Стандартная ошибка среднего значения одной выборки - это оценка стандартного отклонения, которая может быть получена из средних значений большого количества выборок, взятых из этой совокупности.

Как отмечалось выше, если случайные выборки отбираются из генеральной совокупности, их средние значения будут варьироваться от одного к другому. Вариация зависит от изменчивости совокупности и размера выборки. Мы не знаем вариации в совокупности, поэтому мы используем вариацию в выборке как ее оценку. Это выражается в стандартном отклонении. Если теперь разделить стандартное отклонение на квадратный корень из числа наблюдений в выборке, мы получим оценку стандартной ошибки среднего. Важно понимать, что нам не нужно брать повторные выборки, чтобы оценить стандартную ошибку; в пределах одной выборки достаточно информации. Однако идея состоит в том, что если бы мы брали повторяющиеся случайные выборки из совокупности, мы ожидали бы, что среднее значение будет меняться чисто случайно.

Пример 1Врач общей практики исследовал, различается ли диастолическое артериальное давление у мужчин в возрасте 20-44 лет между типографами и сельскохозяйственными рабочими. Для этой цели она произвела выборку из 72 принтеров и 48 сельскохозяйственных рабочих и рассчитала среднее и стандартное отклонения, как показано в таблице 1. Таблица 1:Среднее диастолическое артериальное давление типографий и фермеров.

Номер Среднее диастолическое артериальное давление (мм рт. Ст.) Стандартное отклонение (мм рт. Ст.)
Принтеры 72 88 4.5
Фермеры 48 79 4.2

Чтобы вычислить стандартные ошибки двух средних значений артериального давления, стандартное отклонение каждого образца делится на квадратный корень из числа наблюдений в образце. Эти стандартные ошибки можно использовать для изучения значимости разницы между двумя средними значениями. Стандартная ошибка пропорции или процента.Подобно тому, как мы можем вычислить стандартную ошибку, связанную со средним значением, мы можем также вычислить стандартную ошибку, связанную с процентом или пропорцией. Здесь размер выборки будет влиять на размер стандартной ошибки, но величина вариации определяется значением процента или доли в самой генеральной совокупности, и поэтому нам не нужна оценка стандартного отклонения. Пример 2Старший хирургический регистратор в большой больнице исследует острый аппендицит у людей в возрасте 65 лет и старше. В качестве предварительного исследования он изучает истории болезни в больнице за предыдущие 10 лет и обнаруживает, что из 120 пациентов этой возрастной группы с диагнозом, подтвержденным при операции, 73 (60,8%) женщины и 47 (39,2%) мужчины. Если p представляет один процент, 100-p представляет другой. Затем стандартная ошибка каждого из этих процентов получается путем (1) их умножения, (2) деления произведения на число в выборке и (3) извлечения квадратного корня:

что для данных аппендицита, приведенных выше, выглядит следующим образом:

Референсные диапазоны

Swinscow и Campbell (2002) описали 140 детей, у которых средняя концентрация свинца в моче составляла 2,18 ммоль / 24 часа со стандартным отклонением 0,87. Точки, которые включают 95% наблюдений, составляют 2,18 (1,96 x 0,87), что дает интервал от 0,48 до 3,89. У одного из детей концентрация свинца в моче составляла чуть более 4,0 ммоль / сутки. Это наблюдение превышает 3,89 и поэтому попадает в 5% наблюдений за пределами 95% вероятности. Можно сказать, что вероятность каждого из этих наблюдений составляет 5%. Другой способ взглянуть на это - увидеть, что если вы случайно выберете одного ребенка из 140, вероятность того, что концентрация свинца в моче у ребенка превысит 3,89 или будет меньше 0,48, составляет 5%. Эта вероятность обычно выражается в виде дроби от 1, а не от 100, и записывается как p Таблица 2:Вероятности кратного стандартного отклонения для нормального распределения

Количество стандартных отклонений (z) Вероятность получить наблюдение, по крайней мере, так же далеко от среднего (двусторонний P)
0 1,00
0,5 0,62
1.0 0,31
1.5 0,13
2.0 0,045
2,5 0,012
3.0 0,0027

Чтобы оценить вероятность обнаружения наблюдаемого значения, скажем, концентрации свинца в моче 4,8 ммоль / сутки, в выборке из той же совокупности наблюдений, что и представленные 140 детьми, мы действуем следующим образом. Расстояние нового наблюдения от среднего составляет 4,8 - 2,18 = 2,62. Сколько стандартных отклонений это представляет? Разделив разницу на стандартное отклонение, получим 2,62 / 0,87 = 3,01. Таблица 2 показывает, что вероятность очень близка к 0,0027. Эта вероятность мала, поэтому наблюдение, вероятно, происходило не из той же группы, что и 140 других детей. Другой пример: среднее диастолическое артериальное давление принтеров оказалось равным 88 мм рт. Ст., А стандартное отклонение - 4,5 мм рт. Ст. У одного из принтеров было диастолическое артериальное давление 100 мм рт. Среднее значение плюс или минус 1.96-кратное стандартное отклонение дает следующие две цифры:

Таким образом, мы можем сказать, что только 1 из 20 (или 5%) принтеров в популяции, из которой взят образец, будет иметь диастолическое артериальное давление ниже 79 или выше примерно 97 мм рт. Это пределы 95%. Пределы 99,73% лежат на три стандартных отклонения ниже и на три выше среднего. Артериальное давление 100 мм рт.ст., отмеченное на одном принтере, таким образом, превышает 95% -ный предел 97, но находится в пределах 99,73% -ного предела 101,5 (= 88 + (3 x 4,5)). Пределы 95% часто называют «эталонным диапазоном». Для многих биологических переменных они определяют то, что считается нормальным (то есть стандартным или типичным) диапазоном. Все, что выходит за пределы допустимого диапазона, считается ненормальным. Учитывая выборку субъектов, благополучных по болезни, альтернативным методом определения нормального диапазона было бы просто определить точки, исключающие 2,5% субъектов на верхнем пределе и 2.5% предметов на нижнем уровне. Это дало бы эмпирический нормальный диапазон. Таким образом, из 140 детей мы можем исключить три самых высоких и три самых низких значения. Однако гораздо эффективнее использовать среднее значение +/- 2SD, если набор данных не очень большой (скажем,>400).

Доверительные интервалы

Аналогичным образом можно рассматривать средние значения и их стандартные ошибки. Если будет составлена ​​серия выборок и рассчитано среднее значение каждой из них, можно ожидать, что 95% средних будут находиться в диапазоне двух стандартных ошибок выше и двух ниже среднего этих средних. Ожидается, что это общее среднее значение будет очень близко к среднему значению для генеральной совокупности. Таким образом, стандартная ошибка среднего обеспечивает утверждение о вероятности разницы между средним значением генеральной совокупности и средним значением выборки. В нашей выборке из 72 принтеров стандартная ошибка среднего составила 0,53 мм рт. Среднее значение выборки плюс или минус 1,96 раза его стандартная ошибка дает следующие две цифры:

Это называется 95% доверительным интервалом, и мы можем сказать, что существует только 5% вероятность того, что диапазон от 86,96 до 89,04 мм рт.ст. исключает среднее значение для популяции. Если мы возьмем среднее значение плюс или минус в три раза превышающее стандартную ошибку, интервал будет от 86,41 до 89,59. Это 99,73% доверительный интервал, и вероятность того, что этот интервал исключит среднее значение генеральной совокупности, составляет 1 к 370. Доверительные интервалы являются ключом к полезному устройству для аргументации от выборки к генеральной совокупности. Для небольших выборок - скажем, менее 30 наблюдений - для установления доверительных границ необходимы большие значения, кратные стандартной ошибке. Они происходят из распределения, известного как t-распределение, о котором читатель отсылает к работе Swinscow and Campbell (2002). Доверительный интервал для пропорцииПри обследовании 120 человек, прооперированных по поводу аппендицита, 37 мужчин. Стандартная ошибка для процента пациентов мужского пола с аппендицитом определяется следующим образом:

В данном случае это 0,0446 или 4,46%. Это также стандартная ошибка процента пациенток с аппендицитом, поскольку формула остается той же, если p заменить на 100-p. С помощью этой стандартной ошибки мы можем получить 95% доверительный интервал для двух процентов:

Эти доверительные интервалы исключают 50%. Мы можем сделать вывод, что у мужчин больше шансов заболеть аппендицитом, чем у женщин. Эта формула является приблизительной и лучше всего работает, если n велико, а p находится в пределах от 0,1 до 0,9. Лучшим методом было бы использование критерия хи-квадрат, который будет обсуждаться в следующем модуле. Существует много путаницы в интерпретации вероятности, связанной с доверительными интервалами. Чтобы понять это, мы должны прибегнуть к концепции повторной выборки. Представьте себе повторные выборки одного и того же размера из одной и той же популяции. Для каждого образца рассчитайте 95% доверительный интервал. Поскольку выборки разные, то и доверительные интервалы тоже. Мы знаем, что 95% этих интервалов будут включать параметр совокупности. Однако без дополнительной информации мы не можем сказать, какие именно. Таким образом, только с одним образцом,и никакой другой информации о параметре населения, мы можем сказать, что вероятность включения параметра в наш интервал составляет 95%. Обратите внимание, что это не означает, что мы с вероятностью 95% ожидаем, что среднее значение из другой выборки будет в этом интервале.

Видео 1:видео с кратким обзором доверительных интервалов. (Этот видеоматериал взят с внешнего сайта. Содержание не является обязательным и не является обязательным для ответов на вопросы.)

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!