Анализ оценки склонности

08.09.2021

При оценке влияния лечения на бинарный исход в обсервационных исследованиях часто бывает, что лечение не назначается пациентам случайным образом. Если, например, более тяжелые пациенты часто получали лечение, а более здоровые пациенты часто не получали лечения, простой анализ мог бы неверно оценить степень или направление эффекта лечения.

Обычный способ попытаться скорректировать потенциальное смещение из-за такого рода искажений - это использование моделей многомерной логистической регрессии. Альтернативный подход - использование оценки склонности. В следующих разделах мы приводим небольшой пример набора данных, а затем описываем и проиллюстрируем эти альтернативные методы статистического анализа. Мы сосредоточимся на простейшем примере, где пациентам назначают либо активное лечение, либо контрольную (т.е. 2 группы). В конце мы кратко упомянем возможные расширения до трех или более терапевтических групп.

2. Примеры данных

Следующий пример набора данных будет использован для иллюстрации основных концепций. Данные включают 400 субъектов, включенных в ретроспективное когортное исследование мужчин в возрасте 40-70 лет, госпитализированных с подозрением на инфаркт миокарда. Интересующий результат - 30-дневная смертность (смерть = 1). Интересен возможный эффект быстрого введения нового препарата, разрушающего тромбы (trt = 1), по сравнению со стандартной терапией (trt = 0) на риск смертности. Соответствующие ковариаты - это оценка ранее существовавших факторов риска (по шкале от 0 до 5, 5 - наихудший) и балл серьезности госпитализации (по шкале от 0 до 10, 10 - наихудший). Вот данные по первым 12 предметам:

возраст мужчина риск строгость trt смерть
4813800
5914610
6713601
5110600
5611610
6011600
5310310
5411200
5412700
6210400
6412611
7013810

Данные также можно загрузить как propensity.csv или вызвать непосредственно в R с помощью команды:

example

Сопутствующий сценарий R для выполнения всех следующих анализов можно найти здесь: propensity.R.

3. Описательный анализ

Новое лечение получили 192 (48%) пациента (trt = 1). Показатели 30-дневной смертности для пролеченных и нелеченых пациентов суммированы в следующей таблице:

Исход trt = 0 trt = 1
Выжил168162
Умер4030
30-дневная смертность19%16%

Один из способов изучения потенциального эффекта лечения - оценка разницы в риске между двумя группами. Относительный риск смертности, связанный с лечением 1, составляет 0,375 / 0,40, что составляет 0,81, что свидетельствует о небольшом преимуществе новой терапии.

Другой способ оценить эффект лечения может заключаться в вычислении отношения шансов, а не относительного риска. Отношение шансов составляет (168x30) / (162x40), что составляет 0,78, а 95% доверительный интервал можно рассчитать как (0,46, 1,31).

Третий способ оценить эффект лечения - посмотреть на абсолютное снижение уровня смертности. Здесь изменение, связанное с лечением 1, составляет -3,6% (с 19,2% до 15,6%), а 95% доверительный интервал составляет (-11,5%, 4,3%), т. Е. Снижение на 12% или повышение уровня смертности на 4%. .

Однако следующие два графика показывают, что субъекты, получавшие новое лечение, были немного старше, чем пациенты, получавшие стандартную терапию:

Дальнейшее исследование показывает, что существуют различия в факторах риска и текущем состоянии между двумя группами лечения:

Для полноты картины мы могли бы также использовать модель нелинейной регрессии, чтобы проверить форму влияния возраста, ранее существовавшего риска и серьезности в полностью скорректированной модели. Прилагаемый сценарий R содержит код для оценки и построения соответствующих сплайн-функций, и мы не показываем их здесь; отметим, что эффекты были довольно линейными.

5. Оценка предрасположенности

Альтернативный подход к анализу - попытаться имитировать условия рандомизированного контролируемого исследования (РКИ). В РКИ вероятность того, что участник получит конкретное лечение, одинакова для всех участников или, в стратифицированных планах, зависит только от известных объясняющих переменных пациента, таких как возраст, пол и т. Д. Другими словами, возраст пациента, пол (и т. д.) является достаточной информацией, чтобы сказать нам о вероятности того, что пациент получит лечение.

Если бы в условиях обсервационного исследования у нас была вся информация, доступная медицинским работникам, назначавшим лечение субъектам, мы могли бы воссоздать их процесс принятия решения и оценить вероятность того, что отдельные пациенты получили лечение. Эта вероятность называется оценкой предрасположенности, и в своей основополагающей статье 1983 года Розенбаум и Рубин [1] показали, что до тех пор, пока оценка предрасположенности является подходящей мерой вероятности получения лечения, эти оценки могут использоваться для оценки вероятности лечения. причинные последствия лечения. Баллы используются для уравновешивания прогностических переменных в группах, получавших и не получавших лечение, и есть (по крайней мере) четыре возможных способа сделать это:

  • Разделите пациентов на группы (например, квинтили) по шкале предрасположенности и сравните эффекты лечения в каждой страте.
  • Сопоставьте пролеченных и нелеченных пациентов и сравните полученные сопоставленные пары.
  • Обратное взвешивание результатов по шкале склонности.
  • Скорректируйте оценку склонности в модели логистической регрессии.

5.1 Оценка предрасположенности

Оценка предрасположенности - это условная вероятность того, что субъект будет лечиться с учетом наблюдаемых объясняющих переменных; намерение состоит в том, чтобы эта единственная вероятность могла обобщить информацию о механизме назначения лечения. Затем мы должны иметь возможность получить объективные оценки эффектов лечения, сравнивая субъектов, у которых были одинаковые вероятности получения лечения (независимо от того, получали они его на самом деле или нет).

Баллы склонности обычно оцениваются с использованием модели многомерной логистической регрессии.

В нашем примере мы применили модель логистической регрессии для оценки влияния возраста, оценки риска и индекса тяжести на вероятность получения лечения 1, а не лечения 0. Мы обнаружили, что пожилой возраст (p = 0,05), более высокий балл риска (p = 0,05) и более высокий индекс тяжести (p = 0,01) связаны с более высокой вероятностью получения лечения 1. Показатели предрасположенности варьируются от 0,2 до 0,8, и мы сравниваем распределение оценок между двумя группами лечения на рисунке ниже. Столбики показывают медианный и межквартильный размах.

Как и следовало ожидать, показатели предрасположенности (то есть вероятности получения лечения) в среднем несколько выше в группе лечения. Мы можем видеть, что существует хорошая степень совпадения, когда мы можем найти людей в обеих группах лечения с любыми оценками предрасположенности от 0,2 до 0,8. Это важно, потому что основной принцип анализа шкалы предрасположенности состоит в том, что если мы найдем двух человек, по одному в каждой группе лечения, мы можем представить, что эти два человека были `` случайным образом '' отнесены к каждой группе в том смысле, что любое распределение является одинаково вероятным. .

5.2 Балансирует ли группа по шкале предрасположенности?

При любом анализе предрасположенности мы должны проверять, позволяет ли оценка предрасположенности сбалансировать распределение независимых переменных. Есть много способов проверить баланс [2]; например, мы могли бы посмотреть на распределение объясняющей переменной в пределах квинтилей оценки склонности. На рисунке ниже показаны медиана и межквартильный диапазон возраста в каждом квинтиле оценки предрасположенности:

Без регулировки (в целом) наблюдается значительное расхождение. Однако внутри каждого квантиля распределения очень близки.

Мы можем количественно оценить начальные различия, рассчитав t-статистику для двух выборок ( т.Е. T-тест для различий в возрасте по группам лечения). Это эквивалентно нахождению статистики t для лечения из модели линейной регрессии (или ANOVA) для возраста по сравнению с группой лечения. Мы можем дополнительно измерить различия после корректировки оценки предрасположенности, вычислив t-статистику для лечения на основе модели многомерной линейной регрессии (или ANOVA) с поправкой на возраст для лечения, а также с поправкой на квинтили оценки предрасположенности. Не скорректированная (закрашенные кружки) и скорректированная (светлые кружки) t-статистика представлена ​​на рисунке ниже:

Мы видим, что корректировка оценки склонности устраняет почти все начальные различия в возрасте, оценке риска и индексе тяжести между двумя группами лечения.

5.3 Уровни смертности в пределах квинтилей оценки предрасположенности

Ранее мы обнаружили, что ковариаты сбалансированы в пределах квинтилей оценки склонности. Розенбаум и Рубин [1] показали, что средний эффект лечения в пределах шкалы оценки предрасположенности является объективной оценкой истинного эффекта лечения (при условии сохранения некоторых допущений). Мы наносим на график 30-дневные коэффициенты смертности (с 95% доверительным интервалом) по группам лечения в каждом квинтиле оценки склонности, как показано ниже:

Показатели смертности в целом были ниже в группе, получавшей лечение 1 (синий), чем в группе, получавшей лечение 0 (красный), за исключением третьего квартала, где показатели были аналогичными. Однако нет убедительных доказательств того, что эффекты лечения варьируются в зависимости от диапазона оценок предрасположенности.

Мы можем рассчитать разницу в уровнях смертности между группами лечения в каждом квинтиле и получить средний эффект лечения как средневзвешенное значение по квинтилям. На приведенном ниже рисунке показано абсолютное снижение уровня смертности для лечения 1 по сравнению с лечением 0 и средневзвешенное значение с 95% доверительным интервалом:

В целом наблюдалось абсолютное снижение 30-дневной смертности для лечения 1 на 6% по сравнению с лечением 0 с довольно широким доверительным интервалом.

5.4 Смертность между подобранными парами людей

Альтернативный подход - найти пары субъектов, по одному в каждой группе лечения, с очень похожими оценками предрасположенности. Согласно определению оценки склонности, два субъекта с одинаковыми оценками склонности также должны быть схожими по всем важным ковариатам. Эта процедура сопоставления в вычислительном отношении проще, чем одновременное сопоставление по всем важным ковариатам.

Используя алгоритм сопоставления в данных примера, мы находим 177 совпадающих пар (т. Е. 354 человека) из первоначальных 400 субъектов. Мы могли проверить, что алгоритм сопоставления достиг баланса между группами, сравнив распределения ковариат между двумя группами лечения среди сопоставленных пар. В подобранной подгруппе было 23 смерти в группе с лечением 1 и 36 смертей в группе с лечением 0, что является статистически значимым абсолютным снижением на 7,8% (95% доверительный интервал: -13,7%, -1,8%).

5.5 Обратное взвешивание по показателям склонности

Розенбаум [3] описывает альтернативное использование показателя склонности в качестве весового коэффициента. Не вдаваясь в подробности вывода, он показывает, что ожидаемый уровень смертности, если бы все субъекты были отнесены к группе лечения 1 вместо группы 0 , равен E (YT / p), где Y - переменная результата, T - группа лечения. , а p - оценка склонности к отнесению к группе лечения 1. Аналогичным образом, ожидаемый уровень смертности, если все люди отнесены к группе лечения 0, определяется как E (Y (1-T) / (1 -p)). Тогда усредненный причинно-следственный эффект представляет собой разницу между этими двумя ожидаемыми уровнями смертности.

Используя оценки склонности в качестве весов, мы оценили, что лечение 1 было связано с абсолютным снижением на 6,5% (95% доверительный интервал: -13,9%, 1,8%) по сравнению с лечением 0.

5.6 Логистическая регрессия с поправкой на оценку склонности

Мы оценили эффект лечения 1 по сравнению с лечением 0 в модели логистической регрессии с поправкой на оценку склонности (в квинтилях). Отношение шансов для лечения 1 было оценено как 0,65 (95% доверительный интервал: 0,37, 1,13). Мы обнаружили аналогичное оценочное отношение шансов, когда добавили в модель исходные независимые переменные (то есть с поправкой на оценку склонности, возраст, риск и серьезность).

6. Краткое изложение результатов

Наблюдаемые уровни 30-дневной смертности составляли 19% в группе, получавшей лечение 0, и 16% в группе, получавшей лечение 1. Сравнение оценок, полученных с помощью различных статистических методов, приведено в таблице ниже.



Подход Абсолютная разница Соотношение шансов оценивать 95% ДИ оценивать 95% ДИ
Без регулировки-3,6%(-11,5%, 4,3%)0,78(0,46, 1,31)
Логистическая регрессия с поправкой на возраст, оценку риска и индекс серьезности--0,62(0,35, 1,11)
Стратификация по PS-6,0%(-25,8%, 13,7%)--
Соответствие по PS-7,8%(-13,7%, -1,8%)0,58(0,33, 1,04)
Взвешивание по PS-6,5%(-13,9%, 1,8%)0,63(0,34, 1,11)
Настройка логистической регрессии для PS--0,65(0,37, 1,13)

В целом методы оценки склонности дают результаты, аналогичные результатам модели логистической регрессии. Это хорошо известный результат предыдущих эмпирических исследований и моделирования [4].

Обратите внимание на небольшое расхождение в статистической значимости для метода сопоставления, где 95% доверительный интервал для отношения шансов был рассчитан с помощью стандартного приближения и может быть слишком широким.

7. Обсуждение

В приведенных выше разделах было описано и проиллюстрировано использование поправок на регрессию и оценок склонности для анализа данных наблюдений. Важно отметить неизбежное ограничение данных наблюдений за эффектами лечения по сравнению с данными рандомизированного исследования. То есть методы, основанные на корректировке регрессии или оценках склонности в данных наблюдений, позволяют сбалансировать анализ только по известным ковариатам, тогда как рандомизация уравновешивает известные и неизвестные ковариаты.

При использовании анализа предрасположенности жизненно важно убедиться, что важные прогностические факторы уравновешиваются оценкой предрасположенности - без баланса лежащая в основе теория не работает. Однако, если существует большое количество предикторов, может быть неразумно ожидать идеального баланса по каждому из них, точно так же, как в РКИ сравнение исходных факторов иногда случайно обнаруживает различия между группами.

Поскольку оценки склонности должны уравновешивать распределение объясняющих переменных между группами, иногда в модель необходимо включать не только основные эффекты, но и условия взаимодействия между независимыми переменными. К счастью, модель, которая используется для оценки оценок предрасположенности, обычно не находится в центре внимания, и поэтому она не должна быть скупой - она ​​должна только обеспечивать баланс. Остин и др. [5] провели большое имитационное исследование и показали, что наиболее важными переменными для включения в модель оценки склонности (и для обеспечения баланса) являются те объясняющие переменные, связанные с интересующим результатом. С другой стороны, необязательно включать переменные, которые связаны с назначением лечения, но не связаны с результатом.

Одна ситуация, особенно подходящая для метода оценки предрасположенности, - это когда интересующий результат редок, но лечение является обычным [6]. В этой ситуации может быть не так много данных для моделирования взаимосвязи между результатом и прогностическими переменными - общее практическое правило состоит в том, что для каждой (уровень а) прогностической переменной, включенной в модель многомерной логистической регрессии, должно наблюдаться 10 событий. - в то время как данных может быть достаточно для построения хорошей модели для оценки предрасположенности. В этом случае корректировка с использованием показателя склонности может быть единственным жизнеспособным подходом к анализу.

Одно из потенциальных преимуществ методов оценки склонности перед корректировкой регрессии заключается в том, что может быть легче проверить, что оценка склонности имеет сбалансированные измеренные переменные между леченными и нелеченными субъектами, тогда как труднее судить, правильно ли указана регрессионная модель [7] .

Наконец, важно отметить, что анализ шкалы предрасположенности оценивает эффект лечения, отличный от корректировки регрессии. Анализ предрасположенности оценивает предельный эффект, тогда как поправка на регрессию оценивает условный эффект.эффект [8]. Предельный эффект лечения интерпретируется на уровне популяции: как лечение повлияет на общее количество результатов, наблюдаемых в популяции? При использовании модели логистической регрессии условный эффект лечения - это изменение вероятности исхода для человека, подвергшегося лечению, по сравнению с отсутствием лечения, в зависимости от объясняющих переменных этого человека, т. Е. Условный эффект интерпретируется на индивидуальном уровне. . Числовой пример этого эффекта приведен в следующей таблице, где заболевание поражает 13 200 человек. Большинство людей относятся к группе «низкого риска», в то время как небольшое количество - к группе «высокого риска», с коэффициентами смертности 5% и 25% соответственно при старом лечении.Новое высокоэффективное лечение снизит шансы смерти на 80% (условное отношение шансов равно 0,2), но отношение шансов на уровне популяции равноне 0,2:

8. Ссылки

    Центральная роль шкалы предрасположенности в обсервационных исследованиях причинных эффектов. Биометрика, 1983; 70: 41-55. [ссылка на сайт].

    Слишком много шума о моделях оценки склонности? Сравнение методов сопоставления показателей склонности. Ценность в здоровье, 2006 г .; 9(6): 377-85. [Медлайн] [ссылка].

    Прямая корректировка на основе модели. Журнал Американской статистической ассоциации, 1987 г .; 82: 387-94. [ссылка на сайт].

    Методы оценки предрасположенности дали результаты, аналогичные традиционному регрессионному моделированию в обсервационных исследованиях: систематический обзор. Журнал клинической эпидемиологии, 2005; 58(6): 550-9. [Медлайн] [ссылка].

    Сравнение способности различных моделей оценки предрасположенности уравновешивать измеряемые переменные между леченными и нелеченными субъектами: исследование Монте-Карло. Статистика в медицине, 2007; 26(4): 734-53. [Медлайн] [ссылка].

    Редкие исходы, общие методы лечения: аналитические стратегии с использованием оценок предрасположенности [От редакции]. Анналы внутренней медицины, 2002; 137: 693-5. [Медлайн] [ссылка].

    Методы оценки предрасположенности в исследованиях безопасности лекарственных средств: практика, сильные стороны и ограничения. Фармакоэпидемиология и безопасность лекарств, 2001; 10(4): 341-4. [Медлайн] [ссылка].

    Условие оценки предрасположенности может привести к необъективной оценке общих показателей лечебного эффекта: исследование Монте-Карло. Статистика в медицине, 2007; 26(4): 754-68. [Медлайн] [ссылка].

9. Дополнительная литература

  • Остин ПК. Критическая оценка сопоставления показателей склонности в медицинской литературе с 1996 по 2003 год. Статистика в медицине, 2008 (в печати). [Медлайн] [ссылка].
  • Д'Агостино Р. Б. Младший. Методы оценки склонности для снижения систематической ошибки при сравнении лечения с нерандомизированной контрольной группой. Статистика в медицине, 1998; 17(19): 2265-81. [Медлайн] [ссылка].
  • Imbens GW. Роль показателя предрасположенности в оценке функций доза-реакция. Биометрика, 2000; 87(3): 706-10. [ссылка на сайт].
  • Розенбаум ПР, Рубин ДБ. Снижение систематической ошибки в обсервационных исследованиях с использованием подкласса по шкале предрасположенности. Журнал Американской статистической ассоциации, 1984 г .; 79(387): 516-24. [ссылка на сайт].
  • Винкельмайер В.К., Курт Т. Оценка склонности: помощь или шумиха? Нефрологическая диализная трансплантация, 2004 г .; 19: 1671-3. [Медлайн] [ссылка].

10. Благодарности

Спасибо Эрику Лау за помощь в разработке наглядного примера.



Эта работа находится под лицензией Creative Commons Attribution 3.0 Unported License. Написал Бен Коулинг.

Последнее изменение этой страницы:

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!