Новый GWAS и метаанализ с вменением 1000 геномов выявляют новые варианты риска колоректального рака

08.09.2021

Полногеномные исследования ассоциации (GWAS) колоректального рака (CRC) на данный момент идентифицировали 23 локуса восприимчивости. Анализ ранее проведенных GWAS показывает, что дополнительные локусы риска еще не обнаружены. Чтобы идентифицировать новые локусы восприимчивости к CRC, мы провели новый GWAS и выполнили метаанализ с пятью опубликованными GWAS (всего 7 577 случаев и 9 979 контрольных случаев европейского происхождения), вменяя генотипы с использованием проекта «1000 геномов». Комбинированный анализ определены новые, значительные ассоциации с CRC на 1p36.2 отмечены rs72647484 (минорного аллеля частоты [МАФ] = 0,09) вблизи CDC42и Wnt4( Р= 1,21 × 10 -8, отношение шансов [OR] = 1,21) и на 16q24.1, отмеченный rs16941835 (MAF = 0,21, P= 5,06 × 10 −8; OR = 1,15) в длинной некодирующей РНК (днРНК) RP11-58A18.1 и

500 т.п.н. от ближайшего кодирующего гена FOXL1. Кроме того, мы идентифицировали многообещающую ассоциацию в 10p13 с rs10904849, интронным для CUBN(MAF = 0,32, P= 7,01 × 10 -8; OR = 1,14). Эти результаты позволяют лучше понять генетические и биологические основы наследственной генетической предрасположенности к CRC. Кроме того, наш анализ также показывает, что вменение можно использовать для использования данных GWAS для выявления новых вариантов, вызывающих заболевание.

Вступление

Исследования близнецов показывают, что наследственные факторы составляют 35% вариаций риска развития колоректального рака (CRC) 1. Однако только 5% CRC можно отнести к наследованию мутаций с высокой пенетрантностью в известных генах 2,3. Полногеномные исследования ассоциации (GWAS), проведенные в основном в европейских 4,5,6,7,8,9,10,11,12, но также и в азиатских 13,14,15,16 популяциях, подтвердили давнее убеждение, что часть наследственный риск CRC связан с распространенными вариантами с низким уровнем риска. Эти GW обеспечили понимание биологической основы КПРА, отметив роль генов в пределах костного морфогенетического сигнального белка пути ( ВМР -2 , BMP4, GREM1и Smad7) 4,11 и некоторых генов - кандидатов ( например. CDH1 / CDH3), А также гены , которые ранее не вовлеченные в CRC ( например. POLD3, TERC, CDKN1Aи SHROOM2) 5,6.

Несмотря на успех GWAS, SNP риска, выявленные до сих пор в европейских популяциях, составляют только 8% семейного риска CRC (дополнительная таблица 1). Вместе с чрезмерным представлением ассоциативных сигналов в GWAS убедительно предполагается, что дополнительные SNP риска еще предстоит обнаружить. Статистическая мощность отдельных GWAS ограничена умеренными размерами эффекта генетических вариантов и требованием строгого порога для установления статистической значимости во избежание ошибок 1-го типа. Таким образом, метаанализ данных GWAS дает возможность идентифицировать новые локусы риска CRC и обеспечить более глубокое понимание биологии опухоли. Кроме того, вменение нетипизированных вариантов в данные GWAS с использованием общедоступных эталонных наборов данных увеличивает количество вариантов, которые можно проверить на связь с риском CRC.

Чтобы идентифицировать новые локусы восприимчивости к CRC, мы провели независимое первичное сканирование CRC с использованием образцов пациентов из исследования COIN и выполнили полногеномный метаанализ с пятью ранее опубликованными GWAS. Чтобы восстановить нетипизированные генотипы и тем самым максимизировать перспективы выявления вариантов риска, мы вменяли более 10 миллионов SNP в шести наборах данных GWAS, используя данные из проекта «1000 геномов» 17 в качестве справочной информации (подробности см. В разделе «Материалы и методы»).

Методы

Первичный GWAS

COIN GWAS был основан на 2244 случаях CRC (64% мужчин, средний возраст 61 год, SD = 10), установленных в ходе двух независимых клинических исследований Совета по медицинским исследованиям продвинутого / метастатического CRC; МОНЕТА и МОНЕТА-B 18. Случаи были генотипированы с использованием массивов аксиом Affymetrix в соответствии с рекомендациями производителя (Affymetrix, Санта-Клара, Калифорния 95051, США) с использованием повторяющихся образцов и секвенирования существенно связанных SNP в подмножестве образцов для подтверждения точности генотипирования. Для всех SNP были получены согласованные результаты>99%. Для контроля мы использовали массив данных Affymetrix 6.0 Wellcome Trust Case Control Consortium 2 (WTCCC2) по 2674 лицам из Контрольной группы Службы крови Великобритании. Были исключены люди с: 0,185, n = 4), свидетельство небелого европейского происхождения с использованием PCA в сочетании с образцами HapMap (n = 130; вырезано - выкл на основе минимального и максимального значений двух верхних основных компонентов элементов управления; дополнительный рисунок 2). Подробная информация обо всех исключениях из выборки представлена ​​на дополнительном рисунке 3. Мы исключили SNP из анализа с: частотой вызовов 0,185, n = 4), свидетельство небелого европейского происхождения с использованием PCA в сочетании с образцами HapMap (n = 130; отсечение основано на минимальном и максимальном значениях двух верхних основных компоненты органов управления; дополнительный рисунок 2). Подробная информация обо всех исключениях из выборки представлена ​​на дополнительном рисунке 3. Мы исключили SNP из анализа с: частотой вызовов 0,185, n = 4), свидетельство небелого европейского происхождения с использованием PCA в сочетании с образцами HapMap (n = 130; отсечение основано на минимальном и максимальном значениях двух верхних основных компоненты органов управления; дополнительный рисунок 2). Подробная информация обо всех исключениях из выборки представлена ​​на дополнительном рисунке 3. Мы исключили SNP из анализа с: частотой вызовов

Опубликованный GWAS

Мы использовали пять опубликованных и ранее описанных GWAS (см. Дополнительные методы):

UK1 (CORGI) 6 включал 940 случаев колоректальной неоплазии, Шотландия1 (COGS) 6 включал 1012 случаев CRC и 1012 здоровых популяционных контрольных группы, VQ58 включал 1800 случаев CRC 19 и 2690 контрольных генотипов из когорты WTCCC2 1958 рожденных 20, CCFR1 включал 1290 семейных случаев CRC и 1055 контролей 21, CCFR2 включал еще 796 случаев и 2236 контролей из исследований по генетическим маркерам восприимчивости рака (CGEMS) при раке груди и простаты 22,23.

Когорты GWA VQ, UK1 и Scotland1 были генотипированы с использованием массивов Illumina Hap300, Hap240S, Hap370, Hap550 или Omni2.5M. Генотипирование 1958 г. до н.э. было выполнено в рамках исследования WTCCC2 на пользовательских массивах Hap1.2M-Duo. Образцы CCFR были генотипированы с использованием массивов Illumina Hap1M, Hap1M-Duo или Omni-express. Образцы CGEMS были генотипированы с использованием массивов Illumina Hap300 и Hap240 или Hap550. После применения того же контроля качества, что и для COIN и COIN-B, для метаанализа стали доступны данные о 7 577 случаях CRC и 9 979 элементах контроля (дополнительный рисунок 1).

Исследование проводилось в соответствии с Хельсинкской декларацией. Письменное информированное согласие было получено от всех субъектов, и исследование было одобрено соответствующими советами по этике в принимающих учреждениях.

Статистический и биоинформатический анализ

Анализы проводились с использованием программного обеспечения R (v3.02) 24 и PLINK 25. Связь между каждым SNP и риском CRC оценивалась с помощью теста тенденции Кохрана – Армитиджа. OR и связанные 95% доверительные интервалы рассчитывались с помощью безусловной логистической регрессии. Фазирование генотипов SNP GWAS проводили с помощью SHAPEIT (v2.644) 26. Прогнозирование нетипизированных SNP осуществлялось с использованием IMPUTE (v2.3.0) 27 на основе данных из проекта 1000 Genomes (интегрированный набор вариантов фазы 1, v3.20101123) 28 в качестве справочного материала. Вмененные данные были проанализированы с помощью SNPTEST (v2.4.1) 29. В метаанализ ассоциаций были включены только маркеры с информационным баллом>0,4, условно рассчитанной скоростью звонков / SNP>0,9 и MAF>0,01. Достоверность вменения, оцениваемая по соответствию между вмененными и упорядоченными SNP, была исследована в подгруппе из 200 случаев в Великобритании.Мета-анализ проводился с использованием META (v2.4-1) 30 в рамках модели с обратным взвешиванием с фиксированными эффектами с использованием вероятностей генотипа из IMPUTE, где SNP не был напрямую типизирован. Мы рассчитали статистику Q Кохрана для проверки неоднородности иСтатистика I 2для количественной оценки доли общей вариации, вызванной неоднородностью - значения I2≥75% считаются характерными для большой неоднородности 31. Ассоциации по полу, возрасту и клинико-патологическим фенотипам были изучены с помощью логистической регрессии в анализе только случаев. Семейный относительный риск CRC, связанный с каждым вариантом, был рассчитан, как подробно описано Pharoah et al.32 предполагая, что общий семейный риск CRC, как показывают эпидемиологические исследования, составляет 2,2 33.

Чтобы исследовать эпигенетические профили ассоциативных сигналов, мы использовали ChromHMM 34. Состояния были выведены из данных модификации гистона ENCODE на линии клеток CRC HCT116 (ДНКаза, H3K4me3, H3K4me1, H3K27ac, Pol2 и CTCF) 35, преобразованных в двоичную форму с использованием многомерной скрытой марковской модели.

Чтобы проверить, аннотируют ли какие-либо из SNPs или их прокси ( т.е.r 2>0,8 в контрольной панели CEU 1000 геномов) предполагаемые элементы связывания / энхансера фактора транскрипции, мы использовали CADD (комбинированное истощение, зависящее от аннотаций) 36. Мы оценили сохранение последовательности с использованием: PhastCons ( 10,0 считается вредным).

Анализ данных TCGA

Чтобы изучить взаимосвязь между генотипом SNP и экспрессией мРНК, мы использовали Атлас генома рака опухоли (TCGA), экспрессию РНК-seq 38 и данные SNP Affymetrix 6.0 (номер доступа dbGaP: phs000178.v7.p6) на 223 колоректальной аденокарциноме (COAD). и 75 образцов аденокарциномы прямой кишки с использованием лучшего прокси, где SNP не были представлены напрямую. Связь между нормализованным количеством РНК на ген и генотипом SNP была определена количественно с использованием теста тенденции Краскела-Уоллиса. Частота соматических мутаций в CRC была получена с использованием веб-серверов CBioPortal for Cancer Genomics 39,40 и TumorPortal 41.

Анализ пути

Чтобы определить, действуют ли какие-либо гены, отображающие три недавно идентифицированных региона, в путях, уже избыточно представленных в регионах GWAS, мы использовали базу данных взаимодействий путей NCI 42. Все гены в блоке LD, содержащем каждый tagSNP или связанные с SNP посредством функциональных экспериментов (MYC), были отправлены как пакетный запрос с использованием источника данных NCI-Nature.

Определение статуса микросателлитной нестабильности (MSI), KRAS, NRAS и BRAF при раке

Статус MSI опухоли в CRC определяли с использованием мононуклеотидных микросателлитных локусов BAT25 и BAT26, которые являются высокочувствительными маркерами MSI. Образцы, показывающие более или равное пяти новым аллелям по сравнению с нормальной ДНК, по одному или обоим маркерам, были присвоены как MSI-H (соответствует MSI-high) 43.

Опухоли из исследования COIN были проверены на наличие мутаций в кодонах KRAS12, 13 и 61 и кодоне BRAF600 с помощью пиросеквенирования 18. Кроме того, KRAS(все три кодона), BRAF(кодоны 594 и 600) и NRAS(кодоны 12 и 61) были проверены на наличие мутаций с помощью массива масс MALDI-TOF (Sequenom, Сан-Диего, Калифорния, США) 44.

Результаты

В ходе первичного сканирования 2244 случая прогрессирующего (стадия IV) CRC, выявленных в ходе испытаний COIN 18 и COIN-B 45, выявленных Советом медицинских исследований (MRC), были проанализированы с использованием контрольных данных 2674 человек из контрольной группы национальной службы крови Великобритании WTCCC2. После применения строгих критериев контроля качества (материалы и методы) мы проанализировали 234 675 аутосомных SNP на предмет связи с риском CRC в 1950 случаях и 2162 контроле. График AQ – Q наблюдаемой статистики по сравнению с ожидаемой статистикой χ2-теста показал мало доказательств раздува тестовой статистики, тем самым исключив возможность существенной скрытой субструктуры населения, загадочного родства между субъектами или дифференциального определения генотипа (коэффициент инфляции λ = 1,05; дополнительный рисунок 1).

Мы выполнили мета-анализ данных нашего первичного сканирования с пятью неперекрывающимися сериями случай-контроль GWAS североевропейского происхождения, о которых сообщалось ранее (дополнительная таблица 2). Адекватность сопоставления случай-контроль и возможность дифференциального генотипирования случаев и контроля оценивалась с использованием графиков QQ статистических данных теста. Значения λ GC 46 для исследований UK1, Scotland1, VQ58, CCFR1 и CCFR2 составляли 1,02, 1,01, 1,01, 1,02 и 1,03 соответственно (дополнительный рисунок 1). Любые этнические выбросы или лица, идентифицированные как родственники, были исключены (дополнительный рисунок 2).

После процедур контроля качества шесть GWAS предоставили данные о 7 577 случаях CRC и 9 979 случаях контроля. Чтобы максимизировать перспективы выявления новых вариантов риска, мы вменяли более 10 миллионов вариантов, используя данные пилотного проекта «1000 геномов» в качестве контрольной панели. Графики QQ для всех вариантов после вменения не показали доказательств существенного чрезмерного разброса, вызванного вменением (дополнительный рисунок 1).

Мета-анализ

Ассоциации для всех 23 установленных европейских SNP риска CRC показали направление эффекта, согласующееся с ранее опубликованными исследованиями, при этом восемь локусов имели значение PP-значения вдиапазоне от 3,64 × 10 -2 до 1,71 × 10 -3; дополнительная таблица 3); тем самым обеспечивая поддержку трансэтнических эффектов.

Полногеномные значения P(–log 10 P, y-ось) нанесены на график в зависимости от их соответствующих хромосомных положений ( x-ось).

Известные области, имеющие значение для всего генома ( т. Е. P= 5,0 × 10 -8), помечены с указанием их хромосомного положения. Варианты, выделенные серым цветом, находятся в новых регионах, которые достигают порогового уровня значимости ( P= 1,0 × 10 -7), необходимого для вариантов, которые будут проанализированы в дальнейшем в этом исследовании. Варианты, выделенные черным цветом, относятся к новым областям, имеющим значение для всего генома.

Исключая SNP (включая те, которые коррелируют с r2>0,8), отображаемые в локусах риска, пять вариантов в различных областях неравновесия по сцеплению (LD) были связаны с CRC при P

Мы оценили точность вменения в 200 случаях в Великобритании, сравнив вмененные генотипы с генотипами, полученными путем секвенирования. Для трех распространенных вариантов (MAF>0,05), rs72647484, rs16941835 и rs10904849, каждый из которых имел баллы вмененной информации>0,9, была высокая корреляция между вмененным и прямым типизированным генотипом (r 2 = 0,98, 1,00 и 0,99, соответственно). Для редкого варианта rs79900961 (MAF = 0,016) корреляция была плохой (r 2 = 0,60). Частота обнаружения редкого Indel на хромосоме 5q15 (rs202110856) в данных секвенирования составила всего 71%, и обе предполагаемые гетерозиготы были секвенированы как гомозиготные эталоны. Таким образом, дальнейшему анализу были подвергнуты только три распространенных варианта 1p36.12, 10p13 и 16q24.1.

В объединенном анализе шести наборов данных GWAS, rs72647484, который отображается на хромосоме 1p36.12 (22 587 728 бит / с; NCBI build 37), показал наиболее убедительные доказательства связи с CRC ( P= 1,21 × 10 -8; Phet = 0,33, I2 = 14%; рис. 2а). rs72647484 картирует внутри блока LD размером 300 т.п.н., охватывающего WNT4(семейство сайтов интеграции mmtvбескрылого типа, член 4; MIM 603490) и CDC42(цикл клеточного деления 42, MIM 116952; фиг. 3a). Вторую по силе ассоциацию предоставил rs16941835 ( P= 5.06 × 10 −8; Phet = 0.40, I2 = 3%; Рис. 2c), которая располагается на длинной некодирующей РНК (lncRNA) RP11-58A18.1 на хромосоме 16q24.1 (86 659 720 п.н.; NCBI build 37) в области LD 65 т.п.н. (рис. 3c). Ближайший кодирующий ген,

На расстоянии 500 т.п.н. находится фактор транскрипции FOXL1.Третью по силе ассоциацию предоставил rs10904849 ( P= 7,01 × 10 -8; Phet = 0,83, I2 = 0%; рис. 2b), который локализуется в хромосоме 10p13 (16 997 266 п.н.; NCBI build 37) в интроне 31 ген, кодирующий кубулин ( CUBN; псевдоним рецептор внутреннего фактора кобаламина [IFCR], MIM 602997; рис. 3b).

Лесной график отношений шансов для связи между rs72647484, rs16941835, rs10904849 и CRC.

Исследования были взвешены в соответствии с обратной дисперсией логарифма OR, рассчитанного с помощью безусловной логистической регрессии. Горизонтальные линии:95% доверительный интервал (95% ДИ). Рамка:ИЛИ точечная оценка; его площадь пропорциональна весу исследования. Ромб (и пунктирная линия):общая сводная оценка с доверительным интервалом, заданным его шириной. Непрерывная вертикальная линия:нулевое значение (ИЛИ = 1.0).

Региональный график результатов ассоциации и скорости рекомбинации для (а) 1p36.12, (b) 10p13 и (c) 16q24.1 локусов риска.Результаты ассоциации как генотипированных (треугольники), так и вмененных (кружки) SNP в образцах GWAS и скорости рекомбинации в локусах в 1p36.12 ( a), 10p13 ( b) и 16q24 ( c). Для каждого графика показаны значения −log 10 P( ось y) SNP в соответствии с их положениями в хромосомах ( ось x). Самый верхний условный SNP в каждом комбинированном анализе показан в виде большого треугольника и помечен его rsID. Интенсивность цвета каждого символа отражает степень LD с верхним SNP: от белого ( r2 = 0) до темно-красного (r2 = 1,0), причем r2 оценивается по данным фазы 1 1000 Genomes. Скорости генетической рекомбинации (cM / Mb) показаны голубой линией. Физическое положение основано на NCBI build 37 генома человека. Также показаны относительные положения генов и транскриптов, отображаемые в каждой области ассоциации. На нижней панели показан трек сегментации состояния хроматина (ChromHMM).

Биоинформатический анализ вариантов риска

Чтобы получить представление о биологической основе ассоциаций, мы проанализировали общедоступные данные по экспрессии RNA-seq и SNP из TCGA по 223 случаям рака толстой кишки и 75 рака прямой кишки, используя rs10904850 и rs2744753 в качестве заместителей для rs10904849 (r 2 = 0,97; D '= 1,00) и rs72647484 (r 2 = 0,64; D '= 0,89) соответственно. После корректировки для множественного тестирования не было обнаружено значимых ассоциаций между генотипом SNP и экспрессией генов, отображаемых в любом из трех локусов риска (дополнительная таблица 4).

Мы проверили, лежат ли какие-либо SNP или их прокси (т.е. r2>0,8 в контрольной панели CEU 1000 геномов) в предполагаемых элементах связывания / энхансера фактора транскрипции, и рассчитали баллы GERP и PhastCons для оценки сохранения последовательности в этих положениях (дополнительная таблица 5) .

rs16941835 сопоставляется с регуляторным признаком с модификацией гистона, указывающей на энхансерный элемент. rs10904852, в LD с rs10904849 (r 2 = 0,95, D'= 1,00) сохраняется (баллы GERP и PhastCons 1,20 и 0,47 соответственно) с баллом CADD 11,53. Умеренная оценка CADD (8,21) была связана с rs7267484 (22 590 125 п.н.), что является сильной LD с rs72647489 (r 2 = 0,93, D'= 1,00). Шесть прокси-SNP в LD с rs16941835 показали некоторые доказательства связывания фактора транскрипции (дополнительная таблица 5). Мы использовали данные TCGA исследовать частоту соматической мутации CDC42, Wnt4, FOXL1или CUBNв CRC. Ни один из этих генов не обнаружил существенных соматических мутаций. Затем мы провели анализ путей, чтобы определить, действуют ли какие-либо гены, отображающие три недавно идентифицированных региона, в путях, уже избыточно представленных в GWAS. Пути, содержащие три или более генов, показаны в дополнительной таблице 6. Хотя этот анализ идентифицирует путь передачи сигналов BMP, как и ожидалось, никакие каталогизированные пути, включающие картирование генов в любой из вновь идентифицированных областей, выявлены не были.

Все более широко признается, что некоторые генетические варианты могут иметь плейотропные эффекты, влияя на риск более чем одного типа рака. Чтобы изучить возможность того, что rs72647484, rs10904849 или rs16941835 влияют на риск других злокачественных новообразований, мы исследовали связь с раком легких 47, острым лимфобластным лейкозом 48, множественной миеломой 49, глиомой 50 и менингиомой 51, используя данные из ранее опубликованных GWAS. Однако для этих видов рака не было доказательств того, что rs72647484, rs10904849 или rs16941835 (или коррелированный SNP r 2 ≥ 0,8) связаны с риском опухоли ( т.е. P>0,05).

Наконец, была оценена взаимосвязь между клинико-патологическими переменными (пол, возраст на момент постановки диагноза, семейный анамнез CRC, стадия опухоли или микросателлитная нестабильность (MSI), KRAS-мутантный статус и BRAF-мутантный статус) и генотипом по rs72647484, rs10904849 и rs16941835. логистической регрессией только для случая (дополнительная таблица 7). Были доказательства взаимосвязи между rs72647484 и статусом мутанта KRAS( P= 0,03) с аллелем риска T, ассоциированным с CRC-мутантом KRAS; однако этот результат не был значительным после учета нескольких тестов. Ни один из других SNP не показал никакой связи с какими-либо изученными клинико-патологическими переменными ( т. Е. P>0,05).

Обсуждение

Мы предоставили доказательства, подтверждающие существование новых локусов восприимчивости для CRC в 1p36.12, 10p13 и 16q24.1. Связь 1p36.12 предполагает, что WNT4и / или CDC42являются возможными детерминаторами риска CRC. WNT4является частью семейства структурно родственных генов, которые кодируют богатые цистеином секретируемые гликопротеины, которые действуют как внеклеточные сигнальные факторы. WNT4, WNT14 и WNT16 могут играть избыточные роли в передаче сигналов через CTNNB1-опосредованный канонический путь Wnt 52, который, как известно, играет центральную роль в колоректальном онкогенезе. Кроме того, передача сигналов WNT4, по-видимому, играет ключевую роль во время органогенеза, действуя как аутоиндуктор перехода от мезенхимы к эпителию. Инактивация мутаций зародышевой линии в WNT4вызывают аплазию мюллера и гиперандрогенизм (MIM 158330) и ответственны за аутосомно-рецессивный синдром SERKAL (изменение пола и дисгенезия почек, надпочечников и легких; MIM 611812). Априоридисфункция либо Wnt4или CDC42может быть биологической основой ассоциации 1p36.12. Cdc42 является Ras-связанным GTP-связывающим белком, который играет роль в установлении клеточной полярности, регуляции клеточной морфологии, подвижности и прогрессии клеточного цикла в клетках млекопитающих и злокачественной трансформации 53. Примечательно, что Cdc42 регулирует актиновый цитоскелет посредством активации белков WASP и клеточной полярности посредством GSK3-бета и APC. Передача сигналов Rho-GTPase документально подтверждена ролью в развитии CRC 54. Активация Rho GTPase Cdc42 способствует адгезии и инвазии в CRC 55, а нацеливание на Cdc42 с помощью AZA197 подавляет рост первичного рака толстой кишки и продлевает выживаемость в модели ксенотрансплантата посредством понижающей регуляции PAK156.

Поскольку rs10904849 является интронным по отношениюк CUBN,а область LD не включает какие-либо другие гены или транскрипты, существует высокая вероятность того, что функциональная основа ассоциации 10p13 опосредуется через CUBN. Кубилин является кишечным рецептором эндоцитоза внутреннего фактора витамина B12 и рецептором эпителиального метаболизма апоА-I / ЛПВП 57. Кроме того, cubilin является важным корецептором в пути эндоцитов для извлечения комплексов 25 (OH) D3-DBP посредством мегалин-опосредованного эндоцитоза в почках 58. Мутации зародышевойлинии в CUBNвызывают рецессивную мегалобластную анемию-1 (MGA1; MIM 261100). Вполне возможно, что общая генетическая изменчивость в CUBN, будучи недостаточной для того, чтобы вызвать «фенотип типа MGA», будет иметь физиологические эффекты в силу длительного воздействия на клеточную биодоступность B12. Хотя это полностью спекулятивно, поскольку эпидемиологические исследования еще не убедительно установили уровни B12 как фактора риска для CRC 59,60, его роль в биосинтезе ДНК делает генетически детерминированные вариации в доступности B12 вероятным кандидатом на роль в развитии CRC. .

LncRNA являются регуляторами транскрипции и все чаще признаются как играющие роль в биологии рака. Хотя в настоящее время нет доказательств причастности днРНК RP11-58A18.1 к CRC, днРНК CCAT1 и CCAT2, вероятно, действительно играют такие роли 61,62, и вполне вероятно, что влияние вариации 16q24.1 на риск опосредуется аналогичными эффекты дальнего действия.

Одна из причин невозможности идентифицировать эти CRC-локусы ранее заключается в том, что, помимо проблемы мощности исследования, они не были оптимально помечены SNP, представленными во многих коммерческих массивах. Мощность нашего исследования по выявлению основных общих локусов, дающих риск 1,2 или выше (например, вариант 18q24), была высокой. Следовательно, очень маловероятно наличие дополнительных SNP CRC с аналогичными эффектами для аллелей с частотами>0,2 в популяциях европейского происхождения.

В этом исследовании мы рассмотрели только SNP, демонстрирующие связь с установленным порогом P-значения Pчуть выше этого порога, которые также могут потребовать дальнейшего изучения (рис. 1). Следовательно, дальнейшие усилия по расширению масштаба мета-анализа GWAS с точки зрения как размера выборки, так и охвата SNP, а также увеличения количества SNP, используемых для крупномасштабной репликации, могут выявить дополнительные варианты CRC.

В заключение, мы предоставили доказательства трех новых локусов восприимчивости к CRC. Наши данные также предоставляют дополнительные доказательства ценности метаанализа и ценности вменения как средства улучшения обнаружения новых локусов риска, тем самым расширяя полезность данных GWAS.

Дополнительная информация

Как цитировать эту статью: Al-Tassan, NA et al.Новый GWAS и метаанализ с вменением 1000Genomes идентифицируют новые варианты риска колоректального рака. Sci. Rep.5, 10442; DOI: 10.1038 / srep10442 (2015).

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!