ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Генетические детерминанты ответа на коронавирусную инфекцию COVID-19
Центр стратегического планирования и управления медико-биологическими рисками здоровью, Москва, Россия
Возникшая в конце декабря 2019 года новая инфекция, вызванная коронавирусом SARS-CoV-2, стала одним из серьёзных вызовов человечеству в 21 веке. С середины февраля 2020 года инфекция начала стремительно распространяться по всему миру, и уже в марте ВОЗ объявила о новой пандемии коронавирусной инфекции COVID-19. В июле, на момент написания статьи, подтверждено более 13 миллионов случаев инфекции, из которых более полумиллиона были летальными.
Возбудителем COVID-19 является новый коронавирус SARS-CoV-2, относящийся к бета-коронавирусам, к которым также относится вирус SARS-CoV, вызвавший в 2002 году вспышку коронавирусной инфекции с атипичной пневмонией и тяжелым острым респираторным синдромом (ТОРС).
Высокая контагиозность и тропность к тканям легких делают SARS-CoV-2 опасным патогеном. Кроме того, вирус способен повреждать другие ткани и органы (сосуды, почки, центральную нервную систему, кишечник). Одной из особенностей коронавирусной инфекции является высокая полиморфность течения заболевания: от бессимптомного до крайне тяжелого, сопровождаемого развитием полиорганной недостаточности. Можно предположить, что клиническая картина COVID-19 в каждом конкретном случае обусловлена генетическими особенностями как пациента, так и вируса, что и определяет характер их взаимодействия. Выявление таких особенностей позволит разработать модель для стратификации рисков развития осложнений COVID-19 и послужит основой для разработки средств персонализированной профилактики и терапии инфекции, вызванной SARS-CoV-2.
1. Структура генома SARS-CoV-2
SARS-CoV-2 относиться к коронавирусам имеет длину генома 30 тысяч нуклеотидов. Данный вирус, в отличие от других высокопатогенных коронавирусов SARS-CoV и MERS-CoV, вызывающих тяжелые инфекции у людей, обладает более высокой контагиозностью. Происхождение вируса до сих пор остаётся не выясненным однозначно. Сравнительный анализ данных показал, что SARS-CoV-2 мог появиться в результате рекомбинации коронавируса панголинов pangolin-CoV и вируса летучих мышей bat-CoV-RaTG13 [1]. Рецептор-связывающий домен поверхностного S-белка pangolin-CoV имеет высокое сходство с SARS-CoV-2: 6 основных позиций, ответственных за связывание основного клеточного рецептора вируса, идентичны. Новый вирус имеет отличную от SARS-CoV первичную аминокислотную последовательность рецептор-связывающего домена, в связи с чем аффинность связывания рецептора S-белка SARS-CoV-2 в 10 раз сильнее чем у S-белка SARS-CoV [2].
2. Жизненный цикл SARS-CoV-2
Для проникновения в клетки SARS-CoV-2 использует ряд клеточных рецепторов. Основным рецептором вируса SARS-CoV-2 является ангиотензинпревращающий фермент 2 (ACE2) [3]. Помимо основного рецептора, вирус может использовать в качестве дополнительных рецепторов и другие клеточные белки, такие как CD147 и GRP78. Для эффективного проникновения в клетки поверхностный белок S вируса SARS-CoV-2 должен протеолитически активироваться с помощью клеточных протеаз: фурина и мембранно-связанной протеазы TMPRSS2 [4].
Кроме этого, SARS-CoV-2 может использовать и альтернативный путь проникновения в клетку - через эндосомы, в котором принимает участие протеаза Cathepsin L [5]. Проникнув внутрь клетки вирус перепрограммирует биосинтетический аппарат клетки для своих нужд, используя при этом различные клеточные белки, формируя интерактом (совокупность взаимодействующих между собой биомолекул) вирусных белков и РНК с клеточными факторами [6].
3. Полиморфизмы в геноме SARS-CoV-2 и их влияние на биологические свойства вируса
C начала секвенирования первого генома SARS-CoV-2 и по настоящее время были получены десятки тысяч последовательностей полных геномов SARS-CoV-2 из разных регионов мира. Информация о новых секвенированных изолятов SARS-CoV-2 депонируется в международную базу данных GISAID (https://www.gisaid.org/), в которой на середину июля содержится более 63000 последовательностей полных геномов SARS-COV-2.
На основании различий в нуклеотидных последовательностях вирусов, циркулировавших в конце 2019 –начале 2020 года, были выделены 2 две основные филогенетические клады. Клада I состояла из субклад, которые характеризовались аминокислотными заменами в белках ORF3a: p.251G>V или S: p.614D>G. Клада II отличалась от клады I присутствием следующих мутаций: замена в белке ORF8: p.84L>S (28144T>C) и белке ORF1ab: p.2839S (8782C>T) [7].
Описанная в феврале мутация в S белке с заменой аспартата в позиции 614 на глицин (614G), относящаяся к кладе I, по мере накопления данных стала привлекать всё большее внимание. Распространение данного варианта вируса имело взрывоподобный характер в Италии в 20-х числах февраля. В настоящее время вирусы, несущие мутацию G614 широко распространены по всему миру. Если в марте эта замена встречалась в вирусных геномах с частотой 26%, то в апреле ее частота выросла до 65%, а в мае уже до 70%. Такая мутация может быть связана с большей вирусной нагрузкой у пациентов, инфицированных вирусом с данной мутацией, что делает вирус более контагиозным. В настоящее время роль G614 варианта и его детальные биологические свойства, в том числе и вирулентность активно изучаются [8].
За время пандемии были описаны различные полиморфизмы как в структурных, так и неструктурных белках, которые потенциально могут влиять на биологические свойства вируса. Например, полиморфизм в нуклеокапсидном белке в 203 и в 204 позициях (R203K/G204R) может снижать связывание антигенных пептидов с HLA-C*07, преобладающего у европейского населения [9]. Имеются данные, что мутация N501T в S белке SARS-CoV-2 может значительно усиливать связывание с ACE2 [10]. Основываясь на 10 наиболее чаще всего встречающихся мутациях (частота встречаемости мутации более 5%), SARS-CoV-2 геномы можно разделить на несколько основных групп:
- Группа 1 содержит миссенс мутацию (ORF8:c.251tTa>tCa; и синонимичную мутацию (orf1ab:c.8517agC>agT).
- Группа 2 содержит 3 мутации, включая миссенс вариант в S-белке (c.1841gAt>gGt), генный вариант в ORF1AB и синонимичный вариант ORF1AB: c.2772ttC>ttT.
- Группа 3 содержит нуклеотидную замену (orf1ab:c.10818ttG>ttT).
- Группа 4 содержит новую миссенс мутацию (ORF3a:c.752gGt>gTt) впервые обнаруженную в Китае.
Изоляты из Франции и других стран содержат мутации в ORF3a: c.752gGt>gTt, а также часто содержат мутацию в S гене :c.1099Gtc>Ttc [11]. К настоящему времени описаны сотни полиморфизмов генов SARS-CoV-2 и это описание продолжается. Все это может свидетельствовать о непрерывном процессах эволюции и адаптации вируса к условиям нового организма-хозяина.
4. Плейотропность проявления инфекции COVID-19 связана с индивидуальными особенностями генома человека
Одной из основных особенностей COVID-19 инфекции является большая полиморфность в клиническом проявлении болезни: от бессимптомного течения до тяжелого острого респираторного дистресс- синдрома (ОРДС) и полиорганных повреждений. Такое разнообразие проявлений болезни трудно объяснить вариабельностью вируса, учитывая его незначительную, по сравнению с другими РНК-вирусами, генетическую изменчивость. Было проведено большое количество исследований, посвященных выявлению клеточных факторов, необходимых для осуществления жизненного цикла вируса, в особенности его проникновения в клетку. К примеру, были проведены исследования на уровне единичных клеток паттернов экспрессии рецепторов ACE2 и TMPRSS2 в различных тканях и органах, показавшие, что, помимо клеток респираторного эпителия и легких, данные рецепторы могут экспрессироваться в кишечном эпителии, кардиомиоцитах, гепатоцитах и нейронах [12]. По всей видимости, индивидуальные паттерны экспрессии данных рецепторов в различных тканях и органах могут определять характер протекания COVID-19.
Множество других факторов, таких как сопутствующие заболевания и воздействие внешней среды, могут определять тяжесть течения COVID-19. При этом существует гипотеза, что основополагающую роль в чувствительности к вирусу играют генетические детерминанты, представляющие собой набор генных вариантов, формирующих ответ организма на инфицирование SARS-CoV-2.
5. Генетические детерминанты чувствительности к COVID-19
Важным фактором чувствительности организма к коронавирусу является экспрессия рецепторов и клеточных факторов, необходимых для реализации основных этапов жизненного цикла вируса. Для эффективного проникновения в клетки-мишени вирусу необходимо совместное присутствие рецептора и корецепторов, тем самым ко-экспрессия основных ACE2 и TMPRSS2 может определять клетки-мишени для коронавируса. Ряд работ с использованием scRNA показали, что различные паттерны коэкспрессии ACE2 и TMPRSS2 наблюдаются в различных клетках, тканях и органах организма человека, что может объяснять гетерогенность клинического проявления COVID-19 инфекции, когда помимо легких, в патогенез инфекции также вовлекаются и другие органы: печень, почки, кишечник, сосуды, миокард и мозг [13, 14].
В нормальных клетках уровни экспрессии ACE2 и TMRSS2 незначительны, однако, при патологиях легких, а также под воздействием поллютантов и токсических веществ их экспрессия обычно повышена. Чувствительность таких клеток к вирусной инфекции выше, чем у здоровых клеток, что и может объяснять больший процент инфицирования и более тяжелое течение инфекции у людей с сопутствующими патологиями.
Еще одним важным свойством вируса является его способность инфицировать клетки иммунной системы и вызывать иммунодефицитные состояния [15]. Вариации состава генных аллелей, влияющих на структуру кодируемых данными генами белков, а также варианты в некодирующих участках, выполняющих регуляторные функции, влияют на экспрессию, а также могут определять ответ организма на вирусную инфекцию и влиять на степень тяжести течения инфекции.
Для поиска таких факторов были созданы международные консорциумы, аккумулирующие информацию о генетической основе ответа организма на SARS-CoV-2, к которым относятся:
- COVID-19 Host Genetics Initiative [16],
- COVID-19 Genomics UK (COG-UK) Consortium [17] и др.
Наиболее вероятные гены и их аллельные варианты, связанные с чувствительностью и тяжестью течения COVID-19 приведены в таблица.
Варианты гена ACE2 и чувствительность к SARS-CoV-2
Носители разных аллельных вариантов в кодирующей части гена ACE2, могут по-разному связывать поверхностный S белок вируса, например, аллели rs73635825 (S19P) и rs143936283 (E329G) показывают значительные различия в способности связывать S белок SARS-CoV-2 [17]. Были показаны как «вредные» аллели гена ACE2, которые обладают повышенной способностью к связыванию вирусного S белка: S19P, I21V, E23K, K26R, T27A, N64K, T92I, Q102P и H378R, так и «защитные» ACE2 варианты: K31R, N33I, H34R, E35K, E37K, D38V, Y50F, N51S, M62V, K68E, F72V, Y83H, G326E, G352V, D355N, Q388L и D509Y, которые слабее могут снижать эффективность связывания S белка SARS-CoV-2 с рецептором [18]. При исследовании итальянской популяции были выявлены редкие «защитные» миссенс варианты гена ACE2: p.Asn720Asp, p.Lys26Arg, p.Gly211Arg (MAF 0.002 to 0.015), которые могут интерферировать со связыванием S белка вируса. При этом следует помнить, что недавно проведенный анализ 1000 геномов из UK Biobank не выявил ассоциацией между тяжестью течения COVID-19 и вариантами генов ACE2 и TMPRSS2 [19].
Варианты гена TMPRSS2и чувствительность к SARS-CoV-2
Клеточная протеаза TMPRSS2 необходима для протеолитической активации S белка SARS-CoV-2 с целью последующего проникновения в клетку-мишень. Дифференциальная экспрессия TMPRSS2 может определять тканевую специфичность взаимодействия вирус-хозяин и играет ключевую роль в восприимчивости к вирусной инфекции.
Так, легочно-специфические генные варианты локусов, влияющих на профили экспрессии (eQTL), связанных с экспрессией TMPRSS2, могут определять различную чувствительность и ответ на SARS-CoV-2 инфекцию. Было показано, что eQTL вариант rs35074065 ассоциирован с высокой экспрессией TMPRSS2 и с низкой экспрессией интерферон-индуцибельного гена MX1 [20]. Ряд аллелей с повышенной экспрессией TMPRSS2, например (rs2070788, rs9974589, rs7364083), часто встречаются в европейской популяции [21]. Встречающийся чаще других в европейской популяции eQTL (rs8134378), локализующийся в районе андроген-зависимого энхансера TMPRSS2 может быть связан с повышенной экспрессией TMPRSS2 у мужчин [22]. Несмотря на предсказанные ассоциации между аллельными вариантами ACE2 и TMPRSS2, недавно опубликованное исследование не подтвердило ассоциаций между ними и чувствительностью к COVID-19 [23].
HLA и особенности иммунного ответа, иммунодеплеция при коронавирусной инфекции
Известно, что способность связывать и презентировать антигены является ключевым моментом для выработки эффективного иммунного ответа. Разные молекулы MHC (HLA молекулы) способны по-разному связывать антигенные пептиды вирусных белков, генерируемые во время инфекции. Этим можно объяснить отличие в способности развивать иммунный ответ у разных индивидуумов.
Носители HLA-B*46:01 варианта могут связывать минимальное количество предсказанных пептидов SARS -CoV-2, делая их наиболее чувствительными к COVID-19 инфекции. Например, было показано, что у носителей этого генотипа SARS-CoV имеет более тяжелое течение [24]. Среди аллелей HLA первого типа HLA -A*02:02, HLA -B*15:03 и HLA -C*12:03 обладают максимальным спектром связывания консервативных антигенных пептидов SARS-CoV-2. Напротив, A*25:01, B*46:01, 150 C*01:02 HLA -A, -B, и -C аллели способны связывать минимальный спектр антигенных пептидов.
Важно отметить, что при генерации антигенных пептидов 8-13 а.а. - 44 пептида имеют высокую степень консервативности и присущи всем коронавирусам, включая сезонные коронавирусы человека OC43, HKU1, NL63, и 229E [24].
6. Генетические детерминанты в генах, связанных с тяжестью течения COVID-19 и коморбидностью
Как уже упоминалось выше гетерогенность проявления COVID-19 может быть связана с различиями в аллельных вариантах генов, которые напрямую не нужны вирусу для реализации своей жизненной стратегии. Недавнее исследование GWAS по поиску ассоциаций между генами и тяжестью течения у пациентов с COVID-19 из Италии и Испании показало, что существуют геномные локусы, ассоциированные которыми геномные варианты, могут дискриминировать пациентов по тяжести течения. Одним из таких локусов является локус 3p21.31, включающий в себя гены (SLC6A20, LZTFL1, CCR9, FYCO1, CXCR6, и XCR1). Гены, располагающиеся в локусе 3p21.31 связаны с хемокинами и хемотакисом клеток иммунной системы в очаги воспаления. Важно отметить, что расположенный в данном локусе ген SLC6A20, физически и функционально взаимодействует с ACE2 и может модулировать его рецепторные свойства. Второй из выявленных локусов - локус 9q34 относится к наследованию групповых антигенов крови AB0 [26]. Ранее была показана ассоциация между тяжестью течения COVID-19 и аллелями rs8176747, rs41302905, и rs8176719, определяющими группы крови в китайской популяции. Было показано, что носители первой группы крови защищены от развития тяжёлого течения, и наоборот люди со второй группой крови более подвержены тяжелому течению COVID-19 [27].
Варианты генов, связанные с воспалительным ответом
При COVID-19 развитие патологического воспалительного ответа и синдрома «цитокиновго шторма» зависит от комплексного вклада факторов организма. Это подтверждается недавним исследованием аутопсийного материала от пациентов умерших от COVID-19 инфекции, которое показало, что основной причиной смерти от COVID-19 является патологическая воспалительная реакция [34].
Одним из основных проявлений пневмонии является повышение уровней провоспалительных цитокинов (ИЛ-6, TNF-alpha и IL1-beta) и белков острой фазы (СРБ). Аллельные варианты в генах, связанных с воспалительным ответом, могут влиять на тяжесть течения заболевания. Для IL-6 было показано, что у пациентов с тяжелым течением выявляется корреляция с аллелью IL-6-174C, которая связана с повышенными уровнями ИЛ-6 и тяжестью протекания пневмоний [28]. Полиморфизм в гене С3, кодирующим C3 компонент системы комплемента, наряду с аллельным вариантом гена ACE1, также может определять тяжесть течения COVID-19 [29].
Ряд частот однонуклеотидных полиморфизмов (SNPs) могут отличаться у различных этносов, что также может быть ассоциировано с различной чувствительностью и тяжестью течения инфекции COVID-19. Например делеция в 32 нуклеотиде в гене CCR5 ассоциирована с тяжестью течения COVID-19 у пациентов европейского происхождения [30]. Исследования профилей экспрессии генов в зараженных вирусом клетках легких выявили ряд генов, связанных с моноцитами CSF2 (colonystimulating factor 2), провосполительными каскадами и кальций-связывающими белками S100A8 и S100A9[31].
Варианты генов, связанные с системой коагуляции крови
Значительное распространение нарушения процессов коагуляции у больных COVID-19 может быть связано с особенностями генов, вовлеченных в процессы коагуляции. Повышенный уровень плазмина и плазминогена в крови, которые могут ускорять протеолитическую активацию S белка коронавируса также ассоциированы с повышенной чувствительностью к развитию COVID-19 инфекции [32].
Варианты генов, связанные с противовирусным ответом
При взаимодействии вируса с клеткой происходит активация специфического ответа, через активацию сенсоров вирусных РНК, что приводит к активации синтеза интерферонов. Секретируемые интерфероны посредством рецепторов запускают специальную программу активации интерферон-стимулруемых генов (ISG генов). Это приводит к формированию устойчивости к вирусной инфекции. Более сотни факторов участвуют в реализации данного ответа - это и сенсоры RIG-I, MDA5, MAVS, STING, cGAS, TLR3, TLR9, TRIM25, RNF166, и эффекторы IFNa, IFNb, IFNlambda, OAS1, MX1 и IFITM3. Роль аллельных вариантов этих генов в настоящее время не изучена. Единственное, что было показано, что вариант rs12252 в гене IFITM3 может быть связан с повышенным уровнем воспалительного ответа и тяжестью проявления COVID-19 у носителей этого варианта [33].
Заключение
Масштабные исследования ассоциации геномных локусов, запущенные международными консорциумами, являются важными шагами для понимания молекулярного патогенеза новой коронавирусной инфекции. Увеличение выборок исследуемых пациентов, а также анализ различных этносов позволит определить уникальные редкие варианты аллелей, определяющих чувствительность к COVID-19 инфекции. Реконструирование интегрального вклада аллельных вариантов в сложные генные сети ответа на вирусную инфекцию может пролить свет на особенности патогенеза COVID-19 и составить предиктивную шкалу генетического риска, определяющую вероятность развития осложнённого течения инфекции.