В рамках проекта планируется проведение генетической характеризацииметодом секвенирования вариантовSARS-CoV-2,вызвавших тяжелые последствия у пациентов из Казахстана. Будет исследовано изменение распространенности важных однонуклеотидных полиморфизмоввируса в популяции казахстанцев по мере развития эпидемии.Будет проведен скрининг субгеномных РНК вируса на различных этапах развития болезни нескольких пациентов. Также в рамках проекта будут клонированы открытые рамки считывания полипептидов SARS-CoV-2, являющихся наиболее перспективными мишенями для целей диагностики и разработки вакцин. Клонированные кДНК будут экспрессированы в бактериях, а синтезированные рекомбинантные белки – выделены и очищены. Полученные результаты послужат базой для создания отечественных тест-систем на основе ПЦР и ИФА, предназначенных для диагностики, типирования и прогностикиCOVID-19.
Вариабельность генома SARS-CoV-2 может в скором времени негативно сказаться на эффективности разрабатываемых к этому вирусу вакцин и средств диагностики. Поэтому необходимо постоянно отслеживать, какие генетические варианты вируса циркулируют в различных популяциях людей, чтобы поддерживать систему контроля заболевания на высоком уровне.Существует несколько подходов для оценки генетической вариабельности геномов вирусов.
Первый подход основан на считывании всего вирусного генома и дальнейшем анализеполногеномных библиотек. Данный подход позволяет быстро выявить наиболее часто встречаемые полиморфизмы. Полногеномное секвенирование – высоко затратный и сложный метод анализа; в последнее время он обычно проводится на секвенаторах нового поколения (NGS) [19, 21].
Второй подход предусматривает частичное секвенирование наиболее важных участков вирусного генома. Этот подход позволяет существенно сэкономить ресурсы и сосредоточиться только на наиболее информативных участках генома. Исследователи изменчивости SARS-CoV-2 в качестве главной мишени обычно выбирают ген белка S (являющийся высоко вариабельным): именно на S-белок SARS-CoV-2 вырабатывается больше всего вируснейтрализующих антител [23, 24], азамены в главном поверхностном белке коронавирусов могут повлиять на его связывание антителами. Важно, что на основе белкаS и его отдельных участков разрабатывается больше всего кандидатныхсубъединичных и векторных рекомбинантных вакцин [22]. Помимо белка Sиммунодоминантнымиу сарбековирусовявляются структурные белки M и N: эти три белка содержат наибольшее число эпитопов для презентации MHCI и MHCII [25-26]. Нуклеокапсидный белок Nявляется наиболее иммунодоминантным и наиболее консервативным из трех этих белков. К тому же, он не подвержен гликозилированию. Эти его характеристики делают его удобной мишенью для создания тест-наборов на основе ИФА для детекции SARS-CoV-2. Часто именно ген белка N выбирается в качестве мишени для детекции РНК SARS-CoV-2посредством ПЦР [27-29] из-за его консервативности и наивысшей копийности в сравнении с другими коронавирусными генами (вследствие 3′-концевой дислокации N-гена в гРНК, он присутствует и во всех сгРНК вируса) [30].
Третий подход генетической характеризации геномов SARS-CoV-2 подразумевает выявление в популяции людей конкретных, уже установленных полиморфизмов (чаще однонуклеотидных, SNP) с использованием быстрых, удобных для анализа методов на основе ПЦР или гибридизации нуклеиновых кислот.
В настоящем проекте планируется использовать все три вышеуказанных подхода для генетической характеризации генотипов SARS-CoV-2, циркулирующих на территории Казахстана. Полногеномное секвенирование для ограниченного количества образцов планируется выполнить с использованием платформы MinION (OxfordNanoporeTechnologies). Частичное (таргетное) секвенирование методом Сэнгера планируется провести для образцов, выделенных у пациентов с наиболее тяжёлыми клиническими проявлениями, включая смертельные исходы. Точечные SNP (такие как 241C/T и 23403A/G) будут определяться на большом количестве ПЦР-положительных образцов. Новизна исследования заключается, прежде всего, в том, что будут анализироваться образцы, полученные от казахстанцев.
В рамках предлагаемого проекта планируется анализировать не только генетические, но и субгенетические характеристики коронавируса. Поскольку активная репликация вируса и наработка сгРНК коронавирусов наблюдается в основном на стадии виремии, было высказано предположение, что сгРНКSARS-CoV-2 можно использовать в качестве маркера, позволяющего установить стадию коронавирусной инфекции [31]. Во время вспышек COVID-19 стационары зачастую переполнены, а остаточные количества РНК коронавируса могут долго оставаться в организме человека и давать положительный ответ по ПЦР, даже если в организме пациента активноначинает функционировать специфический Т- и В-клеточный иммунный ответ и размножение вирусапрекращается, что минимизирует шанс заражать других людей. Поэтому этот тип биомаркеров мог бы оказать неоценимую помощь медицинским работникам, занятым в контроле новой инфекции для дифференциации особо инфекционных пациентов от выздоравливающих людей с низким инфекционным потенциалом. В то же время, есть указания на то, что сгРНК нового коронавируса могут быть ассоциированы с клеточной мембраной клеток, что делает их более стабильными, чем считалось ранее [32]. В рамках проекта планируется проверить обоснованность использования в качестве биомаркера для определения стадии коронавирусной инфекции различные субгеномные РНК, чтобы определить целесообразность разработки отечественной тест-системы по выявлению сгРНК SARS-CoV-2. В ходе данного исследования также планируется использовать праймеры и пробы собственной разработки, при этом детектировать не одну, а несколько различных сгРНК. Проведенные в рамках проекта исследования станут фундаментом для разработки различных отечественных тест-систем на основе ПЦР и ИФА для детекции и(или) прогностики COVID-19.
Провести популяционные исследования в отношении генотипов SARS-CoV-2, циркулировавших в Казахстане во время пандемии 2020 г.,анализ их субгеномных характеристик и получить рекомбинантные белки SARS-CoV-2 для выработки научно-обоснованных подходов к диагностике COVID-19.
В ходе реализации проекта будут получены следующие прямые научные результаты:
— ДНК-конструкции, содержащие фрагменты геномов отечественных генотипов SARS-CoV-2;
— линии экспрессионных штаммов E. coli, экспрессирующие целевые кДНК-гены SARS-CoV-2;
— очищенные рекомбинантные белки SARS-CoV-2;
— новые праймеры и флуоресцентно меченые зонды для типирования SARS-CoV-2 и детекции его субгеномных РНК.
Полученные в ходе реализации проекта результаты позволят определить, какие отечественные тест-системы стоит разрабатывать для повышения эффективности диагностики и прогностики COVID-19. Будут получены данные о генотипах нового коронавируса, циркулирующих на различных этапах развития эпидемии в Казахстане. Разработанные в ходе реализации проекта праймеры и пробы, а также генетические конструкции, несущие участки вирусного генома могут быть использованы для разработки отечественных тест-систем на основе RT-qPCR для детекции и типирования SARS-CoV-2, а также прогнозирования тяжести заболевания. Выделенные рекомбинантные белки могут быть использованы для разработки отечественной тест-системы на основе ИФА для выявления антител к SARS-CoV-2.
Скиба Ю.А., Руководитель проекта, кандидат биологических наук (молекулярная биология). Индекс Хирша: 6. ORCID: http://orcid.org/0000-0003-4895-1473. Scopus ID: 56677594900. WoSID: H-6528-2017.
Низкородова А.С., кандидат биологических наук (молекулярная биология). Индекс Хирша: 1. ORCID: https://orcid.org/0000-0002-1597-7207. Scopus ID: 57215971184. WoSID: AAY-1646-2020.
Дмитровский А.М., доктор медицинских наук, профессор, заведующий лабораторией, врач-инфекционист. Индекс Хирша: 2. ORCID: https://orcid.org/0000-0003-4714-3079. ScopusID: 57204864464. WoSID: AAZ-2816-2020.
Исмагулова Г.А. – кандидат биологических наук (молекулярная биология). Индекс Хирша: 1. ORCID: https://orcid.org/0000-0002-2735-4939. ScopusID: 6506396016. WoSID: AAO-3437-2020.
Бердыгулова Ж.А., PhD-докторант (биотехнология), специалист в области вирусологии и молекулярной биологии. Индекс Хирша: 4. ORCID: https://orcid.org/0000-0003-0379-2472. Scopus ID: 23977664200. WoS ID: I-2943-2018.
Неупокоева А.С., магистр биотехнологии. Индекс Хирша: 1. ORCID: http://orcid.org/0000-0001-7257-8037. ScopusID: 57217703182. WoSID: N-9341-2017.
Березовский Д.В., магистр (медицина), врач гигиенист-эпидемиолог. Индекс Хирша: 1. ORCID: https://orcid.org/0000-0002-2830-1994. ScopusID: 57212528777. WoSID: AAY-6245-2020.
Найзабаева Д.А., магистр биотехнологии.ORCID: http://orcid.org/0000-0002-0606-4289. Scopus ID: 57218288692.WoS ID: AAY-5696-2020.
2021 год
Было проведено частичное секвенирование генома SARS-CoV-2 с РНК, выделенных из образцов казахстанцев с тяжелой формой течения болезни, образцов из патологического материала.
Были разработаны праймеры на основе анализа нуклеотидных последовательностей ОРС гена S SARS-CoV-2 в программе MEGA-X и анализа вторичной структуры праймеров и дуплексов в программе RNA-structure; праймеры синтезированы и очищены в лаборатории органического синтеза РГП «НЦБ» КН МОН РК. Были получены уникальные длинные амплификаты, включающие всю ОРС спайкового белка SARS-CoV-2, для единичных ОТ ПЦР положительных образцов РНК, а также удалось получить два амплификата, полностью перекрывающих данную ОРС при использовании пары праймеров CoV-Lead-F/RvS и пары праймеров FwS/Sfull_Kpn_R. После очистки амплификатов проводили реакцию секвенирования по Сэнгеру с использованием синтезированных праймеров.
Было проведено секвенирование образцов от пациентов с тяжелой формой течения болезни, образцов из патологического материала, образцов от переболевших COVID-19 и повторно заразившихся новой коронавирусной инфекцией людей со среднетяжелым течением болезни, а также от провакцинировавшихся людей, которые заразились COVID 19 и проявляли выраженные болезненные симптомы. Для двенадцати РНК-положительных образцов удалось перекрыть ридами полную последовательность ОРС поверхностного гликопротеина (спайкового белка S). Во всех одиннадцати вариантах была выявлена мутация 23403A > G (приводящая к аминокислотной замене D614G в S-белке). В одном образце помимо замены 23403A > G в положении 23208 детектировался микс из нуклеотидов А/С. Нуклеотидная последовательность ОРС S белка семи образцов больше ничем не отличалась от исходной последовательности «уханьского» генетического варианта. Последовательности трех образцов содержали все замены, характерные для британского штамма альфа (по классификации ВОЗ) SARS-CoV-2 (S: HV69-70del; S: Y144del; S: N501Y; S: A570D S: D614G; S: P681H; S: T716I; S: S982A; S: D1118H). Один из образцов содержал все эти мутации (характерные для альфа-штамма вируса по классификации ВОЗ) кроме замены S:T716I. Последовательности этих двенадцати ОРС спайкового белка выложены в базу GenBank NCBI (https://www.ncbi.nlm.nih.gov/genbank): номера GenBank c OK354348 по OK354359.
2022 год
Проведен скрининг ПЦР-положительных образцов, отобранных на различных этапах развития эпидемии COVID-19 в Казахстане, по выявлению наиболее важных однонуклеотидных полиморфизмов (SNP) SARS-CoV-2.
— Проведен дизайн праймеров и проб для выявления наиболее важных мутаций SARS-CoV-2 методом классической ОТ-ПЦР (выявление SNP, делеций и инсерций) и RT-qPCR (SNP). Проведен их синтез de novo и очистка методом ВЭЖХ.
— За период с 01 апреля 2020 г. по 30 апреля 2022 г. проведен отбор ОТ-ПЦР-положительных тотальных препаратов РНК по COVID-19, полученных от пациентов.
— Методом RT-qPCR проведен скрининг первой важной мутации в участке гена S, кодирующего фурин-распознающем участке спайкого белка SARS-CoV-2.
— Методом классической ОТ-ПЦР проведен скрининг мутаций для дифференциации вариантов VOCs друг от друга и от вариантов, не отнесенных к VOC.
Разработаны, синтезированы и очищены праймеры и зонды для выявления наиболее важных однонуклеотидных полиморфизмов (SNP) SARS-CoV-2 методом ПЦР.
— Нуклеотидные последовательности генетических вариантов, которые были утверждены ВОЗ в качестве нотифицируемых (VOCs), а именно – альфа (B.1.1.7), бета (B1.351), гамма (B.1.1.248), дельта (B.1.617+) и омикрон (B.1.1.529).
— Разработаны, синтезированы и очищены праймеры для выявления наиболее важных мутаций (SNP, делеций и инсерций), позволяющих дифференцировать все пять генетических вариантов VOCs SARS-CoV-2 методом классической ПЦР.
— Подобраны, синтезированы и очищены праймеры и зонд для выявления мутации “23403A > G” (S: D614G) методом RT-qPCR (ПЦР в реальном времени).
Проведено ПЦР-типирование вирусных РНК, выделенных из образцов, поступивших на различных этапах развития эпидемии в Казахстане.
— На пятидесяти ОТ-ПЦР положительных образах на начальной стадии пандемии (апрель-сентябрь 2020 год) проведен анализ по выявлению мутации 23403A > G” (S: D614G). Выявлен лишь один образец (из самых ранних), не содержащий мутацию.
— На различных этапах развития пандемии COVID-19 составлена репрезентативная выборка образцов (от двух ста пациентов), давших положительный ответ по RT-qPCR с наименьшим значением Ct.
— Проведено типирование 200 ПЦР-положительных образов в отношении принадлежности или непринадлежности к тому или иному VOC SARS-CoV-2. Варианта гамма (B.1.1.248) не выявлено. Выявлен лишь один вариант бета (B1.351). Выявлено 37 образцов варианта альфа (B.1.1.7), 25 образцов варианта дельта (B.1.617+) и 39 образцов варианта омикрон (B.1.1.529).
— Создана электронная база по генетическим вариантам SARS-CoV-2.
2023 год
— На основе литературных данных были выбраны полипептиды SARS-CoV-2, являющиеся наиболее перспективными мишенями для диагностики и разработки вакцин: спайк-белок S, мембранный белок М, нуклеопротеин N, структурный белок E. В программе Vector NTI 11.0 проведен анализ нуклеотидных последовательностей участков вирусного генома, кодирующих эти структурные белки коронавируса для основных нотифицируемых генетических вариантов (альфа, бета, гамма, дельта, омикрон) и исходного генетического варианта. Выбраны участки с наименьшими генетическими различиями между основными генетическими вариантами SARS-CoV-2, также все нуклеотидные последовательности проанализированы на наличие тех или иных сайтов рестрикции. Разработаны праймеры для клонирования упомянутых выше ОРС SARS-CoV-2, содержание соответствующие сайты рестрикции для клонирования амплификатов в экспрессионный вектор E. coli pET23c. Все праймеры синтезированы и очищены.
— С целью наработки потенциальных мишеней для ИФА-наборов были клонированы ОРС спайкового поверхностного гликопротеида S, мембранного белка М, нуклеопротеина N и белка порина Е. Для клонирования ОРС белка S использовалась только кДНК, кодирующая участок белка S с экстрамембранной локализацией. Проведена ПЦР с использованием высокоточного фермента. Очищенные амплификаты обрабатывали рестрицирующими эндонуклеазами: для кДНК-гена S – NheI/XhoI; для кДНК-гена N – NheI / SalI; для кДНК-гена M – NdeI/XhoI; для кДНК-гена Е – NdeI / SalI. Очищенные после рестрикции амплификаты лигировали в векторную плазмиду pET23c по сайтам рестрикции NdeI / SalI, либо по NheI/SalI. Лигазной сместью трансформировали компетентные клетки штамма E.coli DH5. Из выросших ДНК-клонов наработаны и выделены плазмиды методом с использованием хлороформа. ДНК-клоны тестировали методом рестрикционного анализа с использованием рестрицирующих эндонуклеаз XbaI/ Bpu1102I. Также проведено подтверждение наличия вставок методом ПЦР-анализа с использованием гено-специфических праймеров. Для верификации клонированных нуклеотидных последовательностей, проведено частичное секвенирование (только клонированного участка ДНК) плазмид pET23c_SARS-CoV2-S, pET23c_SARS-CoV2-N, pET23c_SARS-CoV2-M, pET23c_SARS-CoV2-E.
— Для амплификации ОРС структурных белков SARS-CoV-2 в качестве матрицы использовался препарат РНК из назофаренгального смыва, для которого прежде методом секвенирования ДНК по Сэнгеру была считана вся структурная область вирусного генома линии S (B.1.1). С использованием высокоточной полимеразы Phusion и специфических праймеров, содержащих сайты рестрикции для клонирования, были получены амплификаты ОРС структурных белков S, M, N и E SARS-CoV-2. В случае спайкового белка S амплифицировали не полнодлинную ОРС этого белка, а усеченную ее область без участков, кодирующих сигнальный пептид, трансмембранный и цитозольный сегменты спайкового белка.
— Получены амплификаты соответствующих размеров (3626 п.о. – для кДНК-гена S; 1283 п.о. – для кДНК-гена N; 694 п.о. – для кДНК-гена М; 252 п.о. – для кДНК гена Е). Амплификаты после их очистки и обработки соответствующими рестрицирующими эндонуклеазами были клонированы в экспрессионный вектор pET23c, позволяющий экспрессировать клонированные в него участки кДНК в клетках бактерий. Клонирование осуществлялось таким образом, чтобы к целевым ОРС с 3′-конца в одной с ними рамке прибавлялись шесть триплетов, кодирующих гистидин. В программе Vector NTI построены карты плазмид pET23c_SARS-CoV2-S, pET23c_SARS-CoV2-N, pET23c_SARS-CoV2-M, pET23c_SARS-CoV2-E. С Т7-промотора проведено секвенирование клонированных участков ДНК по Сэнгеру.
— Секвенированные плазмиды наработаны в количествах midi-prep и выделены набором GeneJET Plasmid Midiprep Kit (Thermo Fisher Sci.).
— После трансформации клеток экспрессионного штамма E. coli Bl-21(DE3) ДНК-конструкциями проводили экспрессию ОРС целевых белков. Клетки, несущие плазмиду pET23c_SARS-CoV2-N, практически не росли при температуре выше 30 ºС. До добавления IPTG их было решено растить при 28 ºС, после добавления активатора lac-оперона – при температуре 25 ºС. Клетки бактерий, трансформированные плазмидами pET23c_SARS-CoV2-E и pET23c_SARS-CoV2-M нормально росли до добавления IPTG, но после его добавления к питательной среде оптическая плотность клеточных суспензий не увеличивалась со временем, что указывало на токсичность для бактерий синтезируемых в них вирусных белков. Для наработки белков M-6His и E-6His в ходе оптимизации условий экспрессии кДНК было решено снизить концентрацию IPTG с 0,5 мМ до 0,1 мМ и сократить время индукции экспрессии кДНК с четырех часов до одного. Клетки, трансформированные плазмидой pET23c_SARS-CoV2-S, показали стандартный рост при температурах выше 30 ºС, проблем с экспрессией кДНК-гена S зафиксировано не было.
— После наработки рекомбинантных белков в клетках бактерий тестировалась их способность переходить в растворимую форму. Лишь рекомбинантный белок N-6His детектировался в супернатанте после лизиса бактерий и центрифугирования лизата при 20000 g в течение 20 минут.
— Белки S-6His, M-6His и E-6His неизменно локализовались в осадке (т.е. формировали нерастворимые тельца включения или ассоциировались с мембранами) и практически совершенно отсутствовали в надосадочной жидкости (данные не представлены). Добавление к лизирующему раствору детергентов (1% Tween-20, 1% Triton X-100 либо 1% SDS) не решало проблему: какая-то доля S-6His переходила в растворимую фракцию, но при этом формировались димеры и прочие агрегаты (данные не представлены). В случае же белков M-6His и E-6His, добавление детергентов к лизирующему раствору не оказало влияние на их солюбилизацию.
— Белки S-6His, M-6His и E-6His очищали посредством Ni-NTA агарозы в денатурирующих условиях, а белок N-6His – в нативных условиях методом аффинной хроматографии. Элюированные c Ni-NTA агарозы белки очищали диализом с тем, чтобы избавиться от содержащегося в них имидазола или денатурирующих агентов, а также, чтобы скорректировать их рН до 7,5. После диализа белки были сконцентрированы. Анализ синтезированных белков проводился методом Вестерн-блоттинга. Белки с 12,5% ПАА-геля переносили на нитроцеллюлозную мембрану методом полусухого блоттинга. Детекцию His-tag меченных белков проводили с использованием моноклональных антител к 5-His последовательности (первые антитела), окрашивание белков проводили с использованием хемилюминисцентного субстрата.
— Все четыре белка SARS-CoV-2 (N, S, E и M) синтезированы и очищены. Степень чистоты этих белков варьировала от 10 до 25% от всех белков в элюатах. Общие количества полнодлинных наработанных и очищенных белков (из 50 мл исходной клеточной суспензии) составили: 296,2 мкг (белок S), 277,8 мкг (белок N), 137,6 мкг (белок M), 128,2 мкг (белок Е).