AP19679015 «Применение новых методов сбора и обработки данных, основанных на алгоритмах машинного обучения для анализа клеточной протеомы»

Актуальность

Благодаря появлению инструментов нового поколения, новых методов анализа биологических образцов, а также продвинутого программного обеспечения появилась возможность значительно улучшить возможности идентификации белков. Например, в рамках глобальной инициативы HPP удалось повысить число идентификации белков с 13588 в 2011 году до 17874 в 2020 году, что составляет более 7 порядков  динамического диапазона протеомы человека. Эти достижения являются чрезвычайно важными, поскольку биомаркеры различных заболеваний, обычно экспрессируются в клетке, в незначительных количествах, которых иногда трудно обнаружить с помощью традиционных методов анализа. Кроме того, эти современные методы протеомики открывают новые возможности более глубокого изучения и понимания механизмов функционирования клетки. Таким образом, расширение аналитических возможностей протеомной платформы «Национальный центр биотехнологии» позволит более эффективно решать как задачи фундаментальной науки, так и прикладные, включая в первую очередь медицину и здравоохранение.

Цель

Целью проекта является внедрение нового рабочего процесса, заключающегося в сочетании независимого от данных накопления спектров (DIA) и их обработки с помощью программ, основанных на алгоритмах машинного обучения для углубленного анализа субклеточного распределения белков, изучения их пост-трансляционных модификаций и белок-белковых взаимодействий.

Цели проекта будут достигнуты с применением как традиционных методов сбора данных, таких как DDA, MRM, так и нового метода DIA, а также различных компьютерных программ (Spectronaut, PEAKS, MaxDIA, DIA-NN) для обработки полученных результатов.

Модельными задачами проекта являются детализация субклеточного распределения белков (ядро, органеллы и цитоплазма), углубленное изучение пост-трансляционных модификаций (убиквитинирование, сумоилирование), белок-белковых взаимодействий и их логическая взаимосвязь на примерах белков репарации ДНК, мембран ядра и транскрипционных факторов плюрипотентности. Для решения этих задач будут использованы традиционные и новые методы фракционирования клеток, а также новые методы ферментативного in vivo мечения белков на примере биотинилирования от сближения (Proximity Utilizing Biotinylation, PUB) и проксимального биотинилирования с помощью мутантной биотин-лигазы TurboID. Измеримыми показателями выполнения этих этапов будут результаты качественного и количественного анализа образцов, полученных после применения различных рабочих процессов DDA→Mascot, MRM→Skyline, DIA→ML/DL.

Ожидаемые результаты

  1. Будет оптимизирован протокол субклеточного фракционирования клеток HEK293T и CHO, совместимый  с протоколами пробоподготовки для LC-MS/MS.
  2. Будут получены результаты по идентификации и количественному анализу белков субклеточных фракций клеток HEK293T и CHO с помощью  ML/DL программ.
  3. Будут получены генно-инженерные конструкции BirA-UBA-X, BirA-UIM-X (X=GFP, RAD18,  SOX2, OCT4, NANOG) и результаты по биотинилированию убиквитинированных и сумоилированных белков-партнеров в клетках HEK293T и CHO.
  4. Будут получены результаты по идентификации и количественному анализу  убиквитинированных и сумоилированных  белков-партнеров RAD18, POLH,  SOX2, OCT4, NANOG с помощью   ML/DL программ.
  5. Будут созданы и наработаны  генно-инженерные конструкции TurboID-X (X=EMD, NRM, SOX2, OCT4, NANOG,  RAD18, POLH) и получены результаты по биотинилированию  их белков-партнеров в клетках HEK293T и CHO.
  6. Будут получены результаты по идентификации и количественному анализу  белков-партнеров EMD, NRM, SOX2, OCT4, NANOG,  RAD18, POLH с помощью  ML/DL программ.

Руководитель проекта

Кулыясов Арман Табылович, руководитель проекта – кандидат химических наук, ведущий научный сотрудник лаборатории протеомики и масс-спектрометрии НЦБ РК. Индекс Хирша (h-index) – 10 (Scopus). Author ID в Scopus https://www.scopus.com/authid/detail.uri?authorId=7004152301; Researcher ID Web of Science https://www.webofscience.com/wos/author/record/K-9148-2017; ORCID ID https://orcid.org/0000-0002-7932-5689

Члены исследовательской группы

Ахметоллаев Ильяс Амирханович (h-index — 1), кандидат биологических наук, ведущий научный сотрудник, заведующий лабораторией органического синтеза ТОО «Национальный центр биотехнологии», специалист в области молекулярной биологии и химического синтеза олигонуклеотидов и их модификации. Опыт научной работы составляет 20 лет. Автор 5 статей. Проходил стажировку по синтезу олигонуклеотидов в России. Роль в проекте — химический синтез олигонуклеотидов и их модификаций.

Манат Есбол (h-index — 1), PhD, научный сотрудник лаборатории стволовых клеток ТОО «Национальный центр биотехнологии», Выпускник биологического факультета КазНУ им. Аль-Фараби (2006-2010), специальность биотехнология. Магистратура по естественным наукам Евразийского национального университета им. Л.Н. Гумилева (2010-2012). Стажировка и обучение в докторантуре PhD в университете Лунда (Швеция) под руководством доктора Джесики Аббот (2016-2021). Защитил диссертацию на соискание ученой степени доктора философии PhD в 2021 году. Он является также опыт работы по биоинформатике, в частности языком программирования R и статистической обработке данных.

Махсатова Сая, бакалавр университета Дебрецен (Венгрия) по специальности биохимическая инженерия, 2019-2023гг.

Публикации и охранные документы научного руководителя и членов исследовательской группы, касающиеся темы проекта

  1. Shoaib M., Kulyyassov A., Robin C., Winczura K., Tarlykov P., Despas E., Kannouche P., Ramanculov E., Lipinski M., Ogryzko V. PUB-NChIP – “in vivo biotinylation” approach to study chromatin in proximity to a protein of interest // Genome Research.-2013.-Vol.23, №2.-P.331-340. doi:10.1101/gr.134874.111 (Q1)
  2. Mukanov, K.K., Adish, Z.B., Mukantayev, K.N., Tursunov, K.A., Kairova, Z.K., Kaukabayeva, G.K., Kulyyassov, A.T. and Tarlykov, P.V. Recombinant expression and purification of adenocarcinoma GPR161 receptor.//Asia Pac. J. Mol. Biol. Biotechnol.- 2019.-Vol. 27 (4) .-P. 85-95. DOI: 10.35118/apjmbb.2019.027.4.10 (Q4)
  3. Kulyyassov A., Ogryzko V. In Vivo Quantitative Estimation of DNA-Dependent Interaction of Sox2 and Oct4 Using BirA-Catalyzed Site-Specific Biotinylation // Biomolecules. ‒ 2020. ‒ Vol. 10, № 1. DOI: 10.3390/biom10010142 (Q1)
  4. Adish Zh., Mukantayev K., Tursunov K., Ingirbay B., Kanayev D., Kulyyassov A., Tarlykov P., Mukanov K., Ramankulov Y. Recombinant Expression and Purification of Extracellular Domain of the Programmed Cell Death Protein Receptor // Reports of Biochemistry and Molecular Biology. ‒ 2020. ‒ Vol.8, №4. ‒ P.347-357. http://rbmb.net/article-1-391-en.html (Q3)
  5. Kulyyassov A., Fresnais M., Longuespee R. Targeted liquid chromatography-tandem mass spectrometry analysis of proteins: Basic principles, applications, and perspectives // Proteomics. ‒ 2021. ‒ Vol. 21, № 23-24, e2100153. – P.1-20. – doi: 10.1002/pmic.202100153, PMID: 34591362, IF3.984, Q2 (2020, WoS), percentile 73 on Biochemistry, CiteScore 6.3 (2020, Scopus);
  6. Kulyyassov A. Application of Skyline for Analysis of Protein–Protein Interactions In Vivo // Molecules. ‒ 2021. ‒ Vol. 26, № 23, 7170, – P.1-11. – doi: 10.3390/molecules26237170, PMID: 34885753, IF4.412, Q2 (2020, WoS), percentile 74 on Chemistry, CiteScore 4.7 (2020, Scopus);
  7. Kulyyassov A., Ramankulov Y., Ogryzko V. Generation of Peptides for Highly Efficient Proximity Utilizing Site-Specific Biotinylation in Cells // Life (Basel). ‒ 2022. ‒ Vol. 12, № 2, 300. ‒ P.1-14. – doi: 10.3390/life12020300, PMID: 35207587, IF3.817, Q2 (2020, WoS), percentile 50 on General Biochemistry, Genetics and Molecular Biology, CiteScore 2.6 (2020, Scopus);
  8. Kanayev D., Abilmazhenova D., Akhmetollayev I., Sekenova A., Ogay V., Kulyyassov A. Detection of Recombinant Proteins SOX2 and OCT4 Interacting in HEK293T Cells Using Real-Time Quantitative PCR // Life (Basel). ‒ 2023. ‒ T. 13, № 1.-P1-10.-https://doi.org/10.3390/life13010107, PMID: 36676054, IF3.817, Q2 (2020, WoS), percentile 50 on General Biochemistry, Genetics and Molecular Biology, CiteScore 2.6 (2020, Scopus);
  9. Кулыясов А.Т., Раманкулов Е.М., Огрызько В.В. Евразийский патент. Номер 034880. Номер заявки №201500724. Дата подачи 28.05.2015. Дата публикации и выдачи 01.04.2020. Применение биотин-лигазы BirA и пептидов-акцепторов биотина BAP1070 и BAP1108 для детектирования белок-белковых взаимодействий in vivo с использованием пар Bira/BAP1070 и Bira/BAP1108. https://www.eapo.org/ru/patents/reestr/patent.php?id=34880
  10. Кулыясов А.Т., Огрызько В.В. Рекомбинантная плазмида pcDNA3.1(+)-BAP-HP1a, кодирующая гетерохроматиновый белок человека HP1a и обеспечивающая его экспрессию в клетках НЕК293Т. Патент Республики Казахстан на изобретение, регистрационный номер 2013/1352.1. Номер 30034, бюллетень №6, http://kazpatent.kz/images/bulleten/2015/gazette/pdf/2-201506.pdf
  11. Кулыясов А.Т., Огрызько В.В. Рекомбинантная плазмида pcDNA3.1(+)-BAP-KAP1, кодирующая белок транскрипционного кофактора человека KAP1 и обеспечивающая его экспрессию в клетках НЕК293Т. Патент Республики Казахстан на изобретение, регистрационный номер 2013/1377.1. Номер 30035, бюллетень №6, http://kazpatent.kz/images/bulleten/2015/gazette/pdf/2-201506.pdf
  12. Kulyyassov A., Shoaib M., Pichugin A., Kannouche P., Ramanculov E., Lipinski M., Ogryzko V. PUB-MS: A Mass Spectrometry-based Method to Monitor Protein-Protein Proximity in vivo //J. Proteome Res.-2011 .-Vol.10, No.10.-P.4416-4427. doi: 10.1021/pr200189p.
  13. Kulyyassov A., Shoaib M., Ogryzko V. Use of in vivo biotinylation for chromatin immunoprecipitation // Curr. Protoc. Cell Biol.-2011.- Chapter 17, Unit17.12. doi: 10.1002/0471143030.cb1712s51.
  14. Kulyyassov A.T., Ramanculov E.M., Ogryzko V.V. In vivo Biotinylation Based Method for the Study of Protein-Protein Proximity in Eukaryotic Cells// Cent Asian J Glob Health. — 2014 Cent Asian J Glob Health. — 2014 Jan 24;2(Suppl):96. doi: 10.5195/cajgh.2013.96. eCollection 2013.
  15. Kulyyassov A., Zhubanova G, Ramanculov E, Ogryzko V. Proximity Utilizing Biotinylation of Nuclear Proteins in vivo. // Cent Asian J Glob Health. — 2015 Jun 15;3(Suppl):165. doi: 10.5195/cajgh.2014.165. eCollection 2014.
  16. Issabekova A.S., Zhunusova M.S., Ramanculov E.M., Kulyyassov A.T. Comparison and optimization of transient transfection methods at HEK293T cell line. // Eurasian journal of applied biotechnology.-2017.- No.1.-P.38-43. DOI: 10.11134/btp.1.2017.5
  17. Kulyyassov A.T., Ramanculov E.M., Ogryzko V.V. Cloning and expression of recombinant protein of SUMO, fused with biotin acceptor peptide // Eurasian journal of applied biotechnology. — 2018. -№1. — P.37-41. DOI: 10.11134/btp.1.2018.6
  18. Kulyyassov A.T., Ramanculov E.M. Applications of the Impact II high resolution quadrupole time-of-flight (QTOF) instrument for shotgun proteomics // Eurasian journal of applied biotechnology. — 2018. -№3. — P.3-18. DOI: 10.11134/btp.3.2018.1
  19. Yessimseitova A.K., Shustov A.V., Ahmetollaev I.A., Krassavin V.F., Kakimzhanova A.A. Molecular-genetic certification of potato varieties and forms using SSR-markers // Eurasian Journal of Applied Biotechnology, 2015, №2, pp. 4-16. DOI: 10.11134/btp.2.2015.6.

Достигнутые результаты

2023 г.

В рамках первого этапа календарного плана проведена оптимизация протокола субклеточного фракционирования клеток HEK293T и CHO.

Химические методы фракционирования в отличие от методов центрифугирования или ультрацентрифугирования требуют меньше усилий и позволяют быстро получить минимальное количество фракций. Однако, их недостатком является использование поверхностно-активных веществ, как например, Triton X-100 или додецилсульфат натрия (SDS), которые несовместимы с протоколами LC-MS/MS. Совсем недавно, японские исследователи предложили новый метод субклеточного фракционирования с применением совместимых реагентов, таких как деоксихолат натрия (SDC) и лаурилсаркозинат натрия (SLS), для последующего протеомного анализа. В данном проекте мы использовали эту методику для субклеточного фракционирования клеток HEK293T и CHO, в сравнении с  традиционным методом лизирования с использованием 0.5% Triton-X100.

Мы оптимизировали метод спектрофотометрического определения остаточного количества SDC в малых количествах образцов, предназначенных для анализа с помощью жидкостной хроматографии тандемной масс-спектрометрии LC-MS/MS. В ходе исследования мы обнаружили ограничения, связанные с коллапсом линейности калибровочной кривой для количественного определения остаточных детергентов в случае низкого pH и присутствия некоторых ионов в буферных растворах, таких как Cl-, NO3-, особенно при более высоких концентрациях солей. Присутствие ионов хлорида, нитрата и кислот способствует образованию агрегатов метиленового синего для перехода из водной фазы в фазу хлороформа, которые также поглощают при длине волны 655 нм и вызывают конкурентный эффект. Используя оптимизированный протокол, мы продемонстрировали, что одна экстракция этилацетатом снижает количество SDC в 20 раз (с 0,5% до 0,025%). Мы также обнаружили возможность использования полистироловых 96-луночных планшетов для измерения проб хлороформа, но в течение короткого периода времени. Это позволяет проводить высокопроизводительные эксперименты с меньшим количеством реагентов и растворителей, а также проводить больше измерений для статистического анализа.

В рамках второго этапа календарного плана, в настоящее время проводятся анализы полученных образцов субклеточных фракций клеток HEK293T и CHO в режиме DDA метода жидкостной хроматографии тандемной масс-спектрометрии.

Публикации и охранные документы

2021 г.

Принята к печати 1 статья в отечественном издании, рекомендованном КОКСНВО.

Makhsatova Saya, Kulyyassov Arman. Quantification of sodium deoxycholate in proteomics sample preparation using methylene blue // Eurasian journal of applied biotechnology. – 2023.