Управлять геномом: как биоинформатика помогает лечить тяжелые болезни и даже коронавирус
— Что такое биоинформатика и чем она занимается?
— Коротко ответ можно сформулировать так: биоинформатика — это наука, которая изучает компьютерными методами структуры и механизмы, лежащие в основе всего живого. В первую очередь речь идет о ДНК/РНК и белках — базовых молекулах жизни. Собственно говоря, началом эры биоинформатики считается открытие Уотсоном и Криком в 1950-х четырехбуквенного генетического кода. Когда последовательности нуклеотидов в ДНК разных организмов начали сравнивать друг с другом, и родилась новая дисциплина.
Мощный толчок ее развитию дала разработка в конце 1970-х Сенгером метода секвенирования (расшифровки) ДНК. Стало возможно сравнивать друг с другом определенные участки геномов. В 1995 году впервые был полностью секвенирован геном целого организма — бактерии. После этого число новых открытий стало расти стремительно, как снежный ком. Этому очень помогло одновременное быстрое развитие компьютерных технологий.
При этом объем данных, обрабатываемых биоинформатикой, поначалу был небольшим. Большие данные (big data) появились уже в XXI веке, когда, с одной стороны, такие методы, как секвенирование, стали полностью автоматизированными, а с другой — появились технологии обработки и передачи больших объемов данных. Так биоинформатика приобрела свой нынешний вид.
— В каких областях у биоинформатики есть практические применения?
— В первую очередь, конечно, в медицине. Сейчас уже понятно, что многие болезни имеют генетическую природу, то есть либо заложены в геноме человека уже с рождения, либо развиваются в результате возникающих в нем мутаций. Классический пример — онкологические заболевания. Известно, что клетка, прежде чем стать раковой, претерпевает множество геномных изменений. Ее ДНК изменяется, куски хромосом меняются местами. Эти процессы очень гетерогенны: у разных пациентов с одним и тем же типом опухоли раковые клетки могут мутировать по-разному, что затрудняет борьбу с такими болезнями.
Но ДНК раковых клеток расшифровываются по всему миру, и сейчас уже есть открытые базы, из которых можно скачивать геномные данные опухолей, сравнивать с тем, что мы видим у конкретного больного, и лучше понимать, как его лечить. Более того, анализ огромного количества геномов раковых клеток, в том числе с помощью машинного обучения, позволил выявить сильно мутирующие очаги в геноме, на которые нужно смотреть в первую очередь. В 2018 году ученые из американского Университета Джона Хопкинса опубликовали статью о возможности создать на основе накопленных знаний о мутациях панель диагностики рака на ранних стадиях, когда сам человек еще ничего не чувствует и сканирование ничего не показывает. А в анализах крови уже можно найти мутантную ДНК. Я слежу за этими исследованиями с огромным интересом.
Аналогично можно диагностировать предрасположенность и ко многим другим опасным болезням. Например, недавно наша лаборатория инициировала создание в России консорциума научных и медицинских учреждений для изучения генетики сердечно-сосудистых заболеваний. И без генетики понятно, что есть люди, которым риск того или иного заболевания передался по наследству — такое хорошо видно из семейной истории. И мы объединяем усилия врачей и биоинформатиков, чтобы секвенировать геномы таких людей и находить в них корреляции с разными болезнями сердца и сосудов.
«Рак — это во многих случаях уже не приговор»: израильский онколог Полина Степенски — о своей работе
Подобные исследования важно проводить именно внутри страны. Потому что за 20-30 лет активного секвенирования и анализа геномов людей по всему миру стало ясно, что есть очень сильная специфика в разных популяциях людей. А бОльшая часть консорциумных проектов, которые генерируют такие данные и выкладывают их в открытый доступ, делаются в США и Западной Европе. Совсем необязательно препараты и методы лечения, разработанные на основе анализа геномов жителей этих стран, будут так же эффективно работать и в России, где мутации могут быть другими.
Еще один пример — лекарства: биоинформатика способна предсказывать, как организм разных людей будет реагировать на одни и те же лекарства. Например, антикоагулянты, которые назначают при инфарктах, инсультах, после операций, а теперь еще и при ковиде — потому что он повреждает мелкие сосуды и приводит к тромбообразованию. Одному пациенту антикоагулянты помогут, другой умрет от кровотечения, у третьего вообще не будет никакого эффекта. Все это зависит от мутаций, несколько десятков которых уже задокументированы. Здесь открывается путь к персонализированной медицине, за которой будущее.
— В борьбе с коронавирусом биоинформатика тоже может помочь?
— Конечно. Во-первых, SARS-CoV-1 мутирует: постоянно появляются сообщения о появлении новых штаммов. Геномы этих штаммов тоже постоянно расшифровываются и выкладываются в открытый доступ, что имеет значение для разработки вакцин и анализа путей распространения инфекции. У меня на курсе уже второй год есть такое домашнее задание — скачать геномы коронавирусов, построить филогенетические деревья и проанализировать источники заражения по странам. Из такого анализа, кстати, видно, что во многие страны вирус был занесен не один раз, из разных источников.
Во-вторых, похоже, что анализ геномов людей позволяет предсказать, насколько тяжело они будут переносить коронавирусную инфекцию. Уже есть публикации по некоторым точечным мутациям, которые ассоциированы с тяжестью протекания ковида. Но эта работа пока что находится в самом начале: нужно больше данных, больше статистики. Возможно, генотипирование поможет разобраться, почему у некоторых пациентов возникает «цитокиновый шторм» — это когда в организме начинают массово производиться вещества цитокины, которые должны убивать вирус, но вместо этого уничтожают клетки самого организма, что приводит к смерти.
— Как вы думаете, насколько быстро такое тестирование людей на риск тяжелого протекания у них коронавирусной инфекции может стать массовым?
— Скажем так, если бы в 10 раз увеличить число ученых, которые этим занимаются, и, соответственно, в 10 раз увеличить финансирование таких исследований, то, возможно, уже через год у нас была бы такая панель генетической диагностики. И к людям, тесты которых давали бы положительные результаты, можно было бы заранее проявлять больше внимания.
— Достижения биоинформатики используются только в медицине?
— Необязательно, есть и смежные области, в которых они полезны. Например, у нашей дружественной лаборатории недавно был проект по изучению российских спортсменов. Мы отсеквенировали геномы атлетов и нашли корреляции со спортивными результатами, выносливостью, возникающими у них проблемами со здоровьем. Удалось найти генетические маркеры, позволяющие кое-что из этого предсказывать по анализу ДНК.
Сейчас есть компании вроде 23andme или «Генотек», которые предлагают своим клиентам на основе секвенирования их ДНК персонализированные рекомендации по занятиям спортом, питанию, анализируют ту же предрасположенность к болезням или возможные реакции на лекарства, даже определяют происхождение человека. Мы такие сервисы тоже разбираем на занятиях, пока что это не совсем серьезно. Если в результатах анализа написано, что у вас риск возникновения такого-то заболевания составляет 15%, это на самом деле не означает, что вы действительно им заболеете, даже с такой вероятностью. Потому что в основе всего этого лежит статистика, анализ выборок, не обязательно релевантных для вас. И все же какую-то полезную информацию так можно получить.
— А может ли биоинформатика помочь продлить жизнь людей?
— В каком-то смысле, да. Как я уже говорила, биоинформатика изучает фундаментальные процессы, которые лежат в основе жизни, в том числе то, как работают алгоритмы генома. Фактически как жить — и в том числе насколько быстро стареть, — диктует программа, записанная в нашей ДНК. Она принципиально одинакова у всех живых существ на Земле. И если мы поймем, как эта программа работает, мы сможем ей управлять. Условно говоря, взламывать, чтобы останавливать, в том числе процессы старения.
— Некоторые футурологи считают, что «биотехнологическая революция» усилит социальное неравенство: богатым будут доступны технологии, которые позволят им жить дольше и быть здоровее, а бедным — нет. Похоже, биоинформатика будет иметь к этому самое непосредственное отношение. Что вы думаете по поводу таких предсказаний?
— Думаю, мало быть богатым, надо быть еще и умным как минимум. Если богатый не понимает, как все устроено, его могут легко обмануть. Те, кто будет понимать, как работает геном и как можно им управлять — да, в их руках будет очень многое.
Сейчас много говорят о том, что в будущем рутинную и тяжелую работу будут делать роботы. Богатыми и успешными будут те, кто этих роботов будет создавать и настраивать, а для этого нужно иметь определенные навыки и знания. С биотехнологиями примерно такая же история.
Комбайн с искусственным интеллектом и экзоскелеты: как женщины создают роботов в России
— Отстает ли Россия сейчас в области биоинформатики от стран Запада?
— К сожалению, да. Самостоятельно ставить эксперименты и генерировать данные в России могут буквально несколько лабораторий, у которых есть под это финансирование. В России это стоит в 2-3 раза дороже, чем в странах «золотого миллиарда», потому что все необходимое оборудование и препараты мы вынуждены покупать у них, а это огромные деньги.
При этом в компьютерном анализе, в разработке алгоритмов мы можем конкурировать на равных — так получилось, что у нас всегда «земля рожала» хороших математиков и программистов. Многие необходимые для биоинформатических исследований данные можно найти в открытом доступе. Так что здесь нужно только создать условия, в том числе предложить ученым достойные зарплаты. Увы, наука в России недофинансируется.
— Есть ли в отрасли проблема «утечки мозгов» в другие страны?
— Конечно. Когда выпускники, отучившиеся по направлению «биоинформатика», видят, какую зарплату предлагают за рубежом и у нас, большинство предпочитает уехать работать туда. Хотя, например, у нас в лаборатории есть девушка, которая раньше работала в Facebook и Google, а теперь вернулась в Россию. Это исключение, но все же оно есть.
— В США в подобных вашей лаборатории think tank`ах основывается немало стартапов. Как обстоят с этим дела у вас?
— Пока что никак. У нас очень много фундаментальной научной работы, а прикладная связана с деятельностью консорциума по генетике сердечно-сосудистых заболеваний, о котором я рассказывала. Так что сил на то, чтобы основывать стартапы, у нас сейчас не хватает.
При этом у научного консультанта нашей лаборатории, профессора Алана Герберта, есть собственный стартап в США. Он связан с Z-ДНК — вторичной структурой ДНК, которая закручивается влево. Исследования показывают, что она отвечает за многие важные биологические процессы, включая клеточный иммунитет. Сейчас профессор Герберт активно занимается этим в своем стартапе в Америке. Может, он и нас потом научит запускать стартапы.
Кстати, к вопросу об уровне биоинформатических исследований в России — мы с профессором Гербертом познакомились как раз после того, как мы у нас в лаборатории создали систему с элементами ИИ, предсказывающую, где эта Z-ДНК будет находиться в геноме. И он был поражен, когда увидел эту разработку — он не знал, что мы в России настолько круты в машинном обучении и компьютерном анализе.
— На сайте Факультета компьютерных наук ВШЭ можно увидеть логотип «Яндекса». Финансирует ли он или какая-либо другая крупная компания исследования в вашей лаборатории?
— Наш факультет когда-то вырос из базовой кафедры «Яндекса», представители этой компании входят в наш попечительский совет. Но наши исследования в области биоинформатики «Яндекс» пока не финансирует. Они ведутся на внутренние гранты ВШЭ.
— Пробовали ли вы уже искать инвестиции от крупных компаний?
— До сих пор нет. Но сейчас мы ищем финансирование для наших исследований в области кардиогенетики — и гранты, и частные инвестиции. Работы очень много, потому что есть много сердечно-сосудистых заболеваний, и мы хотим охватить их максимально широко. Поэтому ищем деньги в разных источниках. В том числе хотим попробовать привлечь инвестиции от «Яндекса» и «Сбера».