Математический алгоритм: возможно ли создать новые лекарства путем их компьютерного моделирования
Создание и запуск инновационных лекарственных препаратов — обязательное условие существования любой конкурентоспособной развивающейся фармацевтической компании. Однако этот процесс требует значительных инвестиций, занимает много времени и полон рисков. Традиционно считается, что на разработку и запуск в производство нового препарата требуется порядка 7-10 лет, а инвестиции на его создание достигают $2 млрд.
Однако все эти затраты могут стать бесполезными, если созданное лекарство не пройдет клинические испытания и, как следствие, препарат не будет зарегистрирован регулятором. А это случается очень часто. Известно, что за последние несколько лет число препаратов, «проваливших» вторую и третью стадии клинических испытаний, выросло вдвое, как и число лекарств, которым регулятор за последние десять лет отказал в регистрации. Что это значит для участников отрасли? Что объем необходимых инвестиций в разработку лекарств растет вместе с требованиями регуляторов к доказательству эффективности и безопасности препаратов. Производители ищут эффективные способы разработки новых молекул, чтобы с их помощью увеличить число препаратов, которые имеют потенциальные возможности стать революционными на рынке.
В настоящее время одним из самых перспективных направлений НИОКР для решения этих задач является математическое моделирование лекарственных средств. Его развитие обусловлено совершенствованием компьютерных технологий и возможностью обработки с их помощью больших массивов данных.
Возможности и эффективность методов математического моделирования впечатляют. Вряд ли сегодня есть отрасли, не использующие компьютерное моделирование: его применяют в промышленности, сельском хозяйстве, сервисных услугах. С его помощью прогнозируют результаты выборов, стоимость акций, потребительский спрос на новинки, за цифровыми технологиями — будущее. Особое внимание необходимости их развития уделил президент РФ Владимир Путин в рамках своего выступления на заседании Совета по стратегическому развитию и приоритетным проектам.
Сегодня в России есть яркие примеры использования цифровых технологий в различных отраслях промышленности. Например, на производствах в инновационном кластере «Технополис GS» (инвестиционный проект холдинга GS Group в г. Гусеве Калининградской области) с помощью компьютерного моделирования специалисты уже на ранних стадиях разработки продукта могут контролировать надежность изделия, тепловые режимы его работы, нагрузку на процессоры, геометрию и логистику. Благодаря использованию технологии удается максимально оптимизировать затраты в ходе производственного процесса, а также прогнозировать количество отказов и рекламаций еще до выпуска изделий в серию и после начала отгрузок, с высокой степенью управляя затратами на сервис и гарантийное обслуживание.
Другой пример — из авиастроения. В ходе создания новейшего российского авиалайнера МС-21 разработчики активно применяют методы моделирования. В частности, с их помощью инженеры «довели до ума» процессы посадки и торможения лайнера, а также четко определили аэродинамические характеристики и управляемость в форс-мажорных случаях отказа двигателя. Первый испытательный полет МС-21 успешно прошел в мае 2017 года.
Только с помощью использования математических алгоритмов удалось завершить международный исследовательский проект «Геном человека». В работы по расшифровке нуклеотидных пар в течение 15 лет были задействованы 250 машин. Они 24 часа в сутки собирали, анализировали, систематизировали и аннотировали терабайты информации.
Первые математические модели в области фармакологии и анализа клинических данных разрабатываются и применяются на практике с начала 70-х годов XX века. Так называемая фармакометрика способствовала определению дозировки и групп пациентов, которым необходим препарат. Появление и развитие новых компьютерных технологии расширило области применения математических моделей, в том числе в биологии и медицине.
Использование компьютерных моделей ускоряет процессы разработки и вывода на рынок новых продуктов, оптимизирует затраты и снижает себестоимость. По сравнению с методом высокопроизводительного скрининга, который правильнее было бы называть методом проб и ошибок, компьютерное моделирование экономит фармацевтической компании десятки миллионов долларов за счет своевременного отказа от «бесперспективных» веществ.
Кроме того, становится возможным точное прогнозирование и управление свойствами продукта, его фармакокинетическими и фармакодинамическими свойствами. Это позволяет компаниям выпускать на рынок продукт, максимально соответствующий потребительскому запросу.
Компьютерное моделирование уже входит в список обязательных стадий прохождения проектов. Начавшись с обработки экспериментальных данных, сегодня это направление позволяет нам существенно ускорять R&D: повышать эффективность сборки генов и продуктивность выработки белков, превращать животные антитела в человеческие и повышать их аффинность связывания с мишенью, предсказывать течение химических реакций и определять оптимальные модификации малых молекул.
Для примера: в прошлом году мы запустили первый проект, все кандидаты которого были полностью спроектированы in silico — с помощью компьютерного моделирования, и уже спустя три месяца получили два финальных кандидата, которые сейчас проходят доклиническую разработку. Другой пример — проект 2-in-1, целью которого является создание нового класса антител, обладающих всеми свойствами и симметриями IgG, но обеспечивающих мультиспецифическую активность.
Компьютерный анализ данных также помогает и в других областях. С помощью статистики и трехмерного моделирования в этом году нам удалось показать Всемирной организации здравоохранения, что существовавшие более двадцати лет правила присвоения МНН антителам построены на не вполне корректных выводах и потому требуют корректировок. В конце мая эти правила были кардинально изменены.
Кроме этих очевидных преимуществ применение компьютерных моделей позволяет создавать препараты для лечения болезней, которые еще недавно считались трудноизлечимыми или неизлечимыми. Успехами мы опять обязаны машинному разуму. Анализируя взаимодействия молекул, компьютер оперирует огромными массивами данных и способен выявлять сложнейшие закономерности, заметить которые человеку просто не под силу.
Например, известно, что в США в 2013 году FDA одобрила новое лекарство от гепатита С. Это как раз детище компьютерного моделирования. Лекарство вылечивает гепатит С за 12 недель, но довольно дорого: стоимость курса лечения — $84 000.
В 2016 году другая американская компания выпустила на рынок свой препарат для лечения гепатита С. В основе — синтезированные на основе компьютерных моделей вещества гразопревир и илбасвир. Курс лечения также составляет 12 недель, правда, в отличие от предыдущего препарата, он обойдется пациенту почти на $30 000 дешевле.
В этом году компания Sanofi подписала контракт с Schrödinger для использования вычислительных технологий в 10 проектах создания новых лекарственных средств на сумму $120 млн.
«Филип Моррис Интернэшнл» на основе компьютерных моделей изучает влияние на человеческий организм токсичных веществ, которые образуются в результате курения табака.
Компьютерные технологии активно используются в организации лечения пациентов. Наиболее известным является проект Watson, совместно реализуемый IBM и нью-йоркским MSKCC. Его результат — точная диагностика и индивидуальные рекомендации по лечению онкобольных. Советы компьютер генерирует на основе анализа более чем 30 тысяч карт пациентов.
В начале февраля 2017 года о применении искусственного интеллекта для моделирования новых лекарственных препаратов объявила команда разработчиков Mail.Ru Group, Insilico Medicine и МФТИ.
В портфеле перспективных разработок нашей компании сегодня находятся несколько десятков новых молекул, которые искусственный интеллект оценил как перспективные. На то, чтобы прийти к такому выводу, нам понадобилось несколько месяцев, в то время как ранее на это уходили годы. Основные вычисления проводятся в запущенном в 2016 году Центре обработки данных (ЦОД), мощность которого составляет 268 TFLOPS. Сейчас ЦОД в основном занимается сложным структурным анализом: для создания нового лекарственного препарата рассматривается не менее 1 млн природных молекул. Помимо базовых исследований впоследствии нужные молекулы дорабатываются и усовершенствуются, в результате чего синтезируемый препарат становится более безопасным и эффективным. Первичный анализ в данном случае проводится в виртуальной среде in silico, и только после этого прошедшие отбор материалы отправляются в лаборатории для прохождения тестов in vitro и in vivo.
Использование методов математического моделирования экономит компании не только время и деньги, но и положительно сказывается на репутации. Ведь математические исследования снимают необходимость проведения тестов на животных моделях.
И я думаю, это только начало: функциональные математические модели демонстрируют неуклонно возрастающую эффективность и вскоре помогут полностью изменить процесс разработки и создания лекарственных препаратов.