Научная
деятельность
Университет ИТМО

На пересечении научных направлений: специалист по биоинформатике Никита Алексеев – о проблемах отрасли и работе в Университете ИТМО

Ведущий научный сотрудник факультет информационных технологий и программирования, участник программы ITMO Fellowship Никита Алексеев вернулся в Санкт-Петербург после нескольких лет работы в области биоинформатики в США. В интервью он поделился своим взглядом на биоинформатику и рассказал о своей карьере.

Какова ваша область исследований?

Я занимаюсь вычислительной биологией и математикой в биологии. Очень важной областью является биоинформатика, она существует уже около 40 лет, но особенно заметна в последние пару десятилетий. Относительно недавно был завершен проект по сборке генома человека, который стал большим достижением и обусловил быстрое развитие этой области. Сборка генома в целом является типичной задачей в биоинформатике, и, взглянув на уже собранные геномы, можно увидеть, какие животные самые «важные»: человек, само собой; мыши, которые часто используются в экспериментах; лошади, потому что генная инженерия очень важна для людей, которые занимаются лошадьми, и потому что в этой области много денег.

Я же занимаюсь исследованием вирусов. Вот, например, одна из задач, над которой я сейчас работаю. Хорошо известно, что вирус гриппа мутирует от сезона к сезону, что позволяет ему столь успешно заражать людей. Если мы возьмем его геном, то есть последовательность нуклеотидов в ДНК, мы обнаружим, что у каждого человека, которого мы проверяем, есть комбинация различных штаммов вируса, и если у нас достаточно большая выборка людей, мы можем «сопоставить» их и определить, кто кого заразил, создав дерево геномов и их изменений. Это требует достаточно глубокого исследования вирусов.

По образованию вы больше математик, чем биолог. Как вы реализуете себя в двух науках?

Верно, я математик, но я тесно сотрудничаю с биологами. Основная трудность здесь заключается в том, что нередко мы говорим на разных языках, с научной точки зрения. Часто говорят, что будущее за междисциплинарностью, и это правда, но, когда дело дошло до изучения биологии, мне было очень трудно найти курсы, которые были бы мне понятны и интересны. В какой-то момент я нашел курс, который считается одним из лучших в данной области, курс профессора Эрика Ландера из Массачусетского технологического института, и я просто почувствовал, что мне намного легче его понять. Где-то в середине курса я узнал, что у него есть докторская степень в области криптографии и алгебры, и именно этот фактор, как мне кажется, был решающим.

В биоинформатику ученые приходят с обеих сторон. Математик может изучать биологию, а биолог – математику. Конечно, чтобы быть хорошим специалистом, вам нужно иметь определенный уровень знаний в обеих областях. Настоящий биолог легко заметит, что я пришел из математики и не знаю биологию на их уровне, но именно поэтому мы сотрудничаем и поэтому это называется междисциплинарной областью. В настоящее время есть студенты, которые целенаправленно готовятся стать специалистами в области биоинформатики – например, в ИТМО есть такая магистерская программа.

Какие практические задачи решает биоинформатика? Где работают специалисты?

Биоинформатика применяется в фармацевтике, порой даже в парфюмерии. Она также используется для разработки определенных методов диагностики. В Москве есть стартап, который занимается выявлением рака молочной железы с использованием методов биоинформатики. В целом, вы можете провести анализ и секвенирование своей ДНК, и специалисты сообщат вам о вероятности развития определенных заболеваний. Для некоторых заболеваний этот процесс уже хорошо отработан и в некоторых случаях даже тривиален.

Вышеупомянутое построение вирусных деревьев иногда может использоваться для решения судебных дел (кто кого заразил), и в Европе и США уже были прецеденты. Кроме того, это может помочь нам найти точку мутации вируса, при которой он становится более вирулентным, то есть лучше заражает и повреждает носителя.

Летняя школа по биоинформатике-2018
Летняя школа по биоинформатике-2018

Другое приложение для биоинформатики – сельское хозяйство, которое является важным сектором экономики. Почему умирают креветки? Как мы редактируем гены продуктов, чтобы сделать их более устойчивыми к транспортировке? Биоинформатика может ответить на некоторые из этих вопросов.

Криминалистика очень хорошо известна людям из разных фильмов и сериалов. Специалисты могут вычислить преступника по ДНК, если обнаружат его следы на месте преступления. В США существует проект, который пытается оправдать людей, приговоренных к смертной казни или приговоренных к пожизненному заключению, с использованием этой технологии.

Другим примером реализации биоинформатики является проект 23andme, который позволяет вам исследовать ДНК, чтобы найти своих предков по всему миру.

Какие области математики важны для биоинформатики?

В биоинформатике ключевую роль играет теория графов. Построение эволюционных деревьев подпадает под теорию графов, сбор геномов использует теорию графов, сворачивание белков также в определенной степени реализует теорию графов. Поскольку сворачиваемый белок имеет свою трехмерную форму, также необходима геометрия. В целом, непрерывная математика (которую некоторые люди без математического образования называют просто математикой) преподается в университетах чаще, но биология требует знаний и в дискретной математике, то есть математике дискретных значений. Теория графов является ее частью.

Задача о 7 кёнингсбергских мостах
Задача о 7 кёнингсбергских мостах

Теория графов, на самом деле, очень старая. Существует известная задача о семи кёнигсбергских мостах, и попытка Эйлера пройти по всем мостам, не ступая на один и тот же остров дважды, на самом деле имеет отношение к изучению геномов. В каком-то смысле можно сказать, что математика готовилась к биоинформатике заранее.

И, конечно, требуется много статистики, теории вероятностей и комбинаторики.

Каковы текущие проблемы, с которыми сталкивается биоинформатика? Каковы ее задачи на сегодняшний день?

Считывание генома по-прежнему трудная задача. Люди – это одно, мы потратили 10 лет на сбор нашего генома, а кукуруза (геном которой больше, чем у человека) – это другое, а почва – это третье, отличающееся от всего из-за количества живых организмов в ней.

Очень важной общей задачей является определение фенотипа по генотипу. На данный момент мы знаем, что означают некоторые гены и как они влияют на организм, предопределяя гендер, цвет глаз, цвет волос и риск некоторых заболеваний, но нам еще многое предстоит узнать.

В иммунологии существует множество задач, которые связаны с пониманием того, как работает иммунитет и как клетки учатся бороться с чужеродными организмами. Конечно, огромное количество ресурсов уходит на поиск лекарства от рака, и биоинформатика играет здесь важную роль, поскольку рак – это генетическое заболевание. Перед нами много вызовов, биология в целом полностью изменилась за последние 50 лет. Именно поэтому эта наука сейчас так интересна.

Лаборатория компьютерных технологий Университета ИТМО
Лаборатория компьютерных технологий Университета ИТМО

Вы учились и работали в США. Почему вы выбрали именно эту страну?

В последний год обучения в Санкт-Петербургском государственном университете я много путешествовал по Германии и работал там математиком. Я продолжал эти поездки во время написания своей кандидатской диссертации, а после этого вернулся в Россию в 2010 году. Тогда я не изучал биоинформатику, работал со случайными матрицами и только в конце обучения в аспирантуре начал интересоваться этой наукой.

На тот момент я искал место работы, и Штаты меня с этой точки зрения интересовали. Я думаю, что каждый должен посетить США в какой-то момент своей жизни. Я нашел там ученого, который работал в той же области, что и я, и связался с ним. Изначально я просто хотел договориться о коллаборации, но оказалось, что у него была открыта вакансия постдока.

Вашингтон, округ Колумбия, очень необычный город, он кажется искусственным в каком-то смысле. Там в основном чиновники, а все остальное соответствует их потребностям. В целом, американские города сильно отличаются от европейских и российских: там необходим автомобиль. Например, вы не можете по-настоящему гулять по Лос-Анджелесу, вам нужно путешествовать на машине между культурными достопримечательностями, магазинами, барами и так далее. То же самое можно сказать и об Атланте. Дело в том, что американцы живут в малоэтажных домах, и поэтому большой торговый центр, который обслуживает весь район, будет расположен далеко от многих домов. Но Вашингтон в этом смысле гораздо более европейский, более компактный. Очень политизированный город.

Само собой, меня всё это не особо волновало, я работал в университете. А вокруг меня было множество великолепных музеев, которые я часто посещал.

Почему вы выбрали Университет ИТМО?

Летняя школа по биоинформатике-2018
Летняя школа по биоинформатике-2018

В какой-то момент я устал от США и решил, что хочу вернуться в Европу. И Европа оказалась Университетом ИТМО. Во многих отношениях предложение петербургского вуза было уникальным, было приятно вернуться к родному языку, кроме того, у студентов здесь очень хорошая подготовка. Я думаю, что студенты оказались главной причиной того, что я остался здесь. В настоящее время я работаю со многими студентами и курирую ряд проектов. Я до сих пор сотрудничаю с учеными в США, и это дает мне доступ к данным из ряда больниц, а здесь у меня есть талантливые ребята, которые могут выполнять научные работы с этими данными.

Мне здесь нравится. В планах — продолжать развивать проекты и работать со студентами.