Искусственный интеллект научили прогнозировать структуру белков

Биологи представили программу под названием RoseTTAFold, которая способна по аминокислотной формуле белка воссоздать его объемную структуру. Эту непростую задачу алгоритм решает при помощи машинного обучения.
Искусственный интеллект научили прогнозировать структуру белков
Ian Haydon, UW Medicine Institute for Protein Design

Вычислить трехмерную структуру белка не так-то просто — в лаборатории для этого могут потребоваться годы, а чтобы воспользоваться специальной программой, нужно простоять в очереди не меньше месяца. Но с новым алгоритмом такие задачи можно решить всего за 10 минут

Белки состоят из цепочек аминокислот, которые складываются в сложные объемные структуры. Эти уникальные формы, в свою очередь, определяют течение почти всех химических процессов внутри живых организмов. Лучше понимая структуры, в которые складываются белки, ученые могут ускорить разработку новых методов лечения рака, COVID-19 и тысяч других заболеваний.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В прошлом году исследователи из проекта DeepMind представили миру свою программу, которая способно моделировать форму белков и из невообразимо огромного количества вариантов выбирать тот, что наиболее приближен к реальности. Но проект оставался закрытым для большинства ученых — для получения доступа к нему нужно было простоять в очереди несколько месяцев.

Чтобы предоставить всем ученым одинаковую свободу в своих исследованиях, сотрудники Института белкового дизайна при Медицинской школе Вашингтонского университета в Сиэтле создали RoseTTAFold — программу, которая использует глубокое машинное обучение для быстрого и точного прогнозирования белковых структур, основываясь на ограниченном объеме информации. Без помощи такого программного обеспечения могут потребоваться годы лабораторных работ для определения структуры всего одного белка.

RoseTTAFold может рассчитать одну молекулу всего за 10 минут на обычном, хоть и довольно мощном, персональном компьютере. Авторы разработки разместили исходный код программы на GitHub — его скачали уже 140 различных исследовательских групп, которые теперь используют ПО для ускорения собственных исследований.