Ровно год назад компания DeepMind выпустила базу данных с открытым исходным кодом, содержащую трехмерные конструкции сотен тысяч белков, включающую более 20 000 полипептидов человека. Сегодня этот банк данных увеличился до 200 млн и теперь включает практически все известные науке белки.

Белки — это рабочие лошадки клеток, выполняющие невероятное количество биологических процессов, необходимых для поддержания жизни. Они состоят из последовательности аминокислот, которые складываются в замысловатые трехмерные структуры, которые и определяют их предназначение. Картирование белков крайне важно для понимания того, какую роль они выполняют, как они работают и что может пойти не так. Это имеет ключевое значение для исследований во всех областях - от новых лекарств и методов лечения до улучшения урожаев и сохранения животных.
Однако определить точное строение белка на основе входящих в его состав альфа-аминокислот по-прежнему невероятно сложно. Эта задача требует огромного количества вычислительных и человеческих ресурсов. В научном мире такая ситуация известна как "проблема фолдинга белка". Поэтому на протяжении десятилетий работа в этом направлении продвигалась довольно медленно.
Так было до тех пор, пока в работу не включилась Alphabet с мощным ИИ DeepMind. Первоначально обученная на 100 000 известных полипептидов, технология быстро вычислила конструкции миллионов новых молекул. Сегодня поиск нового белка занимает считанные минуты, а то и пару секунд, а раньше на это уходили месяцы и даже годы.
В июле 2021 года первая версия базы данных AlphaFold Protein Structure Database была выложена в открытый доступ для ознакомления. Первоначально она содержала более 350 000 структур белковых молекул, включая около 98,5 процента белков человека, а также полипептидов, встречающихся у плодовых мушек, мышей, дрожжей и кишечной палочки. Позже каталог был расширен до миллиона структур от 10 000 видов животных, растений, бактерий, грибов и других организмов. С тех пор к этой базе данных получили доступ более 500 000 ученых со всего мира.
Буквально вчера DeepMind выпустила представила обновленную версию своего каталога, который теперь насчитывает порядка 214 млн. структур от миллионов различных организмов. "Это касается практически всех известных науке полипептидов, что открывает огромные возможности для научно-исследовательской деятельности в области терапии заболеваний, иммунизации населения, устойчивого развития, резистентности к препаратам и многих других".
"AlphaFold значительно ускорил и сделал возможными крупнейшие открытия, включая изучение структуры комплекса ядерной поры", - сказал Эрик Топол, директор Трансляционного института Скриппсовских исследований. "А благодаря такому масштабному обновлению, охватывающему почти всю белковую вселенную, учёные с каждым днём будут разгадывать всё больше биологических тайн".
Полный каталог AlphaFold можно скачать тут
Источник: DeepMind, AlphaFold Protein Structur Database, Википедиа
1. (https://en.wikipedia.org/wiki/Protein_folding)
2. (https://ru.wikipedia.org/wiki/Ядерные_поры)
3. (https://github.com/deepmind/alphafold/blob/main/afdb/README.md)
4. (https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe)

