Tout chercheur pourra donc trouver la structure 3D d’une protéine, quasiment aussi facilement qu’en tapant une recherche sur Google.

« Des chercheurs ont utilisé AlphaFold, un réseau d’intelligence artificielle (IA) révolutionnaire, pour prédire la structure de plus de 200 millions de protéines provenant d’un million d’espèces, soit la quasi-totalité des protéines connues sur la planète.

Les données sont disponibles gratuitement sur une base de données mise en place par DeepMind, la société d’IA basée à Londres, propriété de Google, qui a développé AlphaFold, et l’Institut européen de bioinformatique du Laboratoire européen de biologie moléculaire (EMBL-EBI), une organisation intergouvernementale située près de Cambridge, au Royaume-Uni. » affirme l’article Nature de juillet 2022.

La base de recherche des protéines d’AlphaFold*

Pourquoi est-ce le début d’une nouvelle ère de la biologie numérique ?

La forme 3D, ou structure, d’une protéine est ce qui détermine sa fonction dans les cellules. La plupart des médicaments sont conçus à l’aide d’informations structurelles, et la création de cartes précises de l’arrangement des acides aminés des protéines est souvent la première étape pour faire des découvertes sur le fonctionnement des protéines.

« La base de données AlphaFold a été lancée il y a un an avec plus de 350 000 prédictions de structure couvrant presque toutes les protéines fabriquées par les humains, les souris et 19 autres organismes largement étudiés. Le catalogue s’est depuis enrichi d’environ un million d’entrées. »

Il s’agit toutefois de prédictions, certes très précises, de la structure de nombreuses protéines d’un réseau. Ces prédictions sont aussi bonnes que celles qui sont obtenues de manière expérimentale, et les chercheurs pourront utiliser les prédictions d’AlphaFold pour valider et donner un sens aux données expérimentales.

Le logiciel d’AlphaFold étant disponible depuis un an, les chercheurs ont déjà la capacité de prédire la structure de toute protéine qu’ils souhaitent, il peut toutefois être encore optimisé.

Des structures de protéines qui impliquent tout le vivant

« Les protéines sont les éléments constitutifs de la vie, responsables de la plupart des activités à l’intérieur des cellules. La façon dont une protéine fonctionne et ce qu’elle fait est déterminé par sa forme en 3D - «la structure est la fonction» est un axiome de la biologie moléculaire. Les protéines ont tendance à adopter leur forme sans aide, guidées uniquement par les lois de la physique.» expliquait également cet article de 2020.

*AlphaFold est un système d’IA développé par DeepMind qui prédit la structure 3D d’une protéine à partir de sa séquence d’acides aminés. Il atteint régulièrement une précision compétitive par rapport à l’expérience.

La base est accessible ici : https://alphafold.ebi.ac.uk/

Une présentationest accessible ici : https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe