L’IA continue d’être au fondement d’un avenir remarquable dans le secteur de la biologie
![](https://www.wisdomtree.eu/-/media/eu-media-files/blog/refresh-images/technology/artificial-intelligence/istock-1150209335.jpg?h=564&iar=0&w=1151&sc_lang=fr-fr&hash=F0FF354912740E750645C92077797C3A)
Le 28 juillet 2022 est à marquer d’une pierre blanche pour la biologie et l’intelligence artificielle (IA). DeepMind, société spécialisée dans la recherche sur l’IA et détenue par Alphabet, a mis gratuitement à disposition les données structurelles sur plus de 200 millions de protéines contenues dans son outil AlphaFold, soit sur environ 1 million d’espèces et la grande majorité des protéines connues sur Terre1.
Dans le domaine des protéines, leur forme peut déterminer leur fonction
À la fin des années 1990 et au début des années 2000, la communauté scientifique a été inondée d’annonces sur la course au séquençage du génome humain. Ce génome contient des instructions intégrées à l’ADN sur la manière dont les cellules doivent construire certaines structures, généralement par la formation de protéines constituées à partir de différentes combinaisons d’acides aminés.
Dans un sens, l’ADN est le manuel d’instructions, les acides aminés sont les composantes et les protéines le produit. Toutefois, connaître le code génétique ne suffit pas.
Sur ce point, le Schéma 1 est instructif. Il s’agit de l’image d’une protéine susceptible de protéger l’organisme responsable de la malaria contre une attaque du système immunitaire humain. Même si vous connaissez la liste et l’ordre de l’ensemble des acides aminés, il vous sera difficile de passer de cette liste à quelque chose qui ressemble au Schéma 1 en trois dimensions.
Schéma 1 : Protéine associée au parasite de la malaria
Source : https://alphafold.ebi.ac.uk/entry/Q8I3H7
L’importance de la forme de la protéine ne doit pas être surestimée :
- Elle peut correspondre à son mode de réaction en présence de différentes molécules, à l’image de celles associées à différentes thérapies médicamenteuses
- Les variations de la forme, parfois baptisées mutations, peuvent contribuer à déterminer les causes de certains symptômes ou maladies
- Certaines parties de la protéine peuvent être utilisées comme cibles. Pensez par exemple à la protéine S associée au virus à l’origine de la pandémie de Covid-19, plus particulièrement ciblé par les vaccins à ARN messager.
AlphaFold représente un bond en avant
Les avancées scientifiques sont difficiles à obtenir. En effet, un scientifique s’appuie dans la plupart des cas sur les résultats d’un autre, puis d’un autre, etc. soit un processus qui peut prendre des décennies avant de parvenir à des résultats généralisés qui a une influence positive sur la vie du grand public. À titre d’exemple, nous avons séquencé le génome humain, ce qui n’a pas nécessairement entraîner des guérisons immédiates de toutes sortes de maladies ou affections. Des recherches sur l’ARN messager2 avaient lieu depuis des décennies, mais la pandémie de Covid-19 a été en quelque sorte un catalyseur d’accélération du processus pour parvenir à la création de vaccins.
Il est donc peu probable que la nouvelle base de données d’AlphaFold aboutisse à des guérisons immédiates de maladies graves. En revanche, il est nécessaire de souligner une avancée essentielle : auparavant, les scientifiques qui devaient appliquer un processus complexe de cristallographie à rayons X pour déterminer la forme d’une proténie pourront désormais consulter la base de données. Les techniques expérimentales auront encore leur place, mais moins de temps devrait être passé sur l’équivalent de la « page blanche ».
Autre fait exceptionnel, la bases de données d’AlphaFold est, conjointement avec l’Institut européen de bioinformatique du Laboratoire européen de biologie moléculaire, disponible gratuitement dans une interface simple. Elle fournit également une estimation du degré de précision en reconnaissant que les prévisions établies grâce à une IA ne produisent pas tout le temps des résultats parfaits. Environ 35 % des 214 millions de prévisions sont jugées hautement précises, soit un résultat à peu près aussi bon que des résultats expérimentaux. Et 45 % sont jugées suffisamment précises pour de nombreuses applications3.
Découverte de médicaments - De meilleurs traitements développés de manière plus efficace
Même avant le début de la période d’inflation élevée observée durant l’été 2022, il était largement reconnu que le développement de médicaments était chronophage et onéreux et qu’en conséquence, de nombreux médicaments différents étaient commercialisés à des prix exorbitants. Or tout processus susceptible de diminuer leur prix sans dégrader la qualité des thérapies est précieux.
Il sera instructif de tenir compte des aspects suivants à mesure des progrès réalisés par le secteur4:
- Croissance des projets en développement : 20 petites sociétés spécialisées dans la découverte de médicaments grâce à l’IA, généralement spécialisées sur les petites molécules, sur une période de 2010 à 2021, avaient des projets de développement qui étaient environ 50 % aussi solides que ceux de 20 des plus grandes entreprises pharmaceutiques. Nous sommes conscients que la publication sur les projets en développement n’est pas parfaite et qu’une molécule en développement n’est pas un produit fini, mais l’activité de ces petites sociétés est un premier pas dans la bonne direction
- Composition des projets en développement : même si cet aspect ne fait pas toujours l’objet de publications, à partir des informations disponibles il apparaît que les sociétés spécialisées dans l’IA se concentreront généralement sur des cibles biologiques bien établies pour leurs thérapies et qui n’ont plus grand chose à cacher. Les données sont le carburant de l’IA et ces entreprises souhaitent une probabilité élevé de succès. Les grandes entreprises pharmaceutiques seront plus susceptibles de s’aventurer dans des domaines plus émergents de la découverte de médicaments
- Structures et propriétés chimiques : il est à ce stade trop tôt pour tirer des conclusions solides sur les efforts de découverte de médicaments grâce à l’IA par rapport aux efforts des grandes entreprises pharmaceutiques
- Temps nécessaire aux découvertes : les données préliminaires sembleraient indiquer que, si les approches traditionnelles prennent généralement de 5 à 6 ans lors des phases précliniques, la découverte de traitement à base d’IA peut dans certains cas réduire cette durée à 4 ans
Nous souhaitons indiquer ici qu’il s’agit actuellement plus de progrès que de perfection dans la mesure où nous sommes encore loin d’une IA capable de créer complètement de nouveaux médicaments, mais l’IA propose une nouvelle série entièrement nouvelle d’outils qui peuvent avoir des incidences positives. À titre d'exemple, la base de données d’AlphaFold peut fournir aux chercheurs de médicaments des données importantes et des catalyseurs d’idées différentes même si elle n’apporte pas de réponse ni de guérison immédiate.
Zoom sur les mégatendances de l’IA et de la biorévolution
Chez WisdomTree, nous privilégions les mégatendances de l'IA et de la biorévolution (cliquez pour en savoir plus). Le cas d’AlphaFold est pour nous une étude de cas importante sur l’IA comme outil d’accélération d’autres mégatendances, ici la biorévolution. Ce n’est pas un hasard si la biorévolution s’intensifie au même moment où les volumes de données sont massifs, les capacités de traitement sont exceptionnelles et d’autres aspects tels que l’informatique dans le cloud sont facilement accessibles. Il est passionnant d’imaginer ce que vont nous réserver les prochaines décennies dans ces domaines.
Sources
1 Source : Ewen Callaway. « ‘The Entire Protein Universe’: AI Predicts Shape of Nearly Every Known Protein. » Nature. Volume 608. Au 04/08/2022.
2 ARN messager – Acide ribonucléique messager
3 Source : Callaway, 4 août 2022.
4 Source : Jayatunga et al. « AI in small-molecule drug discovery: a coming wave? » Nature Review: Drug Discovery. Volume 21. Mars 2022.
Blogs associés
+ La demande presque illimitée en faveur d’un meilleur stockage d’énergie
+ 1ère partie : une synthèse réaliste des progrès réalisés par l’Intelligence artificielle
+ 2ème partie sur l’IA : le battage médiatique, d’accord, mais concrètement ?