Crédit GREG BAKER / AFP
Washington, Etats-Unis | AFP | mardi 19/09/2023 - Des chercheurs de Google DeepMind, entreprise du géant américain spécialisée dans l'intelligence artificielle, ont présenté mardi un outil prédisant si des mutations génétiques sont potentiellement pathogènes ou non, une avancée qui pourrait notamment aider la recherche sur les maladies rares.
Il s'agit d'un "nouveau pas dans la reconnaissance de l'impact que l'intelligence artificielle a dans les sciences naturelles", a déclaré lors d'une conférence de presse Pushmeet Kohli, vice-président pour la recherche chez Google DeepMind.
L'outil s'est penché sur des mutations dites "faux-sens", où une seule lettre du code génétique est affectée, avec pour conséquence de pouvoir changer la fonction des protéines. Or chaque cellule exécute sa fonction à l'aide de protéines, qui livrent en permanence leurs instructions.
Un individu compte environ 9.000 de ces mutations, pour la plupart bénignes, selon l'entreprise, mais certaines peuvent entraîner des maladies, par exemple la mucoviscidose.
A ce jour, quatre millions de ces mutations ont déjà été observées chez les humains, mais seulement 2% d'entre elles ont été classées comme pathogènes ou comme bénignes.
Et au total, il existe 71 millions de ce type de mutations possibles. Elles ont été passées en revue par l'outil de Google DeepMind, appelé AlphaMissense, qui a pu se prononcer sur 89% d'entre elles.
Il a attribué à chaque mutation un score entre 0 et 1 indiquant le risque qu'elle soit pathogène, c'est-à-dire à l'origine d'une maladie. Résultat: 57% ont été classées comme probablement bénignes et 32% comme probablement pathogènes, le reste restant incertain.
La base de données a été rendue publique et mise à disposition de tous les scientifiques. Une étude pour la présenter a été publiée mardi dans la prestigieuse revue Science.
"Performances supérieures"
AlphaMissense affiche des "performances supérieures" aux outils existants, ont écrit les experts Joseph Marsh et Sarah Teichmann dans un article également publié dans Science.
L'outil "ne dit pas quelle maladie cela va causer", a précisé durant la conférence de presse Jun Cheng, scientifique chez Google DeepMind. "Mais nous pensons que nos prédictions peuvent être utiles pour augmenter le taux de diagnostic de maladies rares, et aussi potentiellement nous aider à trouver de nouveaux gènes en cause dans des maladies."
Indirectement, cela pourrait mener au développement de nouveaux traitements, estiment les chercheurs, qui préviennent toutefois qu'AlphaMissense ne doit pas être utilisé seul pour poser un diagnostic.
L'outil a été entraîné à partir d'une base données d'ADN humain et de primates, lui permettant de reconnaître quelles mutations génétiques sont répandues.
"Il apprend à quoi ressemble habituellement une séquence de protéines, et lorsqu'il est mis en présence d'une séquence avec une mutation, il peut dire si cela a l'air inquiétant ou non", a expliqué Jun Cheng.
"C'est un peu comme avec le langage humain: si on remplace un mot dans une phrase en anglais, une personne qui connaît l'anglais verra immédiatement si ce changement affecte la signification de la phrase ou non", a-t-il comparé.
AlphaMissense s'est appuyé sur AlphaFold, un autre programme d'apprentissage automatique présenté il y a plus de deux ans par Google DeepMind, qui avait permis de publier la plus grande base de données de protéines.
Il s'agit d'un "nouveau pas dans la reconnaissance de l'impact que l'intelligence artificielle a dans les sciences naturelles", a déclaré lors d'une conférence de presse Pushmeet Kohli, vice-président pour la recherche chez Google DeepMind.
L'outil s'est penché sur des mutations dites "faux-sens", où une seule lettre du code génétique est affectée, avec pour conséquence de pouvoir changer la fonction des protéines. Or chaque cellule exécute sa fonction à l'aide de protéines, qui livrent en permanence leurs instructions.
Un individu compte environ 9.000 de ces mutations, pour la plupart bénignes, selon l'entreprise, mais certaines peuvent entraîner des maladies, par exemple la mucoviscidose.
A ce jour, quatre millions de ces mutations ont déjà été observées chez les humains, mais seulement 2% d'entre elles ont été classées comme pathogènes ou comme bénignes.
Et au total, il existe 71 millions de ce type de mutations possibles. Elles ont été passées en revue par l'outil de Google DeepMind, appelé AlphaMissense, qui a pu se prononcer sur 89% d'entre elles.
Il a attribué à chaque mutation un score entre 0 et 1 indiquant le risque qu'elle soit pathogène, c'est-à-dire à l'origine d'une maladie. Résultat: 57% ont été classées comme probablement bénignes et 32% comme probablement pathogènes, le reste restant incertain.
La base de données a été rendue publique et mise à disposition de tous les scientifiques. Une étude pour la présenter a été publiée mardi dans la prestigieuse revue Science.
"Performances supérieures"
AlphaMissense affiche des "performances supérieures" aux outils existants, ont écrit les experts Joseph Marsh et Sarah Teichmann dans un article également publié dans Science.
L'outil "ne dit pas quelle maladie cela va causer", a précisé durant la conférence de presse Jun Cheng, scientifique chez Google DeepMind. "Mais nous pensons que nos prédictions peuvent être utiles pour augmenter le taux de diagnostic de maladies rares, et aussi potentiellement nous aider à trouver de nouveaux gènes en cause dans des maladies."
Indirectement, cela pourrait mener au développement de nouveaux traitements, estiment les chercheurs, qui préviennent toutefois qu'AlphaMissense ne doit pas être utilisé seul pour poser un diagnostic.
L'outil a été entraîné à partir d'une base données d'ADN humain et de primates, lui permettant de reconnaître quelles mutations génétiques sont répandues.
"Il apprend à quoi ressemble habituellement une séquence de protéines, et lorsqu'il est mis en présence d'une séquence avec une mutation, il peut dire si cela a l'air inquiétant ou non", a expliqué Jun Cheng.
"C'est un peu comme avec le langage humain: si on remplace un mot dans une phrase en anglais, une personne qui connaît l'anglais verra immédiatement si ce changement affecte la signification de la phrase ou non", a-t-il comparé.
AlphaMissense s'est appuyé sur AlphaFold, un autre programme d'apprentissage automatique présenté il y a plus de deux ans par Google DeepMind, qui avait permis de publier la plus grande base de données de protéines.