L’IA a reproduit l’évolution et généré de nouvelles enzymes aussi bonnes que naturelles – DNyuz

AI Replicated Evolution and Generated New Enzymes as Good as Natural Ones

Au cours des derniers mois, il est devenu clair que l’IA peut être formée pour imiter le langage humain – il suffit de regarder ChatGPT. Et maintenant, la recherche montre que s’ils sont formés de manière adéquate, des modèles de langage similaires peuvent imiter la biologie et l’évolution humaines, et même leur donner leur propre tournure.

Dans une étude, qui a été publié Jeudi dans Nature Biotechnology, les chercheurs ont testé la capacité d’un modèle de langage (ProGen de Salesforce) à générer des séquences d’acides aminés – des enzymes – qui pourraient potentiellement fonctionner dans des scénarios réels. Le projet était une collaboration de nombreuses parties différentes, y compris Salesforce Research et des chercheurs de l’Université de Californie à San Francisco et de l’Université de Californie à Berkeley.

Mais pourquoi utiliser un modèle de langage – quelque chose qui a été utilisé pour générer des essais et des articles, par exemple – pour générer la biologie ? Les protéines peuvent être représentées comme un langage composé d’acides aminés, les 20 molécules qui composent chaque protéine.

« De la même manière que les mots sont enchaînés un par un pour former des phrases textuelles, les acides aminés sont enchaînés un par un pour fabriquer des protéines », a écrit le directeur de la recherche sur l’IA chez Salesforce Research, Nikhil Naik, dans un e-mail à Motherboard. . « En nous appuyant sur cette idée, nous appliquons la modélisation du langage neuronal aux protéines pour générer des séquences de protéines réalistes mais nouvelles. »

Fondamentalement, au lieu d’apprendre la langue anglaise, l’équipe a développé l’IA pour apprendre le langage des protéines, a expliqué Ali Madani Ph.D, un ancien scientifique de Salesforce Research impliqué dans l’étude, écrit dans un e-mail à Motherboard.

Comme d’autres programmes d’IA, le modèle devait être enseigné en conséquence. ProGen a d’abord été formé sur 280 millions de protéines. Après deux semaines, l’équipe a affiné le modèle en l’introduisant dans un ensemble de données d’environ 56 000 protéines de cinq familles différentes. Le modèle a ensuite généré un million de séquences artificielles. L’équipe s’est concentrée sur 100 protéines pour voir comment elles se comparaient aux protéines naturelles et si elles avaient ou non suivi de manière adéquate la soi-disant « grammaire » de la composition en acides aminés.

Sur ces 100 protéines, l’équipe a créé cinq des protéines artificielles et testé leur fonctionnalité dans les cellules, en voyant à quel point elles se comparaient à une enzyme trouvée dans les œufs de poule, appelée à juste titre « lysozyme de blanc d’œuf de poule » (HEWL). Deux des protéines ont démontré une activité similaire à HEWL, décomposant les parois cellulaires des bactéries.

« Les enzymes fonctionnent (prêtes à l’emploi) ainsi que les protéines qui ont évolué au cours de millions d’années d’évolution », a déclaré Madani. L’équipe a également constaté que le modèle était capable de capturer des schémas évolutifs, sans être spécifiquement formé pour le faire.

Alors que l’IA a été utilisé pour générer des protéinescette étude diffère un peu des recherches antérieures et élargit encore l’idée de ce qui est possible avec les modèles de langage.

« Notre travail utilise des modèles de langage conditionnel qui permettent un contrôle beaucoup plus important sur les types de séquences générées, ce qui les rend plus utiles pour concevoir des protéines aux propriétés spécifiques », a écrit Naik. « Nous avons également validé nos résultats dans un laboratoire humide. »

Les méthodes décrites dans le document sont également disponibles sur GitHub pour permettre à la communauté de recherche de s’appuyer sur ces travaux et d’accélérer la recherche sur l’IA pour la conception de protéines. Selon Madani, les protéines sont les bêtes de somme de la vie.

« Tout ce qui peut aller mal ou bien dans un corps humain dépend des protéines, et donc en concevoir de nouvelles peut nous permettre de traiter plus efficacement les maladies ou même de les éviter en premier lieu », a écrit Madani. « Nous pouvons utiliser l’IA pour concevoir ces solutions.

La poste L’IA a reproduit l’évolution et généré de nouvelles enzymes aussi bonnes que les naturelles est apparu en premier sur VICE.

Loading...