AI replikerade evolution och genererade nya enzymer lika bra som naturliga – DNyuz

AI Replicated Evolution and Generated New Enzymes as Good as Natural Ones

Under de senaste månaderna har det blivit tydligt att AI kan tränas för att imitera mänskligt språk – se bara på ChatGPT. Och nu visar forskning att om de tränas adekvat kan liknande språkmodeller imitera människans biologi och evolution, och till och med sätta sin egen spin på det.

I en studie, som var publiceras på torsdagen i Nature Biotechnology testade forskare förmågan hos en språkmodell (Salesforces ProGen) att generera aminosyrasekvenser – enzymer – som potentiellt skulle kunna fungera i verkliga scenarier. Projektet var ett samarbete mellan många olika parter, inklusive Salesforce Research och forskare vid University of California-San Francisco och University of California-Berkeley

Men varför använda en språkmodell – något som till exempel har använts för att generera uppsatser och artiklar – för att skapa biologi? Proteiner kan representeras som ett språk som består av aminosyror, de 20 molekylerna som utgör varje protein.

”På samma sätt som ord strängs ihop en i taget för att bilda textmeningar, strängs aminosyror ihop en och en för att göra proteiner”, skrev direktör för AI Research på Salesforce Research Nikhil Naik i ett mejl till Motherboard . ”Med utgångspunkt från denna insikt tillämpar vi neurala språkmodeller på proteiner för att generera realistiska men ändå nya proteinsekvenser.”

I grund och botten, istället för att lära sig engelska språket, utvecklade teamet AI för att lära sig proteinernas språk, förklarade Ali Madani Ph.D, en före detta forskare vid Salesforce Research involverad i studien, skrev i ett mejl till Motherboard.

Liksom andra AI-program måste modellen läras ut i enlighet med detta. ProGen tränades först på 280 miljoner proteiner. Efter två veckor finjusterade teamet modellen genom att introducera den i en datauppsättning med cirka 56 000 proteiner från fem olika familjer. Modellen genererade sedan en miljon artificiella sekvenser. Teamet fokuserade på 100 proteiner för att se hur de jämförde med naturliga proteiner, och om de hade följt den så kallade ”grammatik” för aminosyrasammansättningen eller inte.

Av dessa 100 proteiner skapade teamet fem av de artificiella proteinerna och testade deras funktionalitet i celler, och såg hur bra de jämförde med ett enzym som finns i kycklingägg, passande namnet ”hen egg white lysozyme” (HEWL). Två av proteinerna uppvisade aktivitet som liknar HEWL och bryter ner bakteriers cellväggar.

”Enzymerna fungerar (out-of-the-box) såväl som proteiner som har utvecklats under miljontals år av evolution,” sa Madani. Teamet fann också att modellen kunde fånga evolutionära mönster, utan att vara specifikt utbildad för att göra det.

Medan AI har använts för att generera proteinerdenna studie skiljer sig lite från tidigare forskning och utökar ytterligare idén om vad som är möjligt med språkmodeller.

”Vårt arbete använder villkorade språkmodeller som möjliggör betydligt mer kontroll över vilka typer av sekvenser som genereras, vilket gör dem mer användbara för att designa proteiner med specifika egenskaper,” skrev Naik. ”Vi har också validerat våra resultat i ett vått labb.”

De metoder som beskrivs i uppsatsen finns också tillgängliga på GitHub för att göra det möjligt för forskarvärlden att bygga vidare på detta arbete och påskynda forskningen om AI för proteindesign. Som Madani ser det är proteiner livets arbetshästar.

”Allt som kan gå fel eller rätt i en mänsklig kropp är beroende av proteiner, så att designa nya kan göra det möjligt för oss att mer effektivt behandla sjukdomar eller till och med undvika dem i första hand”, skrev Madani. ”Vi kan använda AI för att konstruera dessa lösningar.

Inlägget AI replikerade evolution och genererade nya enzymer lika bra som naturliga dök upp först VICE.

Loading...