Dopo aver generato dal nulla proteine che non esistono in natura – in tal senso, lo studio condotto dai ricercatori dell’Università della California a San Francisco e dell’azienda Salesforce AI Research, pubblicato sulla rivista Nature Biotechnology (titolo: “Large language models generate functional protein sequences across diverse families”), rappresenta un passo rilevante per la progettazione di nuovi farmaci) – l’intelligenza artificiale spinge sull’acceleratore nel campo della ricerca biomedica. In tal senso, il binario su cui viaggia è parallelo: prevedere le interazioni fra tutte le molecole della vita (non solo proteine dalla struttura complessa, ma gli acidi nucleici come il DNA e l’RNA nonché le armi del nostro sistema immunitario: dagli anticorpi agli antigeni) per poi generare strutture biologiche complesse abili ad aprire le porte a nuovi farmaci e terapie.
L’esito della ricerca (“Accurate structure prediction of biomolecular interactions with AlphaFold 3”, pubblicata anch’essa su Nature) si deve al modello di IA “AlphaFold 3” messo a punto da Google DeepMind (controllata da Alphabet, ha presentato anche AlphaFold Server, un tool gratuito e di semplice utilizzo che permette ai ricercatori che lavorano nel settore pubblico/universitario di accedere alle capacità del nuovo software in grado di modellare grandi molecole e di “anticipare” le interazioni tra anticorpi e patogeni) insieme a Isomorphic Labs (startup lanciata nel 2021 mirando ad applicare l’intelligenza artificiale e i metodi computazionali alla scoperta di nuovi farmaci, lo scorso gennaio ha annunciato delle collaborazioni strategiche con Eli Lilly and Company e Novartis). Entrambe le aziende inglesi parlano ora di “un modello rivoluzionario capace di prevedere la struttura e le interazioni di tutte le molecole della vita con una precisione senza precedenti”.
Ricorrendo alle strutture relative a quasi tutti i tipi di molecole contenute nel Protein Data Bank, grazie all’impiego di AlphaFold 3 gli studiosi hanno rilevato “un miglioramento di almeno il 50% rispetto ai metodi di previsione esistenti per le interazioni delle proteine con altre tipologie di molecole”. Aggiungendo che “per alcune importanti categorie di interazione, abbiamo raddoppiato la precisione della previsione”. Le informazioni acquisite potrebbero essere sfruttate sia per aumentare il grado di conoscenza sull’universo biologico e cellulare, sia in ambito clinico (a vantaggio dello sviluppo, della scoperta e/o messa a punto di nuovi farmaci).
Nuova generazione di modelli di IA
Il nuovo modello si basa sulle fondamenta di AlphaFold 2, che nel 2020 compì un passo avanti nella previsione della struttura delle proteine; per la prima volta nella storia, infatti, l’intelligenza artificiale ha portato a poche ore – se non minuti –, la ricostruzione 3D della forma che la proteina assume dopo il ripiegamento in rimando alla sua sequenza di aminoacidi. Ad oggi, vari gruppi di ricerca impiegano AlphaFold nello studio di vaccini per combattere la malaria (è il caso di Matthew Higgins dell’Università di Oxford), come alleato nei trattamenti contro il cancro e nella progettazione di enzimi. Senza dimenticare che di AlphaFold è stato citato il paper (“Highly accurate protein structure prediction with AlphaFold”), ovvero l’articolo di riferimento, oltre 20mila volte e la sua incidenza scientifica è stata riconosciuta attraverso numerosi riconoscimenti al Ceo di Google DeepMind, Demis Hassabis – che nel 2010 ha fondato la startup con sede a Londra insieme a Shane Legg, filosofo e ricercatore nel campo dell’IA, e Mustafa Suleyman, neuroscienziato e imprenditore –, tra i più recenti dei quali c’è il Breakthrough Prize in Life Sciences.
In particolare, la capacità di AlphaFold 3 di modellare differenti proteine è stata parzialmente migliorata grazie all’algoritmo “modello di diffusione” (diffusion model), che supporta i generatori di immagini di intelligenza artificiale – da Dall-E a Midjourney – a creare immagini originali e (non di rado) fotorealistiche. Il modello di diffusione di AlphaFold 3 non solo rende maggiormente nitide le strutture molecolari originate dal software, ma riesce a generare modelli proteici plausibili che richiamano gli schemi rilevati nell’analisi di una serie di strutture proteiche verificate. Esattamente come un generatore di immagini apprende dalle fotografie reali. Se negli anni addietro la comprensione delle strutture proteiche richiedeva un impegno certosino compiuto grazie ai microscopi elettronici e alla tecnica della cristallografia a raggi X per lo studio dell’organizzazione strutturale degli atomi nella materia, oggi – illustra Google – “AlphaFold 3 ci conduce oltre le proteine, verso un ampio spettro di biomolecole. Un salto che potrebbe sbloccare una scienza più trasformativa, spaziando dallo sviluppo di materiali biorinnovabili all’accelerazione della progettazione di farmaci e della ricerca per la genomica”.