Proteine: Cronaca di una Rivoluzione

Proteine: Cronaca di una Rivoluzione

Alphafold2 é un programma di intelligenza artificiale che si é dimostrato in grado di decodificare le loro strutture tridimensionali anche quelle più complesse.


Le proteine compongono oltre il 60% del corpo umano e indirizzano il suo metabolismo come quello di tutti gli esseri viventi. Ma per lungo tempo le loro strutture chimiche spesso composte da migliaia di atomi sono rimaste inattaccabili anche ai più sofisticati strumenti analitici oggi disponibili, il microscopio crioelettronico e la cristallografia a raggi X. Un gap di conoscenza inaccettabile per i biologi.

Uno scenario che il 30 novembre del 2020 ha avuto una accelerazione decisiva quanto imprevista. Racconta un emozionato Garrett Morris professore di Systems Approaches to Biomedicine presso la Oxford University in U.K. “Tutto quello che pensavo di avere imparato fino alle tre del pomeriggio di quel lunedì di novembre, é stato improvvisamente spazzato via”. In una conferenza stampa John Moult un biologo computazionale dell’Institute for Bioscience & Biotechnology Research, University of Maryland, USA, ha annunciato che un programma di biologia computazionale di Deepmind della Alphabet di Google, AlphaFold2 il suo nome commerciale, aveva ottenuto risultati oltre ogni previsione nella decrittazione della struttura delle proteine.

Tutto era avvenuto qualche giorno prima nel corso delle giornate del CASP, Critical Assesment of Structure Prediction, una manifestazione all’interno della quale due volte l’anno, si sfidano e vengono messi a confronto vari strumenti e procedure di decrittazione delle proteine realizzati dalle Università o da gruppi di ricerca pubblici o privati. “Dopo quasi tre decenni di queste competizioni, il gruppo di esperti che ha valutato i risultati della gara di questo autunno ha dichiarato che AlphaFold2 era finalmente riuscito a risolvere una sfida aperta da cinquanta anni: sviluppare un metodo che con accuratezza e precisione fosse in grado di predire la struttura in 3D delle proteine semplicemente partendo dalla sequenza degli aminoacidi componenti. La grandezza di questo passo in avanti come il suo potenziale impatto sulla ricerca é innegabile e cambierà nei prossimi anni molti aspetti della proteomica e della ricerca biologica” é il commento realizzato a caldo da Garrett Morris. Un passo in avanti epocale, come poche volte accade nella ricerca scientifica.

“Alphafold2 ha cambiato in modo radicale le carte in tavola del nostro lavoro” osserva Minkyung Baek biologo al Department of Biochemistry, University of Washington, Seattle, Washington “La sua messa a punto così improvvisa é stata spiazzante per tutti noi”. Le capacità di analisi messe in mostra da Alphafold2, sono il necessario complemento del sequenziamento del genoma umano concluso vent’anni fa. Il proteoma, i milioni di proteine che fanno parte del vivente, é finalmente diventato accessibile per essere utilizzato nella ricerca medica e biologica. Per anni lo studio della loro struttura tridimensionale ha rappresentato una sfida ai limiti del possibile per gli addetti ai lavori: un percorso lungo, complesso, costoso, con risultati centellinati nel tempo e non sempre impeccabili nelle conclusioni.

La conoscenza in ‘profondità’ delle proteine é una delle informazioni chiave per la comprensione dei processi biologici in cui sono coinvolte ed é il necessario supporto alla progettazione di molti farmaci. Il problema sono le loro strutture tridimensionali di grande complessità che assumono come effetto dei legami chimici ed elettrostatici che si creano fra le migliaia di atomi che le compongono. La sua decrittazione é stata al centro della ricerca proteomica negli ultimi decenni. Gli approcci sperimentali tradizionali si sono rivelati validi, ma inferiori ai bisogni per l’avanzamento della ricerca di base. Gli sforzi congiunti durati anni di molti laboratori in collaborazione con varie Università e Centri di Ricerca, hanno portato alla decrittazione della struttura di circa centomila proteine. Ma questo rappresenta solo una piccola frazione dei milioni di possibili sequenze proteiche che sono presenti negli esseri viventi.

Una mancanza di risultati preoccupante che ha rallentato intere aree della ricerca da quella biologica a quella medica. Le grandi potenzialità insite nel sequenziamento del genoma umano realizzato all’inizio del secolo sono state penalizzate proprio dalla lentezza con cui si é mosso lo studio delle proteine, un collo di bottiglia per i ricercatori interessati, una perdita netta per la ricerca biologica di base. E’ stata la necessità di superare questi vincoli oggettivi che ha condotto all’utilizzo di tecniche computazionali del resto già ampiamente in uso in biologia.

Il sistema DeepMind di AlphaFold2 incorpora network neuronali supportati da procedure di addestramento realizzate con l’intelligenza artificiale che partono dai vincoli fisici e geometrici della struttura delle proteine già note che sono stati ricavati dai data base esistenti. Le previsioni prodotte da AlphaFold2 sono praticamente indistinguibili da quelle ottenute con i metodi tradizionali. Strumenti che in futuro non saranno obsoleti, ma diventerà finalmente possibile studiare i sistemi viventi in un modo nuovo.

Una previsione realizzata con AlphaFold2 ha reso finalmente fattibile la ricostruzione dettagliata della struttura di una proteina di un batterio che Gal Masrati del Department of Biochemistry and Molecular Biology, Faculty of Life Sciences, Tel Aviv University, Israel ha cercato invano di decifrare per anni. A tal fine ha utilizzato ogni strumento concettuale e innovazione tecnologica a sua disposizione per arrivare a questa svolta, ma tutto é stato vano. Il modello previsto della proteina realizzato utilizzando Alphafold2 é stato ottenuto in due ore di lavoro al computer, una volta inseriti tutti i dati necessari.

“Tutto questo cambierà la medicina, la ricerca, la bioingegneria. Rivoluzionerà e semplificherà nel prossimo futuro tutto il nostro approccio scientifico al corpo umano” ricorda Lupas. “Oltre a portare a termine la completa descrizione del proteoma umano, stiamo indagando quelli di altri venti organismi significativi con l’obbiettivo di arrivare a decrittare quanto prima la struttura delle principali proteine che li compongono” dice Demis Hassabis un neuroscienziato CEO del Google DeepMind coinvolto nel progetto Alphafold2 “Negli anni a venire progettiamo di espandere la conoscenza della struttura di gran parte delle proteine conosciute perché pensiamo che questo possa diventare uno stimolo potente per l’avanzamento delle scienze della vita”.

Previsione che si é realizzata già nel corso del 2022. In pochi mesi sono state decodificate le strutture di oltre duecento milioni di proteine riguardanti più di un milione di specie viventi. Il 28 di luglio dello stesso anno, l’insieme dei dati é stato reso disponibile in modalità free da DeepMind, una società di Google con sede a Londra.