L’intelligenza artificiale manderà l’esperimento in soffitta?

Una volta che le leggi della meccanica quantistica erano state formulate Paul Dirac si spinse ad affermare che: le leggi fisiche necessarie per la teoria matematica . . . dell’intera chimica sono completamente conosciute e la difficoltà è che la loro applicazione porta ad equazioni troppo complicate per essere risolte. All’epoca (1929) era appena stata chiarita la struttura della molecola ione idrogeno e Dirac forse dimenticava la complessità della struttura e dinamica molecolare in fasi condensate e in sistemi biologici. Né, d’altra parte, poteva immaginare lo straordinario sviluppo della potenza di calcolo dei moderni computers. Nei decenni successivi lo sviluppo di tecniche sperimentali (diffrazione x, risonanza magnetica nucleare, microscopia elettronica) aveva consentito di esplorare la struttura di biomolecole in sempre maggiori dettagli. Nella figura che segue è mostrata la struttura della alcol ossidasi ottenuta con microscopia crioelettronica ad una risoluzione di 1.2 A, che è come “vedere” le molecole a livello atomico.

Contemporaneamente c’è stato uno sviluppo eccezionale dei metodi computazionali e delle loro applicazioni alle biomolecole, particolarmente dopo lo sviluppo del funzionale della densità.

Ma le prospettive computazionali si sono amplificate da quando nel 1956 nasce ad opera di Allen Newell e Herbert Simon l’Intelligenza Artificiale. In quell’anno, in occasione del “Summer Research Project on Artificial Intelligence” (New Hampshire) Newell presentò il primo software della storia dell’Intelligenza Artificiale, in grado di dimostrare astratti teoremi matematici. Nel 1957, insieme a Herbert Alexander Simon, Newell sviluppò un programma ancora più ambizioso: “The General Problem Solver” (il risolutore di problemi), che aveva lo scopo di simulare i processi mentali di un essere umano che tenta di risolvere un problema

Oggi siamo andati ben oltre il prevedibile. Utilizzando il metodo di apprendimento profondo (deep learning) dell’intelligenza artificiale, grazie a una classe di algoritmi di apprendimento automatico, è possibile entrare in profondità nel complesso ingranaggio della cellula ottenendo modelli tridimensionali delle proteine. Le proteine sono alla base della vita,e responsabili della maggior parte dei meccanismi cellulari; seguendo l’assioma “struttura-funzione” esplicano la loro funzione, adottando la forma spaziale biologicamente attiva. Dal 2018, nell’ambito del progetto AlphaFold, la startup DeepMind (nata nel 2010 e poi acquisita da Google) ha contribuito agli esperimenti CASP (Critical Assessment of Structure Prediction) con lo scopo di stabilire lo stato dell’arte nella predizione delle strutture delle proteine e identificare i settori in cui investire risorse. Con un processo iterativo, inizialmente vengono determinati i dati strutturali e genetici per predire, a partire dalla stringa dei singoli costituenti delle proteine (gli amminoacidi), le interazioni spaziali in gioco (principalmente interazioni chimico-fisiche non covalenti). Sulla base di queste informazioni viene elaborato un modello tridimensionale che deve risultare biologicamente rilevante per le proteine coinvolte in uno specifico meccanismo biochimico.

Inizialmente, non tutte le predizioni di AlphaFold sono coincise con le strutture sperimentali, forse a causa della impropria implementazione dei dati grezzi nel modello. E’ quanto sostiene John Moult, cofondatore del progetto CASP inteso ad affinare i metodi computazionali per la predizione accurata delle strutture delle proteine. La problematica è resa più complessa dal fatto che negli aggregati di proteine le interazioni proteina-proteina modificano la struttura spaziale di ogni singola unità. Nel corso di quest’anno, alcune predizioni strutturali di AlphaFold sono risultate indistinguibili nel 75% dei casi da quelle determinate con metodi sperimentali, come si può vedere dalla figura che segue che confronta la struttura della proteina gp105 ottenuta da AlphaFold (in giallo) con la struttura sperimentale.

E’ interessante notare che all’inizio del 2020 è stato possibile con questo approccio predire le strutture delle proteine coinvolte nell’infezione da Coronavirus 2 che non erano state determinate sperimentalmente e che ci hanno portato alla pandemia COVID-19 e alle sue conseguenze. La potenza di questi algoritmi offre quindi nuove e forse rivoluzionarie prospettive sia nello studio di biostrutture fondamentali che nella formulazione di presidi terapeutici.

Tra le possibili ricadute in ambito medico bisogna infatti considerare la prospettiva di giungere ad efficaci terapie antitumorali. Andrea Califano (Columbia University) ha messo a punto complessi algoritmi che generano modelli delle reti molecolari che sostengono le cellule tumorali individuando le proteine fattori di trascrizione che controllano il comportamento di molti geni all’interno della cellula. In questo modo è stato possibile identificare che una particolare proteina di trascrizione STAT3 (già nota per essere inibita da ruxolitinib) gioca un ruolo fondamentale nel tumore al seno. Il ruxolitinib (un inibitore della crescita tumorale) è attualmente in un trial clinico in fase I/II in combinazione con trastuzumab per la terapia del cancro metastatico al seno. Da un punto di vista generale, questi algoritmi sono capaci di smascherare i cardini molecolari dei tumori e guidare i medici ad identificare i fattori di trascrizione, suggerendo i farmaci più adeguati per colpirli. Anziché focalizzarsi sull’identificazione di tutte le mutazioni genetiche che portano allo scatenamento del tumore, approccio di terapia personalizzata che richiede decine di migliaia di farmaci per ogni paziente, questo approccio si focalizza sull’identificazione dei fattori di trascrizione che agiscono da regolatori principali, arrestando il tumore nel suo percorso indipendentemente dalle mutazioni che lo hanno scatenato.

In conclusione, c’è una concreta speranza che l’Intelligenza Artificiale porti a determinare la funzione dì una varietà di proteine del genoma umano di struttura non risolta, facendo luce sulle variazioni genetiche alla base di varie forme di malattie. Questo metodo tende a rivoluzionare l’approccio alla biologia e sta già fornendo un importante contributo alla medicina nell’individuazione di farmaci per la cura di pazienti affetti da patologie tumorali in cui mutazioni genetiche dinamiche rendono complessa la cura.

 

  1. Callaway. ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature News. 30 November 2020.
  2. Computing cancer’s weak spots. An algorithm to unmask tumor’s molecular linchpins is tested in patients. Science 2020, 368(6496), 1174-1177

 

Lascia un commento