La prima bozza del genoma umano è stata pubblicata esattamente 20 anni fa. Ci vollero quasi tre anni a completarla, ad un costo di quasi un miliardo di dollari. Il Progetto Genoma Umano ha permesso agli scienziati di leggere, quasi da un capo all’altro, i 3 miliardi di paia di basi del DNA (o “lettere”) che definiscono biologicamente un essere umano.
È stata una impresa epocale. Quel progetto ha permesso a una nuova generazione di ricercatori di identificare nuovi bersagli per i trattamenti contro il cancro, ingegnerizzate topi con sistemi immunitari umani e persino costruire una pagina web in cui si può navigare nell’intero genoma umano come se fosse Google Maps.
Il primo genoma umano completo è stato generato da una manciata di donatori anonimi. Lo scopo era quello di produrre un genoma di riferimento che rappresentasse più di un singolo individuo. Come era prevedibile, non è bastato a comprendere l’ampia diversità delle popolazioni umane nel mondo. Non esistono due persone uguali e nemmeno due genomi sono uguali. Se i ricercatori volessero comprendere l’umanità in tutta la sua diversità con maggiore precisione, non basterebbe un solo genoma umano.
Occorrerebbe sequenziarne migliaia o milioni: ed è proprio questo lo scopo di un progetto attualmente in corso.
Comprendere la diversità genetica
La ricchezza della varietà genetica tra le persone è ciò che rende ogni persona unica. Ma i cambiamenti genetici causano anche molti disturbi e rendono alcuni gruppi di persone più suscettibili a determinate malattie rispetto ad altri.
Ai tempi del progetto genoma umano i ricercatori stavano anche sequenziando i genomi completi di organismi più “semplici” come topi , moscerini della frutta , lieviti e alcune piante . L’enorme sforzo compiuto per generare questi primi genomi ha portato a una rivoluzione nella tecnologia richiesta per leggere i genomi. Una tecnologia progredita al punto che oggi non servono anni e milioni di euro per sequenziare un intero genoma umano. Ora ci vogliono pochi giorni e costa meno di mille euro.
Migliaia di genomi
I progressi della tecnologia hanno permesso agli scienziati di sequenziare i genomi completi di migliaia di individui da tutto il mondo. Iniziative come il Genome Aggregation Consortia stanno facendo grandi sforzi per raccogliere e organizzare questi dati sparsi. Finora, quel gruppo è stato in grado di raccogliere quasi 150.000 genomi. All’interno di questo set di dati, i ricercatori hanno trovato più di 241 milioni di differenze nei genomi delle persone, con una media di una variante ogni otto coppie di basi .
La maggior parte di queste variazioni sono molto rare e non avranno alcun effetto su una persona. Tuttavia, nascoste tra loro ci sono varianti con importanti conseguenze fisiologiche e mediche. Ad esempio, alcune varianti del gene BRCA1 predispongono alcuni gruppi di donne, come gli ebrei ashkenaziti, al cancro alle ovaie e al seno. Altre varianti in quel gene portano alcune donne nigeriane a sperimentare una mortalità più alta del normale per cancro al seno.
Come identificare queste varianti del genoma umano?
Il modo migliore in cui i ricercatori possono identificare questi tipi di varianti a livello di popolazione è attraverso studi che confrontino i genomi di grandi gruppi di persone con un gruppo di controllo. Ma le malattie sono complicate. Lo stile di vita, i sintomi e il tempo di insorgenza di un individuo possono variare notevolmente e l’effetto della genetica su molte malattie è difficile da distinguere. Il potere predittivo dell’attuale ricerca genomica è troppo basso per escludere molti di questi effetti perché non ci sono dati genomici sufficienti .
Comprendere la genetica delle malattie complesse, in particolare quelle legate alle differenze genetiche tra i gruppi etnici, è essenzialmente un problema dei big data. E i ricercatori hanno bisogno di più dati. Molti più dati.
1.000.000 di genomi
Per rispondere alla necessità di ulteriori dati, il National Institutes of Health ha avviato un programma chiamato All of Us . Il progetto mira a raccogliere informazioni genetiche, cartelle cliniche e abitudini sanitarie da sondaggi e dispositivi indossabili di oltre un milione di persone negli Stati Uniti nel corso di 10 anni. È stato aperto al pubblico nel 2018 e da allora più di 270.000 persone hanno contribuito con campioni.
Le grandi potenzialità di questo progetto stanno nella possibilità di fare ricerche incrociando i dati più disparati. Un neuroscienziato potrebbe cercare variazioni genetiche associate alla depressione considerando, ad esempio, i livelli di esercizio fisico. Un oncologo potrebbe cercare varianti correlate al rischio di cancro alla pelle in base alle differenze etniche.
Con un milione di genomi umani avremo una straordinaria ricchezza di dati per scoprire gli effetti della variazione genetica sulle malattie, non solo per gli individui, ma anche all’interno di diversi gruppi di persone.
La selva oscura del genoma umano
Un altro vantaggio di questo progetto è che consentirà agli scienziati di conoscere parti del genoma umano che sono attualmente molto difficili da studiare. La maggior parte della ricerca genetica è stata sulle parti del genoma che codificano per le proteine. Tuttavia, queste rappresentano solo l’1,5% del genoma umano.
Una promettente parte della ricerca si concentra sull’RNA, una molecola che trasforma i messaggi codificati nel DNA di una persona in proteine. Tuttavia, gli RNA che provengono dal 98,5% del genoma umano che non produce proteine hanno una miriade di altre funzioni. Alcuni di questi RNA sono coinvolti in processi come il modo in cui il cancro si diffonde , lo sviluppo embrionale o il controllo del cromosoma X nelle femmine. Poiché il progetto All of Us include tutte le parti codificanti e non codificanti del genoma, sarà di gran lunga il più grande set di dati a disposizione per fare luce su questi misteriosi RNA.