Le porzioni dei nostri genomi che ci distinguono dagli altri animali mantengono il segreto dell’evoluzione umana?
Quando la prima sequenza del genoma umano è stato pubblicato nel 2001, ero una studentessa laureata che lavorava come esperto di statistiche in un team di scienziati. Venendo dal mondo accademico e dalle biotecnologie, abbiamo mirato a scoprire differenze nei livelli di espressione genica tra tumori e cellule sane. Come molti altri, avevo grandi speranze in quello che potevamo fare con questo enorme file di testo di oltre 3 miliardi di A, C, T e G. Tra i miei compagni di classe e professori, avere visioni ambiziose di un preciso diagramma intrecciato per le cellule umane e cure imminenti per la malattia erano all’ordine del giorno. Ma ero molto entusiasta di un diverso uso dei dati e mi sono ritrovata a contare i mesi fino a quando non è stato sequenziato il genoma di uno scimpanzé.
Gli scimpanzé sono i nostri parenti più stretti sull’albero della vita. Mentre la loro biologia è in gran parte simile alla nostra, abbiamo molte differenze sorprendenti, che vanno dagli enzimi digestivi alla lingua parlata. Gli umani soffrono anche di una serie di malattie che non affliggono gli scimpanzé o sono meno gravi in essi, tra cui autismo, schizofrenia, morbo di Alzheimer, diabete, arteriosclerosi, AIDS, artrite reumatoide e alcuni tipi di cancro. Ero stata a lungo affascinata dai fossili di ominini e dal modo in cui le ossa si trasformavano in forme diverse nel tempo evolutivo. Ma quegli scheletri non possono dirci molto sulla storia del nostro sistema immunitario o delle nostre capacità cognitive. Così ho iniziato a fare brainstorming su come estendere gli approcci statistici che stavamo usando per la ricerca sul cancro per confrontare il DNA umano e quello degli scimpanzé. Il mio obiettivo immodesto era identificare le basi genetiche di tutti i tratti che rendono unici gli esseri umani.
Il genoma dello scimpanzé è stato pubblicato nel 2005, quando ero postdottoranda presso l’Università della California, a Santa Cruz, e quelli di altri 12 vertebrati seguirono poco dopo. Allo stesso tempo, gli scienziati computazionali erano impegnati a sviluppare algoritmi per scansionare il DNA alla ricerca di regioni simili in più specie. Tale conservazione della sequenza suggerisce che queste aree sono responsabili di funzioni critiche. Ho portato queste scansioni genomiche comparative al livello successivo scrivendo un programma per computer per identificare sequenze di DNA che sono conservate in altri animali ma che sono cambiate rapidamente negli umani da quando ci siamo evoluti dal nostro antenato comune con gli scimpanzé. Questa firma evolutiva prevede una perdita o una modifica della funzione nell’uomo. I miei colleghi e io abbiamo usato questo schema in due parti per definire le regioni in più rapida evoluzione del genoma umano, note come Human Accelerated Regions (HAR – Regioni Umane Accelerate). Abbiamo pubblicato le prime 202 HAR nel 2006.
È emerso un modello eccitante ma scoraggiante: solo una manciata di HAR erano nei geni. In effetti, non avevamo idea di cosa facesse la stragrande maggioranza di queste sequenze di DNA apparentemente funzionali e unicamente umane, per non parlare del loro ruolo nell’evoluzione umana. Le HAR sono corte: in media solo 227 coppie di basi di lunghezza, molto più piccole di un gene. Sembravano quello che in quel momento chiamavamo “DNA spazzatura” e non sarebbero state in cima all’elenco di nessuno delle regioni genomiche da studiare, se non per la loro irresistibile conservazione nella maggior parte degli animali e le notevoli differenze negli esseri umani.
Grazie alle innovazioni nella tecnologia di sequenziamento che hanno prodotto una cornucopia di genomi, oltre ad alcune modifiche ai metodi computazionali da parte di diversi laboratori, l’elenco combinato di HAR identificate ora include quasi 3.000 segmenti di genoma. Ma la tendenza originale è ancora valida; quasi tutte le HAR sono al di fuori dei geni, alcuni abbastanza lontane da qualsiasi gene nel genoma.
Quindi cosa hanno fatto le HAR che hanno reso le loro sequenze così immutabili durante l’evoluzione dei mammiferi? In che modo le molteplici mutazioni umane in ciascuna HAR hanno cambiato la sua funzione? Dieci anni dopo, il mio gruppo, ora situato presso il Gladstone Institutes di San Francisco, e altri continuano a indagare su queste domande, nella speranza di comprendere meglio ciò che rende gli umani diversi da tutte le altre specie.

REGOLATORI GENICI UNICAMENTE UMANI
Ignorando per un momento il DNA umano, le regioni HAR sono alcune delle sequenze più conservate nei genomi dei mammiferi. Alcune di esse sono quasi identiche tra scimpanzé e ornitorinco, per esempio. Questa stretta identità suggerisce che le informazioni codificate in queste sequenze sono fondamentali e che le modifiche alle sequenze modificheranno le loro importanti istruzioni. Questo rende le mutazioni umane nelle HAR davvero inaspettate.
È allettante ipotizzare che queste mutazioni distruggano o cambino le funzioni regolative dei geni, alterando quando e dove i geni si attivano. Le prime due HAR caratterizzate dal punto di vista funzionale supportano questa idea.
HAR1 non codifica per una proteina ma per un lungo RNA, un tipo di molecola che guida le proteine o modula la loro espressione. Abbiamo predetto che l’RNA di HAR1 potrebbe piegarsi in una struttura tridimensionale perché la sua sequenza conservata ha regioni palindromiche che si accoppiano per formare una serie di “steli” interconnessi che sembrano scale – si pensi a una doppia elica di DNA non attorcigliata. Questa previsione computazionale è stata confermata da esperimenti di sondaggio della struttura dell’RNA usando l’RNA HAR1 umano e di scimpanzé sintetizzato in vitro per identificare gli steli. Etichettando le molecole di HAR1 in embrioni umani e macachi, abbiamo scoperto che gli RNA funzionavano nei neuroni durante la modellatura e la disposizione della corteccia, una struttura cerebrale che si espandeva notevolmente di dimensioni durante l’evoluzione umana. Resta da determinare esattamente quali geni HAR1 sta regolando.
HAR2 (nota anche come HACNS1) non codifica ne’ una proteina ne’ un RNA. Piuttosto, HAR2 funziona come un potenziatore, una sequenza di DNA che lavora per aumentare o diminuire il livello dell’espressione di un gene. Un potenziatore può essere localizzato a migliaia di coppie di basi lontano dal gene che regola. Il gene si attiva quando è prossimo al contatto con il suo potenziatore. Gli studi sui topi hanno rivelato che la HAR2 umana è attiva in diversi tessuti embrionali, compresi quelli che danno origine al polso e al pollice, strutture che si sono trasformate nei nostri antenati dopo la loro separazione da un antenato comune con scimpanzé. Ancora una volta, i geni soggetti alla regolazione HAR2 non sono ancora chiari, sebbene GBX2, un fattore di trascrizione che controlla la corretta espressione dei geni coinvolti nella morfogenesi dell’embrione, è un candidato promettente.
Basandosi su queste scoperte iniziali, i ricercatori hanno rivelato il ruolo di altre HAR nella regolazione genica grazie ai progressi nelle tecniche che misurano l’espressione genica a livello di singola cellula, tracciano dove le proteine si legano al DNA e valutano altre proprietà epigenetiche del genoma. (Vedi “Scaling to Singles”, The Scientist, maggio 2016; “Silencing Surprise”, The Scientist, giugno 2015.) Integrando queste nuove informazioni in modelli computazionali, i miei colleghi e io abbiamo previsto che circa il 5 percento delle HAR funzionano come RNA non codificante, mentre la maggior parte sono potenziatori che controllano l’espressione genica durante lo sviluppo embrionale.
Per testare più concretamente questa ipotesi, il mio team ha iniziato a esaminare la funzione di quasi 100 delle HAR in più rapida evoluzione, molte delle quali sospettavamo di avere attività di potenziamento. Iniettiamo in un topo fecondato o in uova di pesce fertilizzate un costrutto corrispondente che contiene la sequenza HAR di scimpanzé di fronte a un gene che identificherà tutte le cellule dell’embrione in cui l’HAR funziona come potenziatore. Finora, due terzi delle HAR testate per l’attività di potenziamento hanno attivato un gene durante lo sviluppo. Per 26 potenziatori di HAR, abbiamo ripetuto l’esperimento con le sequenze umane. Otto HAR hanno mostrato differenze nella loro attività di potenziamento quando erano presenti le mutazioni umane. Queste differenze modificano il modo in cui i geni sono stati espressi nell’arto in via di sviluppo (HAR2, 2xHAR114), nell’occhio (HAR25) e nel sistema nervoso centrale (2xHAR142, 2xHAR238, 2xHAR164, 2xHAR170, ANC516/HARE5). Poiché sono stati esaminati relativamente pochi punti temporali, è probabile che una percentuale ancora più elevata di HAR testate siano potenziatori attivi ad un certo punto durante lo sviluppo embrionale o nei tessuti adulti, possibilmente con differenze umano-scimpanzé.
Molte HAR si trovano vicino a geni che controllano i processi fondamentali dello sviluppo, quindi la loro funzione regolativa alterata potrebbe avere effetti profondi sulla biologia umana. A supporto di ciò, la versione umana di un potenziatore HAR (ANC516/HARE5) è attiva in precedenza nello sviluppo e in una regione del cervello più ampia rispetto alla HAR di scimpanzé. L’HARE5 umana aumenta l’espressione del suo gene bersaglio, Frizzled 8, che influenza le dimensioni e lo sviluppo del cervello nei topi.
Questi esperimenti dimostrano che le HAR potrebbero aver cambiato i programmi di sviluppo chiave nel corso dell’evoluzione umana. Lo studio HARE5 indica che i ricercatori più vicini sono giunti a dimostrare che una sequenza HAR colpisce un organo importante per l’evoluzione umana. È possibile che le mutazioni umane nelle HAR possano influenzare i tratti umani come le capacità motorie, il linguaggio parlato e la cognizione. Ma collegare le mutazioni HAR alle innovazioni organiche è difficile, dati gli ovvi limiti nel testare gli effetti dei cambiamenti genetici nell’uomo o nelle scimmie. Stabilire queste connessioni è la nostra più grande sfida per il futuro.
LA COMPARSA DELLE HAR
Il più recente antenato comune di umani e scimpanzé probabilmente visse circa 6 milioni di anni fa. La documentazione fossile mostra che le nostre due specie sono cambiate continuamente in modi diversi da allora. Sapere quando una HAR è mutata durante l’evoluzione umana, potrebbe aiutare i ricercatori a collegarla a tratti che sono cambiati nello stesso tempo. Al contrario, mentre chiariamo quali processi biologici sono influenzati dalle mutazioni delle HAR, le età delle mutazioni potrebbero aiutare a datare la comparsa di tratti che sono difficili da discernere dai fossili.


Stimare quando una HAR si è evoluta è una sfida perché questi calcoli si basano su confronti con genomi di ominini che si sono separati dai nostri antenati in momenti diversi nel passato. Senza questi segni molecolari lungo la discendenza umana, è difficile dire se una HAR si sia evoluta subito dopo la scissione tra uomo e scimpanzé o solo poche generazioni fa. Ma il sequenziamento del DNA antico sta iniziando a far luce sulla questione. Ad esempio, confrontando una sequenza HAR umana con la sequenza HAR di un ominino arcaico, i ricercatori possono stimare se la HAR è mutata prima, dopo o durante il periodo di tempo del nostro antenato comune. Questo approccio ha rivelato che il tasso con cui sono emerse le mutazioni delle HAR era leggermente più alto prima di separarci da Neanderthal e Denisovans. Di conseguenza, la maggior parte delle mutazioni HAR ha milioni di anni e sono condivise con questi ominidi estinti (ma non con gli scimpanzé).
Tuttavia, alcune HAR si sono evolute molto più recentemente. Circa il 10 percento delle mutazioni nelle HAR è polimorfico, il che significa che solo un sottogruppo di persone porta le sequenze mutate, mentre altri hanno la sequenza di DNA vista negli scimpanzé. Questi cambiamenti polimorfici nelle HAR si sono verificati relativamente di recente nell’evoluzione umana: è improbabile che abbiano più di 1 milione di anni. Ma tali nuove mutazioni HAR si trovano nelle persone di tutto il mondo, indicando che precedono le migrazioni umane a lunga distanza iniziate circa 60.000 anni fa.
Man mano che vengono sequenziati più genomi umani di diverse popolazioni, sarà eccitante vedere se alcuni tratti sono associati al trasporto della versione mutata rispetto a quella delle Har polimorfiche ancestrali. Questo approccio ha già rivelato tratti rilevanti dal punto di vista medico legati agli antenati di Neanderthal in altre parti del genoma umano. Ad esempio, il sangue tende a coagulare più rapidamente in quelli di noi con il DNA di Neanderthal in una di queste regioni, mentre un’altra sequenza di Neanderthal è associata alla depressione.
LE FORZE CHE HANNO CREATO LE HAR
Statisticamente parlando, la probabilità che una sequenza di DNA altamente conservata cambierà più volte nell’arco di 6 milioni di anni di evoluzione è prossima allo zero, vale a dire a meno che le forze che hanno scelto contro le mutazioni nella sua sequenza cambino improvvisamente. HAR2, ad esempio, sembra attivare un gene coinvolto nello sviluppo degli arti umani grazie alla perdita di sequenze che lo tengono spento negli embrioni di altre specie.

I ricercatori hanno fatto molta strada per illuminare le funzioni delle HAR e i loro ruoli potenziali nell’evoluzione umana, ma siamo ancora lontani dalla comprensione delle loro funzioni specifiche nello sviluppo e in altri processi. Una delle maggiori sfide che dobbiamo affrontare è stabilire la causalità. Fortunatamente, la tecnologia emergente ha permesso di creare cellule cerebrali, cardiache e epatiche a partire da una biopsia cutanea dei primati e di modificare il DNA di queste cellule in laboratorio. Questi progressi consentono ai ricercatori di verificare se specifiche mutazioni umane alterano la capacità delle HAR di attivare i geni nelle cellule umane o dei primati. Inoltre, poiché ora l’attività di potenziamento può essere valutata con tecniche genomiche ad alto rendimento, è ipotizzabile passare dai test HAR uno a uno a indagarne migliaia in parallelo. Queste scoperte entusiasmanti promettono di accelerare la ricerca sulla funzione delle HAR e sulle forze evolutive che hanno plasmato le HAR.
Lo sviluppo di algoritmi e elaborazione ad alte prestazioni continuerà a essere fondamentale per la ricerca sulle HAR. La mia analisi che ha scoperto le 202 HAR originali, sarebbe ancora oggi in esecuzione se l’avessi implementata su un singolo computer desktop anziché su un gruppo di 1000 computer interconnessi. Invece di aspettare la fine del programma, abbiamo trascorso l’ultimo decennio a dimostrare che le HAR sono regolatrici chiave dello sviluppo embrionale. Questo è un enorme passo avanti rispetto al fatto che le HAR vengono viste come un bizzarro DNA spazzatura con una funzione sconosciuta. Guardando al futuro una volta che tutti i nostri genomi saranno analizzati e esisteranno strumenti per la modifica precisa delle HAR nelle cellule umane, sembrerà possibile capire cosa sia successo quando ognuna di queste sequenze evolutesi in modo conservativo è improvvisamente mutata nell’uomo.
Di Katherine S. Pollard
Katherine S. Pollard è biostatista presso il Gladstone Institutes di San Francisco, in California.
Fonte : TheScientist
Approfondimenti: