zona3

La codifica del genoma umano e la sua pubblicazione

Print Friendly, PDF & Email

di Sergio Barocci

(continua dall’articolo “il Progetto Genoma Umano“)

Anno 1996.
Nel mese di febbraio fu organizzato un congresso alle isole Bermuda finanziato dal Wellcome Trust in cui i più importanti laboratori coinvolti nella ricerca del progetto internazionale sul Genoma Umano (HPG) sottoscrissero un accordo in base al quale si impegnavano a rendere liberamente accessibili i dati, così da massimizzare i benefici sociali della ricerca. Molti furono gli scienziati che riposero le loro speranze nel progetto pubblico internazionale sullo studio del genoma
Nel mese di aprile si sviluppò la tecnologia Gene Chip una tecnica rivoluzionaria per studiare l’espressione genica e per il sequenziamento grazie alla collaborazione tra il Dipartimento di Biochimica dell’Università di Stanford e la Società americana Affymetrix Inc. con sede a Santa Clara in California che resero disponibili commercialmente dei DNA microarray (microscopiche sonde di DNA o probes attaccate ad una superficie solida come un chip di silicio formanti un array o matrice che permettevano di esaminare simultaneamente la presenza di moltissimi geni all’interno di un campione di DNA).

Affymetrix Gene ChipAffymetrix Gene Chip

Affymetrix Gene Chip: strumentazione e due singoli chip

Nel mese di luglio fu sequenziato il genoma di Escherichia coli di 4,64 Mb e nel mese di settembre si avviarono, invece, sei progetti pilota con finanziamenti di diversi milioni di dollari per sequenziare le estremità finali dei cloni BAC.  Contemporaneamente Pal Nyren e Mostafa Ronaghi presso il Royal Institute of Tecnology di Stoccolma svilupparono il pirosequencing o pirosequenziamento, una metodologia che prevedeva non più l’utilizzazione di nucleotidi fluorescenti ma che si basava, invece, sul metabolismo del pirofosfato (PPi) rilasciato durante la reazione di sequenziamento da parte di una miscela di enzimi. Questa tecnologia rappresenterà, in seguito, l’innovazione tecnologica del sequenziatore 454 della Roche di nuova generazione che verrà messo in commercio nel 2007.

microarrays a DNA

Nel mese di ottobre , da parte di diversi laboratori, situati negli Stati Uniti, in Europa, in Canada e in Giappone, ci fu il completamento della prima sequenza di un genoma eucariotico, quello del lievito di birra, Saccharomyces cerevisiae, il cui DNA era formato da 12 milioni di basi e infine nel mese di dicembre i ricercatori del centro giapponese Riken guidati da un biologo molecolare, Yoshihide Hayashizaki, completarono la lunghezza del primo set di cDNA del topo.

Anno 1997.
Nel mese di gennaio venne istituito il National Human Genome Research Institute mentre il DOE creò il Joint Genome Institute;

Molecular Dynamics' MegaBACE 1000

Molecular Dynamics’ MegaBACE 1000

Nel mese di settembre Fred Blattner, Guy Plunkett e l’Università di Madison del Wisconsin completarono la sequenza del DNA di E. Coli di 5 Mb. che fu pubblicata su Science mentre l’Amersham Biosciences/Molecular Dynamics introdusse il MegaBACE, una macchina di sequenziamento del DNA a elettroforesi capillare.

Anno 1998.
E’ l’anno in cui incominciarono ad essere lanciati altri grandi progetti detti antropo-molecolari; si ebbe anche un nuovo accordo quinquennale tra NIH e DOE che fissava al 2003 il completamento dei lavori. Inoltre, all’obiettivo originario si aggiunse anche quello sullo studio della variabilità genetica del genoma umano e della sua funzione

SNPs - polimorfismi di singoli nucleotidi

SNPs – polimorfismi di singoli nucleotidi

Nel mese di gennaio l’NIH annunciò un altro nuovo progetto per trovare gli SNPs cioè polimorfismi a singolo nucleotide (single nucleotide polymorphisms) (Per es. se le sequenze individuate in due soggetti sono rappresentate da AAGCCTA e da AAGCTTA, è presente uno SNP che differenzia i due alleli C e T). Gli SNPs sono presenti nelle regioni codificanti ma anche in quelle non codificanti o introni e appaiono con frequenza elevata (da 1 circa ogni 1000 basi a 1 ogni 100–300 basi) e nel mese di febbraio alcune rappresentative del Giappone, degli U.S.A., della Cina e della Corena del Sud si accordarono a Tsukuba (Giappone) allo scopo di stabilire delle linee guida per una collaborazione internazionale sulla sequenza del genoma del riso.
Nel mese di marzo da parte di Phil Green e di Brent Ewing dell’Università di Washington venne sviluppato il software “Phred” per l’analisi di sequenza di DNA e nel mese di maggio la PE Applied Biosystems Inc. introdusse, invece, l’analizzatore di DNA PE Prism 3700, un sistema automatizzato ad elettroforesi capillare in grado di eseguire tutti i quattro reazioni di sequenziamento in un singolo capillare.

analizzatore di DNA ABI PRISM 3700 della ditta PE Applied Biosystems Inc.

analizzatore di DNA ABI PRISM 3700 della ditta PE Applied Biosystems Inc.

Nello stesso anno, C. Venter diede inizio alla corsa del sequenziamento fondando e dirigendo una nuova Compagnia Privata chiamata Celera Genomics con lo scopo di sequenziare l’intero genoma umano entro il 2001, molto prima della data originariamente indicata nel progetto pubblico
Tale dichiarazione fu ispirata non solo dal successo del metodo shotgun sequencing ma anche dalla disponibilità di sequenziatori più potenti che potevano elaborare fino a un milione di basi di DNA al giorno. In risposta, la Wellcome Trust raddoppiò il suo sostegno per il progetto genoma al Consorzio Pubblico con un grande sforzo economico di diversi milioni di dollari.
Nel mese di dicembre J. Sulston del Wellcome Trust Sanger Center e Robert Waterstan dell’Università di Washington completarono il sequenziamento del genoma di Caenorhabditis elegans di 100 Mb (un verme nematode fasmidario cioè provvisto di fasmidi, organi chemio-recettori posti sull’estremità posteriore del corpo), rivelando che nel genoma di questo organismo erano presenti 19.099 geni, il 30 % dei quali simili ai geni umani ma, nella maggior parte dei casi, mai osservati prima di allora.

Anno 1999.
Nel mese di marzo Phil Collins, che aveva già sostituito J. Watson nel 1993 all’NIH, lanciò un nuovo obiettivo con la creazione di un’altra bozza di lavoro sul genoma umano dichiarando che da quel momento in poi sarebbero stati utilizzati nuovi sequenziatori che avrebbero consentito di definire ‘la prima bozza’ del genoma, completa solo al 90 % per la primavera del 2000, e la cui sequenza sarebbe stata ultimata nel 2003.

Wellcome Trust Sanger Center

Wellcome Trust Sanger Center

Tutti questi sforzi sul sequenziamento su larga scala furono concentrati rispettivamente nel centro Whitehead, dell’Università di Washington e nel Sanger Center a Cambridge e al Joint Genome Institute del DOE. Nel mese di dicembre, sulla rivista Nature, fu pubblicata la sequenza completa del cromosoma 22, uno dei più piccoli fra i cromosomi umani. A completare il sequenziamento furono gli scienziati britannici del Sanger Center che si erano sinora sobbarcati quasi un terzo di tutto il lavoro del settore pubblico all’interno del Progetto Genoma Umano.

Anno 2000.
Nel mese di marzo la Celera completò ,in collaborazione con la Berkeley Drosophila Genome Project (BDGP) il sequenziamento del genoma del moscerino della frutta , la “Drosophila melanogaster” il più grande genoma sinora sequenziato composto da 140 Mb, convalidando in questo modo l’utilizzo del nuovo metodo genomico dello “shotgun sequencing” per sequenziare un genoma complesso.  La sequenza completa fu poi pubblicata sulla rivista Science.

copertine di Science e Nature dedicate all'annuncio del sequenziamento completo del genoma umano

copertine di Science e Nature dedicate all’annuncio del sequenziamento completo del genoma umano

P. Collins del Consorzio Pubblico per il Progetto Genoma cercò di stabilire un rapporto di collaborazione con la società, ma i suoi sforzi risultarono vani in quanto la Celera rivendicò sui dati genomici una serie di diritti commerciali esclusivi. Infatti, la società Celera aveva tutto da guadagnare da questa situazione di stallo, in quanto poteva sfruttare tutti quei dati che venivano prodotti dal progetto pubblico continuamente aggiornati e pubblicati sul web.
Nel mese di maggio, il Consorzio Pubblico guidato da ricercatori tedeschi e giapponesi pubblicarono su Nature la sequenza completa del cromosoma 21, il più piccolo dei cromosomi umani e nel mese di giugno durante una Conferenza alla Casa Bianca , alla presenza dell’allora Presidente degli Stati Uniti Bill Clinton e dell’allora Primo Ministro britannico Tony Blair, il Consorzio Pubblico e la Celera Genomics annunciarono congiuntamente il completamento del genoma umano. In realtà, poiché nessuno dei due gruppi rivali era riuscito a mappare completamente il DNA umano, diplomaticamente, si parlò più esattamente di una bozza preliminare o “working draft“, senza entrare troppo nei dettagli.
La Casa Bianca e la Comunità Scientifica si prestarono molto volentieri a quell’annuncio ma che comunque, in ogni caso, portava a casa un risultato importante cioè quella filosofia che aveva animato i fondatori del Progetto la cosiddetta “condivisione libera e gratuita dei dati” che sarebbero scaturiti da tale progetto.  Il messaggio trasmesso fu abbastanza chiaro, i dati sul Genoma Umano dovevano essere di patrimonio comune , di dominio pubblico e disponibili a tutti gratuitamente.

Arabidopsis thaliana

Arabidopsis thaliana

C. Venter , ottenuta la soddisfazione mediatica, a questo punto si fece da parte e lasciò campo libero al Consorzio Pubblico.

Nel mese di dicembre il Consorzio Pubblico completò la sequenza del genoma di una prima pianta, l’Arabidopsis thaliana di 125 Mb e si arrivò così al 2001, anno in cui la bozza completa del genoma umano fu pubblicata nel mese di febbraio su Science quella della Celera Genomics e nel mese di giugno su Nature quella del Consorzio Pubblico.

Il 2002 fu l’anno in cui venne annunciato il sequenziamento completo del genoma murino mentre nell’ aprile del 2003 ci fu l’annuncio ufficiale del completamento (99,7% ) del progetto genoma con due anni di anticipo rispetto ai tempi stabiliti. In realtà il Progetto venne veramente completato solo nel maggio del 2006 quando venne pubblicata dall’NIH via Internet la sequenza del cromosoma 1, il cromosoma più lungo e più difficile da analizzare,

 

IL PROGETTO GENOMA UMANO, IN SINTESI

Il Progetto Genoma Umano ha rappresentato il coronamento di molti anni di ricerca biologica, una impresa davvero titanica e l’inizio di una nuova era, l’era “post-genomica”.
Inizialmente, il Progetto è stato fortemente condizionato dalle difficoltà di sequenziare il DNA e dalla necessità di ridurre al minimo il quantitativo di sequenze da effettuare ma fortunatamente, in seguito, l’ostacolo è stato largamente superato con lo sviluppo di sequenziatori automatici in grado di produrre circa 400.000 basi/giorno.
Il progetto Genoma Umano ha visto anche concorrere fra loro, in una corsa contro il tempo, due cordate scientifiche di scienziati :
a) una cordata pubblica, quella del Consorzio Internazionale HPG non profit, i cui risultati erano di dominio pubblico e disponibili gratuitamente da tutti, sostenuta sia con denaro pubblico che da grandi fondazioni filantropiche come la britannica Wellcome Trust;
b) l’altra privata, la Celera Genomics (operante in maniera centralizzata), una impresa a scopo di lucro in quanto vedeva nella lettura del DNA un business da sfruttare, i cui risultati erano consultabili solo su abbonamento e a prezzi molto alti.

La prima pubblicazione dell'intero genoma umano è stata presentata nella forma di questa serie di volumi cartacei, esposti alla Wellcome Collection, Londra

La prima pubblicazione dell’intero genoma umano è stata presentata nella forma di questa serie di volumi cartacei, esposti alla Wellcome Collection, Londra

Il Progetto, inoltre, si articolava in due fasi: nella prima si sono localizzati i geni presenti su ciascun cromosoma per ottenere una “mappa”; nella seconda si sono sequenziati i geni e nonostante le due cordate avessero concezioni diverse della ricerca, alla fine i loro approcci metodologici sono risultati ugualmente utili: quello della Celera per l’efficienza, l’automazione e la rapidità, quello del Consorzio per ordinare esattamente le sequenze ripetute.
Parallelamente si sono studiati e sequenziati anche i genomi di molti altri organismi (topo, E. coli, S. Cerevisiae, C. elegans, Drosphila, ecc) e il confronto del nostro genoma con quello di questi organismi modello ha permesso di conoscere cosa ci accomuna con essi e le ragioni della nostra peculiarità.

Le tecniche impiegate per il sequenziamento del genoma sono state :
– la tecnica del sequenziamento whole genome shotgun adottato dalla Celera Genomics , in cui un campione contenente un patrimonio genetico umano intero veniva suddiviso in frammenti; questi erano analizzati separatamente dai sequenziatori. Dei calcolatori elettronici elaboravano i dati in modo da ricomporre il puzzle delle sequenze di basi; alla fine, si doveva procedere alla mappatura.
– La tecnica del sequenziamento gerarchico o clone by clone adottata dai laboratori del Consorzio Pubblico che procedevano a disgregare il DNA in frammenti, mappando i geni di ciascuna porzione e sequenziando infine la molecola dell’acido nucleico.

Infine, il Progetto Genoma Umano ha posto anche le basi per lo sviluppo di altri progetti come il Gene Ontology Consortium istituito allo scopo di definire un concetto di funzionalità genica applicabile a tutti gli organismi; l’International SNP Consortium Ltd che ha prodotto una mappa umana basata sugli SNP cioè polimorfismi a singoli nucleotidi; l’International HapMap Project, che ha coinvolto varie nazioni con lo scopo di identificare e catalogare le differenze e le somiglianze genetiche degli individui rappresentanti le quattro principali popolazioni umane mondiali, il Progetto Encode (Encyclopedia of DNA elements) per identificare tutti gli elementi funzionali della sequenza del genoma umano e il 1000 Genomes Project (Progetto 1000 genomi) per catalogare le varianti genetiche umane.

panoramica sul genoma umano

IL RISULTATO FINALE:

1. i geni umani identificati sono all’incirca 21.000 dopo sequenziamento di oltre 3 miliardi di basi costituenti

2. il genoma umano è lungo circa 3200 Mb.

3. Di questi 3200 Mb solo l’1,5% (48 Mb di DNA) è codificante (esoni) mentre il restante 98,5 % costituisce il  junk DNA, ovvero il “DNA spazzatura”.

Successivamente . quest’ultimo concetto è stato mandato definitivamente in soffitta. Infatti, si è scoperto che i 1152 Mb di quel 98,5% costituiscono il “gene related DNA” cioè gli introni (le regioni non codificanti di un gene), le sequenze UTR localizzate alle estremità 5’ e 3’ dell’RNA messaggero che non vengono tradotte), i pseudogeni o geni ancestrali che hanno perso la capacità di essere espressi, quindi privi di espressione all’interno della cellula) e frammenti genici mentre i restanti 2000 Mb, tutt’altro che inutili, sono rappresentati da DNA intergenico formato da:

sequenze ripetute in tandem dette anche microsatelliti e una piccola percentuale di altri tipi

sequenze ripetute intersperse chiamate:
a) SINE (short interspersed elements o brevi sequenze di DNA meno di 500 bp),
b) LINE (long interspersed elements o lunghe sequenze di DNA da più di 5000 bp),
c) Trasposoni (elementi mobili che si trovano nel genoma di tutti gli organismi e capaci di saltare da un punto all’altro del genoma con meccanismi diversi), d) LTR o retrotrasposoni (long terminal repeat)

Ma questa è un’altra storia …………

 


 

BIBLIOGRAFIA

1.   International Human Genome Sequencing Consortium, Initial sequencing and analysis of the human genome, in Nature, 2001 , 409 , 860

2.   Venter JC et al., The sequence of the human genome, in Science, 2001 , 291, 1304

3.   Sulston, Ferry 2002: Sulston, John – Ferry, Georgina, The common thread: a story of science, politics, ethics, and the human genome, London-New York, Bantam, 2002.

4.   International Human Genome Sequencing Consortium, Finishing the euchromatic sequence of the human genome, in Nature, 2004, 431, 931

6.   International HapMap consortium et al. Integrating common and rare genetic variation in diverse human populations. Nature 2010, 467, 52

7.   Gerstein MB, Kundaje A, Hariharan M, et al. “Architecture of the human regulatory network derived from ENCODE data”. Nature. 2012, 489 , 91.

 

 

zona5-zona6

Sostieni la divulgazione della Chimica
Il tuo libero contributo sarà interamente devoluto alle attività di divulgazione della Chimica.
zona1




CONDIVIDI QUESTO ARTICOLO
RICHIEDI LA NEWSLETTER
Una mail settimanale con gli aggiornamenti delle pubblicazioni, le attività dell'Associazione e le novità del mondo della divulgazione chimica
SEGUI CHIMICARE ANCHE SU FACEBOOK
segui chimicare anche su facebook
ARTICOLI RECENTI
ARCHIVIO ARTICOLI PER MESE
SEGUI CHIMICARE ANCHE SU TWITTER
Non solo gli aggiornamenti degli articoli pubblicati sui nostri blog e le novità del Carnevale della Chimica, ma anche le segnalazioni dei migliori interventi di divulgazione chimica in lingua italiana nel web.