Russel Genetica Umana

  • Uploaded by: Paolo Anneck
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Russel Genetica Umana as PDF for free.

More details

  • Words: 467,308
  • Pages: 705
Loading documents preview...
GENETICA

UN APPROCCIO MOLECOLARE Quarta edizione

Peter J. Russell

GENETICA UN APPROCCIO MOLECOLARE Quarta edizione Edizione italiana a cura di:

Carla Cicchini e Alessandra Marchetti Sapienza Università di Roma

© 2014 Pearson Italia – Milano, Torino

Authorized translation from the English language edition, entitled: IGENETICS: A MOLECULAR APPROACH, 3rd edition, by Peter Russell, published by Pearson Education, Inc, publishing as Benjamin Cummings, Copyright © 2010. All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage retrieval system, without permission from Pearson Education, Inc. Italian language edition published by Pearson Italia S.p.A., Copyright © 2014. Le informazioni contenute in questo libro sono state verificate e documentate con la massima cura possibile. Nessuna responsabilità derivante dal loro utilizzo potrà venire imputata agli Autori, a Pearson Italia S.p.A. o a ogni persona e società coinvolta nella creazione, produzione e distribuzione di questo libro. Per i passi antologici, per le citazioni, per le riproduzioni grafiche, cartografiche e fotografiche appartenenti alla proprietà di terzi, inseriti in quest’opera, l’editore è a disposizione degli aventi diritto non potuti reperire nonché per eventuali non volute omissioni e/o errori di attribuzione nei riferimenti. I diritti di riproduzione e di memorizzazione elettronica totale e parziale con qualsiasi mezzo, compresi i microfilm e le copie fotostatiche, sono riservati per tutti i paesi. LA FOTOCOPIATURA DEI LIBRI È UN REATO Le fotocopie per uso personale del lettore possono essere effettuate nei limiti del 15% di ciascun volume dietro pagamento alla SIAE del compenso previsto dall’art. 68, commi 4 e 5, della legge 22 aprile 1941 n. 633. Le riproduzioni effettuate per finalità di carattere professionale, economico o commerciale o comunque per uso diverso da quello personale possono essere effettuate a seguito di specifica autorizzazione rilasciata da AIDRO, corso di Porta Romana n. 108, 20122 Milano, e-mail [email protected] e sito web www.aidro.org. Revisione della quarta edizione a cura di: Carla Cicchini, Alessandra Marchetti, Sapienza Università di Roma Traduzione: Antonio Antoccia, Priscilla Paola Bettini, Paola Castronovo, Gabriella Consonni, Renata Cozzi, Antonella Sgura, Caterina Tanzarella, Paola Vanda Riva Realizzazione editoriale: Il Nove – Bologna Grafica di copertina: Maurizio Garofalo Stampa: Ecobook – Rho (Mi)

Tutti i marchi citati nel testo sono di proprietà dei loro detentori. 978-88-6518-379-3

Printed in Italy 4a edizione: settembre 2014

Ristampa 00 01

02

03

04

Anno 14

15

16

17

18

Indice

Prefazione

Capitolo 1 Introduzione alla genetica

xi

1

Genetica classica e moderna Genetisti e ricerca genetica Le branche della genetica La ricerca di base e la ricerca applicata Le banche dati e le mappe genetiche Gli organismi utilizzati nella ricerca genetica Sommario

1 2 2 3 4 6 10

Capitolo 2 DNA: il materiale genetico

11

La ricerca del materiale genetico L’esperimento di trasformazione di Griffith L’esperimento di trasformazione di Avery Gli esperimenti con i batteriofagi di Hershey e Chase L’RNA come materiale genetico nei virus La composizione e la struttura del DNA e dell’RNA La doppia elica del DNA Differenti strutture del DNA Il DNA nelle cellule Struttura dell’RNA L’organizzazione del DNA nei cromosomi Cromosomi virali Cromosomi procarioti Cromosomi eucarioti Focus sul genoma: Dimensione del genoma e contenuto di DNA ripetuto DNA a sequenza unica e a sequenza ripetuta Sommario Approccio analitico alla soluzione di problemi di genetica

11 12 13 14 16 16 18 21 22 22 22 22 23 25 27 31 33 33

Capitolo 3 La replicazione del DNA

35

La replicazione semiconservativa del DNA L’esperimento di Meselson e Stahl Le DNA polimerasi, enzimi coinvolti nella replicazione del DNA La DNA polimerasi I Il ruolo delle DNA polimerasi Modello molecolare della replicazione del DNA Inizio della replicazione Replicazione semidiscontinua del DNA Replicazione a cerchio rotante La replicazione del DNA negli eucarioti Repliconi Inizio della replicazione

35 35 38 38 38 40 40 42 45 47 48 48

Focus sul genoma: Origini di replicazione nel lievito Enzimi per la replicazione degli eucarioti Replicazione dell’estremità dei cromosomi L’assemblaggio del nuovo DNA nei nucleosomi Sommario Approccio analitico alla soluzione di problemi di genetica

49 50 50 52 53 53

Capitolo 4 La funzione del gene

55

Controllo genetico della struttura degli enzimi Ipotesi di Garrod sugli errori congeniti del metabolismo L’ipotesi un gene-un enzima Deficienze enzimatiche su base genetica nell’uomo Focus sul genoma: Metabolomica intestinale Fenilchetonuria Albinismo Sindrome di Kartagener Sindrome di Tay-Sachs Controllo genetico della struttura delle proteine Anemia falciforme Altre mutazioni dell’emoglobina Fibrosi cistica Consulenza genetica Identificazione dei portatori Analisi fetale Sommario Approccio analitico alla soluzione di problemi di genetica

55 55 56 60 61 61 63 63 64 64 65 67 67 68 69 69 71

Capitolo 5 Espressione genica: la trascrizione

73

Espressione genica. Il dogma centrale: schema generale Il processo della trascrizione La trascrizione nei batteri Inizio della trascrizione: i promotori Allungamento della catena di RNA Terminazione della catena di RNA La trascrizione negli eucarioti Le RNA polimerasi eucariote La trascrizione dei geni che codificano per proteine da parte dell’RNA polimerasi II Focus sul genoma: La ricerca dei promotori La struttura e la produzione degli mRNA eucarioti Auto-splicing (self-splicing) degli introni Correzione (editing) dell’RNA Sommario

71

73 74 74 75 76 78 78 78 79 80 81 87 88 89

vi

Indice

Approccio analitico alla soluzione di problemi di genetica

89

Capitolo 6 Espressione genica: la traduzione

91

Le proteine La struttura chimica delle proteine La struttura molecolare delle proteine La natura del codice genetico Il codice genetico è un codice a triplette La decifrazione del codice genetico Le caratteristiche del codice genetico Focus sul genoma: Altri codici genetici La traduzione: il processo di sintesi proteica L’RNA transfer (o RNA di trasporto) I ribosomi L’inizio della traduzione L’allungamento della catena polipeptidica La fine della traduzione Lo smistamento delle proteine nella cellula Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 7 Mutazione, riparazione del DNA ed elementi trasponibili Mutazione del DNA Adattamento versus selezione Definizione delle mutazioni Mutazioni spontanee o indotte Focus sul genoma: Radioresistenza nei Bacteria: Conan il batterio Identificazione delle mutazioni Le mutazioni dinamiche Riparazione dei danni al DNA Correzione diretta dei danni al DNA Riparazione per escissione Malattie genetiche umane derivanti da mutazioni che interessano i sistemi di replicazione e di riparazione del DNA Elementi trasponibili Le caratteristiche generali degli elementi trasponibili Gli elementi trasponibili dei batteri Gli elementi trasponibili degli eucarioti Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 8 La genomica: la mappatura e il sequenziamento dei genomi Il Progetto Genoma Umano Trasformare i genomi in cloni, e i cloni in genomi Il clonaggio del DNA Vettori di clonaggio e clonaggio del DNA Banche genomiche Banche cromosomiche

91 91 92 94 95 96 97 99 99 100 101 104 106 109 110 112 113

115 116 116 116 120 125 130 131 133 133 134

Sequenziamento del DNA e analisi delle sequenze Sequenziamento mediante didesossinucleotidi Pirosequenziamento Analisi delle sequenze di DNA L’assemblaggio delle sequenze di DNA Il sequenziamento del genoma mediante l’approccio del sequenziamento casuale diretto Assemblaggio e rifinitura delle sequenze genomiche Analisi della variazione nelle sequenze genomiche Annotazione delle sequenze genomiche Identificazione e annotazione delle sequenze geniche Focus sul genoma: I veri occhi blu Conoscenze dall’analisi dei genomi: dimensioni dei genomi e densità dei geni I genomi degli eubatteri I genomi degli archeobatteri I genomi degli eucarioti Alcuni esempi di genomi sequenziati Genomi batterici Genomi di archeobatteri Genomi di eucarioti Prospettive future della genomica Aspetti etici, legali e sociali del sequenziamento del genoma umano Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 9 Genomica funzionale e comparativa

138 138 141 149

Genomica funzionale Ricerca di similarità fra sequenze per attribuire funzioni geniche Attribuire una funzione genica attraverso la sperimentazione La descrizione dei profili di espressione genica Genomica comparativa Esempi di studi di genomica comparativa e delle loro applicazioni Focus sul genoma: Il progetto genoma dell’uomo di Neandertal Sommario Approccio analitico alla soluzione di problemi di genetica

150

Capitolo 10 La tecnologia del DNA ricombinante

137 138

153 154 154 155 159 163 167

Vettori versatili per andare oltre il semplice clonaggio Vettori navetta Vettori di espressione Vettori di clonaggio da PCR Vettori trascrivibili Vettori non plasmidici Clonaggio di un gene specifico Identificazione di cloni specifici usando una libreria di DNA

167 168 172 173 174 174 176 176 180 180 181 185 185 186 186 188 188 188 189 192 193 194 195

199 200 200 202 210 215 215 217 222 222

225 225 226 226 229 230 231 231 232

Indice

Focus sul genoma: Trovare un nuovo gene legato al diabete di tipo 1 Identificazione di geni in librerie per complementazione di mutazioni Identificazione di specifiche sequenze di DNA in librerie mediante l’uso di sonde eterologhe Identificazione di geni o di cDNA in librerie mediante l’uso di sonde oligonucleotidiche Analisi molecolari del DNA clonato Analisi mediante Southern blot di sequenze nel genoma Analisi di RNA mediante northern blot Altri impieghi della PCR nella genetica molecolare Vantaggi e limitazioni della PCR Applicazioni della PCR L’RT-PCR e la quantificazione dell’mRNA Applicazione di tecniche molecolari Mutagenesi sito-specifica del DNA Analisi dell’espressione di singoli geni Analisi delle interazioni proteina-proteina Impieghi dei polimorfismi del DNA nell’analisi genetica Classi di polimorfismi del DNA Test molecolari del DNA per le mutazioni associate a malattie genetiche umane La tipizzazione del DNA La terapia genica Biotecnologia: prodotti commerciali L’ingegneria genetica delle piante La trasformazione delle cellule vegetali Applicazioni dell’ingegneria genetica delle piante Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 11 La genetica mendeliana Genotipo e fenotipo Il piano sperimentale di Mendel Incroci di monoibridi e il principio mendeliano della segregazione Il principio della segregazione La rappresentazione degli incroci mediante uno schema ramificato La conferma del principio della segregazione: l’uso dei reincroci Il fenotipo recessivo a livello molecolare Incroci di diibridi e il principio mendeliano dell’assortimento indipendente Il principio dell’assortimento indipendente Lo schema ramificato degli incroci di diibridi Incroci di triibridi La “riscoperta” delle leggi di Mendel Analisi statistica dei dati genetici: il test del chi-quadrato

vii

La genetica mendeliana nell’uomo L’analisi degli alberi genealogici Focus sul genoma: Qualche volta identico non è così simile Esempi di caratteri genetici dell’uomo Sommario Approccio analitico alla soluzione di problemi di genetica

283 284

237 237

Capitolo 12 Le basi cromosomiche dell’ereditarietà

291

237 239

I cromosomi e la riproduzione cellulare I cromosomi eucariotici Mitosi Meiosi Focus sul genoma: I geni coinvolti nella segregazione cromosomica in meiosi La teoria cromosomica dell’ereditarietà I cromosomi del sesso Ereditarietà legata al sesso Non-disgiunzione del cromosoma X I cromosomi sessuali e la determinazione del sesso Determinazione genotipica del sesso Determinazione genica del sesso L’analisi dei caratteri legati al sesso nell’uomo Ereditarietà recessiva legata al cromosoma X Ereditarietà dominante legata al cromosoma X Ereditarietà legata al cromosoma Y Sommario Approccio analitico alla soluzione di problemi di genetica

232 236 236

239 239 240 240 242 242 243 244 246 246 249 254 258 259 260 260 261 263 265

267 267 268 269 273 273 275 277 277 277 278 280 281 282

Capitolo 13 Estensioni e deviazioni dai principi della genetica mendeliana Alleli multipli I gruppi sanguigni AB0 Il colore dell’occhio in Drosophila Relazione tra alleli multipli e genetica molecolare Modificazioni delle relazioni di dominanza La dominanza incompleta La codominanza Confronto tra dominanza completa, dominanza incompleta e codominanza a livello molecolare Geni essenziali e alleli letali Espressione genica e ambiente Penetranza ed espressività L’effetto dell’ambiente Ereditarietà e ambiente Effetto materno Determinazione del numero di geni implicati in un profilo di mutazioni con lo stesso fenotipo Interazioni tra geni e rapporti mendeliani modificati Interazioni geniche che determinano nuovi fenotipi

285 285 287 288

291 291 294 297 303 304 304 306 309 312 313 317 317 317 318 319 320 320

323 323 324 327 327 328 328 329 329 330 331 332 333 335 336 337 339 339

viii

Indice

L’epistasi Focus sul genoma: Rossi del passato Interazione genica che coinvolge geni modificatori Ereditarietà extranucleare Genomi extranucleari Le leggi dell’ereditarietà extranucleare Esempi di ereditarietà extranucleare Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 14 Mappe genetiche negli eucarioti I primi studi sull’associazione genetica: gli esperimenti di Morgan con Drosophila La ricombinazione genetica e il ruolo dello scambio cromosomico Costruire le mappe genetiche Rilevare l’associazione attraverso i reincroci di prova (testcross) Mappatura dei geni mediante reincroci di prova a due punti Costruzione di una mappa genetica Mappatura dei geni con il reincrocio a tre punti Calcolo accurato delle distanze di mappa Confronto tra mappe genetiche e mappe fisiche Costruzione di mappe genetiche di associazione nell’uomo Studi di associazione nell’uomo Le mappe genetiche umane Focus sul genoma: Analisi del genoma per la ricerca di geni coinvolti nella sclerosi multipla Sommario Approccio analitico alla soluzione di problemi di genetica

341 344 346 347 347 347 348 352 352

355 356 357 359 359 361 362 362 367 368 368 368 369 372 373 374

Capitolo 15 La genetica dei batteri e dei batteriofagi

377

Analisi genetica nei batteri Mappatura dei geni nei batteri mediante coniugazione Scoperta della coniugazione in E. coli Il fattore sessuale F Ceppi di E. coli ad alta frequenza di ricombinazione Fattori F′ Uso della coniugazione per mappare i geni batterici Circolarità della mappa di E. coli Mappatura dei geni nei batteri per trasformazione Focus sul genoma: Vita artificiale: i genomi artificiali e il trasferimento di genomi Mappatura dei geni nei batteri mediante trasduzione Batteriofagi Mappatura del cromosoma batterico mediante trasduzione

377 379 379 380 380 382 383 383 385 386 388 388 389

Mappatura dei geni nei batteriofagi Analisi della struttura fine di un gene di batteriofago Analisi per ricombinazione dei mutanti rII Mappatura per delezione Definizione dei geni mediante test di complementazione (cis-trans) Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 16 Variazioni della struttura e del numero dei cromosomi Tipi di mutazioni cromosomiche Variazioni della struttura dei cromosomi Delezione Duplicazione Focus sul genoma: Le duplicazioni e le delezioni geniche nella famiglia dell’Androgen-Binding Protein (ABP) Inversione Traslocazione Mutazioni cromosomiche e tumori nell’uomo Effetto di posizione Siti fragili e rotture cromosomiche Variazioni nel numero dei cromosomi Cambiamenti di uno o pochi cromosomi Cambiamenti di interi assetti cromosomici Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 17 Regolazione dell’espressione genica nei batteri e nei batteriofagi L’operone lac di E. coli Focus sul genoma: Modelli di espressione genica Il lattosio come fonte di carbonio per E. coli Prove sperimentali della regolazione dei geni lac Modello dell’operone di Jacob e Monod per la regolazione dei geni lac Controllo positivo dell’operone lac Dettagli molecolari della regolazione dell’operone lac L’operone trp di E. coli Organizzazione dei geni per la biosintesi del triptofano Regolazione dell’operone trp L’operone ara di E. coli: controllo positivo e negativo La regolazione dell’espressione genica nel fago lambda Eventi precoci nella trascrizione Il ciclo lisogenico Il ciclo litico Sommario

393 395 396 397 398 401 401

405 405 406 407 409 410 410 412 415 416 417 418 418 422 425 425

427 427 428 428 429 431 436 437 439 439 440 443 443 444 445 446 447

Indice

Approccio analitico alla soluzione di problemi di genetica

Capitolo 18 La regolazione dell’espressione genica negli eucarioti Livelli di controllo dell’espressione genica negli eucarioti Controllo dell’inizio della trascrizione da parte delle proteine regolatrici Regolazione dell’inizio della trascrizione da parte degli attivatori Blocco dell’inizio della trascrizione a opera dei repressori Studio di un caso: regolazione positiva e negativa della trascrizione dei geni per l’utilizzo del galattosio nel lievito Studio di un caso: regolazione della trascrizione da parte degli ormoni steroidei negli animali Regolazione genica di tipo combinatorio: il controllo della trascrizione mediante combinazioni di attivatori e repressori Il ruolo della cromatina nella regolazione della trascrizione genica Regolazione negativa della trascrizione da parte degli istoni Controllo dell’espressione genica e rimodellamento della cromatina Silenziamento genico e metilazione del DNA Focus sul genoma: ChIP on chip Imprinting genomico Silenziamento genico in corrispondenza dei telomeri Controllo del processamento dell’RNA: poliadenilazione alternativa e splicing alternativo Controllo della traduzione dell’mRNA Interferenza dell’RNA: silenziamento dell’espressione genica a livello post-trascrizionale mediante piccoli RNA regolatori Il ruolo dei piccoli RNA regolatori nel silenziamento post-trascrizionale dei geni Regolazione dell’espressione genica a livello post-trascrizionale mediante il controllo della degradazione dell’mRNA e della degradazione delle proteine Controllo della degradazione dell’mRNA Controllo della degradazione delle proteine Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 19 Analisi genetica dello sviluppo Eventi base dello sviluppo Organismi modello per l’analisi genetica dello sviluppo

447

449 450 450 451 452 453 454 457 460 460 461 463 464 465 467 468 469

470 471

473 473 474 476 477

479 479 480

Lo sviluppo è determinato da un’espressione genica differenziale Costanza del DNA nel genoma durante lo sviluppo Esempi di attività genica differenziale durante lo sviluppo Eccezione alla costanza del DNA genomico durante lo sviluppo: perdita di DNA nelle cellule che producono anticorpi La determinazione del sesso e la compensazione di dose nei mammiferi e in Drosophila Determinazione del sesso nei mammiferi Focus sul genoma: L’ornitorinco: uno strano mammifero con un genoma molto insolito Meccanismo di compensazione di dose per i geni X-linked nei mammiferi Determinazione del sesso in Drosophila Compensazione di dose in Drosophila Regolazione genetica dello sviluppo del corpo di Drosophila Stadi di sviluppo in Drosophila Sviluppo embrionale Analisi dello sviluppo di Drosophila mediante microarray Ruolo dei miRNA nello sviluppo Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 20 La genetica del cancro Le relazioni tra il ciclo cellulare, il differenziamento e il cancro Il controllo molecolare del ciclo cellulare La regolazione della divisione cellulare nelle cellule normali Il cancro è una malattia genetica Geni e cancro Oncogeni virali Oncogeni cellulari I geni soppressori dei tumori o oncosoppressori I geni mutatori I geni dei microRNA L’accorciamento dei telomeri, la telomerasi e il cancro umano La natura multifasica del cancro Progressione tumorale e metastasi Focus sul genoma: Metilazione del DNA e cancro Sostanze chimiche e radiazioni come cancerogeni I cancerogeni chimici Le radiazioni Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 21 Genetica di popolazioni La struttura genetica delle popolazioni Frequenze genotipiche

ix 482 482 484 486 489 489 490 491 492 495 496 496 496 503 503 504 505

507 508 508 510 511 511 511 515 518 524 524 525 526 527 528 528 528 529 529 530

531 533 533

x

Indice

Frequenze alleliche La legge di Hardy-Weinberg Assunzioni della legge di Hardy-Weinberg Previsioni della legge di Hardy-Weinberg Da che cosa deriva la legge di Hardy-Weinberg Applicazione della legge di Hardy-Weinberg per loci con più di due alleli Applicazione della legge di Hardy-Weinberg per alleli legati al sesso Test statistico delle proporzioni di Hardy-Weinberg Utilizzo della legge di Hardy-Weinberg per la stima delle frequenze alleliche La variabilità genetica nello spazio e nel tempo La variabilità genetica nelle popolazioni naturali Misura della variabilità genetica a livello proteico Misura della variabilità genetica a livello del DNA Focus sul genoma: Il progetto dei 1000 genomi Forze che cambiano le frequenze alleliche nelle popolazioni Mutazione Deriva genetica casuale Migrazione Selezione naturale L’equilibrio tra mutazione e selezione Scostamento dall’incrocio casuale Inincrocio (inbreeding) Riassunto degli effetti dei processi evolutivi sulla struttura genetica di una popolazione Variazioni nelle frequenze alleliche all’interno di un popolazione Aumento e diminuzione della variabilità genetica entro le popolazioni Gli effetti del crossing-over sulla variabilità genetica Il ruolo della genetica nella biologia della conservazione Speciazione Barriere al flusso genico Le basi genetiche della speciazione Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 22 Genetica quantitativa La natura dei caratteri continui Argomenti studiati in genetica quantitativa La trasmissione ereditaria dei caratteri continui L’ipotesi poligenica per l’ereditarietà quantitativa L’ipotesi poligenica per il colore della cariosside di grano

533 536 537 538 538 540 540 541 542 542 544 544 546 549 550 551 553 559 560 567 568 568 569 569 570 570 571 571 572 572 573 574

575 575 576 576 577 577

Metodi statistici Campioni e popolazioni Distribuzioni La media La varianza e la deviazione standard Correlazione Regressione Analisi della varianza Analisi genetica quantitativa Ereditarietà della lunghezza della pannocchia di mais Ereditabilità Componenti della varianza fenotipica Ereditabilità in senso lato e in senso stretto Comprendere l’ereditabilità Come si calcola l’ereditabilità La risposta alla selezione La stima della risposta alla selezione Correlazioni genetiche Loci per caratteri quantitativi (QTL) Focus sul genoma: Analisi dei QTL associati al comportamento aggressivo in Drosophila melanogaster Sommario Approccio analitico alla soluzione di problemi di genetica

Capitolo 23 Evoluzione molecolare Tipi e modalità di sostituzione Sostituzioni nucleotidiche nella sequenza del DNA Tassi di sostituzione nucleotidica Variabilità dei tassi evolutivi tra i geni Tassi di evoluzione del DNA mitocondriale Orologi molecolari Filogenesi molecolare Alberi filogenetici Metodi di ricostruzione Focus sul genoma: Il trasferimento genico orizzontale Gli alberi filogenetici su grande scala L’acquisizione e l’origine di nuove funzioni Famiglie multigeniche Duplicazione e conversione genica Il genoma di Arabidopsis Sommario Approccio analitico alla soluzione di problemi di genetica

578 579 579 580 580 581 583 584 585 585 586 586 589 589 591 593 593 594 596 600 600 601

603 604 604 605 608 610 611 612 613 614 615 619 621 621 622 623 623 624

Appendice Cenni di Probabilità e Statistica di Giorgio Binelli Glossario Letture consigliate Crediti Indice analitico

(ONLINE) 625 653 669 673

Prefazione all’edizione italiana

La nuova edizione del testo Russell è stata concepita allo scopo di apportare aggiornamenti rispetto all’edizione precedente, in un campo come quello scientifico, in cui le nuove conoscenze, tecnologie e metodiche sono in continuo divenire. Questa edizione è stata anche integrata con alcuni contenuti riguardanti maggiormente l’uomo e le sue patologie per permettere l’uso del testo anche a studenti di discipline mediche la cui conoscenza degli aspetti biologici, molecolari e biotecnologici della scienza sono ormai imprescindibili per la loro professione.

Cambiamenti rispetto all’edizione precedente Tutto il testo è stato revisionato e, ove necessario, aggiornato sulla base di nuove conoscenze. Una maggiore integrazione delle varie parti è stata ottenuta con continui riferimenti tra capitoli per facilitare la consultazione del testo. Numerosi paragrafi sono stati rielaborati per rendere il contenuto più facilmente comprensibile agli studenti; inoltre, nella nuova edizione sono stati inseriti contenuti aggiuntivi. •







La descrizione dell’organizzazione della cromatina e dei suoi livelli di compattazione (Capitolo 2) è stata arricchita ed è stata inclusa una figura riassuntiva. La parte relativa alla struttura dei telomeri è stata ampliata. La descrizione della replicazione delle estremità telomeriche, trattata nel capitolo sulla “Replicazione del DNA” (Capitolo 3), è stata integrata per sottolineare le conseguenze cellulari dell’accorciamento dei telomeri e l’induzione della senescenza replicativa. La trattazione delle mutazioni (Capitolo 7) è stata ampliata aggiungendo un nuovo paragrafo relativo alle mutazioni dinamiche in cui sono descritti i meccanismi che le originano, alcune patologie a esse legate e le loro conseguenze in termini di ereditarietà (anticipazione genetica). In particolare, relativamente alla sindrome dell’X-fragile, il contenuto relativo è stato ripreso dal Capitolo 16, modificato e ampliato. Nel paragrafo sono state incluse due figure esplicative. La trattazione del Progetto Genoma Umano (Capitolo 8) è stata riorganizzata dedicando ampio spazio alla descrizione degli approcci genomici utilizzati per l’assemblaggio di sequenze genomiche (come la costruzione di Contig, l’uso di STS, etc.). Uno speci-



• •







fico box (Box 8.1) è stato introdotto per descrivere l’approccio “storico” del clonaggio posizionale. La parte relativa all’organizzazione del genoma umano è stata spostata in questo capitolo dal Capitolo 9. Nell’ambito dei vettori plasmidici è stata descritta la differenza tra plasmidi ed episomi. Nel capitolo sulla “Genomica funzionale e comparativa” (Capitolo 9) la parte relativa al silenziamento genico è stata ampiamente riorganizzata e aggiornata. La trattazione delle tecnologie del DNA ricombinante (Capitolo 10) è stata riorganizzata e ampliata. Nei capitoli sulla genetica mendeliana è stato aggiunto un esercizio svolto, relativo a un albero genealogico per un carattere autosomico recessivo (Capitolo 11) e una figura relativa a un albero genealogico per un carattere legato al cromosoma Y (Capitolo 12). Altre figure sono state modificate per renderle più facilmente comprensibili. Il capitolo sulle “Estensioni e deviazioni dai principi della genetica mendeliana” (Capitolo 13) è stato ampiamente riorganizzato e integrato con diversi esempi di rapporti di dominanza modificati e di interazioni geniche (con riferimento anche a patologie umane). Una nuova figura relativa alle vie biochimiche che portano alla produzione del pigmento dell’occhio di Drosophila è stata introdotta per illustrare più chiaramente quanto riportato nel testo. Le basi molecolari della dominanza completa, incompleta e codominanza sono state descritte in modo più esteso, con esempi di comportamenti allelici in malattie umane. La trasmissione non mendeliana dei geni contenuti nei genomi extranucleari è stata trattata più dettagliatamente, includendo la struttura dei genomi di mitocondri e cloroplasti e la loro peculiare ereditarietà. Il capitolo sulle “Mappe genetiche degli eucarioti” (Capitolo 14) è stato notevolmente ampliato relativamente al confronto tra le mappe genetiche e le mappe fisiche, e agli studi di associazione nell’uomo (una nuova figura esplicativa è stata inserita). Il capitolo sulle “Variazioni della struttura e del numero dei cromosomi” (Capitolo 16) è stato aggiornato e ampliato. Ora comprende un nuovo Box che descrive il meccanismo genetico del crossing-over ineguale, responsabile di aberrazioni cromosomiche (delezioni/duplicazioni) in relazione a patologie umane. Il paragrafo sui siti fragili è stato focalizzato

xii









Prefazione all’edizione italiana

e aggiornato relativamente alla natura dei siti e alla loro probabile origine; sono stati descritti esempi di correlazione tra i siti fragili e patologie nell’uomo (X-fragile, in parte trattato nel Capitolo 7, e tumori). È stato introdotto il concetto di disomia uniparentale e discusso il mosaicismo genetico relativamente alle mutazioni cromosomiche. La trattazione del ruolo della cromatina nella regolazione dell’espressione genica (Capitolo 18) è stata riorganizzata, ampliata e largamente aggiornata, anche con l’introduzione di nuove figure esplicative. In particolare, è stato evidenziato il ruolo delle modifiche epigenetiche. Nel capitolo sull’“Analisi genetica dello sviluppo” (Capitolo 19) è stato introdotto il ruolo delle cellule staminali adulte e i meccanismi molecolari coinvolti nel riarrangiamento cromosomico dei loci per le immunoglobuline. La trattazione della genetica del cancro (Capitolo 20) è stata ampliata e aggiornata: è stato analizzato il rapporto tra tumorigenesi e differenziamento cellulare discutendo le nuove ipotesi riguardo l’origine dei tumori (introduzione alle cellule staminali tumorali); è stato inserito un nuovo paragrafo sui meccanismi molecolari che portano alla progressione dei tumori verso un fenotipo maligno e alla formazione di metastasi, e un Box focalizzato sui meccanismi genetici responsabili della perdita dell’eterozigosi in tumori familiari. La descrizione degli oncogeni virali e cellulari è stata riorganizzata in modo più omogeneo e integrata con meccanismi aggiuntivi per l’attivazione di oncogeni cellulari da parte di virus e mutazioni. Nel Capitolo 21 sulla “Genetica di popolazioni” è stato brevemente introdotto il concetto di polimorfismo bilanciato.

Trattazione Le quattro aree principali della genetica – genetica della trasmissione dei caratteri, genetica molecolare, genetica di popolazioni e genetica quantitativa – sono trattate in 23 capitoli. Il Capitolo 1 è un capitolo introduttivo ideato per riassumere i principali rami della genetica, descrivere ciò che fanno i genetisti e le loro aree di ricerca e introdurre le banche dati e le mappe genetiche. I Capitoli dal 2 al 7 sono capitoli centrali che trattano dei geni e delle loro funzioni. Nel Capitolo 2 sono trattati la struttura del DNA e i dettagli della struttura e dell’organizzazione del DNA nei cromosomi procariotici ed eucariotici. La replicazione del DNA nei procarioti e negli eucarioti e la ricombinazione tra molecole di DNA sono trattate nel Capitolo 3. Nel Capitolo 4 sono presi in esame alcuni aspetti della funzione dei geni, quali il controllo genetico della struttura e della funzione delle pro-

teine e degli enzimi e il ruolo dei geni nell’indirizzamento e nella regolazione delle vie metaboliche. Per rafforzare la comprensione dei concetti presentati sono descritti numerosi esempi di malattie genetiche umane dovute a carenze enzimatiche. La discussione della funzione genica nel Capitolo 4 consente agli studenti di capire un concetto importante, cioè che i geni codificano per le proteine e per gli enzimi, preparandoli per i due capitoli successivi nei quali è discussa l’espressione genica. Il Capitolo 5 descrive la trascrizione e il Capitolo 6 tratta la struttura delle proteine, l’evidenza della natura del codice genetico e il processo di traduzione nei procarioti e negli eucarioti. Nel Capitolo 7 sono poi presentate le modalità tramite cui il materiale genetico può modificarsi o venire modificato. Gli argomenti presentati comprendono i processi di mutazione genica (incluse le mutazioni dinamiche o di triplette ripetute), alcuni meccanismi di riparazione dei danni al DNA, alcuni procedimenti usati per saggiare particolari tipi di mutanti, e le strutture e i movimenti degli elementi genetici trasponibili nei procarioti e negli eucarioti. Nei tre capitoli successivi vengono descritte la genomica e la tecnologia del DNA ricombinante. Nel Capitolo 8 vengono presentate una visione d’insieme della mappatura e del sequenziamento dei genomi (incluso il Progetto Genoma Umano) e un’introduzione alle informazioni ottenute dall’analisi della sequenza genomica. Quindi, nel Capitolo 9 vengono discusse la genomica funzionale, l’analisi globale delle funzioni dei geni e delle sequenze extrageniche dei genomi, e la genomica comparativa, ovvero il confronto di interi genomi (o di porzioni di genomi) appartenenti alla stessa specie o a specie diverse al fine di aumentare le nostre conoscenze circa le funzioni dei genomi, comprese le relazioni evolutive. Nel Capitolo 10 sono discusse le applicazioni della tecnologia del DNA ricombinante per l’analisi dei geni e di altro DNA, dell’RNA e delle proteine, compresi i vari tipi di polimorfismi del DNA presenti nei genomi, la diagnosi di malattie umane, le scienze forensi (tipizzazione del DNA), la terapia genica, lo sviluppo di prodotti commerciali e l’ingegneria genetica delle piante. I Capitoli da 11 a 18 sono capitoli centrali che trattano i principi dell’analisi della segregazione genica. I Capitoli 11 e 12 presentano i principi di base della genetica in riferimento alle leggi di Mendel. Il Capitolo 11 si concentra sui contributi di Mendel alla nostra comprensione dei principi dell’ereditarietà, mentre il Capitolo 12 tratta della mitosi e della meiosi nel contesto dei cicli vitali animali e vegetali, delle prove sperimentali della relazione tra geni e cromosomi e dei metodi di determinazione del sesso. La genetica mendeliana nell’uomo è introdotta nel Capitolo 11 e si concentra sull’analisi degli alberi genealogici (pedigree) e dei caratteri autosomici. Questo argomento continua nel Capitolo 12 con riferimento ai geni legati al sesso. Le eccezioni, le estensioni

Prefazione all’edizione italiana

e le deviazioni dai principi mendeliani (come l’esistenza di alleli multipli, i cambiamenti dei rapporti di dominanza, i geni essenziali e gli alleli letali, l’espressione genica e l’ambiente, l’effetto materno, i test di complementazione, le interazioni tra geni e i rapporti mendeliani modificati e l’eredità extranucleare) sono descritte nel Capitolo 13. Nel Capitolo 14 si discute la mappatura dei geni negli eucarioti, attraverso la descrizione della determinazione dell’ordine e della distanza tra i geni sui cromosomi eucariotici in esperimenti progettati per quantificare i crossing-over che si verificano durante la meiosi, e la sottolineatura delle modalità di costruzione delle mappe genetiche umane. Inoltre, viene trattato il confronto delle mappe genetiche con le mappe fisiche e la loro applicazione per studi di associazione nell’uomo. Nel Capitolo 15 sono discussi i metodi per mappare i geni nei batteri e nei batteriofagi sfruttando i processi di coniugazione, trasformazione e trasduzione. L’analisi della struttura dei geni dei batteriofagi conclude questo capitolo. Le mutazioni cromosomiche – i cambiamenti nella struttura normale dei cromosomi o nel numero dei cromosomi – sono discusse nel Capitolo 16. Sono evidenziate le mutazioni cromosomiche negli eucarioti e le sindromi umane da esse causate. La regolazione genica è trattata nei due capitoli successivi. Il Capitolo 17 si concentra sulla regolazione dell’espressione genica nei procarioti. In questo capitolo vengono trattati argomenti quali l’operone come unità di regolazione genica, i dettagli della regolazione dell’espressione genica in operoni batterici in base alle conoscenze attuali e la regolazione dei geni nei batteriofagi. Il Capitolo 18 si concentra sulla regolazione dell’espressione genica negli eucarioti, sottolineando i cambiamenti molecolari responsabili di essa; in particolare, viene discusso il ruolo delle modificazioni epigenetiche. Il Capitolo 19 tratta dell’analisi genetica dello sviluppo. Vengono descritti gli eventi di base dello sviluppo e l’evidenza della derivazione dello sviluppo dall’espressione genica differenziale, per poi illustrare i principi di regolazione genica che operano in casi esemplificativi di processi di sviluppo ben caratterizzati, in specifico la determinazione del sesso e la compensazione di dose, e lo

xiii

svolgimento del programma di sviluppo corporeo di Drosophila. Successivamente, nel Capitolo 20 viene discussa la relazione tra il ciclo cellulare e il cancro e i vari tipi di geni che, se mutati, giocano un ruolo nello sviluppo dello stesso. Nel Capitolo 21 sono presentati i principi di base della genetica di popolazioni, che estende gli studi dell’ereditarietà dal singolo organismo a una popolazione di organismi. Questo capitolo include anche una discussione integrata dell’area in fase di espansione della genetica della conservazione. Il Capitolo 22 tratta di genetica quantitativa. Viene presa in considerazione l’ereditarietà dei caratteri che sono determinati da numerosi geni simultaneamente in gruppi di individui. In questo capitolo si discute anche il concetto di ereditabilità; la misura in cui una caratteristica è determinata dai geni o dall’ambiente. Sono comprese anche discussioni relative all’applicazione di strumenti molecolari in questa area della genetica. Il Capitolo 23 tratta dell’evoluzione a livello molecolare delle sequenze del DNA e delle proteine. Lo studio dell’evoluzione molecolare utilizza il fondamento teorico della genetica di popolazione per affrontare due serie sostanzialmente diverse di problematiche: come evolvono il DNA e le proteine e come i geni e gli organismi sono correlati a livello evolutivo.

Pearson Learning Solution Il volume è corredato da un codice di registrazione che consente l’accesso per diciotto mesi alla piattaforma e-Learning MyLab. Questa nuova piattaforma integra l’attività di studio con un sistema di tutoring, esercitazioni e strumenti per l’autovalutazione. In particolare nella piattaforma sono presenti test a risposta multipla, domande aperte e problemi di fine capitolo con le relative soluzioni, animazioni, iAttività e la versione digitale del testo (eText) che contiene un’appendice di “Statistica applicata alla genetica”. Le iAttività e le animazioni sono richiamate nel testo tramite l’icona

. MyLab

Guida alla lettura Poiché il campo della genetica è complesso, il suo studio risulta potenzialmente difficile: abbiamo pertanto incluso numerosi strumenti pedagogici per aiutare gli studenti e per migliorare la comprensione degli argomenti.

Genomica funzionale e comparativa

9 Domande chiave Ogni capitolo si apre con un elenco di domande chiave che preannunciano agli studenti i concetti principali che incontreranno nel capitolo.

Come può essere attribuito un ruolo funzionale a una sequenza di DNA nota?

Come variano i trascritti e i prodotti proteici di tutti i geni del genoma in tipi cellulari diversi, o in condizioni differenti?

Come comprendere la natura genica di una sequenza di DNA nota?

Come si possono rendere più efficaci le terapie farmacologiche attraverso gli studi di genomica?

Come si possono confrontare geni identificati ex novo con quelli studiati in precedenza?

Come si possono ottenere informazioni sui rapporti evolutivi fra organismi diversi attraverso il confronto delle loro sequenze genomiche?

g il restante 30% dei geni di lievito candidati non sono stati trovati omologhi nelle banche dati. Questa classe comprende quel 6-7% di geni candidati per i quali è dubbio se siano o meno veri geni; cioè, alcune di queste ORF probabilmente non vengono trascritte. Le rimanenti ORF a funzione ignota sono probabilmente veri geni, ma attualmente sono stati identificati solo nel lievito. Questi geni sono chiamati geni orfani singoli. Da quando questa analisi è stata effettuata per la prima volta, sono state assegnate funzioni a molte delle famiglie di geni orfani e ai geni orfani singoli, ma c’è ancora un numero elevato di geni di lievito (circa il 14%) che codifica per proteine per le quali non può essere predetta una funzione. Ciò non vuol dire che le proteine codificate da questi geni siano prive di funzione; si tratta piuttosto di proteine non ancora ben caratterizzate. Se consideriamo i geni che codificano per proteine alle quali è stato possibile assegnare una funzione putativa, ci possiamo chiedere quale percentuale dei geni nel genoma di lievito venga utilizzata per una particolare funzione. La Figura 9.2 mostra questo tipo di analisi per i i l di li i P i hi d i i

Focus sul genoma Tutti i capitoli, eccetto l’introduzione, comprendono rubriche chiamate “Focus sul genoma”, scritte dall’esperto di genomica Gregg Jongeward. Questi piccoli contributi introducono gli studenti alla genomica grazie alla connessione tra il contenuto di ogni capitolo e le attuali applicazioni in questo settore all’avanguardia.

g

g

Nota chiave

Nota chiave Per assegnare la funzione genica attraverso l’analisi al computer, la sequenza di un gene sconosciuto di un organismo viene confrontata con le sequenze di geni a funzione nota presenti nelle banche dati. Per il gene sconosciuto, la sequenza confrontata può essere la sequenza di DNA o la sequenza amminoacidica del polipeptide da essa codificato. Una ricerca di similarità come questa può dare come risultato una corrispondenza per l’intera sequenza o per parte di essa, indicando in quest’ultimo caso che un dominio del prodotto genico ha una funzione nota.

Nel corso di ogni capitolo, posizionate strategicamente, sono inserite le cosiddette “Note chiave”, che richiamano le idee principali e i punti fondamentali, consentendo agli studenti di verificare man mano i loro progressi.

Attribuire una funzione genica attraverso la sperimentazione Un approccio chiave per attribuire una funzione genica in modo sperimentale consiste nell’eliminare la funziodi ld i i bi if i i

p

Focus sul genoma La ricerca dei promotori I promotori sono ovviamente importanti per la funzione genica. Precedentemente in questo capitolo abbiamo definito le sequenze consenso per i promotori e altre regioni regolatrici a monte, per esempio le box TATA e CAAT. Le sequenze di questi elementi, così come la loro distanza relativa l’uno rispetto all’altro e rispetto al sito d’inizio della trascrizione, sono importanti dal punto di vista funzionale. Non tutti i geni mostrano nei loro promotori una corrispondenza precisa con queste sequenze, o

perché si legano meno bene all’apparato della trascrizione, o perché altre proteine aiutano l’RNA polimerasi a legarsi. Uno dei primi obiettivi della genomica è stato l’analisi delle sequenze per ricercare possibili promotori, al fine di identificare i geni associati a quelle sequenze. Anche la ricerca di cornici di lettura aperte (ORF, Open Reading Frames), descritte nel Capitolo 6, e di regioni contenenti i segnali di terminazione permettono l’individuazione di sequenze geniche nel genoma.

Box

Centrifugazione all’equilibrio in gradiente di densità

Negli esperimenti che implicano la centrifugazione all’equilibrio in gradiente di densità, una soluzione concentrata di cloruro di cesio (CsCl) viene centrifugata ad alta velocità. Le forze opposte di sedimentazione e di diffusione producono un gradiente di concentrazione di CsCl stabile e lineare. Le densità di CsCl alle estremità del gradiente sono correlate alla concentrazione del CsCl che viene centrifugato. Per esempio, al fine di esaminare DNA con densità di 1,70 g/cm3 (densità tipica del DNA), viene prodotto un gradiente che copre quella densità – per Figura box 3.1 Diagramma schematico che illustra la separazione di DNA con diverse densità mediante centrifugazione all’equilibrio in un gradiente di densità di cloruro di cesio. Viene mostrata la separazione di DNA 14N e DNA 15N.

Sommario Ogni capitolo si conclude con un “Sommario”, che enfatizza ulteriormente i punti principali discussi.

esempio da 1,60 a 1,80 g/cm3. Se il DNA è mescolato con il CsCl e tale miscela viene centrifugata, il DNA si metterà in equilibrio nel punto del gradiente in cui la sua densità è uguale a quella del CsCl circostante (vedi Figura box 3.1). Si dice che il DNA ha formato una banda nel gradiente. Se sono presenti DNA con differenti densità, come nel caso di DNA 15N- 15N e DNA 14N- 14N, essi formeranno bande (giungeranno all’equilibrio) in posizioni diverse. Il DNA viene rilevato in base all’assorbimento di raggi UV.

DNA in CsCl

La centrifugazione per 50-60 ore a 100 000!g dà luogo alla formazione di un gradiente di CsCl con bande di DNA

Densità crescente

Box 3.1

In alcuni capitoli sono presenti dei “box” relativi ad argomenti speciali, pertinenti alla trattazione del capitolo.

DNA 14N-14N

DNA 15N-15N

Sommario  Esiste una relazione specifica tra geni ed enzimi, inizialmente rappresentata dall’ipotesi un gene-un enzima, che stabilisce che ogni gene controlla la sintesi o l’attività di un singolo enzima. Poiché alcuni enzimi sono costituiti da più di un polipeptide, e i geni codificano per catene polipeptidiche individuali, questa relazione fu aggiornata nell’ipotesi un gene-un polipeptide. Oggi sappiamo che non tutti i geni codificano per proteine e che alcuni geni eucariotici che codificano per proteine vengono espressi producendo più di un polipeptide.  Molte malattie genetiche umane sono causate da deficit in attività enzimatiche. La maggior parte sono ereditate come caratteri recessivi, vale a dire che per sviluppare la malattia

un individuo deve avere entrambi gli alleli mutati per il gene implicato.  Dallo studio delle alterazioni in proteine diverse dagli enzimi sono state ottenute prove convincenti che i geni controllano la struttura di tutte le proteine, non solo di quelle che svolgono una funzione enzimatica.  La consulenza genetica consiste in un’analisi del rischio che i futuri genitori possano generare un bambino con un difetto genetico e nella presentazione ai membri della famiglia delle opzioni disponibili per evitare o ridurre al minimo questi rischi. L’individuazione dei portatori e l’analisi fetale permettono una precoce individuazione di una malattia genetica.

Approccio analitico alla soluzione di problemi di genetica A eccezione del Capitolo 1 introduttivo, tutti i capitoli contengono una sezione intitolata “Approccio analitico alla soluzione di problemi di genetica”. I principi della genetica sono stati sempre esposti con un approccio mirato alla risoluzione dei problemi. Tuttavia, spesso gli studenti all’inizio non hanno ancora acquisito l’esperienza necessaria dei concetti di base per risolvere con metodo i problemi assegnati. Approccio analitico alla soluzione di problemi di genetica Tale sezione, in cui vengono risolti passaggio D15.1 In E. coli i seguenti ceppi Hfr donano i geni indicati nelN D A l’ordine dato: dopo passaggio problemi 3 B 4 X Ceppo Hfr Ordine di trasferimento dei geni genetici esemplificativi, 1 G E B D N A è stata creata per aiutare E T 2 P Y L G E B gli studenti a capire 3 X T J F P Y J G 4 B E G L Y P come affrontarli 1 2 applicando i principi + F L Tutti i ceppi Hfr sono derivati dallo stesso ceppo F . Qual è l’ordine dei geni nel cromosoma del ceppo F+ originario? P fondamentali. Y

Pearson Learning Solution La piattaforma MyLab è un ambiente digitale per lo studio, organizzato attorno al libro, che offre risorse didattiche fruibili in modo autonomo o per assegnazione del docente. Tra i materiali integrativi e multimediali troverete:

15

Domande e problemi F–,

F–

15.2 La resistenza agli antibiotici nei batteri è un significativo probema per la salute. Negli anni cinquanta del secolo scorso, i medici identificarono pazienti ospedalizzati affetti da diarrea grave, conseguenza di una dissenteria batterica che non rispondeva ad antibiotici precedentemente efficaci. Alcuni ceppi di Shigella, il patogeno che causa la dissenteria batterica, avevano sviluppato resistenza. Negli anni settanta furono scoperte le basi di questa resistenza: plasmidi che contenevano più geni per la resistenza agli antibiotici furono isolati in Shigella. I ricercatori poi scoprirono che gli stessi geni che conferivano resistenza in Shigella erano presenti anche in altri batteri patogeni. a. In ciascuno dei seguenti incroci, in che ordine dovrebbero essere localizzati i geni che conferiscono resistenza per es-

h+

strR

dei ricombinanti che hanno ricevuto alcuni geni dalla cellula Hfr. Il grafico del numero di ricombinanti rispetto al tempo è riportato nella figura. a. Indicate se ciascuna delle seguenti affermazioni è vera o falsa. h+ e+

100 % dei ricombinanti h+ strR

*15.1 In incroci × il ricevente è convertito a ceppo donatore con una frequenza molto alta. Tuttavia in incroci Hfr × F– raramente il ricevente diviene donatore. Spiegate perché. F+

Domande e Problemi Le sezioni “Domande e Problemi” di ogni capitolo, comprendono complessivamente circa 750 quesiti con le relative soluzioni. I casi presentati sono stati progettati per fornire agli studenti una metodologia nella risoluzione dei problemi di genetica.

75 b+

50 g+

25 0

a+

0

5

10

15

20

25

Minuti

Test a risposta multipla Un ulteriore strumento per l’autovalutazione viene offerto agli studenti con 575 test a risposta multipla, che consentono di esercitarsi e di acquisire familiarità con i temi trattati nei singoli capitoli. La piattaforma MyLab in questo caso fornirà agli studenti un report costante del percorso di apprendimento e dell’esito delle attività esercitative.

Animazioni e iAttività Le iAttività sono state pensate per stimolare la risoluzione interattiva dei problemi introdotti nel corso della trattazione. I video presentano esercitazioni guidate, alternate a domande di stimolo o di verifica, secondo un itinerario didattico lineare. Le Animazioni mostrano invece alcuni processi fondamentali nell’ambito della genetica. Queste risorse sono indicate nel testo con l’icona MyLab.

Attività MyLab

Andate nel sito dedicato agli studenti e, nella iAttività Sorting the Signals of Gene Regulation (Scelta dei segnali della regolazione genica), svolgete il ruolo di un ricercatore che analizza alcuni dei modi usati da una cellula eucariote per la regolazione sincronizzata dei geni.

Regolazione genica di tipo combinatorio: il controllo della trascrizione mediante combinazioni di attivatori e repressori Negli eucarioti i geni codificanti per proteine contengono sia elementi del promotore sia enhancer (Capitolo 5). Gli

Negli animali si differenziano molti tipi di cellule, ciascuno dei quali svolge una o più funzioni specializzate. Le cellule degli animali non sono esposte a cambiamenti rapidi nell’ambiente, come lo nimazione sono le cellule dei batteri o dei microrganismi eucarioti. Ciò si Regolazione della trascrizione verifica perché la maggior parte delle cellule degli animali è da parte degli esposta al fluido intercellulare MyLab ormoni steroidei (che costituisce una sorta di negli animali “microambiente” per la cellula), il cui contenuto di sostanze nutritive, ioni e altre importanti molecole è relativamente costante. Cambiamenti del microambiente agiscono da segnali per la risposta

eText e Appendice La versione digitale del libro, per tablet e pc, è dotata di alcuni strumenti che permettono di evidenziare, commentare e appuntare delle note nel testo, avendo così la possibilità di personalizzare la lettura. Nell’eText è disponibile un’appendice aggiuntiva che tratta gli aspetti della statistica applicata alla genetica.

Appendice di Giorgio Binelli

Cenni di Probabilità e Statistica

1

Introduzione alla genetica

Quali sono le principali branche della genetica? Quali sono gli strumenti e i modelli sperimentali della ricerca genetica?

Benvenuti nello studio della genetica, la scienza dell’ereditarietà. La genetica si occupa in primo luogo di comprendere le caratteristiche biologiche che vengono trasmesse dai genitori alla propria discendenza. Gli argomenti che riguardano la genetica includono l’ereditarietà, la natura molecolare del materiale genetico, il modo con cui i geni, che determinano le caratteristiche dell’organismo, controllano le funzioni della vita e la distribuzione e il comportamento dei geni nelle popolazioni. La genetica ha un ruolo centrale in biologia, dal momento che l’attività dei geni è alla base di tutti i processi vitali, dalla struttura e funzione della cellula fino alla riproduzione. Questo volume si propone di spiegare che cosa sono i geni, come i geni sono trasmessi di generazione in generazione, in che modo avviene e come è regolata la loro espressione. La rapida e costante acquisizione di nuove informazioni genetiche non consente di descrivere tutte le conoscenze del settore. I concetti e i principi più importanti vengono comunque presentati in modo accurato e completo; il lettore che volesse approfondire ulteriormente può usufruire di Internet, ricercando informazioni tramite Google Scholar o la banca dati PubMed, supportata dalla National Library of Medicine e dai National Institutes of Health degli Stati Uniti d’America (Istituti Nazionali di Sanità, abbreviati in NIH), al sito http://www.pubmed.gov. Si presuppone che le nozioni apprese nel corso di introduzione alla biologia abbiano fornito allo studente una conoscenza generale della genetica. Questo capitolo fornisce un quadro riassuntivo del contesto nell’ambito del quale verrà affrontato lo studio della genetica nei successivi capitoli del volume.

Genetica classica e moderna Gli uomini si erano accorti da lungo tempo che i figli tendevano a somigliare ai propri genitori e, per secoli, avevano altresì effettuato esperimenti di ibridazione

Chi sono i genetisti e che cosa sono le ricerche genetiche?

con animali e piante. Tuttavia, i principi dell’ereditarietà non furono compresi fino alla metà del XIX secolo, quando Gregorio Mendel analizzò dal punto di vista quantitativo i risultati degli incroci di piante di pisello odoroso le cui caratteristiche differivano in modo facilmente osservabile. Sebbene lo scienziato avesse pubblicato questi risultati, il loro significato non venne compreso fino a parecchi anni dopo la sua morte; solo allora infatti i ricercatori si accorsero che Mendel aveva scoperto i principi fondamentali dell’ereditarietà. Attualmente gli studi di Mendel sono considerati le fondamenta della genetica moderna. Dall’inizio del XX secolo la genetica ha costituito un potente strumento per lo studio dei processi biologici. Un importante approccio utilizzato da molti genetisti prevede l’isolamento di mutanti di una cellula o di un organismo che controllano particolari processi biologici, la comprensione dei quali è possibile grazie alla rilevazione delle differenze osservabili nelle cellule o negli organismi mutati rispetto alle forme non mutate. Queste ricerche si sono sviluppate in numerose direzioni, quali l’analisi dell’ereditarietà nelle popolazioni, lo studio dei processi evolutivi, l’identificazione e il posizionamento sul genoma dei geni che controllano le diverse fasi di un processo, la determinazione dei prodotti genici e l’analisi delle caratteristiche molecolari dei geni, inclusa la regolazione dell’espressione genica. Le ricerche genetiche subirono una rivoluzione nel 1972, allorché Paul Berg ottenne in vitro la prima molecola di DNA ricombinante, e nel 1973, quando Herbert Boyer e Stanley Cohen clonarono per la prima volta una molecola di DNA ricombinante. Nel 1986 la messa a punto da parte di Kary Mullis della PCR (reazione a catena della polimerasi o Polymerase Chain Reaction), metodica per mezzo della quale è possibile amplificare specifici segmenti di DNA, produsse un’ulteriore rivoluzione. La tecnologia

2

Capitolo 1

del DNA ricombinante, la PCR e altre tecnologie molecolari rendono ora possibile un numero sempre maggiore di esaltanti scoperte, le quali portano a un incremento della conoscenza delle funzioni biologiche di base, consentendo in tal modo un futuro miglioramento nella qualità della vita umana. Allo stato attuale è in corso la rivoluzione genomica. Il sequenziamento del DNA di parecchi organismi, incluso l’uomo, e di molti virus è stato ormai completato. L’analisi dei dati sul genoma da parte dei genetisti fornisce contributi importanti alla conoscenza di numerose aree della biologia. Ovviamente, per noi è naturale che la ricerca scientifica si focalizzi in particolare sui risultati ottenuti studiando il genoma umano; per esempio, si auspica di comprendere la struttura e la funzione di ciascun gene che costituisce il nostro genoma. Infatti, una tale conoscenza porterebbe indubbiamente a una migliore comprensione delle malattie genetiche umane e contribuirebbe in modo significativo alla loro cura. Lo scenario da fantascienza, secondo il quale ogni essere umano porterà con sé la sequenza del proprio DNA genomico in un “chip”, diventerà rapidamente realtà nel futuro. Tuttavia, il progresso delle conoscenze relative al genoma umano suscita preoccupazioni sociali ed etiche che devono essere affrontate con molta attenzione.

Genetisti e ricerca genetica Il materiale presentato in questo volume costituisce il risultato dell’enorme numero di ricerche condotte dai genetisti nei diversi settori della biologia. I genetisti impiegano metodi standardizzati per i loro studi scientifici; in particolare, essi adottano un metodo di indagine ipotetico-deduttivo, che consiste nel fare osservazioni, formulare ipotesi in grado di spiegare tali osservazioni, eseguire esperimenti che consentano di fare previsioni in base alle suddette ipotesi e, infine, saggiare le proprie ipotesi. Queste prove sperimentali producono nuove osservazioni, completando in tal modo un ciclo che conduce a un perfezionamento delle ipotesi e, talvolta, all’elaborazione di una teoria che cerca di spiegare le osservazioni iniziali. In modo analogo a quanto accade in ogni altra area della ricerca scientifica, non è possibile prevedere in modo preciso quale sarà il percorso di un progetto di ricerca genetica, ed è proprio l’imprevedibilità della ricerca a renderla eccitante, motivando gli scienziati a impegnarsi in tali studi. Le scoperte che hanno rivoluzionato la genetica non erano state pianificate; infatti, esse si sono sviluppate nel corso di ricerche in cui si studiavano principi genetici di base. A tal proposito, il lavoro di Barbara McClintock sull’ereditarietà delle macchie di colore presenti sulla cariosside del mais rappresenta un eccellente esempio. Dopo aver accumulato una grande quantità di dati ottenuti da vari incroci

genetici, la McClintock ipotizzò che la comparsa delle macchie di colore fosse il risultato del movimento (trasposizione) di un segmento di DNA da una parte del genoma a un’altra. Soltanto molti anni dopo questi segmenti di DNA, denominati trasposoni o elementi trasponibili, vennero isolati e caratterizzati in dettaglio. (Nel Capitolo 7 è possibile leggere una descrizione più approfondita della storia di questa scoperta e della vita di Barbara McClintock.) Attualmente è noto che i trasposoni sono ubiquitari e giocano un ruolo non solo nell’evoluzione delle specie, ma anche nell’insorgenza di alcune malattie umane.

Le branche della genetica I genetisti spesso dividono la genetica in quattro importanti branche. 1. La genetica della trasmissione dei caratteri, definita talvolta genetica classica, è la branca che si occupa della trasmissione dei geni e dei caratteri genetici da una generazione a quella successiva e della ricombinazione dei geni (ossia dello scambio di materiale genetico tra i cromosomi). Alcuni esempi di studi di genetica della trasmissione sono costituiti dall’analisi della trasmissione dei caratteri in un albero genealogico umano e dagli incroci sperimentali tra organismi modello. 2. La genetica molecolare è la branca che si interessa della struttura e della funzione dei geni a livello molecolare. Esempi di studi di genetica molecolare sono l’analisi degli eventi molecolari coinvolti nel controllo genetico della divisione cellulare e la regolazione delle espressioni dei geni in un genoma. La genomica rientra nella genetica molecolare. 3. La genetica di popolazioni è la branca che studia l’ereditarietà dei caratteri determinati da uno o pochi geni in gruppi di individui. Un esempio di studio di genetica di popolazioni è la determinazione della frequenza di un gene che causa una malattia nella popolazione umana. 4. La genetica quantitativa considera anch’essa l’ereditarietà dei caratteri in gruppi di individui, ma i caratteri analizzati vengono determinati da parecchi geni contemporaneamente. Un esempio di studio di genetica quantitativa è quello condotto sulle piante in agricoltura e consiste nell’analisi dell’abbondanza del raccolto e del peso del frutto. Sebbene questa suddivisione aiuti a pensare ai geni da prospettive differenti, non esistono confini precisi tra le diverse branche. Per esempio, sempre più di frequente i genetisti di popolazioni e quelli che studiano la genetica quantitativa analizzano i dati molecolari per determinare le frequenze geniche in ampi gruppi di indivi-

Introduzione alla genetica

dui. Storicamente, la genetica della trasmissione dei caratteri si è sviluppata per prima, seguita dalla genetica di popolazioni, dalla genetica quantitativa e, infine, dalla genetica molecolare. I geni influenzano tutti gli aspetti degli organismi viventi. La comprensione della genetica della trasmissione dei caratteri, della genetica di popolazioni e di quella quantitativa potrà aiutare a capire la biologia delle popolazioni, l’ecologia, l’evoluzione e il comportamento animale. Analogamente, la conoscenza della genetica molecolare è importante per lo studio della neurobiologia, della biologia cellulare, della biologia dello sviluppo, della fisiologia umana e delle piante, dell’immunologia e, naturalmente, della struttura e funzione dei genomi.

La ricerca di base e la ricerca applicata La ricerca genetica, e la ricerca scientifica in generale, può essere di base o applicata. Nella ricerca di base la realizzazione degli esperimenti si propone di incrementare la conoscenza dei fenomeni fondamentali, indipendentemente dal fatto che tale conoscenza abbia o meno un’applicazione immediata. La maggior parte delle nozioni riportate in questo volume si riferisce alla ricerca di base. Per esempio, la regolazione dell’espressione di numerosi geni procarioti ed eucarioti è attualmente nota grazie a ricerche di base condotte su organismi modello, quali il batterio Escherichia coli (E. coli) (Figura 1.1), il lievito Saccharomyces cerevisiae (Figura 1.4a) e il moscerino della frutta Drosophila melanogaster (Figura 1.4b). Le conoscenze ottenute attraverso la ricerca di base vengono ampiamente utilizzate per stimolare altra ricerca di base. Nella ricerca applicata gli esperimenti vengono eseguiti al fine di trovare la soluzione di specifici problemi che affliggono la società o di sfruttare le scoperte effettuate. In agricoltura la genetica applicata ha contribuito in modo significativo al miglioramento degli animali e delle piante utilizzati a scopo alimentare, per esempio riducendo la quantità di grasso nei bovini e nei suini o aumentando la quantità di proteine nelle farine di soia. Un certo numero di malattie è causato da difetti genetici e sono stati compiuti notevoli progressi nella diagnosi e nella comprensione delle basi molecolari di alcune di queste patologie; per esempio, sfruttando le informazioni acquisite dagli studi di base, la ricerca genetica applicata può impegnarsi nello sviluppo di test diagnostici rapidi per le malattie genetiche e nell’allestimento di nuovi farmaci per la cura di queste ultime. Non esiste una demarcazione netta tra ricerca genetica di base e ricerca genetica applicata. Infatti, in entrambi i casi i ricercatori utilizzano tecniche simili e formulano ipotesi in base a una certa quantità di infor-

3

mazioni acquisite; per esempio, la tecnologia del DNA ricombinante, una serie di procedure che permettono ai biologi molecolari di inserire un frammento di DNA di un organismo nel genoma di un altro organismo e di clonare (ossia di produrre numerose copie identiche) la nuova molecola di DNA ricombinante, ha influenzato profondamente sia la ricerca genetica di base sia quella applicata (vedi Capitoli 8, 9 e 10). L’esistenza di numerose aziende biotecnologiche si deve proprio alla tecnologia del DNA ricombinante; esse cercano di clonare e manipolare geni per sviluppare prodotti commerciali. Nell’ambito del miglioramento genetico delle piante la tecnologia del DNA ricombinante ha reso possibile introdurre nelle specie coltivate caratteristiche tipiche di specie selvatiche, quali la resistenza a determinate malattie. Tradizionalmente questo tipo di miglioramento delle colture veniva raggiunto mediante i consueti esperimenti di ibridazione. Relativamente al miglioramento genetico animale, la tecnologia del DNA ricombinante viene impiegata nell’allevamento dei bovini da carne e da latte e nell’allevamento del pollame, al fine di incrementare, per esempio, la percentuale di carne magra, la quantità di latte e il numero di uova. In medicina i risultati ottenuti sono egualmente impressionanti; in particolare, la tecnologia del DNA ricombinante viene utilizzata per la produzione di molti antibiotici, di ormoni e di altre importanti sostanze medicali, quali il fattore di coagulazione del sangue e l’insulina umana (Figura 1.2), e anche per la diagnosi e il trattamento terapeutico di numerose malattie genetiche. In medicina legale la tipizzazione del DNA, definita anche DNA fingerprinting o DNA profiling, viene cor-

Figura 1.1 In questa microfotografia, colorata e ottenuta al microscopio elettronico, è possibile osservare Escherichia coli, un batterio di forma bastoncellare che si ritrova comunemente nell’intestino dell’uomo e di altri animali.

4

Capitolo 1

Figura 1.2 Esempio di un prodotto commerciale sviluppato grazie all’impiego della tecnologia del DNA ricombinante. Humulin, insulina umana per soggetti diabetici insulina-dipendenti.

rentemente utilizzata per l’accertamento di paternità, per la soluzione di casi criminali e negli studi antropologici. In breve, la scienza della genetica si trova attualmente in una fase di crescita importante ed entusiasmante, e le scoperte da effettuare sono ancora numerose.

tando in modo critico i risultati ottenuti. Tuttavia, è possibile consultare un insieme di banche dati genetiche estremamente importanti e utili presso il sito web del National Center for Biotechnology Information, NCBI (http://www.ncbi.nlm.nih.gov). L’NCBI venne creato nel 1988 negli Stati Uniti come risorsa nazionale di informazioni di biologia molecolare. Il suo ruolo è “creare banche dati pubbliche, condurre ricerche di bioinformatica, sviluppare programmi informatici in grado di analizzare i dati sul genoma e rendere disponibili informazioni di interesse biomedico; l’obiettivo di tali attività è il miglioramento della comprensione dei processi molecolari relativi alla salute e alle malattie dell’uomo”. Di seguito si elencano alcuni degli strumenti di ricerca disponibili al sito dell’NCBI. l

Nota chiave La genetica può essere suddivisa in quattro principali branche: la genetica della trasmissione dei caratteri, la genetica molecolare, la genetica di popolazioni e la genetica quantitativa. La ricerca genetica è considerata di base o applicata, a seconda che l’obiettivo sia la comprensione dei fenomeni genetici fondamentali o lo sfruttamento delle scoperte realizzate.

l

Le banche dati e le mappe genetiche Due importanti risorse per la ricerca genetica sono le banche dati genetiche e le mappe genetiche. Le banche dati genetiche sono diventate molto più sofisticate ed estese da quando sono stati sviluppati strumenti informatici di analisi computerizzata e l’accesso alle banche dati attraverso Internet è diventato un’operazione di routine. La costruzione di mappe genetiche fa parte dell’analisi genetica da circa 100 anni. Le banche dati genetiche La quantità di informazioni genetiche è aumentata in modo stupefacente. Non è più necessario recarsi in una biblioteca universitaria per acquisire conoscenze in ambito genetico. A tal proposito, attualmente i computer svolgono un ruolo fondamentale; per esempio, un metodo efficace per ottenere informazioni genetiche tramite Internet consiste nell’introdurre parole chiave in motori di ricerca quali Google (http://www.google.com), i quali rispondono presentando un elenco di siti web, alcuni dei quali possono essere utili alla ricerca. L’elevato numero di banche dati genetiche non consente di riportarne un elenco in questo paragrafo. Ognuno deve svolgere personalmente la ricerca, valu-

l

PubMed è una banca dati che consente l’accesso a citazioni bibliografiche e a riassunti di pubblicazioni e fornisce collegamenti a siti contenenti articoli di riviste scientifiche in forma elettronica. Questi articoli possono essere letti liberamente oppure possono essere richiesti con un pagamento una tantum o la sottoscrizione di un abbonamento gratuito. Le ricerche su PubMed possono essere effettuate per parola chiave, nome degli autori o titolo delle riviste. È altamente raccomandato l’utilizzo di PubMed per trovare articoli relativi a ricerche genetiche. OMIM (Online Mendelian Inheritance in Man, ossia un database online sull’“eredità mendeliana dell’uomo”) è una banca dati di geni umani e di malattie genetiche preparata e curata dal Dr. Victor A. McKusick e dai suoi collaboratori. Le ricerche su OMIM si effettuano introducendo termini in una finestra di ricerca; il risultato è un elenco di pagine collegate, ognuna con un numero specifico di “entrata” OMIM. Le pagine offrono informazioni dettagliate sul gene o sulla malattia genetica indicati nella ricerca iniziale; tali informazioni includono dati genetici, biomedici e molecolari e una lista aggiornata di citazioni bibliografiche. In questo volume verranno riportati riferimenti a voci di entrata OMIM ogniqualvolta si discuteranno un gene o una malattia genetica umana. GenBank è la banca dati contenente le sequenze genetiche dei National Institutes of Health (NIH) degli Stati Uniti. In particolare, questa banca dati è una collezione annotata delle decine di miliardi di sequenze di DNA disponibili pubblicamente. Le ricerche su GenBank si effettuano introducendo termini in una finestra di ricerca. Per esempio, nel caso in cui interessi la malattia umana nota come fibrosi cistica, sarà sufficiente introdurre le parole “cystic fibrosis” nella finestra di ricerca; in tal modo verranno trovate tutte le sequenze che sono state depositate in GenBank e annotate con quelle due parole.

Introduzione alla genetica l

l

l

BLAST (Basic Local Alignment Search Tool) è uno strumento usato per comparare una sequenza nucleotidica o proteica con tutte le sequenze presenti nella banca dati, al fine di verificare eventuali corrispondenze. Tale strumento risulta utile, per esempio, quando si dispone della sequenza di un nuovo gene e si desidera sapere se qualcosa di simile è stato sequenziato in precedenza. Inoltre, attraverso questa banca dati è possibile ottenere un elenco dei geni con funzioni analoghe, il che consente di focalizzare la propria ricerca sulla funzione del gene oggetto di studio. Entrez è un sistema che permette di effettuare una ricerca su diverse banche dati collegate. Le banche dati disponibili includono: PubMed; Nucleotide, per le banche dati relative alle sequenze di DNA e RNA di GenBank; Protein, per le sequenze amminoacidiche delle proteine; Structure, per le strutture tridimensionali delle macromolecole; Genome, per insiemi di genomi completi; RefSeq, per una lista di geni, trascritti e proteine derivanti da tali trascritti; OMIM, la banca dati di geni umani; PopSet, per dati derivanti da studi di popolazioni. Le banche dati possono essere scelte dai “link” maggiormente utilizzati o dal menu a tendina presente sulla pagina principale di Entrez. Per esempio, qualora interessino le sequenze nucleotidiche correlate alla fibrosi cistica, si selezionerà “Nucleotide” nel menu a tendina e si introdurranno le parole “cystic fibrosis” nella finestra di ricerca; apparirà in tal modo un elenco di sequenze importanti. Books è una raccolta di libri di interesse biomedico su cui è possibile effettuare ricerche. In particolare, in tale raccolta è possibile trovare libri di genetica, di biologia molecolare e di biologia sperimentale.

Una caratteristica particolarmente efficace delle banche dati dell’NCBI è quella di essere collegate fra loro, consentendo all’utilizzatore di integrare in modo relativamente rapido le conoscenze ottenute da ciascuna di esse. Per esempio, una citazione bibliografica trovata in PubMed potrà avere collegamenti (“link”) con le sequenze nelle banche dati nucleotidiche e proteiche. Le mappe genetiche Sin dal 1902 è stato compiuto un grande sforzo per costruire mappe genetiche (Figura 1.3) degli organismi più utilizzati nella sperimentazione genetica. Analogamente alle mappe stradali, che riportano le posizioni delle città lungo una strada, la mappa genetica illustra la disposizione dei geni lungo un cromosoma e la distanza genetica tra i geni. La posizione di un gene sulla mappa viene definita semplicemente locus oppure locus genico. Le distanze genetiche tra i geni localizzati sullo stesso cromosoma vengono determinate in base ai risultati di incroci, calcolando la frequenza di ricombinazione,

5

ossia la percentuale delle volte in cui nella progenie avviene uno scambio fra i geni dei due cromosomi dei genitori (vedi Capitolo 14). L’obiettivo della costruzione di una mappa genetica è la comprensione dell’organizzazione dei geni nei cromosomi (per esempio, può essere importante sapere se geni con funzioni analoghe si trovano sullo stesso cromosoma e se sono vicini l’uno all’altro). Le mappe genetiche si sono dimostrate utili anche nello sforzo di clonare e sequenziare geni di particolare interesse e, più recentemente, nell’ambito di progetti di genomica, hanno contribuito, insieme alle

Distanze dei geni (unità di mappa) 0,0

13,0

dumpy ali

44,0

ancon ali

48,5 53,2 54,0 54,5 55,2 55,5 57,5 60,1

black corpo tuft setole spiny zampe purple occhi apterous (senza ali) tufted testa cinnabar occhi arctus oculus occhi

72,0

lobe occhi

75,5

curved ali

91,5

smooth addome

104,5 107,0

brown occhi orange occhi

Figura 1.3 Esempio di mappa genetica che illustra alcuni geni localizzati sul cromosoma 2 del moscerino della frutta Drosophila melanogaster. I numeri rappresentano le distanze dei geni dall’estremità del cromosoma (in alto) misurate in unità di mappa (um, vedi Capitolo 14). Le distanze di mappa sono calcolate sulla base della frequenza di ricombinazione e sono additive (ciò permette di ottenere valori superiori a 50 um pur essendo la frequenza massima di ricombinazione fra due loci pari al 50%).

6

Capitolo 1

mappe fisiche (in cui la posizione del gene non è ottenuta mediante incroci; vedi Capitolo 8) al sequenziamento completo dei genomi di numerosi organismi.

Nota chiave Due importanti risorse per la ricerca genetica sono le banche dati genetiche e le mappe genetiche. Le banche dati forniscono gli strumenti per la ricerca di specifiche informazioni su un gene (la sua sequenza, la sua funzione e la sua posizione nel genoma), come le pubblicazioni scientifiche e altri dettagli in merito al prodotto codificato da quel particolare gene. Le mappe genetiche indicano la posizione dei geni lungo i cromosomi; esse si sono rivelate utili per clonare i geni e per il sequenziamento dei genomi.

Gli organismi utilizzati nella ricerca genetica Il principio dell’ereditarietà fu stabilito per la prima volta nel XIX secolo con gli esperimenti sulle piante di pisello odoroso effettuati da Gregorio Mendel. Dopo Mendel, molti altri organismi sono stati utilizzati negli esperimenti genetici. In generale, l’obiettivo della ricerca genetica è stato la comprensione della struttura e della funzione dei geni. Grazie al grado elevato di conservazione delle funzioni dei geni nel corso dell’evoluzione, gli scienziati hanno compreso che i risultati ottenuti da studi condotti su particolari organismi avrebbero potuto essere applicati a tutti gli organismi. Tra le caratteristiche che hanno reso un particolare organismo un modello per la sperimentazione in genetica vi sono le seguenti: l

l l

l

l’organismo deve avere un ciclo vitale breve, in modo che sia possibile ottenere numerose generazioni in un tempo relativamente rapido. Il moscerino della frutta, per esempio, produce una generazione ogni 10-14 giorni; la progenie prodotta da un accoppiamento deve essere numerosa; l’organismo deve essere facile da gestire sperimentalmente. Per esempio, centinaia di moscerini della frutta possono essere facilmente contenuti in piccole bottiglie; l’aspetto più importante è che ci sia variabilità genetica tra gli individui della popolazione studiata o che tale variabilità venga prodotta nella popolazione inducendo l’insorgenza di mutazioni, in modo tale che sia possibile studiare la trasmissione ereditaria dei caratteri.

Nella ricerca genetica vengono impiegati sia organismi eucarioti sia organismi procarioti. Gli eucarioti (termine che deriva dal greco antico e che significa “nucleo perfetto”) sono organismi che hanno cellule nelle quali il materiale genetico, il DNA, è localizzato nel nucleo, una struttura cellulare distinta circondata da una membrana. Gli organismi eucarioti possono essere unicellulari o pluricellulari. Gran parte della ricerca genetica attuale viene condotta su questi sei organismi eucarioti (Figura 1.4a-f): Saccharomyces cerevisiae (lievito di birra), Drosophila melanogaster (moscerino della frutta), Caenorhabditis elegans (nematode), Arabidopsis thaliana (specie erbacea della famiglia delle Brassicaceae), Mus musculus (topo) e Homo sapiens (uomo). Sebbene non possieda le caratteristiche degli organismi adatti agli esperimenti genetici, la specie umana viene inclusa in questo elenco perché l’interesse primario della ricerca genetica è l’ottenimento del maggior numero possibile di informazioni sui geni umani e le loro funzioni. Tali conoscenze renderanno possibile combattere le malattie genetiche e acquisire conoscenze fondamentali circa lo sviluppo e l’evoluzione della nostra specie. Negli ultimi anni anche i seguenti sette organismi eucarioti hanno contribuito in modo significativo alla comprensione della genetica (Figura 1.4g-m): Neurospora crassa (la muffa del pane), Tetrahymena (protozoo), Paramecium (protozoo), Chlamydomonas reinhardtii (alga verde), Pisum sativum (pisello odoroso), Zea mays (mais) e Danio rerio (pesce zebra). Fra questi, Tetrahymena, Paramecium, Chlamydomonas e Saccharomyces sono unicellulari, mentre gli altri sono pluricellulari. Molte caratteristiche delle cellule eucariote sono state probabilmente apprese nel corso di introduzione alla biologia. La Figura 1.5 mostra le rappresentazioni schematiche di una tipica cellula vegetale e di una tipica cellula animale. In entrambe le tipologie cellulari è presente una membrana lipidica, denominata membrana plasmatica, che delimita il citoplasma. Le cellule vegetali, a differenza di quelle animali, presentano una parete cellulare rigida all’esterno della membrana plasmatica. Il nucleo delle cellule eucariote contiene il DNA complessato con proteine e organizzato in un certo numero di strutture lineari chiamate cromosomi. Il nucleo è separato dal resto della cellula, costituito dal citoplasma e dagli organelli associati, tramite una doppia membrana che costituisce l’involucro nucleare. Tale membrana è dotata di permeabilità selettiva e possiede pori di diametro compreso tra i 20 e gli 80 nm (1 nm = nanometro = 10–9 metri) che consentono il passaggio di materiale tra nucleo e citoplasma. Per esempio, l’RNA messaggero, deputato alla produzione di polipeptidi a livello citoplasmatico, viene sintetizzato nel nucleo e transita attraverso i pori per raggiungere il citoplasma. In direzione opposta, gli enzimi coinvolti nella replicazione, nella riparazione e nella trascrizione

Introduzione alla genetica

b) Drosophila melanogaster (moscerino della frutta)

a) Saccharomyces cerevisiae (lievito di birra)

d) Arabidopsis thaliana (pianta erbacea appartenente alla famiglia delle Brassicaceae)

g) Neurospora crassa (muffa rosa del pane)

k) Pisum sativum (pisello odoroso)

e) Mus musculus (topo)

h) Tetrahymena (protozoo)

l) Zea mays (mais)

c) Caenorhabditis elegans (nematode)

f) Homo sapiens (uomo)

i) Paramecium (protozoo)

j) Chlamydomonas reinhardtii (alga verde)

m) Danio rerio (pesce zebra)

Figura 1.4 Organismi eucarioti che hanno contribuito in modo significativo alla conoscenza della genetica.

7

8

Capitolo 1

a) Cellula vegetale

b) Cellula animale

Citoscheletro Grande vacuolo centrale

Perossisoma Mitocondri Ribosomi Membrana nucleare Poro nucleare Cromatina Centrioli Nucleolo Reticolo endoplasmatico rugoso Nucleo Reticolo endoplasmatico liscio

Tonoplasto Cloroplasto Plasmodesmi Parete cellulare

Apparato del Golgi Lisosoma Citoplasma Membrana plasmatica

Figura 1.5 Le cellule eucariote. Schemi di sezioni trasversali che illustrano le caratteristiche di organizzazione

e gli organelli principali di (a) una tipica cellula vegetale e (b) una tipica cellula animale.

del DNA, nonché le proteine che si associano al DNA costituendo il cromosoma, vengono sintetizzati nel citoplasma ed entrano nel nucleo attraverso i pori. Il citoplasma delle cellule eucariote contiene organelli e molti materiali di diverso tipo. Per i genetisti le strutture intracellulari di particolare interesse sono i centrioli, il reticolo endoplasmatico (RE), i ribosomi, i mitocondri e i cloroplasti. I centrioli, definiti anche corpi basali, si ritrovano nel citoplasma di quasi tutte le cellule animali (vedi Figura 1.5b), mentre non sono presenti nelle cellule vegetali. Nelle cellule animali una coppia di centrioli è localizzata al centro del centrosoma, una regione citoplasmatica indifferenziata che organizza le fibre del fuso, strutture coinvolte nella segregazione cromosomica durante le fasi della mitosi e della meiosi (processi discussi nel Capitolo 12). Il reticolo endoplasmatico è una struttura a doppia membrana che fa parte del sistema di endomembrane e si trova in continuità con la membrana nucleare. A differenza di quello liscio, il reticolo endoplasmatico rugoso presenta sulla sua superficie i ribosomi attaccati,

che gli conferiscono il caratteristico aspetto rugoso. Questi ribosomi sintetizzano proteine che sono secrete dalle cellule o devono essere localizzate nella membrana plasmatica o in particolari organelli intracellulari. La sintesi delle altre proteine viene realizzata dai ribosomi liberi nel citoplasma. I mitocondri (vedi Figura 1.5) sono grandi organelli circondati da una doppia membrana (la membrana interna è altamente circonvoluta). Questi organelli giocano un ruolo cruciale nei processi energetici cellulari e contengono DNA che codifica alcune delle proteine necessarie al funzionamento del mitocondrio e alcune componenti del macchinario necessario alla sintesi delle proteine mitocondriali. Molte cellule vegetali contengono i cloroplasti, grandi organelli avvolti da una tripla membrana che contengono clorofilla e sono coinvolti nella fotosintesi (vedi Figura 1.5a). Analogamente ai mitocondri, questi organelli contengono DNA che codifica alcune proteine che svolgono precise funzioni nel cloroplasto e alcune componenti del macchinario di sintesi proteica del cloroplasto.

Introduzione alla genetica

9

Capsula I procarioti (termine che deriva dal greco antico e significa “prenucleari”) non presentano una membrana nuMembrana cleare che circonda il materiale geneesterna tico (Figura 1.6); questa è la caratteristica principale che li contraddistingue. A questo gruppo di organismi apParete cellulare partengono tutti i batteri, che possono assumere forma sferica, a bastoncello Membrana o a spirale. La forma del batterio è plasmatica mantenuta da una parete cellulare rigida collocata esternamente alla memRegione brana cellulare. È possibile suddividedel nucleoide (DNA) re i procarioti in due gruppi evolutivaRibosomi mente distinti: i Bacteria (batteri) e gli Archaea. I batteri si trovano comunemente negli organismi viventi (natuPili ralmente o tramite infezione), nel suolo e nell’acqua. Gli Archaea sono procarioti che vivono spesso in condizioni ambientali molto inospitali, quali l’acqua calda, le saline ricche di metano o le profondità oceaniche, dove i batteri non riescono a proliferare. Inoltre, gli Archaea sono stati trovati in particolari condizioni anche nel suolo e nell’acqua. I batteri hanno un diametro che varia dai 100 nm ai Flagelli 10 µm. La specie di maggiori dimensioni, la Thiomargarita namibiensis, di forma sferica, può raggiungere un Figura 1.6 diametro pari a 3/4 di millimetro, diSchema della sezione trasversale di una tipica cellula procariote. venendo in tal caso visibile a occhio nudo (circa la dimensione di un occhio di Drosophila melanogaster). Nella maggior parte dei casi i procarioti studiati dai genetisti sono batteri; in particolare, quello più studiato Nota chiave è Escherichia coli (Figura 1.1), un batterio di forma baGli eucarioti sono organismi nelle cui cellule il mastoncellare che si ritrova comunemente nell’intestino teriale genetico è localizzato in un nucleo provvidell’uomo e di altri animali. Gli studi condotti su tale sto di membrana. Il materiale genetico è organizbatterio hanno contribuito in modo significativo all’auzato in numerosi cromosomi lineari. I procarioti, al mento della comprensione della regolazione dell’econtrario, non possiedono un nucleo provvisto di spressione genica e allo sviluppo della biologia molemembrana. colare. Attualmente E. coli viene ampiamente utilizzato anche negli esperimenti di DNA ricombinante.

10

Capitolo 1

Sommario l La genetica spesso viene suddivisa in quattro principali

branche: la genetica della trasmissione dei caratteri, che si occupa della trasmissione dei geni da una generazione all’altra; la genetica molecolare, che si interessa della struttura e della funzione dei geni a livello molecolare; la genetica di popolazioni, che studia l’ereditarietà dei caratteri determinati da uno o pochi geni in gruppi di individui; la genetica quantitativa, che considera l’ereditarietà dei caratteri determinati da numerosi geni contemporaneamente in gruppi di individui. l La ricerca genetica si definisce “di base”, quando si propone di incrementare la conoscenza dei fenomeni gene-

tici fondamentali, o “applicata”, quando l’obiettivo è lo sfruttamento delle scoperte genetiche. l Le banche dati genetiche forniscono strumenti per ricercare specifiche informazioni che riguardano un gene e i suoi prodotti. Le mappe genetiche illustrano la disposizione dei geni sui cromosomi. l Gli eucarioti sono organismi che hanno cellule nelle quali il materiale genetico è localizzato in un nucleo provvisto di membrana. Il materiale genetico è organizzato in cromosomi lineari. Al contrario, i procarioti non possiedono un nucleo provvisto di membrana.

2

DNA: il materiale genetico

Qual è la natura molecolare del materiale genetico?

In che modo è organizzato il DNA nei cromosomi?

Qual è la struttura molecolare del DNA e dell’RNA?

Attività Immaginate di tenere fra le mani una scatola nera proveniente dal mare all’interno della quale sia contenuto il segreto della vita. Immaginate inoltre che l’identificazione della composizione chimica, della struttura molecolare e della funzione del contenuto della suddetta scatola possa consentire di salvare vite umane, fornire nutrimento agli affamati, risolvere crimini e, addirittura, creare nuove forme di vita. Che cosa contiene la scatola? Quali strumenti e quali tecniche potrebbero essere impiegate per scoprirlo? In questo capitolo scoprirete in che modo gli scienziati hanno identificato il contenuto di questa “scatola nera”, rivelando così il “segreto della vita”. Più avanti nel presente capitolo sarà possibile applicare quanto appreso attraverso la iAttività, nella quale verranno impiegati numerosi strumenti e tecniche utili alla determinazione della natura genetica di un virus capace di devastare le piante di riso.

Una semplice osservazione appare in grado di evidenziare l’esistenza di enormi differenze tra individui di una stessa specie. Per esempio, nonostante tutti gli uomini appartengano alla specie Homo sapiens, i diversi individui di tale specie differiscono per altezza, colore degli occhi, della pelle e dei capelli. La variabilità intraspecifica e interspecifica rappresenta principalmente il risultato delle differenze che intercorrono a livello delle sequenze di DNA dei geni che costituiscono il genoma degli esseri viventi. L’informazione genetica codificata nel DNA è ampiamente responsabile della struttura, della funzione e dello sviluppo delle cellule in ogni organismo. Nei prossimi capitoli verranno analizzate la struttura molecolare e la funzione del materiale genetico (sia dell’acido desossiribonucleico – DNA – sia dell’acido ribonucleico – RNA) e verrà esaminato il meccanismo

molecolare mediante il quale avviene la trasmissione dell’informazione genetica di generazione in generazione. Saranno spiegate la struttura del gene e le modalità attraverso cui i geni esprimono il loro messaggio. La trattazione del presente capitolo inizierà illustrando gli avvenimenti che condussero gli scienziati alla scoperta della natura e della struttura del materiale genetico. Tali scoperte portarono a un’esplosione delle conoscenze relative agli aspetti molecolari della biologia.

La ricerca del materiale genetico Molto tempo prima della scoperta del ruolo del DNA e dell’RNA come portatori delle informazioni genetiche, gli scienziati avevano intuito che gli organismi viventi dovevano contenere una sostanza responsabile della trasmissione delle informazioni dai genitori ai figli. I genetisti si erano convinti che il materiale responsabile delle informazioni ereditarie dovesse presentare tre caratteristiche essenziali, ossia: 1. contenere, in forma stabile, le informazioni concernenti la struttura, la funzione, lo sviluppo e la riproduzione delle cellule di un organismo; 2. essere in grado di replicare accuratamente le informazioni, in modo che le cellule della progenie possano avere le stesse informazioni genetiche di quelle dei genitori; 3. essere capace di cambiare. Infatti, l’assenza di variabilità genetica impedisce agli organismi di differenziarsi e di adattarsi, rendendo impossibile l’evoluzione. Il biochimico svizzero Friedrich Miescher è noto per la scoperta, nel 1869, dell’acido nucleico. Egli isolò una sostanza dai leucociti contenuti nel pus presente sulle

12

Capitolo 2

bende dei feriti di guerra. Sebbene in un primo momento lo scienziato avesse immaginato che tale sostanza fosse costituita da una proteina, alcuni test chimici dimostrarono che essa conteneva carbonio, idrogeno, ossigeno, azoto e fosforo; all’epoca era già noto che quest’ultimo elemento non rappresenta un costituente delle proteine. Analizzando materiale di diversa provenienza, Miescher osservò la medesima sostanza nel nucleo di tutti i campioni esaminati, e la definì pertanto “nucleina”; in quel momento erano sconosciute sia la sua esatta posizione nelle cellule sia la sua funzione. All’inizio del Novecento fu dimostrato sperimentalmente che i cromosomi, strutture filamentose presenti nei nuclei delle cellule, erano portatori di informazione genetica. Nel corso dei successivi quarant’anni le analisi chimiche rivelarono che i cromosomi sono costituiti da proteine e acidi nucleici; questi ultimi rappresentano una classe di composti che include DNA e RNA. In un primo momento molti scienziati ritennero che le proteine nei cromosomi costituissero il materiale ereditario. Essi pensavano che le proteine avessero una grande capacità di immagazzinare informazioni, poiché erano composte da 20 differenti amminoacidi.* Invece, il DNA, costituito da quattro nucleotidi, era ritenuto una molecola troppo semplice e, pertanto, inadatta a contenere le informazioni responsabili delle differenze che è possibile rilevare nei diversi organismi viventi. Tuttavia, a partire dalla fine degli anni venti del Novecento, una serie di esperimenti condusse alla definitiva identificazione del DNA quale materiale genetico.

una mutazione che impedisce la formazione dell’involucro polisaccaridico. La mutazione è un cambiamento ereditario nel materiale genetico (vedi Capitolo 7). In questo caso la mutazione del gene pregiudica la capacità del batterio di formare la capsula alterando, di conseguenza, lo stato di virulenza del batterio stesso. Esistono diverse varianti del ceppo S, ciascuna caratterizzata da una distinta composizione chimica dell’involucro polisaccaridico. Griffith condusse i suoi studi utilizzando i ceppi IIS e IIIS, che presentavano rispettivamente un involucro di tipo II e III; le cellule di tipo S possono mutare in cellule di tipo R e viceversa. Le mutazioni sono tipo-specifiche nel senso che, se una cellula del tipo IIS muta in una cellula di tipo R, quest’ultima può retromutare unicamente nel tipo IIS e non nel tipo IIIS. Griffith iniettò differenti ceppi batterici nei topi e ne osservò gli effetti (Figura 2.2). I topi iniettati con batteri del ceppo IIR (ossia batteri derivanti da mutazioni del ceppo IIS) sopravvivevano, mentre i topi iniettati con batteri vivi del ceppo IIIS morivano e dal loro sangue era possibile isolare batteri vivi di tipo IIIS. Tuttavia, se i a) Fotografia al microscopio elettronico che mostra singoli batteri.

L’esperimento di trasformazione di Griffith Nel 1928 Frederick Griffith, un ufficiale medico inglese, era impegnato nello studio di Streptococcus pneumoniae (chiamato anche pneumococco), un batterio in grado di causare la polmonite (Figura 2.1a). Griffith utilizzava due ceppi del batterio: il ceppo S (Smooth), che produce una colonia liscia e lucente ed è virulento (ovvero altamente infettivo) (Figura 2.1b), e il ceppo R (Rough), che dà origine a colonie rugose e non è virulento (non è infettivo) (Figura 2.1c). La differenza molecolare tra i due ceppi non era ancora nota a quel tempo; oggi sappiamo che la virulenza del ceppo S è dovuta alla presenza di un involucro polisaccaridico, o capsula, che avvolge ogni cellula. La presenza di tale involucro determina inoltre la lucentezza e l’aspetto liscio delle colonie del ceppo S. Il ceppo R si differenzia da un punto di vista genetico dal ceppo S esclusivamente per il fatto che esso contiene

* A quel tempo erano noti 20 amminoacidi. Un ventunesimo amminoacido fu identificato nel 1970, un ventiduesimo nel 2002.

b) Colonie di batteri del ceppo S (liscio).

c) Colonie di batteri del ceppo R (rugoso).

Figura 2.1 Il batterio Streptococcus pneumoniae.

DNA: il materiale genetico Batteri con capsula polisaccaridica

Tipo IIR: vivi, non virulenti

Tipo IIIS: vivi, virulenti

Iniettare il topo

Sopravvive: non si trovano batteri

Iniettare il topo

Muore: si trovano batteri virulenti di tipo IIIS

Figura 2.2 L’esperimento di trasformazione di Griffith. Topi a cui erano stati iniettati pneumococchi del tipo IIIS morivano, mentre topi iniettati o con batteri del tipo IIR o con batteri

batteri IIIS venivano uccisi al calore prima dell’infezione, i topi vivevano. Tali esperimenti dimostrarono che i batteri dovevano essere vivi e possedere la capsula polisaccaridica per essere virulenti e uccidere i topi. Nei suoi esperimenti fondamentali Griffith infettò i topi con una miscela di batteri IIR vivi e IIIS uccisi con il calore. I topi morirono e il batterio del tipo IIIS fu isolato dal loro sangue. Questi batteri non potevano derivare da una mutazione dei batteri del tipo R, dal momento che la mutazione avrebbe prodotto solo batteri del tipo IIS. Pertanto, Griffith concluse che alcuni batteri di tipo IIR si erano trasformati, con un meccanismo allora sconosciuto, in batteri lisci e virulenti a seguito di un’interazione con i batteri morti del tipo IIIS. Il materiale genetico dei batteri morti del tipo IIIS era stato mescolato al materiale genetico dei batteri vivi del tipo IIR. Griffith riteneva che l’agente sconosciuto responsabile dello scambio del materiale genetico fosse costituito da una proteina; tale ipotesi era solo un’intuizione e non si dimostrò esatta. Lo scienziato non disponeva di evidenze sperimentali che dimostrassero la natura del materiale che agiva come intermediario nel suddetto scambio di materiale genetico. Griffith definì questo agente il principio trasformante. (Vedi Capitolo 15 per una discussione relativa alla trasformazione batterica. Appare opportuno sottolineare che la trasformazione rappresenta attualmente una tecnica di fondamentale

Calore

Tipo IIIS: uccisi con il calore, non virulenti

Calore

Tipo IIR vivi, non virulenti

Iniettare il topo

Sopravvive: non si trovano batteri

13

+

Tipo IIIS: uccisi con il calore, non virulenti

Iniettare il topo

Muore: si trovano batteri virulenti di tipo IIIS

del tipo IIIS uccisi con il calore sopravvivevano. Tuttavia, se iniettati con una miscela di batteri di tipo IIR vivi e di tipo IIIS uccisi con il calore, i topi morivano.

importanza che viene impiegata negli esperimenti di ingegneria genetica; vedi Capitolo 8.)

L’esperimento di trasformazione di Avery Negli anni trenta e quaranta del Novecento il biologo americano Oswald T. Avery, insieme ai colleghi Colin M. MacLeod e Maclyn McCarty, tentò di identificare il “principio trasformante” di Griffith studiando in provetta la trasformazione dei batteri da tipo R a tipo S. I ricercatori sottoposero a lisi le cellule di tipo IIIS, utilizzando un detergente, e separarono mediante centrifugazione le differenti componenti cellulari, cioè l’estratto cellulare, dai detriti cellulari o débris. Successivamente incubarono l’estratto con una coltura di batteri vivi di tipo IIR e piastrarono questi ultimi su un terreno di coltura in una capsula di Petri. Colonie di batteri del tipo IIIS comparvero sulla piastra; tale circostanza dimostrò che l’estratto conteneva il “principio trasformante”, ossia che il materiale genetico proveniente dai batteri di tipo IIIS era in grado di trasformare un batterio di tipo IIR in uno IIIS. Avery e i suoi colleghi sapevano che una delle componenti macromolecolari presenti nell’estratto (polisaccaridi, proteine, RNA o DNA) doveva costituire il “principio trasformante”. Al fine di determinare quale componente corrispondesse al “principio trasformante”, i ricercatori sottoposero l’estratto cellulare a trattamenti

14

Capitolo 2

Figura 2.3 L’esperimento che dimostrò che il principio trasformante è il DNA e non l’RNA. Quando una miscela di DNA e RNA veniva trattata con ribonucleasi (RNasi) e, successivamente, posta in contatto con batteri vivi di tipo IIR, si ottenevano trasformanti IIIS. Tuttavia, quando la miscela di DNA e RNA veniva trattata con desossiribonucleasi (DNasi) e successivamente posta in contatto con batteri vivi IIR, non si ottenevano trasformanti IIIS. (In entrambe le piastre rappresentate nella figura sono presenti colonie IIR, ma per maggior chiarezza queste ultime non sono state disegnate.)

Aggiunta del DNA ai batteri di tipo IIR

Trattamento con RNasi

Miscela di DNA e RNA provenienti da batteri di tipo IIIS

Aggiunta dell’RNA ai batteri di tipo IIR

Piastramento su terreno di crescita

Rimane solo l’RNA

enzimatici per degradare, una alla volta, le diverse componenti, verificando dopo ogni trattamento se la trasformazione avvenisse ancora. Essi osservarono che la trasformazione non avveniva solo quando veniva degradato il DNA, nonostante la presenza di tutte le altre macromolecole. Viceversa, il principio trasformante continuava a essere presente fino a che non si usava un enzima in grado di degradare il DNA. Questi risultati dimostrarono che il DNA, e solo il DNA, doveva essere il principio trasformante (il materiale genetico). In altri termini, la rimozione del DNA dall’estratto cellulare rappresentava l’unico modo con cui si poteva sopprimere la capacità dell’estratto di fornire al batterio di tipo IIR il materiale genetico. La Figura 2.3 mostra una versione moderna di una parte dell’esperimento di trasformazione di Avery, al fine di illustrarne l’approccio generale. Il punto di partenza è rappresentato dalla miscela di DNA e RNA purificati estratta dalle cellule di tipo IIIS. Campioni della miscela sono trattati separatamente con due tipi di nucleasi, enzimi che degradano gli acidi nucleici. Successivamente i campioni vengono testati per saggiare la loro capacità di trasformare i batteri da tipo IIR a tipo IIIS. Nella miscela trattata con ribonucleasi (RNasi), un enzima in grado di degradare esclusivamente l’RNA, il DNA rimane inalterato e la trasformazione avviene. Diversamente, nella miscela trattata con desossiribonucleasi (DNasi), enzima che degrada il DNA, l’RNA rimane inalterato e la trasformazione non avviene. Tali risultati dimostrano che il DNA costituisce il “principio trasformante”. Figura 2.4 Fotografia al microscopio elettronico e schema del batteriofago T2 (1 nm = 10–9 m).

Produzione di trasformanti IIIS

Rimane solo il DNA

Trattamento con DNasi

Miscela di DNA e RNA provenienti da batteri di tipo IIIS

Piastramento su terreno di crescita

Assenza di trasformanti IIIS

Sebbene avessero svolto un ottimo lavoro, Avery e colleghi vennero criticati dagli scienziati del tempo, secondo i quali il materiale genetico era costituito dalle proteine. Questi ultimi sottolinearono che i vari enzimi utilizzati negli esperimenti erano stati purificati grossolanamente, rendendo impossibile escludere la presenza di contaminanti. Qualora le proteine avessero costituito il materiale genetico, tali molecole sarebbero potute sfuggire alla digestione da parte di enzimi proteolitici, mentre il trattamento con DNasi avrebbe potuto degradarle accidentalmente.

Gli esperimenti con i batteriofagi di Hershey e Chase Nel 1953 Alfred D. Hershey e Martha Chase pubblicarono i risultati di alcuni studi sperimentali che dimostravano che il DNA è il materiale genetico. Essi studiarono il batteriofago chiamato T2 (Figura 2.4). I batteriofagi (o fagi) sono virus che infettano i batteri. Come tutti i virus, il fago T2 si deve riprodurre in una cellula vivente. In particolare, T2 si riproduce infettando le cellu-

65 nm

DNA

Testa

Corpo centrale

100 nm

Guaina 100 nm

Fibre della coda

Piastra basale

DNA: il materiale genetico

15

1 Il fago si fissa su E. coli e inietta il suo cromosoma fagico 6 Rilascio della progenie in seguito a lisi della parete batterica

2 Degradazione del cromosoma batterico provocata dagli enzimi specifici del fago Cromosoma batterico (ospite)

Cromosoma fagico Cellula ospite di E. coli

Cromosoma fagico

Cromosoma batterico completamente degradato

Cromosomi fagici

5 Assemblaggio delle particelle della progenie fagica

Figura 2.5 Ciclo litico di un fago virulento, come T2.

Testa del fago in fase di assemblaggio

Guaina, piastra basale e fibre della coda

4 Espressione dei geni del fago per la produzione delle componenti strutturali del virus

le di Escherichia coli (E. coli) e utilizzandone il materiale molecolare per fabbricare numerose copie virali (Figura 2.5). Queste ultime vengono assemblate all’interno del batterio; successivamente la cellula ospite si rompe, rilasciando 100-200 copie del fago. Viene definito ciclo litico il processo mediante il quale un fago infetta un batterio producendo una progenie che viene rilasciata in seguito alla rottura della cellula infettata; la sospensione costituita dalla progenie fagica rilasciata nel mezzo esterno viene denominata lisato fagico. Hershey e Chase sapevano che T2 era costituito esclusivamente da DNA e proteine ed era in grado di utilizzare le cellule batteriche per produrre nuovi fagi. Essi non sapevano, però, quale componente fagica (DNA o proteine) ne costituisse il materiale genetico, responsabile di tale processo. (Si noti che il fago infetta un batterio iniettando il proprio materiale genetico all’interno della cellula ospite, mentre l’involucro esterno, detto capside o ombra fagica, rimane all’esterno del batterio.) Al fine di dimostrare che il materiale genetico del fago era il DNA e non le proteine, Hershey e Chase coltivarono cellule di E. coli in un terreno che conteneva o un isotopo radioattivo del fosforo (32P) o un isotopo radioattivo dello zolfo (35S) (Figura 2.6a). Questi due isotopi vennero impiegati in virtù del fatto che il DNA contiene fosforo ma non zolfo, mentre le proteine contengono zolfo ma non fosforo. I batteri cresciuti su terreno contenente l’isotopo 32P incorporavano tale isotopo negli acidi nucleici, mentre quelli cresciuti sul terreno con-

3 Replicazione del cromosoma fagico, usando materiale batterico ed enzimi codificati dal fago

tenente l’isotopo 35S incorporavano tale isotopo in tutte le proteine. I due scienziati infettarono le colture batteriche con il fago T2 e raccolsero la progenie fagica. A questo punto essi disponevano di due gruppi di fagi T2: uno con il DNA marcato radioattivamente con 32P, l’altro con le proteine marcate radioattivamente con 35S. Gli studiosi infettarono quindi due colture di E. coli con l’uno o l’altro gruppo di fagi T2 marcati radioattivamente (Figura 2.6b). Nel caso in cui il fago infettante era marcato con 32P, la maggior parte della radioattività fu rilevata all’interno dei batteri subito dopo l’infezione. Solo una quantità esigua di radioattività venne rilevata sulla superficie delle cellule. Dopo il completamento del ciclo litico, una certa quantità di 32P venne trovata nella progenie. Al contrario, dopo l’infezione di E. coli con il fago T2 marcato con 35S, la radioattività non era praticamente presente nella cellula batterica infettata o nella progenie fagica, mentre la maggior parte di essa venne rilevata nelle ombre fagiche. Dal momento che era il DNA, e non le proteine, a essere entrato nella cellula batterica, come dimostrato dalla presenza di 32P e dall’assenza di 35S nelle cellule batteriche dopo che il fago aveva dato inizio all’infezione iniettando il proprio materiale genetico, Hershey e Chase dedussero che il DNA dovesse essere il materiale responsabile della funzione e della riproduzione del fago T2. Pertanto, il DNA doveva costituire il materiale genetico del fago T2. Nella riproduzione del fago solo il materiale genetico (il DNA) viene trasferito dai progenitori virali alla progenie, mentre non avviene

16

Capitolo 2

Figura 2.6 L’esperimento di Hershey e Chase.

nessun coinvolgimento del materiale strutturale (le proteine) del virus. Nel 1969 Alfred Hershey fu uno dei vincitori del Premio Nobel per la Fisiologia o Medicina per le sue “scoperte relative alla struttura genetica dei virus”.

a) Preparazione dei batteriofagi T2 marcati radioattivamente Progenie fagica con DNA marcato con 32P

1 Fagi con DNA marcato con 32P Involucro proteico Infettare E. coli e far DNA crescere in un terreno di coltura contenente 32P

Lisi

E. coli Fago T2 Progenie fagica con proteine marcate con 35S

2 Fagi con proteine marcate con 35S Infettare E. coli con fagi e far crescere in un terreno di coltura contenente 35S

L’RNA come materiale genetico nei virus

Lisi

E. coli

Il materiale genetico di tutti b) L’esperimento che dimostrò che il DNA è il materiale genetico di T2 gli organismi e della maggior 1 E. coli infettati con fagi T2 marcati con 32P parte dei virus esaminati in Ombre fagiche DNA marcato questo volume (quali l’uoOmogeneizzare con 32P La radioattività mo, Drosophila, il lievito, E. brevemente si ritrova nell’ospite coli e il batteriofago T2) è e viene trasferita alla progenie fagica costituito dal DNA. Tuttavia, in alcuni virus batterici (per esempio MS2 e Qβ), virus 2 E. coli infettati con fagi T2 marcati con 35S animali (come quelli della Proteine marcate poliomielite e dell’immunocon 35S deficienza umana – HIV) e Omogeneizzare La radioattività brevemente in un certo numero di virus si ritrova nelle ombre fagiche e non viene delle piante (come per esemtrasferita alla progenie pio il virus del mosaico del fagica tabacco e il virus del nanismo giallo dell’orzo) il materiale genetico è costituito dall’RNA. Al contrario, non definite monomeri. I monomeri che costituiscono il si conoscono organismi eucarioti e procarioti che ab- DNA e l’RNA sono denominati nucleotidi. Ogni nucleotide è costituito da un pentoso (zucchero a cinque biano l’RNA come materiale genetico. atomi di carbonio), da una base azotata (molecola contenente azoto e abitualmente denominata semplicemente base) e da un gruppo fosfato. Nota chiave Nel DNA il pentoso è il desossiribosio, mentre Una serie di esperimenti ha dimostrato che il matenell’RNA è il ribosio (Figura 2.7). I due zuccheri differiale genetico consiste di uno dei due acidi nucleici: riscono l’uno dall’altro solo per i gruppi chimici legati DNA o RNA. Tra le due molecole, il DNA costituisce all’atomo di carbonio 2′: un atomo di idrogeno (H) nel il materiale genetico di tutti gli organismi viventi e di alcuni virus, mentre l’RNA rappresenta il materiale genetico dei rimanenti virus.

5„

4„C

La composizione e la struttura del DNA e dell’RNA Qual è la struttura molecolare del DNA? Il DNA e l’RNA sono polimeri, grandi molecole costituite dal legame di numerose molecole più piccole simili tra loro,

H

5„

O

HOCH2 H

C

3„

OH

OH

HOCH2

H

C 1„

4„C

C

H

2„

H

Desossiribosio

H

O H

C

3„

OH

OH H

C 1„

C

H

2„

OH

Ribosio

Figura 2.7 Le strutture del desossiribosio e del ribosio, gli zuccheri pentosi del DNA e dell’RNA, rispettivamente. Sono evidenziati i gruppi chimici che differiscono nelle due molecole.

17

DNA: il materiale genetico Figura 2.8 La struttura delle basi azotate nel DNA e nell’RNA. I composti progenitori sono le purine (in alto a sinistra) e le pirimidine (in basso a sinistra). Le differenze tra le basi sono evidenziate.

NH2 H C N1 HC 2

6

3

C

N 5C

7

4C

9

N1

8 CH

HC 2

N H

N

6

3

O

7

4C

9

Purina (composto progenitore)

HN 1

8 CH

N H Adenina (A) N

C

N 5C

N

6 5

C

7

4

C

9

8

H2N

C2

3

N

CH

N H

Guanina (G)

desossiribosio e un gruppo idrossilico NH2 O O (OH) nel ribosio. (Gli atomi di carbonio H nei pentosi sono numerati da 1′ a 5′ per C C C C CH3 4 4 4 4 distinguerli dagli atomi di carbonio e N3 HN 3 HN 3 N3 5 CH 5 CH 5C 5CH azoto negli anelli delle basi.) C 2 1 6 CH C 2 1 6 CH C 2 1 6 CH HC 2 1 6CH O O O Le basi azotate si distinguono in due N N N N H H H classi: le purine, strutture a doppio anelPirimidina Citosina (C) Uracile (U) Timina (T) lo formate da nove atomi, e le pirimidi(composto (nell’RNA) (nel DNA) ne, strutture ad anello singolo costituite progenitore) da sei atomi. Negli acidi nucleici sono presenti due purine: adenina (A) e guanina (G), e tre sina; invece, la timina è contenuta soltanto nel DNA e differenti pirimidine: timina (T), citosina (C) e uraci- l’uracile esclusivamente nell’RNA. Nel DNA e nell’RNA le basi sono unite all’atomo di le (U). Le strutture chimiche delle cinque basi sono illustrate nella Figura 2.8 (gli atomi di carbonio e di azo- carbonio 1′ del pentoso mediante un legame covalente. to degli anelli delle purine sono numerati da 1 a 9, men- Le purine sono legate mediante l’atomo di azoto 9, tre quelli delle pirimidine sono numerati da 1 a 6). Sia mentre le pirimidine si legano mediante l’atomo di azoil DNA sia l’RNA contengono adenina, guanina e cito- to 1. La combinazione di uno zucchero e di una base viene denominata nucleoside. L’aggiunta di un gruppo fosfato (PO4) a b) Catena polinucleotidica di DNA a) Nucleotidi del DNA e dell’RNA un nucleoside dà luogo a un nucleoEstremità 5„ Nucleotide del DNA Base (adenina) side fosfato o nucleotide. Il gruppo – O NH2 fosfato è legato all’atomo di carbonio –O P O Gruppo C 5′ dello zucchero sia nel DNA sia N fosfato N O C – nell’RNA. Nella Figura 2.9a vengono HC O Zucchero 5„ CH CH C A 2 – O P O CH illustrati due esempi di un nucleotide N N 2 O O del DNA (desossiribonucleotide) e O H H di un nucleotide dell’RNA (ribonu3„ H H H H H H cleotide). La lista completa dei nomi O H delle basi, dei nucleosidi e dei nuH OH –O P O cleotidi è riportata nella Tabella 2.1. Legame Nucleoside (zucchero + base) O fosfodiesterico Per la formazione dei polinucleodesossiadenosina 5„ CH2 tidi di DNA e di RNA, i nucleotidi G O Nucleotide (zucchero + base + gruppo fosfato) sono uniti da un legame covalente tra desossiadenosina 5„-monofosfato il gruppo fosfato di un nucleotide e H H Nucleotide dell’RNA

–O

P

–O

HC

NH

HC

C

Zucchero O

CH2

N

H

H

O

C

Gruppo fosfato O–

3„

H

Base (uracile) O

Legame fosfodiesterico O

P

O

O 5„ CH 2

T

O

O

O

H H

H

H

H OH

H

3„

OH

H H H

OH Estremità 3„

Nucleoside (zucchero + base) uridina Nucleotide (zucchero + base + gruppo fosfato) uridina 5„-monofosfato o acido uridilico

Figura 2.9 La struttura chimica del DNA e dell’RNA. (a) Strutture fondamentali dei nucleosidi (zucchero + base) e dei nucleotidi (zucchero + base + gruppi fosfato) del DNA e dell’RNA. I gruppi fosfato sono colorati in giallo, gli zuccheri in rosa e le basi in marroncino. (b) Un segmento di una catena polinucleotidica che forma un singolo filamento di DNA. Le molecole di desossiribosio sono legate mediante legami fosfodiesterici tra il carbonio 3’ di uno zucchero e il carbonio 5’ dello zucchero successivo.

18

Capitolo 2

Tabella 2.1 Nomenclatura delle basi, dei nucleosidi e dei nucleotidi che costituiscono il DNA e l’RNA Basi: purine (Pu) Adenina (A) DNA

RNA

Basi: pirimidine (Py)

Guanina (G)

Citosina (C)

Timina (T) (solo con il desossiribosio)

Nucleoside: desossiribosio + base

Desossiadenosina Desossiguanosina Desossicitidina (dA) (dG) (dC)

Desossitimidina (dT)

Nucleotide: desossiribosio + base + gruppo fosfato

Acido desossiadenilico o desossiadenosina monofosfato (dAMP)

Acido desossiguanilico o desossiguanosina monofosfato (dGMP)

Acido desossicitidilico o desossicitidina monofosfato (dCMP)

Acido desossitimidilico o desossitimidina monofosfato (dTMP)

Nucleoside: ribosio + base

Adenosina (A)

Guanosina (G)

Citidina (C)

Nucleotide: ribosio + base + gruppo fosfato

Acido adenilico o Acido guanilico o Acido citidilico o adenosina mono- guanosina mono- citidina monofofosfato (AMP) fosfato (GMP) sfato (CMP)

l’atomo di carbonio 3′ del pentoso di un altro nucleotide. Questo tipo di legame fosfato 5′-3′ viene definito legame fosfodiesterico. I legami fosfodiesterici sono relativamente forti e, di conseguenza, la struttura ripetuta zucchero-fosfato-zucchero-fosfato, che costituisce l’ossatura del DNA e dell’RNA, è molto stabile. Nella Figura 2.9b viene riportata la rappresentazione schematica di una breve catena polinucleotidica. La catena polinucleotidica presenta una polarità, ovvero le due estremità della molecola sono differenti (Figura 2.9b); in particolare, un’estremità del polinucleotide presenta un atomo di carbonio 5′ (che porta un gruppo fosfato), mentre l’altra estremità è caratterizzata da un atomo di carbonio 3′ (che porta un gruppo idrossilico). Le due estremità del polinucleotide sono comunemente denominate 5′ e 3′.

Nota chiave Il DNA e l’RNA si trovano in natura come macromolecole composte da subunità più piccole denominate nucleotidi. Ogni nucleotide è costituito da uno zucchero a cinque atomi di carbonio (desossiribosio nel DNA e ribosio nell’RNA) a cui sono legati un gruppo fosfato e una delle quattro basi azotate: adenina, guanina, citosina e timina nel DNA, oppure adenina, guanina, citosina e uracile nell’RNA.

La doppia elica del DNA Nel 1953 James D. Watson e Francis H.C. Crick proposero un modello per la struttura fisica e chimica della

Uracile (U) (solo con il ribosio)

Uridina (U)

Acido uridilico o uridina monofosfato (UMP)

molecola del DNA. Questi scienziati proposero l’ormai famosa struttura a doppia elica del DNA, che forniva una spiegazione comune a tutti i dati sino allora conosciuti circa la composizione della molecola dell’acido desossiribonucleico. La determinazione della struttura del DNA costituì indubbiamente uno dei momenti di maggiore importanza in biologia; infatti, tale scoperta ha reso possibile l’attuale comprensione della scienza della vita. All’epoca della scoperta di Watson e Crick si sapeva che il DNA era formato da nucleotidi. Tuttavia, non erano note le modalità con cui i nucleotidi si associano dando luogo alla struttura del DNA. Watson e Crick intuirono che la determinazione della struttura del DNA avrebbe consentito di comprendere il modo in cui il DNA funge da base genetica degli organismi viventi. I dati che utilizzarono per generare il loro modello provenivano principalmente dagli studi sulla composizione in basi del DNA condotti da Erwin Chargaff e dagli studi sulla diffrazione dei raggi X condotti da Rosalind Franklin e Maurice H.F. Wilkins. Studi sulla composizione in basi Erwin Chargaff aveva idrolizzato, mediante trattamenti chimici, il DNA di numerosi organismi, quantificando successivamente le purine e le pirimidine presenti nella soluzione. I suoi studi dimostrarono che il 50% delle basi era costituito da purine e il restante 50% da pirimidine e, ancora più importante, che in tutti i DNA analizzati la quantità di adenina (A) era uguale a quella di timina (T), mentre la quantità di guanina (G) era uguale a quella di citosina (C). Tali equivalenze sono note come regole di Chargaff. Paragonando i DNA di differenti organismi, è pos-

DNA: il materiale genetico

19

Tabella 2.2 Composizione in basi del DNA proveniente da differenti organismi Origine del DNA

Percentuali delle diverse basi nel DNA

Rapporti

A

T

G

C

A/T

G/C

(A + T)/(G + C)

Sperma umano

31,0

31,5

19,1

18,4

0,98

1,03

1,67

Mais (Zea mays)

25,6

25,3

24,5

24,6

1,01

1,00

1,04

Drosophila

27,3

27,6

22,5

22,5

0,99

1,00

1,22

Nucleo di Euglena

22,6

24,4

27,7

25,8

0,93

1,07

0,88

Escherichia coli

26,1

23,9

24,9

25,1

1,09

0,99

1,00

sibile osservare che il rapporto A/T e G/C è sempre pari a uno, mentre il rapporto (A + T)/(G + C) (indicato generalmente come % di GC) varia. Inoltre, dal momento che la quantità di purine è uguale a quella di pirimidine, il rapporto (A + G)/(C + T) è uguale a uno (vedi Tabella 2.2). Studi sulla diffrazione dei raggi X Rosalind Franklin, lavorando insieme con Maurice H.F. Wilkins, aveva studiato fibre sottili di DNA usando la tecnica della diffrazione dei raggi X, mediante la quale un fascio parallelo di raggi X viene diretto contro le molecole. Il fascio viene diffratto dagli atomi secondo uno schema caratteristico che dipende dal peso atomico e dall’organizzazione spaziale della molecola. I raggi X diffratti possono impressionare una lastra fotografica (Figura 2.10). Analizzando le fotografie ottenute, la Franklin ricavò informazioni riguardanti la struttura atomica della

Metodo di diffrazione dei raggi X

molecola; in particolare giunse alla conclusione che il DNA possiede una struttura elicoidale, caratterizzata da due distinte periodicità di 0,34 nm e 3,4 nm lungo l’asse della molecola (1 nanometro, nm = 10–9 metri = 10 ångstrom, Å; 1 Å = 10–10 metri). Il modello di Watson e Crick Watson e Crick usarono alcuni dati ottenuti dalla Franklin e alcune intelligenti deduzioni derivanti dai loro lavori per costruire modelli tridimensionali della struttura del DNA. La Figura 2.11a mostra un modello tridimensionale della molecola del DNA, mentre la Figura 2.11b riporta un diagramma stilizzato della stessa molecola in cui sono visibili l’ossatura zucchero-fosfato e le coppie di basi. La Figura 2.11c illustra la struttura chimica del DNA a doppia elica. Il modello a doppia elica proposto da Watson e Crick e basato sui dati della cristallografia a raggi X presenta le seguenti principali caratteristiche.

Spettro di diffrazione dei raggi X

Lastra fotografica

Sorgente di raggi X

Campione di DNA

Figura 2.10 Analisi del DNA mediante diffrazione dei raggi X. Lo spettro del DNA ottenuto dalla diffrazione dei raggi X che Watson e Crick utilizzarono per sviluppare il loro

modello a doppia elica. Le aree scure che formano una X al centro della fotografia indicano la natura elicoidale del DNA. Le mezze lune scure in alto e in basso nella fotografia indicano la distanza di 0,34 nm tra le coppie di basi.

Capitolo 2 b) Diagramma stilizzato

c) Struttura chimica

Asse dell’elica A =T T= A

–O

O

O

CßG

Coppie di basi (C e N)

A

T

O

H2C

–O

T =A O –O

P

H

H

O

O

O

T

G

O

H2C

CH2

O

GßC CßG

–O

–O

3,4 nm

P

H

H

O

A =T

P

O

O

T =A O

O

A

T

O

H2C

CH2 O

G ßC

O

CßG

–O

GßC O –O

P

H

A=T

H

P

O

O

Solco maggiore

P

O

Solco minore

Solco minore

Solco maggiore

CH2

G ßC A =T

C

P

1 nm

O

H

O

0,34 nm

O

P

3„

5„

O

O

H

a) Modello molecolare

O

20

O

O CH2

–O O

H

P

O

O

Ossatura zucchero-fosfato

1. La molecola di DNA consiste di due catene polinucleotidiche avvolte l’una intorno all’altra a formare una doppia elica destrorsa; in altre parole le due eliche, osservate lungo il loro asse, si avvolgono in senso orario l’una sull’altra. 2. Le due catene sono antiparallele (hanno polarità opposta), ovvero sono orientate in direzioni opposte; in particolare, un filamento è orientato in direzione 5′3′, mentre l’altro in direzione 3′-5′. Con parole semplici, considerando l’estremità 5′ come la “testa” e l’estremità 3′ come la “coda”, il termine antiparallela indica che la “testa” di una catena è posizionata in corrispondenza della “coda” dell’altra. 3. Le impalcature di zucchero-fosfato sono posizionate all’esterno della doppia elica, mentre le basi sono orientate verso l’asse centrale (vedi Figura 2.11). Le basi di entrambe le catene hanno una struttura planare orientata perpendicolarmente all’asse lungitudinale del DNA; tali basi sono impilate come monetine l’una sull’altra e, in tal modo, assecondano la torsione dell’elica. 4. Le basi dei due filamenti polinucleotidici sono tenute insieme da legami idrogeno, legami chimici relativamente deboli. È possibile osservare due tipi di appaiamento e, in particolare, A si appaia con T (mediante due legami idrogeno; vedi Figura 2.12a) e G si appaia con C (con tre legami idrogeno; vedi Figura 2.12b). I legami idrogeno rendono agevole la separazione

C

A

O

H2C

O

Figura 2.11 Struttura molecolare del DNA.

Coppie di basi

O

Coppie di basi Ossatura zucchero-fosfato

5„

3„

a)—Coppia di basi adenina-timina (si appaiano mediante la formazione di due legami idrogeno) Timina

H

Adenina H

CH3 C H

O

N

N C

C

C

N N

H

H

N

N

C C

C

C

C

N Desossiribosio

H

O Desossiribosio

b)—Coppia di basi guanina-citosina (si appaiano mediante la formazione di tre legami idrogeno) Citosina

Guanina

H

H H

N

H

O

N C

C H

C

C

C N

N

H

C

N

C

C C

N

N Desossiribosio

O

H

N

Desossiribosio H

Figura 2.12 Strutture delle coppie di basi complementari nel DNA. In entrambi i casi una pirimidina (a sinistra) si appaia con una purina (a destra).

DNA: il materiale genetico

delle due catene del DNA, per esempio mediante riscaldamento. Le coppie di basi A-T e G-C sono le uniche compatibili con le dimensioni del modello a elica e la loro organizzazione si accorda perfettamente con le regole di Chargaff. Le coppie specifiche AT e G-C vengono definite coppie di basi complementari, e mediante il loro appaiamento la sequenza dei nucleotidi in un filamento determina la sequenza dell’altro. Per esempio, se una catena ha la sequenza 5′-TATTCCGA-3′, la catena opposta, antiparallela, deve possedere la sequenza 3′-ATAAGGCT-5′. 5. Le coppie di basi nell’elica del DNA sono alla distanza di 0,34 nm. Un giro completo dell’elica (360°) è lungo 3,4 nm; pertanto, vi sono 10 coppie di basi (bp) per ogni giro. Il diametro esterno dell’elica è pari a 2 nm. 6. A causa del tipo di legame che unisce le basi, le impalcature zucchero-fosfato della doppia elica non presentano sempre eguale distanza lungo l’asse dell’elica stessa. Questa spaziatura ineguale si traduce nella formazione di solchi di diverse dimensioni lungo l’asse del DNA; nello specifico, si possono distinguere un solco maggiore e un solco minore (vedi Figura 2.11a). I margini delle coppie di basi si trovano esposti nei solchi e questi ultimi sono entrambi abbastanza ampi da poter ospitare particolari molecole proteiche che prendono contatto con le basi del DNA. Per le loro “scoperte riguardanti la struttura molecolare degli acidi nucleici e il significato di tali molecole nel trasferimento dell’informazione nel materiale vivente” venne conferito nel 1962 a Francis Crick, James Watson e Maurice Wilkins il Premio Nobel per la Fisiologia o

a) A-DNA

Figura 2.13 Modelli spaziali di differenti forme di DNA.

b) B-DNA

21

Medicina. Quale fu il contributo di Rosalind Franklin alle suddette scoperte? Vi è stato un grande dibattito relativo a tale questione e probabilmente non sarà possibile stabilire se la studiosa avrebbe meritato di condividere il premio. Infatti, la Franklin morì nel 1962 e non è prevista l’assegnazione postuma dei Premi Nobel.

Differenti strutture del DNA I ricercatori hanno dimostrato l’esistenza di diverse forme di DNA, tra cui le più note sono la A, la B e la Z (Figura 2.13). A-DNA e B-DNA Le prime analisi condotte sulle fibre del DNA utilizzando la cristallografia con raggi X identificarono l’A-DNA e il B-DNA; tali forme del DNA sono caratterizzate entrambe da una struttura a doppia elica destrorsa e presentano rispettivamente 11 e 10 bp (coppie di basi) per ogni giro d’elica. L’A-DNA è presente solo in condizioni di bassa umidità. La doppia elica dell’A-DNA è corta e larga (diametro 2,2 nm), con il solco maggiore stretto e molto profondo e il solco minore largo e poco profondo. (Si pensi a questa descrizione come se si riferisse a un canyon: i termini “stretto” e “largo” indicano la distanza tra le pareti, mentre “profondo” e “poco profondo” si riferiscono all’altezza del canyon.) Il B-DNA si forma in condizioni di elevata umidità e rappresenta la struttura che somiglia maggiormente al DNA presente nelle cellule. La doppia elica di B-DNA, a parità di coppie di basi, è più stretta e più lunga di quella dell’A-DNA e presenta un ampio solco maggiore e uno stretto solco minore; entrambi i solchi hanno profondità simile. Il B-DNA è caratterizzato da un diametro di 2 nm.

c) Z-DNA

22

Capitolo 2

Z-DNA Il DNA che presenta un’alternanza tra basi puriniche e pirimidiniche può organizzarsi in eliche sinistrorse o destrorse. Le eliche sinistrorse sono dotate di un’ossatura zucchero-fosfato con andamento a zig zag e, per tale ragione, vengono definite Z-DNA. Lo ZDNA possiede 12 bp per ogni giro completo dell’elica. L’elica dello Z-DNA, sottile e allungata, dà luogo a un solco minore profondo, mentre il solco maggiore si trova talmente vicino alla superficie dell’elica da risultare poco evidente. Lo Z-DNA è caratterizzato da un diametro di 1,8 nm.

Attività MyLab

Determinate la composizione molecolare e la struttura di un virus che infetta le colture di riso in Asia. Visitate la iAttività Cracking a Viral Code (Decifrazione del codice virale) sul sito web per gli studenti.

Il DNA nelle cellule Il DNA nelle cellule è in soluzione, cioè in uno stato differente rispetto all’acido desossiribonucleico utilizzato negli esperimenti di cristallografia a raggi X. Gli esperimenti hanno dimostrato che il DNA in soluzione possiede 10,5 coppie di basi per giro di elica, ossia è leggermente meno avvolto del B-DNA. Da un punto di vista strutturale, il DNA delle cellule assomiglia al B-DNA e la maggior parte del genoma si presenta in tale forma. Tuttavia, in alcuni complessi DNA-proteine l’acido desossiribonucleico assume la struttura dell’A-DNA. L’esistenza dello Z-DNA nelle cellule costituisce motivo di acceso dibattito tra gli scienziati. Il significato fisiologico dello Z-DNA risulta sconosciuto anche in quegli organismi nei quali ne è stata dimostrata la presenza.

Struttura dell’RNA La struttura molecolare dell’RNA è simile a quella del DNA; nello specifico, le uniche differenze dell’RNA rispetto all’acido desossiribonucleico risiedono nella presenza dello zucchero ribosio (che sostituisce il desossiribosio) e della base uracile (U) al posto della timina. Nella cellula le forme funzionali dell’RNA, quali l’RNA messaggero (mRNA), l’RNA transfer (tRNA), l’RNA ribosomale (rRNA), il piccolo RNA nucleare (snRNA) e il microRNA (miRNA), sono molecole a elica singola. Tuttavia, tali molecole non sono bastoncini rigidi e lineari; al contrario, ogni volta che due basi possono appaiarsi, lo fanno. Di conseguenza, una molecola di RNA a singola elica si ripiegherà su se stessa formando regioni di RNA a doppia elica separate da regioni di RNA a singolo filamento. Questo tipo di configurazione viene denominato struttura molecolare secondaria.

Le molecole di RNA a singola o a doppia elica costituiscono i genomi di alcuni virus. L’RNA a doppia elica ha una struttura simile a quella del DNA a doppio filamento, con eliche antiparallele, ossatura zucchero-fosfato all’esterno dell’elica e coppie di basi complementari unite da legami idrogeno nella porzione interna della doppia elica.

Nota chiave La molecola di DNA consiste di due catene polinucleotidiche unite a formare una doppia elica grazie alla formazione di legami idrogeno fra le basi A e T e fra le basi G e C. I tre principali tipi di DNA, identificati tramite l’analisi in vitro di fibre e cristalli di tale acido nucleico, sono i destrorsi A-DNA e B-DNA e il sinistrorso Z-DNA. La forma più comune del DNA contenuto nelle cellule ha una struttura molto simile a quella del B-DNA. Dal punto di vista molecolare l’RNA è simile al DNA; tuttavia, l’acido ribonucleico si presenta tipicamente come singola elica.

L’organizzazione del DNA nei cromosomi Un genoma è l’intero materiale genetico rinvenuto in un virus, in un procariote, in un organello eucariote, o in un set aploide di cromosomi di un organismo. Nei virus il genoma può essere costituito da DNA o da RNA. Nei procarioti il genoma è rappresentato generalmente, ma non sempre, da un singolo cromosoma circolare di DNA. Negli eucarioti i mitocondri (presenti in tutti gli eucarioti) e i cloroplasti (contenuti soltanto all’interno delle cellule vegetali) possiedono un proprio genoma costituito da DNA. Il genoma degli eucarioti è tipicamente organizzato in un set di cromosomi contenuto nel nucleo della cellula. Le cellule eucariote aploidi hanno una copia del genoma, mentre le cellule eucariote diploidi ne hanno due. Al fine di comprendere il processo mediante il quale le informazioni contenute nei geni divengono accessibili (vedi Capitolo 5), è importante conoscere l’organizzazione del DNA nei cromosomi. Nei paragrafi seguenti verrà discussa l’organizzazione delle molecole del DNA nei cromosomi dei virus, dei procarioti e degli eucarioti.

Cromosomi virali A seconda del tipo di virus, il materiale genetico può essere costituito da DNA a doppia o a singola elica oppure da RNA a doppia o a singola elica; inoltre, il cro-

DNA: il materiale genetico

mosoma virale può essere circolare o lineare. I genomi di alcuni virus sono organizzati in un singolo cromosoma, mentre altri virus hanno un genoma segmentato, ossia organizzato in un determinato numero di molecole di DNA. I batteriofagi T2, T4 e T6 (noti come batteriofagi Tpari), gli herpesvirus e il virus Gemini rappresentano esempi di virus con genomi costituiti da DNA a doppia elica. Diversamente, il parvovirus B19, che causa infezioni nei bambini, il parvovirus canino, agente causale nei cani di malattie altamente infettive che risultano spesso mortali per i cuccioli, e il fago virulento ΦX174 sono esempi di virus con genomi a DNA a singola elica. I parvovirus hanno genomi lineari, mentre il fago ΦX174 possiede un genoma circolare. Tutti questi virus, a eccezione del virus Gemini, presentano un singolo cromosoma; il genoma del virus Gemini può consistere, a seconda del genere, sia in una sia in due molecole di DNA. I reovirus, uno dei quali è responsabile nell’uomo di lievi infezioni delle alte vie respiratorie, sono esempi di virus con genomi a RNA a doppia elica. I picornavirus (che includono il poliovirus) e i virus influenzali costituiscono invece esempi di virus con genomi a RNA a singola elica. Il genoma dei picornavirus consiste in una molecola singola di RNA, mentre i genomi degli altri virus a RNA menzionati sono segmentati. Tale condizione spiega in parte la variabilità genetica dei virus influenzali che richiede un adeguamento continuo dei vaccini prodotti e desta preoccupazioni dal punto di vita epidemiologico per la possibile genesi di virus killer.

Cromosomi procarioti La maggior parte dei procarioti contiene un singolo cromosoma costituito da una molecola di DNA circolare e a doppia elica. Gli altri procarioti possiedono genomi costituiti da uno o più cromosomi circolari o lineari. In quest’ultimo caso il genoma consta tipicamente di un cromosoma principale e di uno o più cromosomi di dimensioni inferiori. I cromosomi più piccoli si replicano in modo autonomo rispetto al cromosoma principale e possono essere o non essere essenziali per la vita della cellula. Quando non sono essenziali per la vita della cellula, tali cromosomi vengono chiamati plasmidi (vedi anche Capitolo 8). Per esempio, tra i batteri, Borrelia burgdorferi, l’agente patogeno che causa nella specie umana la malattia di Lyme, ha un cromosoma lineare di 0,91 Mb (1 Mb = 1 megabase = 1 milione di coppie di basi ) e almeno 17 piccoli plasmidi, alcuni lineari e altri circolari, che hanno una dimensione totale di 0,53 Mb. Il Rhizobium radiobacter (chiamato anche Agrobacterium tumefaciens), l’agente eziologico del tumore del colletto in alcune piante, ha un cromosoma circolare di 3,0 Mb e uno lineare di 2,1 Mb. Anche tra gli Archaea

23

l’organizzazione del cromosoma varia, sebbene non siano stati ancora ritrovati cromosomi lineari. Per esempio, il Methanococcus jannaschii ha un cromosoma circolare di 1,66 Mb e plasmidi circolari di 58 e 16 kb (1 kb = 1 kilobase = 1000 coppie di basi); l’Archaeoglobus fulgidus ha un unico cromosoma circolare di 2,2 Mb. Nei batteri e negli Archaea il cromosoma è organizzato nella cellula in una densa struttura denominata nucleoide. A differenza degli eucarioti non si osserva l’interposizione di una membrana fra la regione del nucleoide e il resto della cellula. Il genoma di E. coli consta di una molecola di DNA circolare a doppio filamento di 4,6 Mb e lunga approssimativamente 1100 μm (1000 volte la lunghezza della cellula batterica). Il DNA riesce ad adattarsi all’interno della regione del nucleoide poiché l’acido nucleico in parte è superavvolto; in altri termini, la doppia elica è avvolta nello spazio attorno al proprio asse. L’avvolgimento del cromosoma di E. coli può essere osservato dopo aver indotto una lisi blanda della cellula batterica, processo in seguito al quale il DNA viene rilasciato all’esterno della cellula (Figura 2.14). Per comprendere il grado di superavvolgimento, si consideri un tratto lineare di DNA che presenti 20 giri di elica e le due estremità libere (Figura 2.15a). Unendo semplicemente le due estremità, si ottiene una molecola di DNA circolare definita rilassata (Figura 2.15b). Diversamente, se prima si srotola un’estremità della molecola lineare di DNA per due giri (Figura 2.15c), unendo successivamente le due estremità la molecola di DNA circolare prodotta avrà 18 giri di elica e una piccola regione non avvolta (Figura 2.15d). Tale struttura non è favorita dal punto di vista energetico e presto si trasformerà in un’altra con 20 giri d’elica e 2 giri di superelica, una forma superavvolta del DNA (Figura 2.15e).

Figura 2.14 Cromosoma rilasciato da una cellula lisata di E. coli.

24

Capitolo 2

a) DNA lineare con 20 giri

b) DNA circolare con 20 giri

c) DNA lineare con 20 giri di cui due non avvolti

d) DNA circolare con 18 giri e una corta regione non avvolta

Figura 2.15 Rappresentazione del superavvolgimento del DNA. (a) DNA lineare in forma B con 20 giri dell’elica. (b) DNA circolare in forma rilassata prodotto dall’unione delle due estremità della molecola lineare definita in a. (c) La molecola lineare definita in a nella quale a un’estremità sono svolti due giri dell’elica. (d) Possibile molecola di DNA circolare prodotta dall’unione delle due estremità della molecola lineare mostrata in c. Questa molecola presenta 18 giri di elica e una piccola regione non avvolta. (e) DNA superavvolto con 20 giri di elica e 2 giri di superelica, che rappresenta la forma di d energeticamente più favorevole.

Il superavvolgimento produce tensione nella molecola del DNA. Pertanto, se viene introdotta una rottura a singolo filamento (o “nick”) nell’ossatura zucchero-fosfato di un filamento di DNA circolare superavvolto, la molecola si svolge spontaneamente divenendo una molecola di DNA circolare rilassato. Il superavvolgimento può verificarsi anche in una molecola di DNA lineare. Attorcigliando una corda a una estremità senza tenere ferma l’altra estremità, la corda girerà liberamente nell’aria e rimarrà lineare (rilassata). Diversamente, nel caso in cui venisse effettuata la stessa operazione su una grande molecola di DNA lineare, il superavvolgimento si produrrebbe in regioni specifiche e l’estremità si comporterebbe come se fosse fissata. La Figura 2.16 mostra la molecola del DNA circolare in forma rilassata e superavvolta, a dimostrazione di quanto una molecola superavvolta sia più compatta rispetto a una molecola in forma rilassata. Esistono due tipi di superavvolgimenti: negativo e positivo. Per visualizzare il superavvolgimento, si immagini la doppia elica del DNA come una scala a chiocciola che gira in senso orario. Se la scala a chiocciola viene svolta per un giro completo, il numero di gradini da salire sarà lo stesso ma si avrà un giro di 360° in meno da fare; in tal caso si parla di superavvolgimento negativo. Al contrario, avvolgendo la scala a chiocciola per più di un giro completo, il numero di gradini da salire sarà lo stesso ma si avrà un giro di 360° in più da fare; in questo caso si parla di superavvolgimento positivo.

e)

DNA superavvolto con 20 giri di elica e 2 giri di superelica

Sia l’uno sia l’altro tipo di superavvolgimento rendono il DNA più compatto. La quantità e il tipo di superavvolgimento del DNA sono controllati dalle topoisomerasi, enzimi presenti in tutti gli organismi. a) Molecola di DNA rilassata

b) Molecola di DNA superavvolta

Figura 2.16 Fotografie al microscopio elettronico di una molecola di DNA circolare che illustrano: (a) una molecola rilassata e (b) una molecola superavvolta. (Entrambe le molecole sono mostrate allo stesso ingrandimento.)

DNA: il materiale genetico

Il DNA dei cromosomi batterici risulta compattato, anche in virtù del fatto che è organizzato in domini ad ansa (Figura 2.17), il cui numero varia tra le specie e dipende dalle dimensioni del genoma. In E. coli vi sono circa 400 domini di DNA con superavvolgimento negativo per ogni cromosoma e ogni dominio ha una grandezza variabile. Il dibattito in merito a quali molecole si leghino al DNA per produrre il dominio è aperto; senza dubbio tale processo coinvolge diverse proteine e, probabilmente, anche qualche molecola di RNA. Il grado di compattamento che viene raggiunto attraverso l’organizzazione del DNA in domini ad ansa risulta circa dieci volte superiore rispetto al caso in cui tale disposizione sia assente.

Nota chiave I genomi virali possono essere costituiti da DNA (a doppio o a singolo filamento) o da RNA (a doppio o a singolo filamento). Essi possono essere sia circolari sia lineari. I genomi di alcuni virus sono organizzati in un singolo cromosoma, mentre altri virus hanno un genoma suddiviso in segmenti. Il materiale genetico dei batteri e degli Archaea è costituito da DNA a doppio filamento localizzato in uno o pochi cromosomi. Il cromosoma di E. coli è circolare ed è organizzato in circa 400 domini ad ansa indipendenti di DNA superavvolto.

Cromosomi eucarioti Il genoma degli eucarioti è tipicamente distribuito fra diversi cromosomi lineari, il cui numero è caratteristico per ogni specie. L’uomo, per esempio, che è un organismo diploide (2N), ha 46 cromosomi nella maggior parte delle cellule tranne nei gameti aploidi (N), uova e spermatozoi, in cui il numero di cromosomi è 23. (I 46 cromosomi sono costituiti da coppie di cromosomi omologhi, uno di derivazione materna, l’altro di derivazione paterna.) Oltre al DNA nucleare, il genoma degli eucarioti è costituito dal DNA di organelli come i mitocondri e i cloroplasti, aventi replicazione autonoma (derivano per semplice scissione da organelli preesistenti) e specializzati per la respirazione cellulare (i mitocondri) o per la fotosintesi (cloroplasti). Ognuno di questi organelli contiene un proprio DNA, generalmente circolare a doppia elica, che codifica per alcuni RNA e per un certo numero di proteine, sintetizzate direttamente negli stessi organelli dove rimangono a svolgere funzioni specifiche (vedi Capitolo 13). La quantità complessiva di DNA che costituisce il genoma aploide di una specie viene definita come il suo valore C, dove la lettera “C” sta per costante, espresso in coppie di basi (bp).

25

Ansa di DNA

Le anse sono ancorate alla base secondo una modalità sconosciuta

Figura 2.17 Modello della struttura di un cromosoma batterico. Il cromosoma è organizzato in domini ad ansa, le cui basi sono ancorate secondo una modalità sconosciuta.

La Tabella 2.3 elenca i valori C relativi ad alcune specie selezionate. Tali valori C dimostrano che la quantità di DNA nei diversi organismi varia sensibilmente e che tali variazioni possono esistere anche tra organismi correlati. Per esempio, mammiferi, uccelli e rettili mostrano una variabilità modesta, mentre gli anfibi, gli insetti e le piante presentano variazioni in un ampio intervallo, spesso di dieci volte o più. Inoltre, non esiste una relazione diretta tra il valore C e la complessità strutturale od organizzativa degli organismi – situazione indicata come il paradosso del valore C. (Per esempio, l’ameba ha una quantità di DNA quasi cento volte superiore a quella della specie umana.) L’assenza della sopraindicata relazione diretta può essere spiegata considerando la variazione della quantità di sequenze ripetute nel genoma (trattata nel Focus sul genoma di questo capitolo). Come verrà spiegato nel Capitolo 12, le cellule eucariote si dividono attraverso un processo denominato ciclo cellulare, costituito da quattro fasi: G1, S, G2 e M. Durante la fase G1, ogni cromosoma è costituito da una singola molecola lineare di DNA a doppia elica. Durante la fase S, il cromosoma duplica se stesso dando origine a due cromatidi fratelli uniti dal centromero. Questa condizione permane durante la fase G2. Successivamente, nella fase M di divisione cellulare, i centromeri si separano e i cromatidi fratelli diventano nuove copie di cromosomi. Negli eucarioti, ogni cromosoma è associato a proteine il cui peso è circa il doppio del proprio. Il complesso tra il DNA e le proteine, chiamato cromatina, è sperimentalmente visualizzabile all’interno del nucleo mediante coloranti specifici ed ha una struttura essenzialmente identica in tutti gli eucarioti. Le proteine che costituiscono la cromatina sono associate al DNA direttamente, attraverso la formazione di complessi, oppure indirettamente, costituendo un supporto strutturale per il cromosoma. Il loro ruolo è essen-

26

Capitolo 2

ziale per la struttura fisica e per la funzione del cromosoma stesso; esse, infatti, permettono la condensazione e la segregazione dei cromosomi nella divisione cellulare e contribuiscono alla regolazione dell’espressione genica. Tabella 2.3 Contenuto di DNA aploide, o valore C, in alcune specie Specie Virus e fagi Batteriofago lambda (λ) Batteriofago T4 Virus della leucemia felina (virus del gatto) Simian virus 40 (SV40) Virus dell’immunodeficienza umana1 (HIV-1, agente che causa l’AIDS) Virus del morbillo (virus dell’uomo) Batteri Bacillus subtilis Borrelia burgdorferi (spirocheta della malattia di Lyme) Carsonella ruddii Escherichia coli Helicobacter pylori (batterio che causa l’ulcera gastrica) Neisseria meningitidis Mycoplasma genitalium Archaea Methanococcus jannaschii Eukarya Saccharomyces cerevisiae (lievito gemmante, lievito di birra) Schizosaccharomices pombe (lievito) Plasmodium falciparum (parassita della malaria) Lilium formosanum (giglio) Zea mays (mais, granoturco) Oryza sativa (riso) Amoeba proteus (ameba) Aedes aegypti (zanzara tigre egiziana) Drosophila melanogaster (moscerino della frutta) Caenorhabditis elegans (nematode) Danio rerio (zebrafish) Xenopus laevis (rospo africano) Mus musculus (topo) Rattus rattus (ratto) Loxodonta africana (elefante africano) Canis familiaris (cane) Equus caballus (cavallo) Macaca mulatta (macaco rhesus) Pan troglodytes (scimpanzè) Homo sapiens (uomo)

Valori C (bp)

48 502(a) 168 904(a) 8448(a) 5243(a) 9750(a) 15 984(a)

4 214 814(a) 910 724(a) 159 662(a) 4 639 221(a) 1 667 867(a) 2 272 351(a) 580 076(a)

1 664 970(a)

13 105 020(a) 12 590 810(a) 22 859 790(a) 36 000 000 000 5 000 000 000 370 792 000(a) 290 000 000 000 1 310 900 000(a) 132 576 936(a) 100 289 800(a) 1 527 000 581(a) 3 100 000 000 3 420 842 930(a) 2 719 924 000(a) 3 000 000 000 2 443 707 000(a) 3 311 000 000 3 097 179 900(a) 3 350 417 645(a) 3 243 037 807(a)

I valori contrassegnati con l’annotazione (a) derivano dal sequenziamento completo del genoma; tutti gli altri sono stati determinati con metodi di misura diversi.

La struttura della cromatina La cromatina è costituita da due principali tipi di proteine associate al DNA: gli istoni e le proteine non istoniche. Entrambi i tipi di proteine giocano un ruolo importante nel determinare la struttura fisica del cromosoma. Gli istoni, le proteine più abbondanti nella cromatina, sono piccole proteine basiche con una carica netta positiva che agevola il loro legame con il DNA carico negativamente. Cinque tipi di istoni sono associati al DNA del nucleo eucariote: H1, H2A, H2B, H3 e H4. Stechiometricamente, nella cromatina vi è eguale quantità di DNA e di proteine istoniche. Le sequenze degli amminoacidi che costituiscono gli istoni H2A, H2B, H3 e H4 si sono altamente conservate nel corso dell’evoluzione, anche tra specie relativamente distanti. La conservazione di queste sequenze nell’evoluzione indica che nell’organizzazione del DNA di tutti i cromosomi eucarioti gli istoni svolgono il medesimo ruolo di base. Gli istoni giocano un ruolo cruciale nell’impacchettamento del DNA nella cromatina. Una cellula umana diploide, per esempio, contiene una quantità di DNA 1400 volte superiore a quella presente in una cellula di E. coli. Senza il compattamento delle 6 × 109 bp di DNA nelle cellule diploidi, il DNA cromosomico rilassato di una singola cellula umana sarebbe lungo oltre 2 metri. Differenti livelli di impacchettamento consentono ai cromosomi, lunghi parecchi millimetri o perfino centimetri, di essere contenuti all’interno di un nucleo il cui diametro è pari a pochi micron. Le proteine non istoniche sono tutte le proteine associate al DNA diverse dagli istoni. Tali molecole sono molto meno abbondanti rispetto agli istoni. Molte proteine non istoniche sono proteine acide dotate di carica netta negativa. Questo gruppo di molecole comprende le proteine che giocano un ruolo nella duplicazione, riparazione, trascrizione (inclusa la regolazione dell’espressione genica) e ricombinazione del DNA. Ogni cellula eucariote contiene molte proteine non istoniche differenti nel nucleo, ma, al contrario degli istoni, queste ultime differiscono profondamente sia in numero sia in tipologia fra un tipo cellulare e un altro all’interno di un organismo, in momenti diversi nello stesso tipo cellulare e tra organismi diversi. Con il microscopio elettronico è possibile apprezzare differenti strutture della cromatina. Le strutture di complessità inferiore possono essere osservate nel corso della ricostituzione in vitro del DNA purificato e degli istoni, mentre quelle di complessità maggiore riflettono l’alto grado di impacchettamento necessario al compattamento del DNA in vivo. La forma meno compatta è la fibra cromatinica da 10 nm, che presenta una caratteristica morfologia a “filo di perle”; le “perle” hanno un diametro di circa 10 nm (Figure 2.18b e 2.22b) e sono nucleosomi, le unità strutturali di base della cromatina eucariote. Ogni nucleosoma ha un diametro di circa 11 nm e un nucleo che consiste di otto proteine istoniche, due per ciascuno

DNA: il materiale genetico

27

Focus sul genoma Dimensione del genoma e contenuto di DNA ripetuto Allorché volsero la loro attenzione sulle dimensioni dei genomi degli organismi aploidi (valore C), i biologi notarono che queste ultime tendevano a essere molto piccole nei virus e progressivamente più grandi nei procarioti e negli eucarioti. Tuttavia, essi rimasero sorpresi nel constatare che la dimensione del genoma variava in modo sostanziale entro il medesimo gruppo di organismi; fu difficile comprendere il motivo per cui particolari organismi avevano genomi molto piccoli o molto grandi. Per esempio, nell’ambito dei genomi animali conosciuti, quelli più grandi hanno dimensioni 6000 volte superiori rispetto a quelle dei più piccoli; inoltre, secondo una stima delle variazioni nel materiale genetico eucariote, le dimensioni dei genomi realmente più grandi sarebbero da 40 000 a 200 000 volte superiori a quelle dei più piccoli. Il genoma umano non è né grande né piccolo, bensì di dimensioni medie. Ancora, sorprendentemente, i genomi degli animali sono più piccoli rispetto a quelli di altri organismi; per esempio, i più grandi genomi animali sono notevolmente più piccoli dei genomi della maggior parte dei protisti e delle piante. L’iniziale convinzione che il numero di geni do-

dei seguenti tipi: H2A, H2B, H3 e H4 (Figura 2.18a). Attorno a tale nucleo è avvolto circa 1,65 volte un segmento di 147 bp di DNA (Figura 2.18b). In questa configurazione il DNA è compattato circa di un fattore sei. I singoli nucleosomi sono connessi fra loro tramite DNA linker (vedi Figura 2.18b). La lunghezza del linker è variabile sia all’interno di un singolo organismo sia fra diversi organismi; per esempio, i DNA linker nell’uomo sono lunghi da 38 a 53 bp. Il successivo livello di compattamento della cromatina è dovuto all’istone H1. Una singola molecola di H1 si lega sia al filamento linker a una estremità del nucleosoma, sia al centro della sequenza di DNA avvolta intorno al “core” istonico. Il legame di H1 induce il DNA nucleosomico ad assumere una forma più regolare con un andamento a zig zag (Figura 2.18c). Successivamente, i nucleosomi stessi si compattano in una struttura dal dia-

vesse essere direttamente proporzionale al grado di complessità degli organismi sembrò in conflitto con le reali osservazioni relative alle dimensioni dei genomi. Studiando il contenuto dei genomi, il problema è stato parzialmente risolto. Le dimensioni del genoma sono determinate prevalentemente dal DNA ripetuto. Le ripetizioni nel genoma hanno come conseguenza l’aumento del valore C. Organismi con genomi di grandi dimensioni hanno una quantità elevata di DNA ripetuto e, invece, il numero di geni è relativamente poco correlato alla dimensione del genoma. I virus e i batteri contengono quantità ridotte di DNA ripetuto, mentre negli eucarioti quest’ultimo può variare da un minimo del 15% nel pesce palla, Takifugu, fino a costituire la parte predominante del genoma. Note oggi le diverse sequenze del genoma di vari organismi (vedi Capitolo 8), è chiaro che il numero di geni, pur crescendo in linea di massima nella scala evolutiva degli organismi considerati, non sempre spiega la complessità biologica, come nel caso dell'uomo. Molto, infatti, resta ancora da capire sulla regolazione dei geni e sul ruolo delle sequenze ripetute contenute nel genoma.

metro di circa 30 nm definita fibra cromatinica da 30 nm (Figure 2.19 e 2.22c). Uno dei modelli proposti per tale fibra cromatinica, il modello a solenoide, prevede che i nucleosomi si avvolgano formando un’elica (Figura 2.19). Un altro modello, più recente, propone che la fib) Struttura di base dei nucleosomi nella cromatina a “filo di perle” largo 11 nm ⫻ spesso 5,7 nm

DNA linker Nucleosoma H1

c) Condensazione della cromatina mediante il legame di H1

a) Nucleo istonico H2A H2B

H4 H3

Figura 2.18 Struttura di base del cromosoma eucariote.

28

Capitolo 2

Cromatidi fratelli

Figura 2.19 La fibra cromatinica da 30 nm. Modello a solenoide per l’impacchettamento dei nucleosomi nella fibra di cromatina da 30 nm (H1 non e ` mostrato).

bra da 30 nm sia un filamento irregolare di nucleosomi con andamento a zig zag. Il compattamento della cromatina oltre il filamento da 30 nm, che è necessario per spiegare la condensazione dei cromosomi nella metafase della divisione cellulare (vedi Capitolo 12), è assai meno noto. I modelli correnti sono basati su fotografie d’epoca, risalenti agli anni settanta del XX secolo, di cromosomi metafasici osservati al microscopio elettronico previa rimozione della loro componente istonica (Figura 2.20). (I cromosomi metafasici sono i cromosomi duplicati di una cellula che non ha subito ancora la divisione, osservabili in metafase, nel momento di massima condensazione.) Tali foto mostrano la caratteristica forma a X della coppia di cromatidi fratelli, costituita da anse di DNA di 30-90 kb attaccate a una “impalcatura” proteica. Se gli istoni non vengono rimossi, è possibile osservare come la fibra da 30 nm formi domini ad ansa, simili a quelli trovati nei cromosomi procariotici superavvolti. Un cromosoma umano di medie dimensioni presenta approssimativamente 2000 domini ad ansa. Ogni dominio ad ansa è ancorato alla base da proteine non istoniche che costituiscono l’impalcatura cromosomica (scaffold) (Figura 2.21a). Particolari regioni del DNA, le SAR (Scaffold Associated Regions, “regioni associate alla impalcatura”), si legano alle proteine non istoniche per rendere possibile la formazione delle anse.

Centromero

Figura 2.20 Fotografia al microscopio elettronico di un cromosoma metafasico privato degli istoni. Il cromosoma privo di istoni mantiene la sua morfologia generale attraverso un’impalcatura di proteine non istoniche (scaffold) dalla quale si protendono le anse di DNA.

Il metodo più semplice consiste nel raffigurare queste anse organizzate in forma di spirale intorno all’impalcatura cromosomica centrale (Figura 2.21b). In sezione trasversale le anse sembrerebbero disposte come i petali di un fiore. Il diametro della cromatina ad ansa è di circa 300 nm, per questo si parla di fibra cromatinica da 300 nm. In un cromosoma mitotico gli stessi domini ad ansa si avvolgono, secondo modalità non ancora completamente note, determinando un ulteriore compattamento della cromatina che porta alla formazione del cromosoma metafasico, il quale rappresenta il maggior livello di condensazione. Lo spessore di un cromatidio è infatti pari a 700 nm. Il ripiegamento segue un processo estremamente preciso e i diversi geni sono sempre posizionati allo stesso punto del cromosoma metafasico (la Figura 2.22 riassume i vari livelli di condensazione della cromatina). I cromosomi eucarioti non sono organizzati in strutture rigide; infatti, la maggior parte delle regioni del cromosoma ha strutture dinamiche che si srotolano quando il

a) Domini ad ansa di fibre di cromatina da 30 nm ancorate all’impalcatura cromosomica formano la fibra di 300 nm b) Modello di una sezione del cromosoma metafasico

Ansa del DNA

Altre componenti non istoniche dell’impalcatura Impalcatura cromosomica

Figura 2.21 I domini ad ansa dei cromosomi metafasici. (a) Anse di fibre da 30 nm attaccate alle regioni associate all’impalcatura dei cromosomi (scaffold) per mezzo di proteine non istoniche formano fibre di 300 nm di diametro. (b) Schema di una sezione del cromosoma metafasico. Viene mostrata la disposizione a spirale dei domini ad ansa. Per semplicità, sono illustrati otto domini ad ansa per giro; una più accurata stima lascia pensare che si arrivi a 15 per giro. Con un tale numero di domini ad ansa per giro, si stima che il diametro di un braccio di un cromatidio possa raggiungere i 700 nm.

DNA: il materiale genetico (a)

29

(b) Collana di perle

Nucleosoma, 11 nm Proteine istoniche

Fibra da 10 nm Ottameri istonici 146 paia di basi di DNA avvolte intorno al core istonico

Fibra da 10 nm

Istone H1 DNA linker

Duplex di DNA, 2 nm DNA core

(c) Solenoide (34 nm), fibra da 30 nm

Nucleosoma

Istone H1

Vista dall’estremità del solenoide

Vista laterale del solenoide Solenoide (34 nm), fibra da 30 nm

Cromatina estesa, 300 nm

(e) Cromatidi

Proteina di collegamento (impalcatura) Centromero

Cromatina condensata, 1400 nm

(d)

Braccio di cromosoma spiralizzato, 700 nm

Figura 2.22 Condensazione del materiale nucleare. Organizzazione gerarchica della cromatina e del cromosoma.

gene è attivo e si compattano di nuovo quando il gene cessa la sua attività. Tale regolazione viene realizzata “localmente” mediante modifiche epigenetiche sul DNA e sugli istoni da parte di specifici enzimi (vedi Capitolo 18). Eucromatina ed eterocromatina Il grado di impacchettamento del DNA cambia nel corso del ciclo cellulare. La fase di minor compattamento corrisponde all’inizio della fase S, quando i cromosomi sono in procinto di duplicarsi, mentre durante la fase M si osserva il maggior grado di impacchettamento. La condensazione della cromatina varia però anche da una regione all’altra del cromosoma, in modo direttamente correlabile alla tra-

scrizione genica. Durante l’interfase (complessivamente le fasi G1-S-G2), infatti, le regioni contenenti geni trascrizionalmente attivi hanno un minor grado di condensazione della cromatina rispetto a regioni inattive. Sulla base della colorabilità del cromosoma si definiscono due forme di cromatina. L’eucromatina rappresenta quelle regioni cromosomiche che mostrano la normale condensazione e decondensazione durante il ciclo cellulare. Visivamente l’eucromatina mostra una variazione nell’intensità della colorazione, da più scura in metafase a più chiara nella fase S. La maggior parte del genoma di una cellula attiva è eucromatica. L’eucromatina è tipicamente: (1) trascritta in

30

Capitolo 2

modo attivo in maniera tale che i geni in essa contenuti possano essere espressi, e (2) priva di sequenze ripetute. L’eterocromatina, al contrario, rappresenta cromosomi o regioni cromosomiche che usualmente rimangono allo stato condensato e che, nel corso dell’intero ciclo cellulare, si colorano in modo più scuro dell’eucromatina, anche in interfase. L’eterocromatina spesso replica in ritardo nella fase S rispetto al resto del DNA. I geni che si trovano all’interno dell’eterocromatina sono trascrizionalmente inattivi. Vi sono due tipi di eterocromatina. L’eterocromatina costitutiva è presente in tutte le cellule nella identica posizione su entrambi i cromosomi omologhi di una coppia; questa forma di eterocromatina consiste per la maggior parte di sequenze di DNA ripetuto ed è esemplificata dalle regioni centromeriche e telomeriche. L’eterocromatina facoltativa, al contrario, varia di condizione nei differenti tipi cellulari, nei diversi stadi di sviluppo o, talvolta, da un cromosoma omologo all’altro. Questa forma di eterocromatina rappresenta segmenti di eucromatina condensati e perciò inattivi. Il corpo di Barr, un cromosoma X inattivo presente nelle cellule somatiche delle femmine dei mammiferi, costituisce un esempio di eterocromatina facoltativa (vedi Capitolo 12). DNA centromerico e telomerico Il centromero e il telomero sono due regioni specializzate dei cromosomi eucarioti. Il centromero è la regione di un cromosoma contenente sequenze di DNA a livello del quale si localizzano le strutture proteiche dette cinetocori che permettono l’ancoraggio delle fibre del fuso mitotico e meiotico e l’accurata separazione dei cromosomi e dei cromatidi fratelli nelle cellule figlie durante la divisione cellulare (vedi Capitolo 12). Al microscopio il centromero di un cromosoma metafasico (Figure 2.20 e 2.22e) appare come una restrizione del cromosoma. Le sequenze dei centromeri sono state analizzate dettagliatamente in pochi organismi, fra cui il lievito Saccharomyces cerevisiae. Tali sequenze nel lievito sono chiamate sequenze CEN (da centromero). Sebbene ogni centromero di lievito svolga la stessa funzione, le regioni CEN sono molto simili tra loro relativamente a sequenza nucleotidica e organizzazione, ma non sono identiche. In ogni cromosoma di lievito la regione del centromero consiste di 112-120 bp che possono essere distinte in tre domini di sequenze (elementi del DNA Regione CDE:

Nota chiave I cromosomi contenuti nei nuclei delle cellule eucariote sono complessi costituiti da DNA, proteine istoniche e non istoniche. Ogni cromosoma consiste di una molecola di DNA lineare a doppio filamento ininterrotto, che si estende per tutta la lunghezza del cromosoma. Vi sono cinque tipi principali di istoni (H1, H2A, H2B, H3 e H4) costanti in tutte le cellule di un organismo. Le proteine non istoniche, delle quali esistono diversi tipi, variano in maniera significativa a seconda della tipologia cellulare, sia all’interno di un organismo sia tra organismi differenti, come pure entro lo stesso tipo cellulare con il variare del tempo. La grande quantità di DNA presente nel cromosoma eucariote è resa compatta dall’associazione con gli istoni nei nucleosomi e da livelli superiori di ripiegamento dei nucleosomi nelle fibre di cromatina. Ogni cromosoma contiene un elevato numero di domini ad ansa delle fibre di cromatina da 30 nm ancorati all’impalcatura proteica. Lo stato funzionale del cromosoma è in relazione al grado di condensazione: le regioni contenenti geni attivi sono meno condensate rispetto alle regioni contenenti geni inattivi.

centromerico o CDE; Figura 2.23). Il dominio CDEII, una regione di 78-86 bp con più del 90% di coppie di basi A-T, rappresenta il dominio più esteso. Lo affiancano da una parte il CDEI, che ha una sequenza di 8 bp (RTCACRTG, dove R è una purina, A o G), e dall’altro lato il CDEIII, dominio costituito da una sequenza di 26 bp ricca in A-T. Le sequenze dei centromeri sono state determinate per un certo numero di altri organismi e differiscono sia da quelle del lievito sia fra di loro. Per esempio, i centromeri di un altro lievito Schizosaccharomyces pombe sono lunghi 40-80 kb e presentano un’organizzazione complessa di parecchie sequenze ripetute. I centromeri umani sono addirittura più lunghi, con una dimensione che varia da 240 kb a parecchi milioni di coppie di basi; il centromero più lungo possiede dimensioni maggiori rispetto a quelle di alcuni genomi batterici! Pertanto, sebbene i centromeri esplichino le stesse funzioni in tutti gli eucarioti, non esiste una sequenza unica responsabile di tale funzione.

I

II

III

RTCACRTG

7 8 – 8 6 b p ( > 9 0 % AT )

tGttTttG–tTTCCGAA––––aaaaa

8 bp Figura 2.23 Sequenza consenso dei centromeri del lievito Saccharomyces cerevisiae. Le coppie di basi presenti in 15 dei 16 centromeri sono altamente conservate e sono indicate con lettere maiu-

26 bp scole. Le coppie di basi (bp) presenti in 10-13 dei 16 centromeri sono conservate e sono indicate con lettere minuscole. Le posizioni non conservate sono indicate con trattini. (R = purina.)

DNA: il materiale genetico

Il telomero è costituito da una sequenza specifica posizionata alla fine di un cromosoma lineare, stabilizza il cromosoma e svolge una precisa funzione durante la replicazione (vedi Capitolo 3). Ogni cromatidio presenta due estremità e, pertanto, due telomeri. Nella maggior parte degli organismi studiati i telomeri sono posizionati all’interno della membrana nucleare e spesso sono associati gli uni agli altri e alla membrana nucleare stessa. Tutti i telomeri di una specie presentano una stessa sequenza, ma le sequenze telomeriche differiscono tra le diverse specie. È possibile suddividere gran parte delle sequenze telomeriche in due tipi. 1. Le sequenze telomeriche semplici sono situate alle estremità del DNA cromosomico. A seconda degli organismi e del loro stadio di sviluppo esistono copie di tali sequenze che si ripetono dalle 100 alle 1000 volte. Queste sono componenti funzionali essenziali della regione telomerica, in quanto sono sufficienti a garantire la stabilità delle estremità cromosomiche, e consistono in una serie di semplici sequenze di DNA ripetute una dopo l’altra (definite sequenze di DNA ripetute in tandem). Per esempio, nel ciliato Tetrahymena, leggendo la sequenza in direzione della fine di un filamento di DNA, la sequenza ripetuta è 5′-TTGGGG3′, mentre nell’uomo e negli altri vertebrati la sequenza ripetuta è 5′-TTAGGG-3′ (Figura 2.24a). Differenti ricercatori possono descrivere la sequenza telomerica ripetuta nell’uomo e negli altri vertebrati come 5′-GGTTAG-3′ o come 5′-GGGTTA-3′, a seconda del punto di inizio della lettura. Si noti che il DNA telomerico localizzato alla fine del cromosoma non è a doppio filamento. Secondo un modello, il DNA telomerico è ripiegato all’indietro su se stesso, formando un t-loop (Figura 2.24b). L’estremità a singolo filamento invade le sequenze telomeriche a doppio filamento, determinando la formazione di un D-loop (displacement loop). 2. Le sequenze associate ai telomeri sono regioni interne alle sequenze telomeriche semplici. Tali regioni contengono spesso sequenze ripetute complesse che si estendono per parecchie migliaia di coppie di basi a partire dall’estremità del cromosoma. Il significato di queste sequenze non è ancora noto. Il DNA telomerico a singolo e doppio filamento è legato da proteine, come le TRF (Telomeric Repeat binding Factor), a loro volta associate a complessi proteici con funzione strutturale e regolativa. I telomeri di mammifero contengono anche nucleosomi e mostrano regioni fortemente eterocromatiche. Tuttavia, il telomero è una struttura dinamica che può cambiare conformazione per permettere l’accesso sul DNA all’enzima telomerasi, responsabile del mantenimento delle estremità telomeriche (vedi Capitolo 3). Mentre i telomeri della gran parte de-

31

gli eucarioti contengono sequenze corte, semplici e ripetute, i telomeri di Drosophila sono strutturalmente molto differenti. In particolare, questi ultimi sono costituiti da trasposoni, sequenze di DNA che possono spostarsi in altri punti del genoma (vedi Capitolo 7).

DNA a sequenza unica e a sequenza ripetuta Dopo aver compreso la struttura di base e l’organizzazione del DNA nei cromosomi, è possibile discutere in merito alla distribuzione di alcune sequenze nei genomi dei procarioti e degli eucarioti. I risultati di analisi molecolari hanno permesso ai genetisti di scoprire che alcune sequenze sono presenti una sola volta nei genomi, mentre altre sequenze sono ripetute. Per comodità, queste sequenze sono raggruppate in tre categorie: DNA a sequenza unica (sequenze presenti da una a poche copie nel genoma), DNA moderatamente ripetuto (sequenze presenti da poche fino a 105 copie) e DNA altamente ripetuto (sequenze presenti da 105 a 107 copie nel genoma). Nei procarioti, con l’eccezione dei geni per l’RNA ribosomale, dei geni per l’RNA transfer e di poche altre sequenze, tutto il genoma è presente come DNA a sequenza unica. Il genoma degli eucarioti, al contrario, è costituito sia da DNA a sequenza unica sia da DNA a sequenze ripetute, queste ultime molto complesse per numero di tipi, numero di copie e distribuzione. Allo stato attuale si dispone di informazioni approssimative sulla distribuzione delle varie classi di sequenze nel genoma. Tuttavia, man mano che saranno determinate le sequenze del DNA a) Sequenze telomeriche semplici ripetute in un cromosoma umano T T A G G G T T A G G G T T A G G G OH 3„ A A T C C C 5„ La lunghezza della sporgenza varia b) Modello a t-loop nei telomeri t-loop

D-loop 5„ ... 3„ ...

5„ 3„

Figura 2.24 Telomeri. (a) Sequenze telomeriche semplici ripetute alle estremità di un cromosoma umano. (b) Modello della struttura di un telomero in cui il DNA telomerico si avvolge all’indietro formando un’ansa (t-loop). L’estremità a singolo filamento si insinua tra le sequenze telomeriche a doppio filamento formando un D-loop (displacement loop).

32

Capitolo 2

di un numero sempre maggiore di genomi eucarioti, verrà acquisita una conoscenza precisa dell’organizzazione molecolare del DNA a sequenza unica e ripetuta. DNA a sequenza unica Le sequenze uniche, talvolta denominate sequenze a singola copia, sono presenti nel genoma in copia unica. (Se ne trovano quindi due copie in ogni cellula diploide.) Nell’uso corrente il termine si applica alle sequenze che sono presenti nel genoma in una o poche copie. La maggior parte dei geni conosciuti, ovvero i geni che codificano per le proteine della cellula, rientra nella classe dei DNA a sequenza unica. Si stima che nell’uomo le sequenze uniche rappresentino circa il 55-60% del genoma. DNA a sequenza ripetuta Entrambe le sequenze classificate come DNA moderatamente ripetuto e altamente ripetuto sono presenti numerose volte nel genoma. Tali sequenze possono essere organizzate nel genoma in due modi: distribuite a intervalli irregolari (conosciute come DNA ripetuto disperso oppure DNA ripetuto intersperso) o raggruppate insieme in “cluster”, disposizione in cui le sequenze si ripetono molte volte una dopo l’altra lungo il filamento (DNA ripetuto in tandem). Le sequenze di DNA ripetuto disperso consistono di famiglie di sequenze ripetute sparse nel genoma insieme a DNA a sequenza unica. Ogni famiglia consiste di una serie di sequenze correlate caratteristiche della famiglia stessa. Spesso poche famiglie presentano un numero di copie molto elevato e costituiscono la maggior parte delle sequenze ripetute disperse nel genoma. Si conoscono due tipi di sequenze disperse: (1) lunghe sequenze ripetute intersperse (LINE, Long Interspersed Elements), caratterizzate da una lunghezza di circa 1000-7000 bp, e (2) corte sequenze ripetute intersperse (SINE, Short Interspersed Elements), lunghe approssimativamente da 100 a 400 bp. Tutti gli eucarioti hanno sia SINE sia LINE, con grandi variazioni nelle proporzioni dei due tipi di sequenze. L’uomo e le rane, per esempio, hanno prevalentemente SINE, mentre Drosophila e gli uccelli hanno soprattutto LINE. Le LINE e le SINE rappresentano una proporzione significativa di tutto il DNA moderatamente ripetuto presente nel genoma. I genomi dei mammiferi diploidi possiedono circa 500 000 copie della famiglia LINE-1 (L1), che rappresenta circa il 15% del genoma. Possono essere presenti anche altre famiglie LINE, ma in misura notevolmente minore rispetto alla L1. La lunghezza completa delle sequenze della famiglia LINE-1 è pari a 6-7 kb, sebbene la maggior parte di queste ultime sia costituita da elementi tronchi di circa 1-2 kb. Gli elementi completi della famiglia LINE1 sono trasposoni, ovvero segmenti di DNA che si possono spostare da un posto all’altro del genoma e che codificano per gli enzimi necessari al loro stesso movimento.

Le famiglie SINE si trovano in diverse specie di eucarioti, compresi i mammiferi, gli anfibi e il riccio di mare. Ogni specie con SINE ha la sua caratteristica distribuzione di famiglie SINE. Una famiglia SINE ben studiata è la famiglia Alu di alcuni primati. Quest’ultima deriva la propria denominazione dal sito di taglio per l’enzima di restrizione Alu1, che si ritrova tipicamente nelle sequenze ripetute. Nell’uomo la Alu costituisce la famiglia di tipo SINE più abbondante del genoma; essa consiste di sequenze di 200-300 bp, ripetute fino a un milione di volte, che costituiscono fino al 9% del DNA aploide. In media nel genoma una ripetizione Alu si trova ogni 5000 bp. Anche le SINE sono trasposoni, ma tali sequenze non codificano gli enzimi necessari al loro movimento; tuttavia, esse possono muoversi qualora gli enzimi vengano forniti da un trasposone LINE attivo. Le sequenze di DNA ripetuto in tandem sono disposte l’una dopo l’altra nel genoma in un’organizzazione testa-coda. Il DNA ripetuto in tandem è comune nei genomi degli eucarioti. In alcuni casi questo tipo di DNA è organizzato in corte sequenze della lunghezza di 1-10 bp, mentre in altri casi le sequenze ripetute sono associate a geni e sono molto più lunghe. Le sequenze telomeriche ripetute in tandem mostrate nella Figura 2.24a non sono geni, mentre i geni per l’RNA ribosomale (vedi Capitolo 6) sono geni ripetuti in tandem, spesso organizzati in uno o più raggruppamenti (cluster) nella maggior parte degli eucarioti. La quantità maggiore di DNA ripetuto in tandem è associata ai centromeri e ai telomeri. In ogni centromero si trovano da centinaia a migliaia di copie di sequenze semplici, corte e ripetute in tandem (sequenze altamente ripetute). Infatti, una significativa proporzione del genoma degli eucarioti può essere costituita dalle sequenze altamente ripetute presenti in corrispondenza dei centromeri: 8% nel topo, circa 50% nel topo canguro e approssimativamente 5-10% nell’uomo. (Si rimanda al Capitolo 9 per la descrizione di quanto appreso dal sequenziamento del genoma in merito all’organizzazione dei geni e delle sequenze ripetute nel genoma umano, e al Capitolo 10 per una discussione più dettagliata sul DNA non codificante ripetuto in tandem.)

Nota chiave I genomi dei procarioti consistono principalmente di DNA a sequenza unica, con solo poche sequenze e geni ripetuti. Gli eucarioti hanno nel genoma sequenze sia uniche sia ripetute, con un ampio e complesso spettro delle sequenze di DNA ripetute tra le diverse specie. Alcune delle sequenze ripetute sono geni, ma la maggior parte non lo sono.

DNA: il materiale genetico

33

Sommario l Gli organismi contengono materiale genetico che controlla le caratteristiche di un individuo e viene trasmesso dai genitori alla progenie. l L’acido desossiribonucleico (DNA) costituisce il materiale genetico di tutti gli organismi e di molti virus. Soltanto in alcuni virus l’acido ribonucleico (RNA) è il materiale genetico. Nei procarioti e negli eucarioti il DNA è sempre a doppio filamento, mentre nei virus il materiale genetico può essere DNA o RNA a singolo o doppio filamento, a seconda del tipo di virus. l Il DNA e l’RNA sono macromolecole composte da monomeri chiamati nucleotidi. Ogni nucleotide consiste di uno zucchero a cinque atomi di carbonio (desossiribosio nel DNA, ribosio nell’RNA) al quale sono legati una base azotata e un gruppo fosfato. Nel DNA le quattro possibili basi azotate sono l’adenina (A), la guanina (G), la citosina (C) e la timina (T), mentre nell’RNA sono l’adenina, la guanina, la citosina e l’uracile (U). l Secondo il modello di Watson e Crick, la molecola di DNA consiste di due catene polinucleotidiche (polimeri di nucleotidi) unite da legami idrogeno che si instaurano fra precise coppie di basi – adenina (A) con timina (T) e guanina (G) con citosina (C) – per formare una doppia elica. l I tre tipi di DNA individuati analizzando le sue molecole al di fuori delle cellule sono l’A-DNA (destrorso), il B-DNA (destrorso) e lo Z-DNA (sinistrorso). La forma più comune presente nelle cellule è strutturalmente molto simile al BDNA. L’A-DNA si trova nelle cellule a livello di particolari complessi DNA-proteine. Lo Z-DNA può essere ritrovato in ambiente intracellulare, ma il suo significato fisiologico non è stato ancora chiarito. l A seconda del tipo di virus, il materiale genetico può essere costituito da DNA a doppio filamento, DNA a singolo filamento, RNA a doppio filamento o RNA a singolo filamento; inoltre, l’acido nucleico dei virus può essere circolare o lineare. I genomi di alcuni virus sono organizzati in un singolo cromosoma, mentre altri possiedono un genoma segmentato. l Il materiale genetico dei procarioti è formato da DNA a doppio filamento organizzato in uno o pochi cromosomi. Tipicamente, i cromosomi procarioti sono circolari, sebbene in alcune specie sia possibile trovare cromosomi lineari.

l Il cromosoma dei batteri è compattato in una regione definita nucleoide, mediante il superavvolgimento dell’elica del DNA e la formazione di domini ad ansa del DNA superavvolto. l Il genoma degli eucarioti è distribuito in un certo numero di cromosomi lineari costituiti da complessi di DNA e proteine istoniche e non istoniche detti cromatina. Ogni cromosoma non duplicato consta di una molecola di DNA a doppio filamento, lineare e ininterrotta, che si estende per tutta la sua lunghezza; il DNA è avvolto e immagazzinato in vari modi. Le proteine istoniche sono uguali e costanti in tutte le cellule di un organismo, mentre le proteine non istoniche variano significativamente fra i differenti tipi cellulari. l Gran parte del DNA presente nei cromosomi eucarioti è reso compatto dall’associazione con proteine istoniche nei nucleosomi e da livelli superiori di ripiegamento dei nucleosomi nelle fibre di cromatina. Ciascun cromosoma nella sua forma altamente condensata è composto da un elevato numero di domini ad ansa di fibre di cromatina da 30 nm ancorate con un andamento a spirale a un’impalcatura proteica. Maggiore è il grado di condensazione di una regione cromosomica, minore sarà la probabilità che i geni di quella regione siano attivi. l La regione del centromero del cromosoma eucariote è responsabile dell’accurata segregazione dei cromosomi duplicati nelle cellule figlie durante la mitosi e la meiosi. Le sequenze del DNA dei centromeri variano poco nell’ambito di uno stesso organismo, mentre presentano un’elevata variabilità tra un organismo e l’altro. l I telomeri, posizionati nella parte terminale dei cromosomi eucarioti, sono spesso associati gli uni agli altri e alla membrana nucleare. I telomeri consistono di semplici e corte sequenze ripetute in tandem che sono specie-specifiche. l I genomi dei procarioti constano prevalentemente di sequenze uniche di DNA; essi presentano solo alcune sequenze e alcuni geni ripetuti. I genomi degli eucarioti contengono sequenze sia uniche sia ripetute. Le sequenze ripetute disperse sono localizzate tra le sequenze uniche, mentre il DNA ripetuto in tandem consiste di sequenze ripetute una dopo l’altra nel cromosoma. La complessità delle sequenze di DNA ripetuto negli eucarioti è notevole. Alcune sequenze ripetute sono trasposoni, elementi in grado di spostarsi da un posto all’altro all’interno del genoma.

Approccio analitico alla soluzione di problemi di genetica Il sistema più pratico per fissare i principi della genetica consiste nel risolvere i problemi. In questo e in tutti i capitoli seguenti discuteremo di come affrontare i problemi di genetica presentando esempi e discutendo le relative risposte. I problemi utilizzano esempi familiari e poco familiari e pongono domande finalizzate allo scopo di insegnare a pensare in modo analitico.

D2.1 Il cromosoma lineare del fago T2 è lungo 52 μm. Il cromosoma consiste di DNA a doppio filamento, con 0,34 nm tra ogni coppia di basi. Quante coppie di basi contiene un cromosoma di T2? R2.1 Questa domanda implica una accurata conversione delle differenti unità di misura. Il primo passo consiste nell’esprimere

34

Capitolo 2

le lunghezze nelle stesse unità: 52 μm sono 52 milionesimi di metro, ovvero 52 000 × 10–9 m, pari a 52 000 nm. Una base occupa 0,34 nm nella doppia elica, così il numero di coppie di basi in un cromosoma di T2 è 52 000 diviso 0,34 ovvero 152 941 coppie. Il genoma umano contiene 3 × 109 bp di DNA, per una lunghezza totale di circa un metro, distribuita tra 23 cromosomi. La lunghezza media di una doppia elica in un cromosoma umano è 3,8 cm, che è 3,8 centesimi di metro, ovvero 38 milioni di nm, molto più della lunghezza del cromosoma di T2! Vi sono più di 111,7 milioni di coppie di basi nel cromosoma medio umano. D2.2 La tabella seguente elenca la percentuale relativa delle basi degli acidi nucleici isolate nelle differenti specie. Per ogni specie che tipo di acido nucleico è coinvolto? È a filamento unico o doppio? Spiegate la vostra risposta. Specie

Adenina

Guanina

Timina

Citosina Uracile

(i)

21

29

21

29

0

(ii)

29

21

29

21

0

(iii)

21

21

29

29

0

(iv)

21

29

0

29

21

(v)

21

29

0

21

29

R2.2 Questa domanda si focalizza sul ruolo delle coppie di basi e sulle differenze tra DNA e RNA. Analizzando i dati forniti determineremo per prima cosa se l’acido nucleico è un DNA o un RNA e poi se è a filamento doppio o singolo. Se l’acido nucleico contiene timina allora è un DNA; se contiene uracile allora è un RNA. Così le specie (i), (ii) e (iii) devono avere DNA come loro materiale genetico e le specie (iv) e (v) devono avere RNA come loro materiale genetico. Successivamente dobbiamo analizzare i dati che si riferiscono al tipo di filamento. Il DNA a doppio filamento deve avere una eguale percentuale di A e di T nonché di G e C. Similmente un RNA a doppia elica deve avere una eguale percentuale di A e di U nonché di G e C. Pertanto le specie (i) e (ii) hanno DNA a doppio filamento, mentre la specie (iii) deve avere DNA a singolo filamento, dal momento che le regole di appaiamento delle basi sono violate in quanto A è diverso da T e G è diverso da C. Per quel che riguarda le specie contenenti RNA, la specie (iv) contiene RNA a doppio filamento, dal momento che A = U e G = C, e la specie (v) deve contenere RNA a filamento singolo. D2.3 Di seguito sono elencate quattro caratteristiche di un filamento 5′-3′ appartenente a una molecola di DNA a doppio filamento particolarmente lunga: I. il 35 % dei nucleotidi contenenti adenina (A) ha come vicino, in direzione 3′, un nucleotide contenente guanina (G); II. il 30% di A ha T come proprio vicino al 3′; III. il 25% di A ha G come proprio vicino al 3′; IV. il 10% di A ha A come proprio vicino al 3′. Usate le precedenti informazioni per rispondere alle seguenti domande nel modo più completo possibile, spiegando per ogni risposta il vostro ragionamento. a. Sul filamento di DNA complementare quali saranno le frequenze delle varie basi situate vicino ad A in direzione 3′? b. Sul filamento complementare quali saranno le frequenze delle varie basi vicino a T in direzione 3′?

c. Nel filamento complementare quali saranno le frequenze di ogni specie di base vicino a T in direzione 5′? d. Perché la percentuale di A non è uguale alla percentuale di T (e la percentuale di C non è uguale alla percentuale di G) tra i vicini di A in 3′ nel filamento 5′-3′ di DNA descritto? R2.3 a. Non si può rispondere a questa domanda senza ulteriori informazioni. Sebbene noi sappiamo che a ogni A che ha come vicino T nel filamento originale corrisponderà A vicino a T nel filamento complementare, vi saranno sicuramente nel filamento complementare ulteriori A di cui non sappiamo nulla. b. A questa domanda non si può dare risposta. A tutte le A nel filamento originale corrispondono T nel filamento complementare, ma noi conosciamo solo i vicini 5′ di queste T e non i vicini 3′. c. Sul filamento originale il 35% era 5′-AG-3′ di modo che, sul filamento complementare, il 35% delle sequenze sarà 3′-TC5′. Così il 35% delle basi vicino a T in direzione 5′ sarà C. Similmente, sul filamento originale, il 30% era 5′-AT-3′, il 25% era 5′-AC-3′ e il 10% era 5′-AA-3′; il che significa che sul filamento complementare il 30% delle sequenze sarà 3′TA-5′, il 25% sarà 3′-TG-5′ e il 10% sarà 3′-TT-5′. Così il 30% delle basi vicino a T in direzione 5′ sarà A, il 25% sarà G e il 10% sarà T. d. Le regole A-T e G-C si applicano solo quando si considerano entrambi i filamenti di un DNA a doppio filamento. In questo caso noi stiamo considerando solo il filamento originale. D2.4 Quando il DNA a doppio filamento è riscaldato a 100 °C i due filamenti si separano, poiché il legame idrogeno tra i filamenti si rompe. A certe condizioni, quando la soluzione si raffredda, i due filamenti possono ritrovarsi e riformare la doppia elica; il processo è chiamato rinaturazione. Considerate la seguente elica di DNA: G CG CG CG CG CG CG C CG CG CG CG CG CG CG

Se questo DNA è riscaldato a 100 °C e quindi raffreddato, quale potrebbe essere la struttura del singolo filamento se i due filamenti non si ricongiungono? R2.4 Questa domanda ha due scopi. Innanzitutto ripropone alcune informazioni circa il DNA a doppio filamento; secondariamente pone un problema che può essere risolto solo con la logica. Possiamo analizzare le sequenze di basi per vedere se vi è qualcosa da segnalare su di esse ed evitare una risposta del tipo “non succede niente di significativo”. Il DNA è un segmento di 14 bp di G-C e C-G che si alternano. Esaminando solo un filamento, si può notare a metà di esso un asse di simmetria tale che è possibile per un singolo filamento formare una molecola di DNA a doppio filamento semplicemente ripiegandosi su se stesso e appaiando le basi. Il risultato è una struttura a forcina a doppio filamento, come mostrato nel seguente diagramma (ricavato dal filamento superiore; l’altro filamento formerà egualmente una struttura a forcina). G CG CG CG CG CG CG C

3

La replicazione del DNA

Come si replica il DNA?

Come si replicano i cromosomi circolari dei procarioti e dei virus?

In che modo la DNA polimerasi sintetizza una nuova catena di DNA?

Qual è la sequenza temporale della replicazione del genoma di un organismo eucariote?

Come avviene la replicazione e si organizza il cromosoma a livello molecolare?

Come si replicano le estremità dei cromosomi degli eucarioti?

Attività Una proprietà fondamentale del materiale genetico è la sua capacità di replicarsi in modo tale che l’informazione genetica codificata dai nucleotidi possa essere trasmessa da ciascuna cellula alla sua discendenza. James Watson e Francis Crick compresero che la complementarità tra i filamenti del DNA era probabilmente alla base della replicazione del DNA. Tuttavia, cinque anni dopo la presentazione del modello di Watson e Crick, una volta che gli scienziati confermarono questa ipotesi, molte domande circa il meccanismo con cui si replica il DNA rimanevano ancora senza risposta. In questo capitolo sono descritti le fasi e gli enzimi coinvolti nella replicazione delle molecole di DNA nei procarioti e negli eucarioti. Quindi, nella iAttività viene offerta l’opportunità di analizzare le caratteristiche della replicazione del DNA di E. coli.

La replicazione del DNA è essenziale per la trasmissione del genoma e dei geni in esso contenuti da una generazione cellulare a un’altra e da una generazione di organismi alla successiva. L’obiettivo di questo capitolo consiste nella comprensione dei meccanismi di replicazione del DNA nei batteri e negli eucarioti, e nella conoscenza di alcune delle proteine e degli enzimi necessari alla replicazione. Alcuni di questi enzimi sono coinvolti anche nella riparazione dei danni al DNA, che verranno discussi nel Capitolo 7, e sono utilizzati per applicazioni biotecnologiche che saranno discusse nel Capitolo 10.

La replicazione semiconservativa del DNA Quando Watson e Crick nel 1953 proposero il loro modello a doppia elica del DNA, capirono che, se la loro ipotesi fosse stata corretta, la modalità di replicazione

del DNA sarebbe stata semplice. Vale a dire, se la molecola di DNA fosse stata srotolata e le due eliche separate, ogni elica avrebbe potuto essere lo stampo per la sintesi di un nuovo filamento complementare di DNA. Questo modello di replicazione del DNA è noto come modello semiconservativo, poiché ogni molecola figlia conserva una delle due eliche parentali (Figura 3.1a). A quei tempi erano stati proposti altri due modelli per la replicazione del DNA, il modello conservativo (Figura 3.1b) e il modello dispersivo (Figura 3.1c). Nel modello conservativo, le due eliche di DNA parentali rimangono insieme o si riassociano dopo la replicazione e nell’insieme funzionano da stampo per la sintesi di nuove doppie eliche di DNA figlie. Così, una delle due molecole di DNA figlie è in realtà la doppia elica parentale, mentre l’altra è costituita interamente di nuovo materiale. Nel modello dispersivo, la doppia elica parentale viene tagliata in segmenti di DNA a doppia elica che funzionano da stampo per la sintesi di nuovi segmenti di DNA. In qualche modo, i segmenti si riassociano in doppie eliche complete di DNA, con segmenti parentali e segmenti figli mescolati. In questo modo, sebbene le due molecole figlie di DNA siano identiche relativamente alla loro sequenza di coppie di basi, il DNA parentale a doppio filamento viene disperso in entrambe le molecole figlie. È difficile immaginare come le sequenze di DNA dei cromosomi possano essere mantenute inalterate con un meccanismo del genere. Questo modello è stato tuttavia incluso nella trattazione per completezza storica.

L’esperimento di Meselson e Stahl Nel 1958, Matthew Meselson e Frank Stahl ottennero la prova sperimentale che il modello di replicazione se-

nimazione L’esperimento di Meselson e Stahl

MyLab

36

Capitolo 3 a) Modello semiconservativo

b) Modello conservativo

c) Modello dispersivo

Parentale

Parentale

Parentale

Dopo il primo ciclo di replicazione

Dopo il primo ciclo di replicazione

Dopo il primo ciclo di replicazione

Dopo il secondo ciclo di replicazione

Dopo il secondo ciclo di replicazione

Dopo il secondo ciclo di replicazione

Figura 3.1 Tre modelli per la replicazione del DNA. I filamenti parentali sono mostrati in rosso e quelli neosintetizzati sono mostrati in blu.

miconservativo era quello corretto. Meselson e Stahl fecero crescere il batterio Escherichia coli in un terreno minimo in cui la sola fonte di azoto era 15NH4Cl (cloruro di ammonio) (Figura 3.2). In questo composto il normale isotopo dell’azoto, 14N, è sostituito dall’isotopo pesante, 15N. (Nota: la densità è il peso diviso per il volume, per cui 15N, con un neutrone supplementare nel suo nucleo, è 1/14 più denso di 14N.) Come risultato, tutte le molecole batteriche contenenti azoto, incluso il DNA, contenevano 15N invece di 14N.

Centrifugazione all’equilibrio in gradiente di densità

Negli esperimenti che implicano la centrifugazione all’equilibrio in gradiente di densità, una soluzione concentrata di cloruro di cesio (CsCl) viene centrifugata ad alta velocità. Le forze opposte di sedimentazione e di diffusione producono un gradiente di concentrazione di CsCl stabile e lineare. Le densità di CsCl alle estremità del gradiente sono correlate alla concentrazione del CsCl che viene centrifugato. Per esempio, al fine di esaminare DNA con densità di 1,70 g/cm3 (densità tipica del DNA), viene prodotto un gradiente che copre quella densità – per Figura box 3.1 Diagramma schematico che illustra la separazione di DNA con diverse densità mediante centrifugazione all’equilibrio in un gradiente di densità di cloruro di cesio. Viene mostrata la separazione di DNA 14N e DNA 15N.

esempio da 1,60 a 1,80 g/cm3. Se il DNA è mescolato con il CsCl e tale miscela viene centrifugata, il DNA si metterà in equilibrio nel punto del gradiente in cui la sua densità è uguale a quella del CsCl circostante (vedi Figura box 3.1). Si dice che il DNA ha formato una banda nel gradiente. Se sono presenti DNA con differenti densità, come nel caso di DNA 15N- 15N e DNA 14N- 14N, essi formeranno bande (giungeranno all’equilibrio) in posizioni diverse. Il DNA viene rilevato in base all’assorbimento di raggi UV.

DNA in CsCl

La centrifugazione per 50-60 ore a 100 000!g dà luogo alla formazione di un gradiente di CsCl con bande di DNA

Densità crescente

Box 3.1

Come passaggio successivo, i batteri marcati 15N venivano trasferiti in un terreno contenente azoto nella forma normale 14N e lasciati replicare nelle nuove condizioni per molte generazioni. Tutto il nuovo DNA sintetizzato dopo il trasferimento era marcato con 14N. Quando i batteri iniziarono a riprodursi nel terreno contenente 14N, campioni di E. coli vennero prelevati in tempi successivi, e il DNA venne estratto e analizzato per determinarne la densità (Figura 3.2). La tecnica usata era la centrifugazione all’equilibrio in gradiente di densità (descritta nel Box 3.1).

DNA 14N-14N

DNA 15N-15N

La replicazione del DNA Coltura di E. coli

DNA in gradiente di CsCl

Composizione del DNA

Fotografia delle bande di DNA

37

Misurazione densitometrica

Inizio DNA pesante (15N-15N) Terreno contenente 15N Proseguimento della crescita per una generazione in terreno 14N Primo ciclo di replicazione

DNA di densità intermedia (ibrido 15N-14N)

Proseguimento della crescita Secondo ciclo di replicazione

DNA leggero (14N-14N)

DNA di densità intermedia (15N-14N)

Proseguimento della crescita Terzo ciclo di replicazione

14N-14N

14N-14N

14N-14N

15N-14N 15 N 15 N14 N 15 N14 N 14 N-

) ante (pes DNA brido) (i ) DNA eggero (l

DNA

) ante (pes DNA brido) (i ) DNA eggero (l

DNA

In breve in questa tecnica, mediante centrifugazione ad alta velocità, una soluzione di cloruro di cesio (CsCl) forma un gradiente di densità, con il materiale più leggero in alto nella provetta e il materiale più denso in basso. Il DNA presente nella soluzione durante la centrifugazione si depositerà formando una banda in corrispondenza della posizione in cui la sua densità è la stessa del cloruro di cesio circostante. DNA marcato 15N (15N-15N DNA) e DNA marcato 14N (14N-14N DNA) formano bande in posizioni distinte in un gradiente CsCl, come illustrato nel Box 3.1. Dopo un ciclo di replicazione (una generazione) in terreno contenente 14N, tutto il DNA aveva una densità esattamente intermedia fra quella del DNA 15N e quella del DNA 14N. Dopo due cicli di replicazione, metà del DNA era ancora di densità intermedia mentre l’altra metà era della densità del DNA 14N. Queste osservazioni, presentate nella Figura 3.2, e quelle ottenute dai suc-

15 N 15 N14 N 15 N14 N 14 N-

Figura 3.2 L’esperimento di Meselson e Stahl. Dimostrazione della replicazione semiconservativa in E. coli. Le cellule erano fatte crescere in terreno contenente 15N per numerosi cicli di replicazione e poi trasferite in terreno contenente 14N. In tempi successivi, per molti cicli di replicazione, venivano prelevati dei campioni; il DNA veniva estratto e analizzato mediante centrifugazione all’equilibrio in gradiente di CsCl. L’interpretazione schematica della composizione del DNA a diverse generazioni, le fotografie delle bande di DNA e un’analisi densitometrica delle bande sono mostrate in figura.

cessivi cicli di replicazione erano esattamente quelle previste dal modello semiconservativo. Se il modello conservativo di replicazione del DNA fosse stato corretto, dopo un ciclo di replicazione si sarebbero dovute vedere due bande di DNA: una banda di DNA 15N-15N nella posizione di densità pesante del gradiente, in quanto contenente le molecole di DNA parentali; l’altra banda, di DNA 14N-14N, nella posizione di densità leggera, in quanto contenente le molecole di DNA di nuova sintesi con entrambe le eliche marcate con 14N (Figura 3.1b). La banda parentale pesante si sarebbe dovuta vedere a ogni ciclo successivo di replicazione nella quantità trovata all’inizio dell’esperimento. Tutte le nuove molecole di DNA avrebbero dovuto avere entrambe le eliche con solo 14N. Di conseguenza, la quantità di DNA 14N-14N nella posizione di densità leggera sarebbe dovuta aumentare a ogni ciclo di replicazione. Secondo il modello conservativo di replicazione

38

Capitolo 3

del DNA, la previsione più significativa era che in nessun momento si sarebbe dovuto trovare DNA di densità intermedia. Il fatto che si sia trovato DNA di densità intermedia escludeva il modello conservativo. Se il modello dispersivo di replicazione del DNA fosse stato corretto, tutto il DNA presente nel terreno contenente 14N dopo un ciclo di replicazione sarebbe stato di densità intermedia (14N-15N) (vedi Figura 3.1c), circostanza effettivamente rilevata nell’esperimento di Meselson e Stahl. Il modello dispersivo prevedeva che, dopo un secondo ciclo di replicazione nello stesso terreno, i segmenti di DNA della prima generazione sarebbero stati dispersi nelle doppie eliche di DNA prodotte. Quindi, i segmenti di DNA 15N-15N, dispersi nel nuovo DNA 14N-14N dopo un ciclo di replicazione, avrebbero dovuto distribuirsi nel doppio di molecole di DNA dopo due cicli di replicazione. Come risultato, le molecole di DNA si sarebbero dovute trovare in una banda situata a metà fra la posizione della banda a densità intermedia 15N-14N e quella della banda a densità leggera 14N-14N. Con cicli di replicazione successivi, sarebbe stata presente un’unica banda che sarebbe dovuta diventare sempre più leggera come densità a ogni ciclo di replicazione. I risultati ottenuti da Meselson e Stahl non si adattavano a queste previsioni e, quindi, il modello dispersivo venne escluso. Successivamente, esperimenti di altri ricercatori dimostrarono che anche negli eucarioti la replicazione del DNA è semiconservativa.

Nota chiave La replicazione in E. coli e in altri procarioti, così come negli eucarioti, avviene con un meccanismo semiconservativo nel quale i filamenti del DNA a doppia elica si separano e nuovi filamenti complementari vengono sintetizzati sui due filamenti parentali (che funzionano da stampo). La replicazione semiconservativa dà origine a due molecole di DNA a doppio filamento, ognuna delle quali ha un filamento parentale e l’altro di nuova sintesi.

Le DNA polimerasi, enzimi coinvolti nella replicazione del DNA Nel 1955, Arthur Kornberg e colleghi furono i primi a identificare gli enzimi necessari per la replicazione del DNA. Il loro lavoro si concentrò sui batteri, presupponendo che il meccanismo di replicazione in essi fosse meno complesso che negli eucarioti. Kornberg nel 1959 condivise il Premio Nobel per la Fisiologia o Medicina per la sua “scoperta dei meccanismi della sintesi biologica dell’acido desossiribonucleico”.

La DNA polimerasi I L’approccio di Kornberg fu biochimico; in particolare, egli si propose di identificare tutti gli ingredienti necessari per la sintesi in vitro del DNA di E. coli. La prima sintesi di DNA fu ottenuta con successo in una miscela di reazione contenente frammenti di DNA – una miscela di quattro precursori desossiribonucleosidi 5′-trifosfati (dATP, dGTP, dCTP e dTTP, indicati collettivamente con l’abbreviazione dNTP, per deoxyribo-Nucleoside TriPhosfate) – e un lisato di cellule di E. coli (cellule batteriche danneggiate allo scopo di far rilasciare il loro contenuto). Per poter misurare la piccolissima quantità di DNA attesa come prodotto di sintesi nella reazione, Kornberg usò dNTP marcati con isotopi radioattivi. Kornberg analizzò il lisato e isolò un enzima responsabile della sintesi di DNA. Questo enzima fu dapprima chiamato enzima di Kornberg, mentre ora è più comunemente definito DNA polimerasi I (DNA Pol I). (Per definizione, gli enzimi che catalizzano la sintesi di DNA si chiamano DNA polimerasi.) Con l’isolamento della DNA Pol I fu possibile ottenere informazioni più dettagliate sulla sintesi di DNA. I ricercatori trovarono che erano indispensabili cinque componenti per avere sintesi di DNA in vitro. La sintesi di DNA, infatti, non avveniva in assenza di uno qualsiasi dei seguenti elementi: 1. tutti i quattro dNTP (in mancanza di un qualsiasi dNTP non avviene sintesi). Queste molecole sono i precursori dei blocchi nucleotidici (fosfato-zucchero-base) per la costruzione del DNA, descritti nel Capitolo 2; 2. la DNA Pol I; 3. un frammento di DNA di E. coli che funga da stampo, cioè una molecola utilizzata per produrre una molecola complementare di DNA nella reazione; 4. un frammento di DNA come innesco (“primer”). Un innesco è una corta catena di DNA necessaria per innescare la reazione di sintesi del DNA discussa più in dettaglio successivamente. Come inneschi, Kornberg utilizzò corti frammenti di DNA prodotti dalla digestione del DNA di E. coli con DNasi; 5. ioni magnesio (Mg2+), necessari per la funzionalità ottimale della DNA polimerasi I.

Il ruolo delle DNA polimerasi Tutte le DNA polimerasi dei procarioti e degli eucarioti (descritte più avanti) catalizzano la polimerizzazione di precursori nucleotidici (dNTP) in una catena di DNA (Figura 3.3a). La stessa reanimazione zione in una rappresentazioLa biosintesi del ne schematica è mostrata DNA: come è nella Figura 3.3b. La reaziofatta una nuova ne ha tre caratteristiche prinelica di DNA cipali.

MyLab

39

La replicazione del DNA

1. All’estremità in crescita della catena, la DNA polimerasi catalizza la formazione di un legame fosfodiesterico fra il gruppo 3′-OH del desossiribosio dell’ultimo nucleotide e il fosfato in 5′ del dNTP precursore. L’energia per la formazione del legame fosfodiesterico deriva dalla liberazione di due dei tre fosfati dal dNTP. Il concetto importante è che la catena di DNA in allungamento funziona nella reazione come innesco (primer) – una catena polinucleotidica preesistente, a cui può essere aggiunto un nuovo nucleotide all’estremità 3′-OH libera.

2. A ogni tappa dell’allungamento della nuova catena di DNA, la polimerasi trova il precursore (dNTP) giusto che può formare una coppia di basi complementari con il nucleotide sull’elica stampo. I nucleotidi vengono aggiunti rapidamente – per esempio, 850 al secondo in E. coli e 60-90 al secondo nelle cellule umane in coltura. Il processo non avviene con una precisione del 100%, ma la probabilità di errore è molto bassa (grazie anche a un meccanismo di correzione di bozze descritto più avanti).

a) Meccanismo di allungamento del DNA Filamento stampo

Nuovo filamento 5¢ O –O

H

P





O

O –O

O

P

O

3¢ H

O

O

O

T

O

H2C

A

CH2

O

T

O

H 2C

A

CH2

O

O

O –O

P

H

O O–

P

O

O

O

H

O

–O

DNA polimerasi

O

G

O

H 2C

C

P

O

H

O O

O

CH2

O

H

O–

P

O

G

O

H2C

C

O

O

P

O–

H

–O

O

P

O

O–

P

O

O–

P O–

O O

P

OH

O–

O–

P

O H

O

O



O –O

H

OH

–O

O

P

O

Formazione di un legame fosfodiesterico

+

CH2

O

O

H

O

O

P

O

T

O

CH2

A

CH2

O

T

O

H2 C

A

CH2

O

O

O–

P

O OH

H

O O– OH

O

H

P

O H

O–

O

H

3¢ Nuova aggiunta di desossiribonucleoside trifosfato

T

CH2

O

T

CH2

O

O

Direzione di crescita della catena da 5¢ a 3¢

O

O O–

O

O

H

C

P

CH2

O

C

P

CH2

O

O P

O

O–

O

H

O O–

O

P

O

O





O–

b) Rappresentazione schematica dell’allungamento del DNA 5¢ 3¢ Filamento stampo A

P

P

T

P

C

A

G

T

T



P P P

P

P

P



C

P

A

C

A

T

G

T

P P P

P

T

C

DNA polimerasi 3¢ P

P



OH OH P

5¢ P P

Crescita della catena

P

P 5¢

P

3¢ OH + P P

Figura 3.3 Allungamento di una catena di DNA catalizzato dalla DNA polimerasi. (a) Meccanismo a livello molecolare. (b) Lo stesso meccanismo, usando un sistema abbreviato per rappresentare il DNA.

40

Capitolo 3

3. La direzione della sintesi della nuova catena di DNA è solo da 5′ a 3′. Uno dei sistemi di replicazione del DNA meglio conosciuti è quello di E. coli. Per molti anni dopo la scoperta della DNA polimerasi I, gli scienziati credettero che questo enzima fosse l’unico enzima replicativo di E. coli. Tuttavia studi genetici smentirono tale ipotesi. Gli scienziati hanno identificato finora un totale di cinque DNA polimerasi, DNA Pol I, II, III, IV e V. Dal punto di vista funzionale, DNA Pol I e DNA Pol III sono polimerasi necessarie per la replicazione, mentre DNA Pol I, DNA Pol II, DNA Pol IV e DNA Pol V sono polimerasi coinvolte nella riparazione del DNA. Le DNA polimerasi coinvolte nella replicazione sono strutturalmente differenti. DNA Pol I è codificata da un singolo gene (polA) e consiste in un polipeptide. La parte centrale della DNA polimerasi III contiene le funzioni catalitiche dell’enzima e consiste di tre polipeptidi: α (alfa, codificato dal gene dnaE), ε (epsilon, codificato dal gene dnaQ) e ␪ (theta, codificato dal gene holE). L’enzima completo DNA Pol III, chiamato anche oloenzima Pol III, contiene ulteriori sei differenti polipeptidi. Sia DNA Pol I sia DNA Pol III replicano il DNA nella direzione da 5′ a 3′. Entrambi gli enzimi hanno anche attività esonucleasica da 3′ a 5′; in altri termini, essi possono rimuovere nucleotidi dall’estremità 3′ della catena di DNA. Questa attività enzimatica è utilizzata nel meccanismo di correzione di bozze (proofreading); nello specifico, se la DNA polimerasi inserisce una base non corretta (un evento che si verifica con una frequenza di 10–6 sia per la DNA Pol I sia per la DNA Pol III, il che significa che una base su un milione non è corretta), in molti casi l’errore è riconosciuto immediatamente dall’enzima. Con un processo simile al tasto “indietro” o “cancella” sulla tastiera di un computer, l’attività esonucleasica dell’enzima rimuove il nucleotide errato dal nuovo filamento. Quindi, la DNA polimerasi riprende il cammino in avanti e inserisce il nucleotide corretto. Mediante questo sistema di correzione di bozze la frequenza degli errori attribuibili a DNA Pol I o III durante la replicazione è ridotta a meno di 10–9.

Nota chiave Gli enzimi che catalizzano la sintesi del DNA sono chiamati DNA polimerasi. Tutte le DNA polimerasi conosciute sintetizzano il DNA nella direzione da 5’ a 3’. Le polimerasi possono anche avere altre attività; per esempio, possono rimuovere nucleotidi da un filamento nella direzione da 3’ a 5’ (attività nota come “correzione di bozze”), oppure possono rimuovere nucleotidi da un filamento nella direzione da 5’ a 3’.

La DNA Pol I ha anche un’attività esonucleasica da 5′ a 3′ e può rimuovere nucleotidi dall’estremità 5′ di un filamento di DNA o RNA. Questa attività è importante nella replicazione del DNA e sarà esaminata più oltre nel capitolo. Nel Box 3.2 viene descritto come i primi studi genetici rivelarono che le cellule di E. coli contenevano DNA polimerasi diverse dalla DNA Pol I.

Modello molecolare della replicazione del DNA La Tabella 3.1 presenta le funzioni di alcuni dei geni della replicazione di E. coli e delle sequenze chiave di DNA coinvolte nella replicazione. Un certo numero di geni è stato individuato mediante l’analisi di mutanti. In questo paragrafo, verrà discusso un modello molecolare di replicazione del DNA che prevede il coinvolgimento di questi geni e di queste sequenze.

Inizio della replicazione L’inizio della replicazione avviene in un punto specifico, corrispondente a una sequenza di DNA che viene indicata come origine di replicazione, la regione specifica in cui la doppia elica di DNA viene denaturata in singoli filamenti e a livello della quale inizia la replicazione. Il segmento di DNA denaturato localmente è denominato bolla di replicazione. I segmenti delle singole eliche srotolate su cui vengono sintetizzate le nuove eliche (in accordo con la legge dell’appaiamento delle basi complementari) sono chiamati filamenti stampo. Quando una molecola di DNA si srotola per esporre i due filamenti stampo a singola elica per la replicazione del DNA, si forma una struttura a forma di Y, chiamata forca replicativa (o forca di replicazione). Una forca replicativa si muove nella direzione dello srotolamento del DNA. Quando il DNA si srotola nel mezzo di una molecola di DNA, come nel caso di un cromosoma circolare o dell’inizio di replicazione di un cromosoma lineare, ci sono due forche di replicazione – come due lettere Y unite insieme nella loro parte superiore. In molti casi (ma non in tutti) ogni forca di replicazione è attiva, cosicché la replicazione del DNA procede in modo bidirezionale. Uno schema dell’inizio della replicazione in E. coli è rappresentato nella Figura 3.4. L’origine di replicazione di E. coli è oriC, che si estende per 245 coppie di basi e contiene un cluster di tre copie di una sequenza di 13 coppie di basi ricca in AT e quattro copie di una sequenza di 9 coppie di basi. Perché la replicazione abbia inizio, una proteina iniziatrice (o più proteine) deve legare l’origine di replicazione e indurre la denaturazione locale della regione ricca in AT. La proteina iniziatrice in E. coli è la DnaA (gene dnaA), che si lega in molte copie alle regioni di 9 coppie

La replicazione del DNA

Box 3.2

41

Mutanti di DNA polimerasi di E. coli

Un modo per studiare l’azione di un enzima in vivo consiste nell’indurre mutazioni nel gene codificante per quel particolare enzima. In questo modo, il fenotipo dei mutanti può essere confrontato con il fenotipo selvatico. Il primo mutante nel gene per la DNA Pol I, polA1, fu isolato nel 1969 da Paula DeLucia e John Cairns (il mutante è stato così chiamato grazie all’utilizzo di una allitterazione fra “Paula” e “polA”) . Questo mutante è caratterizzato da meno dell’1% della normale attività polimerasica e da un’attività esonucleasica 5’→3’ (la progressiva rimozione dei nucleotidi da una estremità 5’ libera a una 3’) quasi normale. Era atteso che la DNA polimerasi fosse essenziale al funzionamento cellulare e che, quindi, una mutazione nel gene codificante per tale enzima fosse letale o almeno deleteria. Inaspettatamente, invece, cellule di E. coli con la mutazione polA1 crescevano e si dividevano normalmente. Tuttavia, i mutanti polA1 mostravano un elevato tasso di mutazione se esposti a luce ultravioletta (UV) e a mutageni chimici, proprietà, questa, spiegata attribuendo alla DNA polimerasi I una funzione importante nella riparazione del DNA danneggiato (modificato chimicamente).

Per studiare le conseguenze di mutazioni in geni codificanti per proteine ed enzimi essenziali, i genetisti trovano più facile lavorare con mutanti termosensibili – mutanti che funzionano normalmente fino a che la temperatura non viene innalzata oltre un livello soglia, dopo il quale si manifesta il difetto funzionale. Alla normale temperatura di crescita di E. coli, 37 °C, i ceppi mutanti polAex1 termosensibili producono DNA Pol I con normale attività catalitica. Studi con la DNA Pol I del ceppo mutante, in vitro a 37 °C, mostrarono che l’enzima aveva una normale attività polimerasica, ma decresceva l’attività esonucleasica da 5’ a 3’. In vitro a 42 °C, tuttavia, la DNA Pol I termosensibile ha attività polimerasica quasi normale, ma l’attività 5’→3’ esonucleasica è fortemente inibita. A 42 °C mutanti termosensibili polAex1 muoiono (la mutazione è letale), mostrando che l’attività esonucleasica 5’→3’ della DNA Pol I è essenziale per la replicazione del DNA. Nell’insieme, i risultati degli studi sui mutanti polA1 e polAex1 indicarono da una parte che nella cellula dovevano esserci altri enzimi che polimerizzano il DNA e, dall’altra, evidenziarono l’importanza dell’attività esonucleasica per una replicazione fedele del DNA.

Tabella 3.1 Le funzioni di alcuni geni e sequenze di DNA coinvolti nella replicazione del DNA in E. coli Prodotto genico e/o funzione

Gene

DNA polimerasi I

polA

DNA polimerasi III

dnaE, dnaQ, dnaX, dnaN, dnaD, holA→E

Proteina iniziatrice; si lega a oriC

dnaA

Proteina IHF (proteina che lega il DNA); si lega a oriC

himA

Proteina FIS (proteina che lega il DNA); si lega a oriC

fis

Elicasi e attivatore di primasi

dnaB

Si complessa con la proteina DnaB e la guida sul DNA

dnaC

Primasi; forma il primer di RNA per l’allungamento da parte della DNA polimerasi III

dnaG

Proteine che legano il DNA a singolo filamento (SSB); si legano ai bracci a singola elica delle forche replicative

ssb

DNA ligasi; salda le interruzioni a singolo filamento

lig

Girasi (topoisomerasi di tipo II); perno che fa ruotare i prodotti di replicazione gyrA, gyrB per evitare che il DNA si aggrovigli durante l’avanzamento della forca replicativa Origine della replicazione cromosomica

oriC

Terminazione della replicazione cromosomica

ter

TBP (proteina che lega ter); blocca le forche replicative

tus

42

Capitolo 3 Ripetizioni Ripetizioni di 9 bp di 13 bp

5¢ 3¢

3¢ 5¢ A

DNA elicasi (DnaB)

DnaA 3¢ 5¢

A A AA

3¢ 5¢

DNA elicasi loader (DnaC) A

3¢ 5¢

A AA

Nota chiave L’inizio della sintesi del DNA, in corrispondenza di un’origine di replicazione, coinvolge prima la denaturazione del doppio filamento di DNA catalizzata dalla DNA elicasi. Successivamente, la DNA primasi si lega all’elicasi e al DNA denaturato, e sintetizza un corto primer di RNA. Il primer di RNA viene allungato dalla DNA polimerasi nel corso della sintesi del nuovo DNA e, in seguito, verrà rimosso.

3¢ 5¢

Replicazione semidiscontinua del DNA Elicasi attivate 5¢ 3¢

AAA A

3¢ 5¢

Figura 3.4 Inizio della replicazione in E. coli. La proteina iniziatrice DnaA si lega a oriC e provoca la denaturazione del DNA. Vengono reclutate la DNA elicasi DnaB e la DNA elicasi loader, che iniziano a svolgere il DNA per formare due forche replicative in configurazione testa a testa.

di basi, determinando la denaturazione della regione con le sequenze di 13 coppie di basi. Le DNA elicasi (DnaB, codificate dal gene dnaB) sono reclutate e caricate sul DNA mediante proteine “DNA helicase loader” (DnaC, codificate dal gene dnaC). Le elicasi cominciano a srotolare il DNA in entrambe le direzioni a partire dall’origine di replicazione, rompendo il legame idrogeno fra le basi. L’energia necessaria allo srotolamento deriva dall’idrolisi dell’ATP. Successivamente, ogni DNA elicasi recluta l’enzima DNA primasi (un prodotto del gene dnaG), formando un complesso detto primosoma. La DNA primasi è importante nella replicazione del DNA, poiché nessuna delle DNA polimerasi può iniziare la sintesi di un filamento di DNA; esse possono solo aggiungere nucleotidi a un filamento preesistente. La DNA primasi (che consiste in una RNA polimerasi modificata) sintetizza un corto filamento di RNA primer (innesco; circa 5-10 nucleotidi), al quale possono essere aggiunti dalla DNA polimerasi nuovi nucleotidi. Il primer di RNA viene successivamente rimosso e rimpiazzato con DNA; questo evento sarà discusso più avanti. A questo punto, la replicazione bidirezionale del DNA è appena iniziata. È necessario fare una chiara distinzione fra primer e stampo rispetto alla replicazione del DNA. Il filamento stampo è quello su cui viene sintetizzata la nuova elica, seguendo le leggi dell’appaiamento delle basi complementari. Un primer è un corto segmento di nucleotidi legato al filamento stampo. Il primer serve come substrato per l’azione della DNA polimerasi, che allunga il primer e sintetizza una nuova elica di DNA, la cui sequenza è complementare al filamento stampo.

La discussione precedente nimazione sull’inizio della replicazioModello ne prendeva in consideramolecolare zione la produzione di due della replicazione forche replicative in seguidel DNA to a denaturazione del DNA in corrispondenza di un’origine. Gli eventi della replicazione sono identici a livello di ogni forca, per cui l’attenzione verrà rivolta a una sola forca (Figura 3.5). Per illustrare chiaramente questa complicata serie di eventi, la discussione seguente la semplifica, considerando separatamente gli enzimi che sintetizzano i due differenti nuovi filamenti. Nella realtà, i due set di enzimi lavorano insieme in un complesso; ciò sarà discusso più dettagliatamente in seguito (Figura 3.8). La forca replicativa viene generata quando le elicasi srotolano il DNA per dare origine a due singoli filamenti che funzionano da stampo. Il processo di separazione di una molecola di DNA a doppio filamento in due filamenti singoli è chiamato denaturazione del DNA o dissociazione (melting) del DNA. Proteine SSB (SingleStrand Binding) si legano a ognuno dei singoli filamenti di DNA, stabilizzandoli (Figura 3.5) ed evitando che essi formino di nuovo DNA a doppio filamento mediante l’appaiamento delle coppie di basi (processo chiamato riassociazione, o reannealing). Il primer di RNA sintetizzato dalla DNA primasi si trova a livello dell’estremità 5′ del nuovo filamento da sintetizzare alla fine del filamento stampo (Figura 3.5, fase 1). La DNA primasi che si trova alla forca replicativa sintetizza un altro primer di RNA, nella parte alta del filamento stampo (Figura 3.5, fase 1). Ogni primer di RNA viene allungato dalla DNA polimerasi III mediante l’aggiunta di desossiribonucleotidi di DNA (Figura 3.5, fase 1). Le polimerasi spostano le proteine SSB quando si muovono lungo il filamento stampo. I nuovi DNA sintetizzati sono complementari al filamento stampo. Si ricordi che le DNA polimerasi possono sintetizzare DNA solo nella direzione 5′→3′, e ancora che i due filamenti di DNA sono di polarità opposte.

MyLab

La replicazione del DNA Polimerasi III Elica in ritardo 1 Inizio; il primer di RNA sintetizzato dalla DNA primasi incomincia la replicazione del filamento in ritardo con sintesi del 1° frammento di Okazaki

SSB (proteine che legano DNA a singola elica) Primer di RNA per il 2° frammento di Okazaki sintetizzato dalla DNA primasi



Movimento della forca

Elica guida

DNA elicasi



3¢ 5¢

1° frammento di Okazaki 5¢ 3¢

43

Polimerasi III DNA sintetizzato dalla DNA polimerasi III Primer di RNA sintetizzato dalla primasi

La polimerasi III si dissocia La sintesi discontinua prosegue su questo filamento 2 Ulteriore srotolamento e allungamento di nuovi filamenti di DNA; viene allungato il 2° frammento di Okazaki

1° frammento di Okazaki

3¢ 5¢





Primer di RNA per il 3° frammento di Okazaki

Allungamento del 2° frammento di Okazaki 5¢ 3¢

3¢ 5¢

Continuo srotolamento e movimento della forca

La polimerasi III si dissocia 3 Il processo continua; il 2° frammento di Okazaki è terminato, il 3° viene sintetizzato; la DNA primasi inizia il 4° frammento





3¢ 5¢ 3¢ 5¢

3° frammento di Okazaki 5¢ 3¢

Posizione dell’interruzione a singolo filamento 5¢

4 Il primer è rimosso dalla DNA polimerasi I; rimane un’interruzione a singolo filamento (filamento rosso)



3¢ 5¢

5¢ 3¢ 5¢

4° frammento di Okazaki

La DNA polimerasi I sostituisce il primer di RNA con DNA 5¢ 3¢

Primer di RNA che viene sostituito con DNA dalla DNA polimerasi I 5¢

5 Giunzione di frammenti di DNA adiacenti a opera della DNA ligasi

3¢ 5¢



L’interruzione viene saldata dalla DNA ligasi



5° frammento di Okazaki

3¢ 5¢

5¢ 3¢

Figura 3.5 Modello degli eventi che avvengono attorno a una singola forca replicativa del cromosoma di E. coli. Verde = RNA; blu = DNA parentale; rosso = nuovo DNA.

Per mantenere la polarità 5′→3′ della sintesi del DNA su ogni filamento stampo e una sola direzione di movimento della forca replicativa, il DNA viene sintetizzato in direzioni opposte sulle due eliche stampo (Figura 3.5, fase 1). Il nuovo filamento sintetizzato nella stessa direzione del movimento della forca replicativa è l’elica guida (leading strand) (il suo filamento stampo – il filamento inferiore nella Figura 3.5 – è il filamento stampo guida), mentre il nuovo filamento che viene sintetizzato nella direzione opposta al movimento della forca replicativa è detto elica in ritardo (lagging strand) (il suo filamento stampo – il filamento superiore nella Figura 3.5 – è il filamento stampo in ritardo). L’elica guida necessita solo di un primer di RNA per essere sintetizzata, mentre l’elica in ritardo richiede una serie di primer di RNA. L’elicasi srotola ulteriore DNA, causando un avanzamento della forca di replicazione lungo il cromosoma

(Figura 3.5, fase 2). La DNA girasi (una forma di topoisomerasi) allenta la tensione prodotta nel DNA, nella parte anteriore della forca replicativa. Questa tensione è considerevole poiché la forca replicativa ruota a circa 3000 giri al minuto. Sullo stampo leading (il filamento inferiore nella Figura 3.5) il nuovo filamento viene sintetizzato dalla DNA polimerasi III in maniera continua nella direzione della forca di replicazione. Dal momento che, tuttavia, la sintesi del DNA avviene nella direzione 5′→3′, la sintesi del filamento in ritardo può procedere solo fino a un certo punto. Per poter continuare la sintesi del DNA sul filamento stampo, è necessario un nuovo inizio di sintesi del DNA; un primer di RNA è sintetizzato dalla DNA primasi nella forca di replicazione (Figura 3.5, fase 2). La DNA polimerasi III aggiunge DNA al primer di RNA per sintetizzare un nuovo segmento di DNA. Dato che l’elica leading viene sintetizzata in modo continuo, men-

44

Capitolo 3

tre il filamento lagging è sintetizzato segmento dopo segmento, vale a dire in maniera discontinua, la replicazione del DNA nel suo insieme procede con modalità semidiscontinua. I frammenti del filamento lagging fabbricati in modo semidiscontinuo sono chiamati frammenti di Okazaki, dai loro scopritori, Reiji e Tuneko Okazaki e colleghi. Sperimentalmente gli Okazaki aggiunsero alle colture di E. coli un precursore radioattivo del DNA (3H-timidina) per lo 0,5% del tempo di una generazione. In seguito, aggiunsero una grande quantità di timidina non radioattiva per prevenire l’incorporazione di ulteriore radioattività nel DNA. Estrassero il DNA a tempi variabili (fino al 10% del tempo di una generazione) e determinarono le dimensioni delle molecole marcate di recente. Nei tempi vicini al periodo di marcatura, gran parte della radioattività era presente nel DNA a basso peso molecolare che conteneva da 100 a 1000 nucleotidi. Con l’aumentare del tempo, una proporzione sempre maggiore di molecole marcate fu trovata nel DNA ad alto peso molecolare. Questi risultati indicavano che la replicazione del DNA normalmente coinvolge la sintesi di brevi frammenti – i frammenti di Okazaki – che successivamente sono legati insieme. Il processo di replicazione continua allo stesso modo (Figura 3.5, fase 3): l’elicasi continua a srotolare il DNA, che viene sintetizzato in modo continuo sul filamento stampo leading e in modo discontinuo sul filamento stampo lagging; ogni frammento di Okazaki riparte con Figura 3.6 Saldatura dei frammenti di Okazaki. Dettaglio della sostituzione del primer di RNA con il DNA.

un nuovo primer di RNA. Infine, i frammenti di Okazaki sono legati insieme per costituire un filamento continuo. La loro saldatura richiede l’attività di due enzimi, DNA polimerasi I e DNA ligasi. Se si considerano due frammenti di Okazaki adiacenti, l’estremità 3′ del nuovo segmento è adiacente ma non legata all’estremità 5′ del frammento del primer sintetizzato in precedenza. La DNA polimerasi III lascia il segmento più nuovo e la DNA polimerasi I si lega. La DNA polimerasi I allo stesso tempo digerisce il primer di RNA anteriormente e allunga il DNA posteriormente (Figura 3.5, fase 4 e Figura 3.6). La digestione dell’RNA implica l’attività 5′→3′ esonucleasica degli enzimi necessari a rimuovere i nucleotidi dall’estremità 5′ del primer, e inoltre espone i nucleotidi che funzionano da stampo. L’allungamento del filamento di DNA implica l’attività 5′→3′ polimerasica degli enzimi per aggiungere nucleotidi all’estremità 3′ del filamento di DNA, la cui sequenza è guidata dai nucleotidi stampo esposti. Quando la DNA polimerasi I ha sostituito tutti i ribonucleotidi del primer di RNA con desossiribonucleotidi, rimane un’interruzione a singolo filamento fra i nucleotidi adiacenti dei due frammenti dell’elica (un punto nel quale la struttura portante zucchero-fosfato tra i due nucleotidi adiacenti è interrotta). I frammenti sono uniti dalla DNA ligasi per formare un’elica di DNA più lunga (Figura 3.5, fase 5). La reazione catalitica della DNA ligasi è schematizzata nella Figura 3.7. L’intera

Origine della regione terminale 3¢ del nuovo frammento di Okazaki

Posizione dove il primer di RNA del frammento di Okazaki precedente termina e il DNA inizia DNA polimerasi III

Stampo del filamento lagging



1 La DNA polimerasi III si allontana. La regione terminale 3¢ del nuovo frammento di Okazaki è vicina alla terminazione 5¢ del precedente frammento di Okazaki.





5¢ Precedente frammento di Okazaki

2 La DNA polimerasi I lega e contemporaneamente rimuove il primer di RNA dal precedente frammento di Okazaki e sintetizza DNA per sostituirlo.



5¢ Primer di RNA



Nuovo frammento di Okazaki

DNA polimerasi I

3¢ L’attività esonucleasica allontana il primer da 5¢ a 3¢

3¢ 5¢

L’attività polimerasica allunga il DNA da 5¢ a 3¢

DNA polimerasi I 3 Quando il primer di RNA è completamente rimosso, la DNA polimerasi I si allontana. Rimane un’interruzione fra i due frammenti.









Interruzione a singolo filamento dopo l’allontanamento del primer DNA ligasi 5¢ 4 La DNA ligasi salda l’interruzione e quindi si allontana.

3¢ Interruzione saldata dalla DNA ligasi

3¢ 5¢

La replicazione del DNA 3¢ A T T C C G A T C G A T 5¢ 5¢ T A A G G C TOH pA G C T A 3¢

tente. Analogamente, poiché la DNA polimerasi dell’elica lagging è complessata alle altre proteine replicative a livello della forca, questo enzima può continuamente essere riutilizzato nella stessa forca replicativa, con sintesi di una serie di frammenti di Okazaki mentre si sposta insieme al resto della macchina replicativa. In sostanza, il complesso di proteine replicative che si forma alla forca replicativa si muove essenzialmente come un’unità lungo il DNA e rende possibile la sintesi di nuovo DNA in modo efficiente, sia sullo stampo dell’elica leading sia su quello dell’elica lagging. La discussione si è focalizzata su una singola forca di replicazione, mentre in realtà nella bolla di replicazione ne sono coinvolte due. La Figura 3.9 mostra come il filamento leading e il filamento lagging sono sintetizzati nei primi stadi della replicazione bidirezionale. La Figura 3.10 mostra la replicazione bidirezionale di un cromosoma circolare, come quello di E. coli.

3¢ A T T C C G A T C G A T 5¢ 5¢ T A A G G C T A G C T A 3¢

DNA ligasi

Interruzione a singolo filamento

Interruzione saldata

Figura 3.7 Azione della DNA ligasi nella saldatura delle interruzioni tra frammenti di DNA adiacenti (per esempio, frammenti di Okazaki) con formazione di una catena covalentemente continua più lunga. La DNA ligasi catalizza la formazione di un legame fosfodiesterico fra il gruppo 3’-OH e il gruppo 5’-fosfato ai due lati dell’interruzione, saldando l’interruzione stessa.

sequenza di eventi si ripete finché non viene replicata l’intera molecola di DNA. La Figura 3.5 mostra la replicazione del DNA in forma semplificata. In realtà, le proteine chiave sono strettamente associate in modo da formare un macchinario chiamato replisoma, a livello della forca replicativa. La Figura 3.8 mostra il filamento lagging di DNA, avvolto in modo tale che la DNA polimerasi III formi un complesso con la DNA polimerasi che opera sul filamento leading. Queste sono due copie della regione centrale (core) dell’enzima descritto in precedenza, tenute insieme da sei altri polipeptidi per formare l’oloenzima DNA Pol III. Per semplicità, nella figura sono rappresentati solo i nuclei degli enzimi. Il ripiegamento dello stampo del filamento lagging porta l’estremità 3′ di ogni frammento di Okazaki completo in prossimità del punto in cui inizierà il successivo frammento di Okazaki. La primasi si trova vicino alla forca di replicazione, sintetizzando nuovi primer di RNA in modo intermitPrimer di RNA DNA stampo

Attività Identificate alcuni degli specifici elementi e processi necessari per la replicazione del DNA nella iAttività Unraveling DNA Replication (Svelare la replicazione del DNA) nel sito web degli studenti.

MyLab

Replicazione a cerchio rotante Il DNA circolare a doppia elica di alcuni virus, tra cui il batteriofago λ, si replica producendo un DNA lineare; il processo è chiamato replicazione a cerchio rotante

DNA polimerasi III Elica lagging Frammento di Okazaki 3¢





Proteina SSB DNA primasi DNA elicasi

5¢ DNA parentale 3¢ DNA



Direzione del movimento della forca 5¢ 3¢ DNA stampo

45

DNA polimerasi III Elica leading

Figura 3.8 Modello della “macchina replicativa” (replisoma), il complesso delle proteine chiave della replicazione, con il DNA a livello della forca replicativa. La DNA polimerasi III sullo stampo dell’elica lagging (parte in alto della figura) sta terminando la sintesi di un frammento di Okazaki.

Origine di replicazione

II II II II III IIII I IIIIIIII 5¢ 3¢

II 3¢ 5¢

II

Filamento 3¢ lagging



3¢ Filamento leading

I II 3¢ 5¢ II II I III IIII I IIIIIIII



Movimento della forca 3¢ 5¢

II I



Filamento lagging

II

II II

II

Figura 3.9 Sintesi dei filamenti leading e lagging nelle due forche di una bolla di replicazione durante la replicazione bidirezionale del DNA.

Filamento leading

II II



I





II

Movimento della forca

46

Capitolo 3

(Figura 3.11). Il primo passo nella replicazione a cerchio rotante è la generazione di una incisione specifica su uno dei due filamenti in corrispondenza dell’origine di replicazione (Figura 3.11, fase 1). Nella molecola circolare l’estremità 5′ del filamento inciso è quindi dislocata in modo da formare una forca replicativa (Figura 3.11, fase 2). L’estremità 3′ del filamento inciso agisce da primer per la DNA polimerasi nella sintesi del nuovo DNA, utilizzando la regione del DNA circolare a filamento singolo come stampo (Figura 3.11, fase 3). L’estremità 5′ del filamento di DNA dislocato è srotolata esternamente come una “lingua” libera che aumenta in lunghezza man mano che la replicazione procede. Il nuovo DNA è sintetizzato dalla DNA polimerasi sul DNA dislocato nella direzione 5′→3′, ovvero dal

Origine della replicazione

Forche replicative 3¢ 5¢

Rotazione intorno all’asse

Proteine SSB

Primer di RNA

cerchio in direzione dell’estremità del DNA dislocato. Con un ulteriore spostamento viene sintetizzato nuovo DNA, iniziando dal cerchio e procedendo lungo il filamento di DNA spostato (Figura 3.11, fase 4). Quindi, la sintesi di questo filamento avviene in modo discontinuo; vale a dire, il filamento dislocato è lo stampo dell’elica in ritardo (come in Figura 3.5). Man mano che la “lingua” a singola elica si srotola al di fuori, la sintesi di DNA continua sullo stampo circolare. Poiché il cerchio di DNA parentale può continuare a ruotare, è possibile generare una molecola lineare di DNA a doppia elica più lunga della circonferenza del cerchio. Si consideri il meccanismo della replicazione del DNA nel contesto del ciclo vitale del fago λ. (Una descrizione completa del ciclo vitale del fago λ è riportata nel Capitolo 15 ed è schematizzata nella Figura 15.12.) Il fago λ ha un cromosoma di DNA lineare, per la maggior parte a doppio filamento con le estremità, della lunghezza di 12 nucleotidi, a singolo filamento (Figura 3.12). Le due estremità hanno sequenze complementari – esse sono dette coesive poiché possono appaiarsi l’una con l’altra. 1 Viene fatto Quando il fago λ un taglio infetta E. coli, il cronell’elica + della doppia mosoma lineare O elica parentale (O = origine) viene iniettato nella cellula e le estremità complementari si appaia2 L’estremità 5¢ viene spostata no. Il cromosoma e coperta circolare del fada proteine SSB go, per produrre O le copie del cro3 La polimerizzamosoma da imzione all’estremità 3¢ 3¢ aggiunge nuovi pacchettare codesossiribonume progenie facleotidi gica, si replica 5¢ mediante il meccanismo del cerchio rotante. Il riO 4 Attacco sultato è una moledel replisoma Replisoma e formazione cola molto lunga, di frammenti costituita da copie di Okazaki del cromosoma di λ legate tra di loro dall’unione tra la testa e la coda Vecchio frammento di due genomi successivi. di Okazaki

Frammento di Okazaki appena iniziato

Figura 3.10 Replicazione bidirezionale di molecole di DNA circolare.

Figura 3.11 Il processo di replicazione di molecole di DNA circolare a doppia elica mediante il meccanismo del cerchio rotante. La forza attiva che svolge la coda al 5’ è il movimento del replisoma spinto dalla sua componente elicasica.

La replicazione del DNA

Questa molecola, costituita da una serie ripetuta di monomeri, è chiamata concatamero. Da questo concatamero sono prodotti i cromosomi unitari di λ nel modo seguente: nel cromosoma di λ c’è il gene ter (da terminus generating activity, “attività di produzione delle terminazioni”; Figura 3.12b), il cui prodotto è una DNA endonucleasi (un enzima che digerisce una catena di acido

Nota chiave Durante la replicazione viene sintetizzato nuovo DNA nella direzione da 5’ a 3’. In tal modo, la crescita è continua su un filamento e discontinua sull’altro (cioè a segmenti congiunti successivamente). Questo modello discontinuo è applicabile a parecchi altri sistemi di replicazione dei procarioti, ognuno dei quali differisce nel numero e nelle proprietà degli enzimi e delle proteine necessari.

47

nucleico tagliando in determinate posizioni centrali della molecola, e non alle estremità). Questa endonucleasi riconosce la sequenza cos (Figura 3.12b) e produce un taglio asimmetrico in corrispondenza di ciascun sito cos. In questo modo sono prodotti cromosomi λ lineari con le corrette estremità complementari coesive a singola elica, lunghe 12 bp. I singoli cromosomi sono poi impacchettati nelle teste del fago λ.

La replicazione del DNA negli eucarioti La biochimica e la biologia molecolare della replicazione del DNA sono simili in eucarioti e procarioti. Tuttavia, la complicazione addizionale negli eucarioti è che il DNA non si trova in un solo cromosoma, ma è distribuito in molti cromosomi. In questa parte del capitolo verranno riassunti alcuni aspetti importanti della replicazione del DNA negli eucarioti. Sequenza cos

a) Il cromosoma lineare di l (~ 48 000 bp) forma il cromosoma circolare di l

3¢ G C G C C C A ... C A A T G C C C C G C C G C T GG A 5¢ L’infezione della cellula ospite determina la circolarizzazione del cromosoma

Terminazioni complementari a singola elica

G T T A CG C A A T GC G C

G T T A C G 3¢

CGCGGG T CGCCC T C AG A G

C GG C G A C G G C G C CGC T G C

Interruzione

... 5¢ G G G C G G C G A C C T C G C G G G T

Interruzione

Le interruzioni sono chiuse dalla DNA ligasi b) La produzione di cromosomi l figli dai concatameri (copie multiple legate una di seguito all’altra mediante estremità complementari) Sequenza cos

Sequenza cos Parte della molecola concatamerica

... 5¢

G T T A C G G G G C G G C G AC C T C G C G G G T



C A A T G C C C C G C C G C TG G A G C G C C C A

Enzima ter

...

G T T A C G G G G CG G C G A C C T C G C G G G T



C A A T G C C C C GC C G C T G G A G C G C C C A



Punto di taglio L’enzima ter produce un cromosoma di l con le terminazioni complementari a singola elica mediante un taglio asimmetrico ( ) in corrispondenza delle sequenze cos

G T T A CG





C A A T G C CCC G CCGC TGG A

... GGGCGGCG ACC T C G C G G G T 5¢



GC GCC CA

GT TA CG

...





GGGCGGCGAC C T C G C G G G T

C A A T G C CC CG C CGC TGG A 5¢

3¢ G C G C C C A

Terminazioni complementari a singola elica Il cromosoma di l è ritagliato dalla molecola concatamerica

Figura 3.12 La struttura del cromosoma di l varia in funzione degli stadi del ciclo vitale del fago in E. coli. (a) Parti del cromosoma di λ che mostrano la sequenza nucleotidica delle due terminazioni coesive a singola elica complementari tra loro e la circolarizzazione del cromosoma dopo l’infezione, dovuta all’appaiamento delle terminazioni e alla saldatura delle interruzioni a singola elica con produzione di una molecola circolare chiusa covalentemente. (b) La produzione di terminazioni coesive nel DNA di λ durante la replicazione.

Durante la replicazione del cromosoma di λ, si forma una gigantesca molecola concatamerica di DNA; questa molecola contiene una serie di genomi di λ ripetuti in tandem uno di seguito all’altro. Lo schema mostra la giunzione di due cromosomi di λ adiacenti e l’estensione della sequenza cos. La sequenza cos è riconosciuta dal prodotto del gene ter, una endonucleasi che fa due tagli in corrispondenza dei siti indicati dalle frecce. Questi tagli producono un cromosoma di λ completo dal concatamero.

48

Capitolo 3

a) Microfotografia (al microscopio elettronico) che mostra le unità di replicazione (repliconi)

Unità di replicazione

b) Interpretazione della fotografia al microscopio elettronico

Unità di replicazione

Figura 3.13 DNA di Drosophila melanogaster durante la replicazione.

forca di replicazione adiacente, che ha avuto inizio in un’origine di replicazione attigua. Negli eucarioti, il tratto di DNA compreso fra un’origine di replicazione e le due terminazioni della replicazione (dove le forche di replicazione adiacenti si fondono) a ciascun lato dell’origine si chiama replicone o unità di replicazione (Figura 3.13). Il genoma di E. coli consiste di un unico replicone, della dimensione di 4,6 Mb (milioni di coppie di basi, la dimensione dell’intero genoma), con un tasso di avanzamento della forca di replicazione di circa 1000 bp al secondo; per la replicazione dell’intero cromosoma sono necessari 42 minuti. Al contrario, i repliconi degli eucarioti sono più piccoli. Per esempio, si stima ci siano da 10 000 a 100 000 repliconi nell’uomo, per una media di 30-300 kb; il tasso di movimento della forca di replicazione è di circa 100 bp per secondo. Per la replicazione dell’intero genoma occorrono otto ore, ma ogni replicone viene replicato solo per una parte di questo tempo. Vi è una specifica sequenza temporale per l’inizio della replicazione alle varie origini di replicazione. La Figura 3.14 mostra un segmento (teorico) di un cromosoma nel quale tre repliconi iniziano a replicarsi in tempi differenti. Quando le forche di replicazione si fondono ai margini dei repliconi adiacenti, il cromosoma si è replicato in due cromatidi fratelli.

Inizio della replicazione Repliconi Ogni cromosoma di un eucariote consiste di un DNA lineare a doppia elica. Per esempio, il genoma aploide umano (23 cromosomi) consiste di circa tre miliardi di coppie di basi di DNA e ogni cromosoma è lungo mediamente circa 108 bp, circa 25 volte più lungo del cromosoma di E. coli. Il movimento della forca di replicazione è molto più lento negli eucarioti che in E. coli; pertanto, se ci fosse una unica origine di replicazione per cromosoma, la replicazione di ogni cromosoma riTempo chiederebbe parecchi giorni. In effetti i cromosomi degli eucarioti si replicano in modo efficiente e relativamente veloce poiché la replicazione del DNA viene iniziata nel genoma in parecchi punti contemporaneamente. In ogni punto di origine, come in E. coli, il DNA si srotola in filamenti singoli e la replicazione procede in modo bidirezionale; infine, ogni forca di replicazione corre verso la Figura 3.14 Sequenza temporale degli eventi di inizio della replicazione del DNA nelle unità replicative dei cromosomi eucariotici.

Le sequenze di inizio della replicazione sono meno ben definite negli eucarioti che nei procarioti. Nel lievito Saccharomyces cerevisiae sono sequenze di circa 100 bp chiamate sequenze autonome di replicazione (ARS, Autonomously Replicating Sequences). Le sequenze di origine di replicazione negli organismi multicellulari più complessi sono ancora meno caratterizzate. Nel Focus sul genoma di questo capitolo si descrive un approccio genomico per identificare le origini di replicazione nel lievito. Origini di replicazione

DNA stampo (blu)

Nuovo DNA (rosso)

DNA stampo (blu)

Nuovo DNA (rosso)

La replicazione del DNA

49

Focus sul genoma Origini di replicazione nel lievito Gli scienziati trovarono per la prima volta l’origine di replicazione nel lievito (Saccharomyces cerevisiae) osservando frammenti di DNA che davano inizio alla replicazione dei plasmidi di lievito. Le origini contengono una regione ACS (una sequenza autonoma di replicazione con sequenza di consenso) di 200 bp, alla quale si lega un gruppo di polipeptidi (il complesso di riconoscimento dell’origine o ORC) non appena inizia la replicazione. Usando l’approccio molecolare tradizionale, gli scienziati trovarono solo circa il 10% delle origini (30 su circa 400) previste affinché il genoma del lievito possa funzionare. La genomica consentì di catalogare in maniera esaustiva le origini nel lievito. Quando fu sequenziato l’intero genoma del lievito furono trovate circa 12 000 regioni ACS, molto più delle 400 previste. Chiaramente occorre più di una ACS per identificare un’origine. Molti ricercatori hanno usato microarray a DNA (Capitolo 8) per analizzare parecchie sequenze di DNA simultaneamente. Per creare un microarray a DNA, milioni di copie di sequenze di DNA identiche a filamento singolo sono immobilizzate su una unica ben nota posizione di un vetrino (creando così uno “spot” di molte copie di questa sequenza). Migliaia di sequenze differenti, che rappresentano regioni di geni e non geni, possono essere deposte come “spot” unici su un singolo vetrino (creando così una grande griglia di piccoli spot individuali che viene definita microarray). Gli scienziati depositarono a caso sequenze del genoma del lievito sul vetrino. Alcuni di questi spot contenevano le origini o sequenze vicine, ma la gran parte non le conteneva, e i ricercatori avevano bisogno di identificare sul microarray le sequenze corrispondenti alle origini o quelle a esse vicine. Di seguito verrà spiegato come trovarono queste sequenze. Per prima cosa avevano bisogno di avere a

La proteina di inizio negli eucarioti è il complesso di riconoscimento dell’origine (ORC, Origin Recognition Complex). L’origine di replicazione del lievito, per esempio, si estende per circa 100 bp. L’ORC si lega in due differenti regioni a una estremità dell’origine di replicazione e recluta altre proteine di replicazione, tra le quali vi è la proteina necessaria per srotolare il DNA in una terza regione vicina all’altra estremità. L’origine di replicazione è tra le prime due regioni e la terza. La replicazione del DNA avviene in uno specifico stadio del ciclo di divisione cellulare. Il ciclo cellulare si compone di quattro stadi (Figura 12.4): fase G1, durante

disposizione il DNA delle cellule che avevano appena iniziato la replicazione. Successivamente, essi coltivarono le cellule di lievito in presenza di isotopi pesanti, in modo da avere DNA più denso. Trasferirono le cellule in un mezzo di coltura con isotopi normali più leggeri e consentirono alle cellule di dare inizio alla replicazione. Dopo pochi minuti essi estrassero il DNA da queste cellule. Il DNA di nuova costruzione conteneva un filamento con isotopi leggeri e un altro con isotopi pesanti, ma il DNA non replicato conteneva solo isotopi pesanti (ciò è simile a una parte dell’esperimento di Meselson-Stahl). Essi tagliarono il DNA in piccoli pezzi e separarono il DNA meno denso (replicato); dal momento che esso era stato sicuramente replicato doveva trovarsi vicino all’origine. I ricercatori marcarono questo DNA con sostanze fluorescenti, lo denaturarono per ridurlo a filamento singolo e lo posero sul DNA di un microarray. Il DNA fluorescente potrebbe appaiarsi al DNA depositato sul microarray qualora le due sequenze di DNA fossero complementari. L’appaiamento sperimentale di due filamenti di DNA è chiamato ibridazione. Le sonde di DNA fluorescente si legano a qualche sequenza sul DNA del microarray e ignorano le altre. I ricercatori utilizzarono il laser per rivelare la localizzazione delle marcature fluorescenti. Poiché conoscevano le sequenze esatte depositate sul microarray, i ricercatori a questo punto erano in grado di conoscere quali sequenze erano presenti nel genoma ibridizzato dal DNA (replicato) con quello marcato con fluorescenza. In tal modo, questi studiosi individuarono 332 regioni candidate a essere considerate origini. Queste e altre tecniche alla fine consentirono agli scienziati di clonare 228 origini di replicazione di S. cerevisiae. Ciascuna di queste ultime mostrò di essere funzionale nelle cellule di lievito.

la quale la cellula si prepara per la replicazione del DNA; fase S, durante la quale avviene la replicazione; fase G2, durante la quale la cellula si prepara per la divisione cellulare; fase M, durante la quale avviene la divisione cellulare attraverso la mitosi. Per la corretta duplicazione del cromosoma, ogni origine di replicazione deve essere usata solo una volta nel ciclo cellulare. Ciò si realizza attraverso una complicata serie di eventi. In sintesi, l’inizio della replicazione avviene in due fasi separate temporalmente. L’inizio consiste nella selezione dell’origine di replicazione, in cui l’ORC si lega a ogni origine nella fase G1 e recluta altre proteine per formare

50

Capitolo 3

il complesso prereplicativo (pre-RCs). Lo srotolamento del DNA non avviene quando un iniziatore si lega a una origine di replicazione, al contrario di quanto si verifica nei batteri. Piuttosto, i pre-RC vengono attivati quando la cellula passa dalla fase G1 alla fase S e ha inizio la replicazione. L’inizio della replicazione nella fase S è controllato da una proteina chiamata licensing factor. Questa proteina viene sintetizzata solo nella fase G1 e poi si muove verso il nucleo, dove sono presenti le prime proteine che si legano all’ORC per formare i pre-RC. Sono quindi reclutate altre proteine, e l’intero complesso inizia a srotolare il doppio filamento del DNA. A questo punto le proteine licensing factor sono estromesse dal complesso e sono inattivate, sia mediante degradazione sia mediante la loro espulsione dal nucleo, a seconda dell’organismo. Complessivamente, la combinazione della sintesi dei licensing factor solo in G1 con il loro funzionamento all’interno dei pre-RC e la loro inattivazione guidata serve a limitare l’inizio della replicazione di ogni origine a una volta sola per ciclo cellulare.

Enzimi per la replicazione degli eucarioti Sono stati identificati molti degli enzimi e proteine coinvolti nella sintesi del DNA dei procarioti, mentre le conoscenze sono minori circa gli enzimi e le proteine coinvolti nella replicazione del DNA degli eucarioti. a) Diagramma schematico di una molecola parentale di DNA a doppia elica rappresentante l’intera lunghezza di un cromosoma 5¢ 3¢ 3¢



b) Dopo la replicazione semiconservativa, nuovi segmenti di DNA uniti da ponti idrogeno all’elica stampo hanno primer di RNA all’estremità 5¢ 5¢





5¢ Primer di RNA e

Primer di RNA

Nuovo DNA









c) I primer di RNA sono rimossi, la DNA polimerasi riempie le interruzioni risultanti e la DNA ligasi congiunge i frammenti adiacenti. Tuttavia, in corrispondenza dei telomeri si trovano ancora interruzioni alle estremità 5¢ del nuovo DNA, derivanti dalla rimozione dei primer di RNA, perché nessuna sintesi ha potuto riempirle 5¢





5¢ Interruzione



e

Interruzione lasciata dopo la rimozione del primer 5¢

Figura 3.15 Il problema della replicazione completa di un cromosoma lineare negli eucarioti.

Le cellule eucariote hanno 15 o più DNA polimerasi. Tre di queste sono necessarie alla replicazione del DNA nucleare: Pol α/primasi, Pol δ e Pol ε. La Pol α/primasi inizia la replicazione dei nuovi filamenti mediante la primasi sintetizzando circa 10 nucleotidi di un primer di RNA, allungato dalla Pol α di circa 10-20 nucleotidi di DNA. Pol ε sintetizza il DNA del filamento leading e Pol δ il DNA del filamento lagging. Le altre DNA polimerasi eucariote replicano il DNA mitocondriale o il DNA del cloroplasto, oppure sono implicate in specifici processi di riparazione del DNA. Come nei procarioti, la giunzione dei frammenti di Okazaki sul filamento lagging che funziona da stampo coinvolge la rimozione del primer dal frammento di Okazaki più vecchio e la sostituzione con DNA mediante l’estensione del frammento di Okazaki più recente. La rimozione del primer non coinvolge la progressiva rimozione dei nucleotidi, come nel caso dei procarioti. Pol δ continua l’estensione del nuovo frammento di Okazaki e questa attività sposta l’RNA/DNA davanti all’enzima, producendo un lembo che viene rimosso dalle nucleasi. I due frammenti di Okazaki vengono infine legati insieme dalla DNA ligasi eucariote.

Replicazione dell’estremità dei cromosomi Poiché la DNA polimerasi può catalizzare nuovo DNA soltanto estendendo un primer, la replicazione delle estremità dei cromosomi eucariotici – i telomeri – pone dei problemi (Figura 3.15). Un cromosoma parentale (Figura 3.15a) viene replicato, generando due nuove molecole di DNA, ciascuna delle quali ha un primer di RNA all’estremità 5′ nella regione del telomero di ciascuna elica di nuova sintesi (Figura 3.15b). Al contrario, i numerosi primer di RNA in ogni filamento lagging sono stati sostituiti dal DNA durante le normali fasi della replicazione (Figura 3.6). Si noti che il frammento 5′ di Okazaki è esteso nella direzione 5′→3′ per rimpiazzare il primer di RNA. Dal momento che non ci sono frammenti di Okazaki alle estremità 5′ del primer, la rimozione dell’RNA alle estremità 5′ dei nuovi filamenti di DNA lascia un pezzo di filamento singolo di DNA parentale che si estende oltre l’estremità 5′ di ogni nuovo filamento. La DNA polimerasi non può riempire questa parte sporgente all’estremità del cromosoma. Se queste sporgenze non venissero in qualche modo risolte, i cromosomi diventerebbero sempre più corti a ogni ciclo di replicazione. Invece, vi è uno speciale meccanismo per replicare le estremità dei cromosomi. La maggior parte dei cromosomi eucariotici ha semplici sequenze specie-specifiche ripetute in tandem ai telomeri (Capitolo 2). Elizabeth Blackburn e Carol W. Greider hanno dimostrato che un enzima chiamato telomerasi mantiene la lunghezza dei cromosomi aggiungendo ripetizioni telome-

La replicazione del DNA

riche a un filamento (quello che ha un’estremità 3′), che serve da stampo per la replicazione del DNA a ciascuna estremità del cromosoma lineare. La Figura 3.16 mostra uno schema semplificato del meccanismo usato per l’aggiunta delle ripetizioni telomeriche all’estremità di un cromosoma umano. Nell’uomo e in tutti gli altri vertebrati la sequenza ripetuta è 5′TTAGGG-3′, leggendola sull’elica superiore nella figura, in direzione della fine del DNA. La reale estremità 3′ è variabile da cromosoma a cromosoma; qui viene mostrata la sequenza terminale più frequente. La telomerasi agisce allo stadio mostrato nella Figura 3.15c, cioè dove una estremità del cromosoma è stata sintetizzata dopo la rimozione del primer con formazione di una sporgenza che si estende oltre l’estremità 5′ del nuovo DNA (Figura 3.16a). La telomerasi è un enzima ribonucleoproteico, cioè costituito sia da proteine sia da RNA. La componente di RNA (lunga nell’uomo 451 basi) comprende una sequenza di 11 basi che funziona da stampo e che è utilizzata per la sintesi delle nuove sequenze ripetute di DNA telomerico. La telomerasi si lega in modo specifico alle sporgenze telomeriche sul filamento con l’estremità 3′ del cromosoma (Figura 3.16b). L’estremità 3′ della sequenza di RNA che funziona da stampo nella telomerasi (3′-CAAUC-5′) si appaia con la sequenza 5′-GTTAG-3′ all’estremità del filamento di DNA sporgente. A questo punto, la telomerasi catalizza l’aggiunta di nuovi nucleotidi all’estremità 3′ del DNA (5′-GGGTTAG-3′) utilizzando l’RNA telomerasi come stampo (Figura 3.16c). La telomerasi scivola quindi verso la fine del cromosoma, in modo che la sequenza all’estremità 3′ (3′CAAUC-5′) dell’RNA stampo si appai ora con il DNA di nuova sintesi (Figura 3.16d). Quindi, come prima, la telomerasi sintetizza il DNA telomerico allungando la sporgenza (Figura 3.16e). Se la telomerasi si allontana ora dal DNA, il cromosoma si sarà allungato di due ripetizioni telomeriche (Figura 3.16f). Ma il processo può continuare aggiungendo più ripetizioni telomeriche. Così il cromosoma si può allungare aggiungendo un certo numero di ripetizioni telomeriche. Allora, quando il cromosoma è replicato usando il filamento allungato come stampo e il primer del nuovo filamento di DNA è rimosso, ci sarà ancora una sporgenza, ma qualunque accorciamento del cromosoma sarà stato più che compensato dall’azione della telomerasi (Figura 3.16g). Nella maggior parte delle cellule il DNA dei telomeri si avvolge su sé stesso all’indietro per formare un tloop, con una parte finale a singolo filamento che invade le sequenze telomeriche ripetute a doppio filamento in modo da formare un D-loop (Capitolo 2 e Figura 2.24). La sintesi del DNA a partire dallo stampo di RNA è chiamata trascrizione inversa; pertanto, la telomerasi è un esempio di enzima definito trascrittasi inversa. (La telomerasi trascrittasi inversa è abbreviata in TERT.

51

a) Punto di inizio: estremità cromosomica con interruzione in 5¢ lasciata dalla rimozione del primer Estremità sporgente dopo l’allontanamento del primer 5¢

T T A G G G T T A G G G T T A G 3¢



A A T C C C 5¢

b) Legame della telomerasi alla ripetizione telomerica sporgente alla fine del cromosoma 5¢ 3¢

T T A G G G T T A G G G T T A G 3¢ A A T C C C 5¢

Telomerasi

CA AUCCCA A UC

RNA telomerasi 5¢ 3¢ Stampo a RNA per il nuovo DNA telomerico c) Sintesi di un segmento di DNA all’estremità del cromosoma, usando l’RNA stampo della telomerasi. Nuovo DNA 5¢

T T A G G G T T A G G G T T A G G G T T A G 3¢



A A T C C C 5¢

CA AUCCCA A UC





d) La telomerasi si muove verso la regione terminale 3¢ del DNA telomerico neosintetizzato 5¢

T T A G G G T T A G G G T T A G G G T T A G 3¢



A A T C C C 5¢

CA AUCCCA A UC





e) Sintesi di nuovo DNA telomerico Nuovo DNA 5¢

T T A G G G T T A G G G T T A G G G T T A G G G T T A G 3¢



A A T C C C 5¢

CA AUCCCA A UC





f) Regioni terminali del cromosoma dopo che la telomerasi si è dissociata 5¢

T T A G G G T T A G G G T T A G G G T T A G G G T T A G 3¢



A A T C C C 5¢

DNA sintetizzato dopo due cicli di attività della telomerasi

g) Nuova regione terminale del cromosoma dopo la replicazione e la rimozione del primer Estremità sporgente dopo l’allontanamento del primer 5¢

T T A G G G T T A G G G T T A G G G T T A G G G T T A G 3¢



A A T C C C A A T C C C A A T C C C 5¢ Allungamento 5¢ del cromosoma dovuto all’attività telomerasica

Figura 3.16 Sintesi di DNA telomerico da parte della telomerasi. L’esempio è riferito ai telomeri dell’uomo. Il processo è descritto in maniera semplificata.

Altre trascrittasi inverse sono usate in applicazioni biotecnologiche, come la reverse transcription-PCR o RTPCR, descritta nel Capitolo 10.) La lunghezza dei telomeri, pur non essendo identica in tutti i cromosomi, ha tuttavia una regolazione che ne sta-

52

Capitolo 3

bilisce la lunghezza media a livello di organismo e di tipo cellulare. Nel lievito, per esempio, le semplici sequenze telomeriche (TG1-3, una sequenza ripetuta costituita da una T seguita da una fino a tre G) coprono in media 300 bp mentre in tutti i vertebrati, compreso l’uomo, le sequenze telomeriche (TTAGGG) si estendono per parecchie migliaia di basi. L’analisi di mutanti nel lievito ha dimostrato che la lunghezza dei telomeri è regolata geneticamente. Se, per esempio, il gene TLC1 (che codifica per l’RNA della telomerasi) è deleto, oppure se il gene EST1 (Ever Shorter Telomeres, che codifica per la componente proteica della telomerasi di lievito) è mutato, i telomeri si accorciano sempre più, finché la cellula muore. Questo fenotipo fornisce la prova che l’attività della telomerasi è necessaria per la vitalità a lungo termine delle cellule. Prove recenti suggeriscono l’esistenza di più livelli di regolazione dell’attività e della lunghezza dei telomeri. Si sta prestando attenzione, per esempio, all’osservazione che l’attività telomerasica nei mammiferi è limitata alle cellule immortali (come le cellule tumorali) e a molte cellule che proliferano (come le cellule embrionali, alcune cellule staminali e le cellule germinali). L’assenza di attività telomerasica negli altri tipi cellulari causa il progressivo accorciamento delle estremità dei cromosomi durante le divisioni successive e stabilisce un limite al numero

di divisioni che la cellula può fare (detto limite di Hayflick dal nome dello scienziato che lo ha dimostrato in cellule in coltura). Oggi sappiamo che l’accorciamento dei telomeri segnala alla cellula di dover smettere di dividersi, uscire dal ciclo cellulare ed entrare in uno stato noto come senescenza replicativa. In questo stato (caratterizzato da un metabolismo ridotto, una ridotta sintesi proteica, una perdita delle funzioni cellulari differenziate e produzione di fattori specifici) la cellula permane per un tempo anche lungo fino a quando muore.

Nota chiave Enzimi specifici – le telomerasi – replicano le estremità dei cromosomi negli eucarioti. La telomerasi è un complesso di proteine e di RNA. L’enzima utilizza l’RNA come stampo per la sintesi delle ripetizioni telomeriche complementari del cromosoma; per questo è funzionalmente definita trascrittasi inversa. L’assenza di attività telomerasica provoca accorciamento progressivo dei telomeri e induce senescenza cellulare, riducendo a lungo termine la vitalità delle cellule.

L’assemblaggio del nuovo DNA nei nucleosomi

Dimero H2A-H2B

Il DNA degli eucarioti è complessato con istoni in strutture nucleosomiche, che sono le unità di base dei cromosomi (Capitolo 2). Si ricordi che nel nucleosoma vi sono Istoni vecchi: H2A H2B H3 H4 otto istoni, due copie ciascuno di H2A, H2B, H3 e H4. Istoni nuovi: H2A H2B H3 H4 Perciò, quando il DNA viene replicato, il complemento Direzione della Nucleosoma replicazione del DNA istonico deve venire raddopparentale piato, in modo che tutti i nuMacchinario cleosomi siano duplicati. della replicazione Questa duplicazione coinvolge del DNA due processi: la sintesi di nuove proteine istoniche e l’assemblaggio di nuovi nucleosomi. La maggior parte della sintesi degli istoni avviene durante la fase S del ciclo cellulare, ed è coordinata con la sintesi del DNA. Affinché la replicazione proceda, i nucleosomi devono dissociarsi durante il breve tempo del passaggio della forca replicativa; il DNA di nuova replicazione viene assemblato nei nucleosomi quasi immediaDimero H2A-H2B Dimero H2A-H2B

Figura 3.17 Assemblaggio di nuovi nucleosomi a livello della forca replicativa. I nuovi nucleosomi vengono assemblati dapprima usando un tetramero H3-H4 parentale o uno nuovo e poi completando la struttura con una coppia di dimeri H2A-H2B.

La replicazione del DNA

tamente. I nuovi nucleosomi vengono assemblati nel modo seguente (Figura 3.17): ogni nucleo istonico parentale di un nucleosoma si separa in un tetramero H3-H4 (due copie ciascuno di H3 e H4) e in due copie di un dimero H2A-H2B. Il tetramero H3-H4 viene trasferito direttamente a una delle due doppie eliche replicate dopo il passaggio della forca replicativa, il che segna l’inizio dell’assemblaggio del nucleosoma. I dimeri H2A-H2B vengono rilasciati e raggiungono il pool di dimeri H2A-H2B sintetizzati ex novo e assemblati.

53

È anche presente un pool di nuovi tetrameri; uno di questi tetrameri inizia l’assemblaggio del nucleosoma sull’altra doppia elica di DNA dopo il passaggio della forca replicativa. La restante parte dei nuovi nucleosomi viene assemblata da dimeri H2A-H2B parentali o nuovi. Ne deriva che un nuovo nucleosoma avrà un tetramero sia parentale sia nuovo e una coppia di dimeri H2A-H2B che possono essere parentali-parentali, parentali-nuovi o nuovi-nuovi. Le proteine chaperonine istoniche nel nucleo dirigono il processo di assemblaggio del nucleosoma.

Sommario l La replicazione del DNA nei procarioti e negli eucarioti avviene con un meccanismo semiconservativo nel quale i due filamenti di DNA a doppia elica sono separati e un nuovo filamento complementare di DNA viene sintetizzato nella direzione da 5′ a 3′ su ognuno dei filamenti parentali, che funzionano da stampo. Questo meccanismo assicura che l’informazione genetica sia copiata accuratamente a ogni divisione cellulare. l Gli enzimi chiamati DNA polimerasi catalizzano la sintesi del DNA. Usando il precursore desossiribonucleoside 5′-trifosfato (dNTP), tutte le polimerasi fabbricano nuovi filamenti nella direzione da 5′ a 3′. l Le DNA polimerasi non possono iniziare la sintesi di un nuovo filamento di DNA. I DNA neosintetizzati usano come innesco l’RNA, la cui sintesi è catalizzata dall’enzima DNA primasi. l La replicazione in E. coli richiede due DNA polimerasi e parecchi altri enzimi e proteine. Sia nei procarioti sia negli eucarioti, la sintesi del DNA è continua su un filamento e discontinua sull’altro filamento, che funzionano entrambi da stampo; questo processo è chiamato replicazione semidiscontinua. l Negli eucarioti la replicazione del DNA avviene nella fase S del ciclo cellulare ed è simile alla replicazione nei procarioti da un punto di vista biochimico e molecolare.

l Nei procarioti la replicazione del DNA inizia in un punto singolo e procede in modo bidirezionale. Negli eucarioti la replicazione del DNA inizia contemporaneamente in parecchi punti lungo ogni cromosoma e procede in modo bidirezionale a partire da ogni punto di origine. l Enzimi speciali (telomerasi) replicano le estremità dei cromosomi in parecchie cellule eucariote. Una telomerasi è un complesso di proteine e RNA. L’RNA agisce da stampo per la sintesi delle ripetizioni telomeriche complementari di un cromosoma. Nei mammiferi l’attività della telomerasi è limitata alle cellule immortali (come le staminali, le cellule germinali e quelle tumorali). L’assenza dell’attività della telomerasi produce un progressivo accorciamento della parte finale del cromosoma a ogni divisione cellulare e, in questo modo, viene limitato il numero di divisioni delle cellule somatiche che, a lungo termine, vanno incontro a senescenza e poi a morte. l L’organizzazione nucleosomica del cromosoma eucariote deve essere duplicata man mano che la forca di replicazione avanza. I nucleosomi devono dissociarsi per permettere alla forca di replicazione di passare; successivamente, nuovi nucleosomi sono assemblati non appena la forca di replicazione è passata. L’assemblaggio del nucleosoma è un processo ordinato diretto dalle proteine chaperonine istoniche.

Approccio analitico alla soluzione di problemi di genetica D3.1 a. Meselson e Stahl usarono DNA marcato con 15N per dimostrare che la replicazione del DNA è semiconservativa. Il metodo di analisi era la centrifugazione all’equilibrio in gradiente di densità di cloruro di cesio, in cui il DNA batterico marcato su tutte e due le eliche con 15N (l’isotopo pesante dell’azoto) forma una banda in una posizione del gradiente diversa da quella di un DNA marcato su entrambe le eliche con 14N (l’isotopo normale dell’azoto). Partendo da una miscela di DNA contenente 14N e DNA contenente 15N, dopo la centrifugazione in gradiente di CsCl si ottengono due bande.

Quando il DNA a doppia elica è scaldato a 100 °C, le due eliche si separano in seguito alla rottura dei legami idrogeno – processo chiamato denaturazione del DNA. Quando la soluzione contenente il DNA è raffreddata lentamente, ciascuna delle due eliche complementari trova l’altra elica e riforma la doppia elica – processo detto rinaturazione. Se la miscela di DNA contenente 14N e 15N è riscaldata a 100 °C e poi raffreddata lentamente prima della centrifugazione, il risultato è diverso rispetto a quello indicato in precedenza. Si osservano due bande esattamente nelle posizioni precedenti e una terza banda a metà strada fra le due. Dalla sua posizione rispetto alle altre due bande, la nuova banda appa-

54

Capitolo 3

re di densità intermedia fra le altre due. Spiegate l’esistenza di tre bande nel gradiente. b. DNA di E. coli contenente 15N in entrambe le eliche viene mescolato con DNA di un’altra specie batterica, il Bacillus subtilis, contenente 14N in entrambe le eliche. Si osservano due bande dopo centrifugazione in gradiente di CsCl. Se i due DNA mescolati sono riscaldati a 100 °C, raffreddati lentamente e poi centrifugati, si osservano solo due bande. Le bande sono situate esattamente nelle stesse posizioni dell’esperimento con DNA non riscaldato. Spiegate questi risultati. R3.1 a. Quando il DNA è riscaldato a 100 °C, viene denaturato in singoli filamenti. Se il DNA denaturato viene fatto raffreddare lentamente, le eliche complementari si riassociano a formare di nuovo doppie eliche. Perciò, quando DNA 15N-15N e 14N-14N della stessa specie, denaturati e miscelati, vengono raffreddati lentamente, le singole eliche si appaiano a caso durante la rinaturazione generando doppie eliche di DNA 15N-15N, 14N-14N e 14N-15N. Quest’ultimo DNA ha una densità intermedia rispetto agli altri due tipi di DNA e giustifica la terza banda. Teoricamente, se tutti i filamenti di DNA si appaiassero a caso, ci dovrebbe essere una distribuzione 1:2:1 di DNA 15N-15N, 14N-15N, 14N-14N, e questo rapporto si dovrebbe riflettere nelle intensità relative delle bande. b. I DNA di specie differenti hanno sequenze diverse. In altre parole, il DNA di una specie generalmente non è complementare a quello di un’altra specie. Perciò si osserveranno solo due bande, perché solo le due eliche di DNA di E. coli possono rinaturare e formare DNA 15N-15N e solo le due eliche di DNA di B. subtilis possono rinaturare e formare DNA 14N-14N. Non si può formare DNA 14N-15N e quindi in questo caso non vi sarà una banda di densità intermedia. D3.2 Quale sarebbe in un ceppo di E. coli l’effetto sulla replicazione cromosomica di delezioni dei seguenti geni? a. dnaE b. polA c. dnaG d. lig e. ssb f. oriC

R3.2 Quando i geni sono deleti, la funzione codificata da quei geni va perduta. Tutti i geni elencati nella domanda sono coinvolti nella replicazione del DNA in E. coli, e le loro funzioni sono descritte brevemente nella Tabella 3.1 e ulteriormente discusse nel testo. a. dnaE codifica una subunità della DNA polimerasi III, la DNA polimerasi principale in E. coli, responsabile dell’allungamento delle catene di DNA. Una delezione del gene dnaE causerebbe senza dubbio una perdita della funzionalità della DNA polimerasi III. In assenza di DNA polimerasi III, non si possono sintetizzare filamenti di DNA dai primer di RNA; quindi, nuovi filamenti di DNA non potrebbero essere sintetizzati e non vi sarebbe replicazione cromosomica. b. polA codifica la DNA polimerasi I, che è usata nella sintesi di DNA per allungare catene di DNA sintetizzate dalla DNA polimerasi III, rimuovendo contemporaneamente i primer di RNA con l’attività esonucleasica 5′→3′. Come discusso nel testo, la replicazione del DNA avviene ancora in mutanti mancanti della DNA polimerasi originalmente studiata – la DNA polimerasi I. Quindi, i cromosomi replicherebbero normalmente in un ceppo di E. coli portatore di una delezione di polA. c. dnaG codifica la DNA primasi, l’enzima che sintetizza il primer di RNA sullo stampo di DNA. Senza la sintesi del corto primer di RNA, la DNA polimerasi III non può iniziare la sintesi di DNA e perciò non può avvenire la replicazione del DNA. d. lig codifica la DNA ligasi, l’enzima che catalizza la giunzione dei frammenti di Okazaki. In un ceppo portatore di una delezione di lig, si avrebbe sintesi di DNA, ma non si otterrebbero cromosomi figli stabili, perché i frammenti di Okazaki non potrebbero essere legati insieme; quindi, l’elica lagging sintetizzata in modo discontinuo sul filamento stampo lagging sarebbe costituita da frammenti. e. ssb codifica le proteine che legano e stabilizzano le regioni di DNA a singola elica prodotte dallo svolgimento del DNA alla forca replicativa. In assenza delle proteine SSB, la replicazione del DNA sarebbe ostacolata o assente, perché la bolla replicativa non potrebbe essere mantenuta aperta. f. oriC è la regione dell’origine di replicazione in E. coli, cioè il punto in cui inizia la replicazione cromosomica. Senza l’origine, la proteina iniziatrice non può legarsi, non si può formare la bolla di replicazione e perciò non può avvenire la replicazione cromosomica.

4

La funzione del gene

Qual è la relazione tra i geni e gli enzimi?

Quale relazione esiste tra i geni e le proteine non enzimatiche?

In che modo i geni controllano le vie biochimiche?

Come si possono individuare le mutazioni che causano malattie genetiche?

Attività Entro i primi minuti di vita, la maggior parte dei neonati negli Stati Uniti viene sottoposta a una serie di test: sono valutati, per esempio, i riflessi e la respirazione, rilevato il colore della pelle e prelevati campioni di sangue che vengono inviati rapidamente in laboratorio. Le prove sui campioni di sangue aiutano i medici a determinare se il bimbo ha una malattia genetica debilitante o addirittura letale. Che cosa sono le malattie genetiche? Quali sono le relazioni tra geni, enzimi e malattie genetiche? In che modo comprendere la funzione di un gene può aiutare a prevenire o minimizzare il rischio di tali malattie? Che cosa hanno in comune la muffa del pane e certe malattie genetiche umane? Nella iAttività di questo capitolo imparerete a utilizzare le procedure sperimentali di Beadle e Tatum per poter rispondere a questa domanda.

In questo capitolo esaminiamo la funzione del gene presentando alcune delle prove classiche che i geni codificano per gli enzimi e le proteine non enzimatiche. Attraverso l’esame del controllo genetico delle vie biochimiche si vedrà che i geni non funzionano in modo isolato, ma in cooperazione con altri geni per assicurare il buon funzionamento delle cellule. La comprensione del funzionamento dei geni e di come i geni sono regolati è lo scopo fondamentale per i genetisti. Sotto il profilo storico, gli esperimenti descritti in questo capitolo rappresentano gli inizi della genetica molecolare, in quanto il loro scopo era comprendere meglio un gene a livello molecolare. Nei capitoli successivi sarà approfondita la nostra moderna comprensione della struttura del gene e della sua espressione.

Controllo genetico della struttura degli enzimi Ipotesi di Garrod sugli errori congeniti del metabolismo Nel 1902 Archibald Garrod, un medico inglese, e il genetista William Bateson studiarono l’alcaptonuria (OMIM, Online Mendelian Inheritance in Man, http://www. ncbi.nlm.nih.gov/omim, annotazione 203500), una malattia dell’uomo caratterizzata dal fatto che le urine diventano scure dopo l’esposizione all’aria e dalla tendenza a sviluppare artrite in tarda età. Il difetto è facilmente identificabile poco dopo la nascita a causa del tipico colore dell’urina. La trasmissibilità del difetto e il tipo di ereditarietà suggerivano che l’alcaptonuria fosse un carattere controllato geneticamente causato da un allele recessivo, come dimostrato nel 1908 da Garrod. (Molte malattie genetiche umane sono recessive – il che significa che, per sviluppare la malattia, un individuo deve ereditare da ogni genitore un allele mutato per il gene responsabile della malattia, risultando quindi omozigote per questo allele; l’argomento è ripreso e ampliato nel Capitolo 11). Garrod scoprì che individui con l’alcaptonuria eliminano con l’urina acido omogentisico (HA), mentre gli individui senza la malattia non lo fanno; è l’HA presente nelle urine che diventa scuro a contatto con l’aria. Questo risultato indicò a Garrod che, mentre gli individui normali sono capaci di metabolizzare l’HA, quelli affetti da alcaptonuria non ne sono capaci. Detto nei termini di Garrod, questa malattia è un esempio di errore congenito del metabolismo, cioè l’alcaptonuria è una malattia genetica causata dall’assenza di un particolare enzima necessario per il metabolismo dell’HA. La Figura 4.1 mostra parte della catena metabolica della fenilalani-

56

Capitolo 4

na-tirosina: il passaggio da HA ad acido maleilacetoacetico non ha luogo negli alcaptonurici. La mutazione responsabile dell’alcaptonuria comporta quindi una perdita di funzione del gene coinvolto e risulta perciò recessiva (vedi Capitolo 11): solo le persone omozigoti per questo gene mutante manifestano il difetto. Analisi successive hanno localizzato il gene sul cromosoma 3. Il lavoro di Garrod ha fornito la prima prova della relazione tra geni ed enzimi. Un’importante conseguenza dell’analisi di Garrod dell’alcaptonuria, e di altre malattie genetiche umane che coinvolgono processi biochimici, fu la comprensione del fatto che la posizione di un blocco in una via metabolica può essere determinata dall’accumulo del composto chimico (HA, nel caso dell’alcaptonuria) che precede il passaggio laddove la catena metabolica è bloccata. Tuttavia, l’importanza del lavoro di Garrod non venne colta dai suoi contemporanei.

L’ipotesi un gene-un enzima

MyLab

Nel 1942, George Beadle ed Edward Tatum diedero inizio alla genetica biochimica, una branca della genetica che utilizza la biochimica per spiegare la natura molecolare di una catena metabolica. I risultati degli studi compiuti con il fungo aploide Neurospora crassa (la muffa del pane) indicarono che vi era una relazione diretta fra geni ed enzimi e portarono alla formulazione dell’ipotesi un gene-un enzima, una pietra miliare nella storia della genetica. Beadle e Tatum condivisero il Premio Nobel per la Fisiologia o Menimazione dicina nel 1958 per la loro “scoperta che i geni agiscono L’ipotesi un gene-un enzima regolando determinati eventi chimici”. Proteine della dieta

Fenilalanina

Tiroxina

Tirosina PKU

Acido fenilpiruvico

Isolamento di mutanti nutrizionali in Neurospora Per comprendere gli esperimenti di Beadle e Tatum, occorre prima comprendere il ciclo di crescita di Neurospora crassa, la muffa del pane (Figura 4.2). Neurospora crassa è un fungo miceliale, il che significa che si diffonde nel terreno di coltura a formare una massa di filamenti intrecciati (Figura 1.4g). Il micelio produce spore asessuali chiamate conidi, di un colore arancione responsabile del nome comune del fungo. Neurospora possiede proprietà importanti che la rendono utile per gli studi di genetica e biochimica, tra le quali il fatto di essere un organismo aploide, cosicché l’effetto delle mutazioni può essere visto direttamente, e di avere un ciclo vitale breve, il che facilita lo studio della segregazione di difetti genetici. Neurospora può essere propagata vegetativamente (asessualmente), inoculando frammenti di micelio o le spore asessuali (conidi) in un terreno di coltura per dare origine a un nuovo micelio. Neurospora crassa può anche riprodursi in modo sessuato. Vi sono due tipi sessuali (due “sessi” in senso lato), chiamati A e a. Entrambi i tipi sessuali hanno identico aspetto e possono essere distinti solo sulla base del fatto che i ceppi di tipo A non si incrociano con altri ceppi A, e i ceppi a non si incrociano con altri a. Il ciclo sessuale viene iniziato mescolando i tipi A e a in un terreno povero di azoto. In queste condizioni le cellule dei due tipi sessuali si fondono, con successiva fusione dei due nuclei aploidi a produrre un nucleo diploide A/a, che è il solo stadio diploide del ciclo di crescita. Il nucleo diploide va immediatamente incontro a meiosi e produce quattro nuclei aploidi (due A e due a) all’interno di un sacco allungato chiamato asco. Una successiva divisione mitotica porta a otto i nuclei aploidi allineati, attorno ai quali si formano le pareti della spora a produrre otto ascospore sessuali (quattro A e quattro a).

DOPA Albinismo

p-idrossifenil-piruvato Melanina 2,5-diidrossifenil-piruvato

Acido omogentisico (HA) Alcaptonuria Acido maleilacetoacetico

CO 2 +H 2 O

Figura 4.1 Via metabolica della fenilalanina-tirosina. Gli individui affetti da alcaptonuria non possono metabolizzare l’acido omogentisico (HA) in acido maleilacetoacetico e quindi lo accumulano. Gli affetti da fenilchetonuria (PKU) non possono trasformare la fenilalanina in tirosina e di conseguenza accumulano acido fenilpiruvico. Individui affetti da albinismo non possono sintetizzare la melanina dalla tirosina.

La funzione del gene Ascospore (4 A : 4 a)

Figura 4.2 Ciclo vitale del fungo miceliale aploide Neurospora crassa. (Non in scala.)

Asco N

Ascospora aploide, tipo sessuale A

Divisione mitotica e maturazione delle spore

57

Ascospora aploide, tipo sessuale a

2ª divisione Meiosi

Germinazione

Germinazione

1ª divisione

Conidi (spore asessuali) N

N Nucleo 2N

Comincia a formarsi l’asco A/a

Conidio in germinazione Micelio vegetativo, tipo sessuale A

Micelio vegetativo, tipo sessuale a

Fusione nucleare

Nucleo A

Nucleo a Fusione cellulare

Ogni asco, quindi, contiene tutti i prodotti della singola meiosi iniziale. Numerosi aschi si sviluppano all’interno di un corpo fruttifero. Quando l’asco è maturo, le ascospore (spore sessuali) vengono scagliate fuori da esso e dal corpo fruttifero per essere disperse dal vento. La germinazione di un’ascospora dà origine a un nuovo micelio aploide. Particolarmente importante per gli esperimenti di Beadle e Tatum è il fatto che Neurospora ha esigenze nutrizionali semplici. Neurospora selvatica può crescere in un terreno minimo, che contiene solo sali inorganici (tra i quali una fonte di azoto), una fonte di carbonio organico (per esempio, glucosio o saccarosio) e la vitamina biotina. Un ceppo che può vivere in un terreno minimo è chiamato ceppo prototrofo o semplicemente prototrofo; Beadle e Tatum si resero conto che Neurospora sintetizza le altre molecole necessarie per la crescita (per esempio amminoacidi, nucleotidi, vitamine, acidi nucleici, proteine) a partire dai composti chimici semplici presenti nel terreno minimo di coltura. Neurospora selvatica può crescere anche su terreno minimo al quale vengano aggiunti altri elementi nutrizionali quali amminoacidi o vitamine. Beadle e Tatum quindi capirono che doveva essere possibile isolare dei mutanti nutrizionali (chiamati anche mutanti auxotrofi o solo auxotrofi) di Neurospora, che non potevano crescere su terreno mi-

Le cellule di tipo sessuale opposto si fondono a formare cellule binucleate

nimo e che richiedevano ulteriori elementi nutrizionali. Beadle e Tatum isolarono e caratterizzarono i mutanti auxotrofi; per isolarli, trattarono i conidi con i raggi X, che sono mutageni (generatori di mutazioni). Incrociarono i mutanti ottenuti con il ceppo prototrofo (tipo selvatico) di tipo sessuale opposto (Figura 4.3). Incrociando le spore mutate con quelle selvatiche essi si assicuravano che, qualsiasi mutante auxotrofo avessero isolato, questo segregasse nell’incrocio e quindi avesse una base genetica, piuttosto che una non genetica, per la sua richiesta nutrizionale. Per ogni asco una sola progenie di questi incroci fu fatta germinare in un terreno nutrizionalmente completo, che conteneva tutti gli amminoacidi, purine, pirimidine e vitamine in aggiunta a saccarosio, sali e biotina che si trovano normalmente in un terreno minimo. Qualsiasi ceppo che non fosse capace di sintetizzare amminoacidi, purine, pirimidine o vitamine, partendo dagli ingredienti di base presenti nel terreno minimo, poteva crescere utilizzando i composti forniti nel terreno di coltura completo. Ogni coltura cresciuta in terreno completo venne quindi analizzata durante la crescita in un terreno minimo. I ceppi che non crescevano erano mutanti auxotrofi. Questi mutanti, a loro volta, vennero analizzati individualmente per la capacità di crescere su terreni minimi con l’aggiunta di amminoacidi o vitami-

58

Capitolo 4

Selvatico

Figura 4.3 Metodo utilizzato da Beadle e Tatum per isolare mutazioni auxotrofe in Neurospora. In questo caso il ceppo mutante isolato è auxotrofo per il triptofano.

Ascospore trasferite separatamente in provette di coltura

Incrociato con ceppo selvatico di tipo sessuale opposto Raggi X Corpi fruttiferi

Conidi mutagenizzati

Centinaia di provette contenenti terreno completo inoculate con singole ascospore

Terreno completo

Conidi (spore asessuali) di ciascuna coltura analizzate in terreno minimo

Terreno minimo

L’assenza di crescita in terreno minimo è indice di un mutante nutrizionale

ne. In teoria, un mutante auxotrofo per un amminoacido – un ceppo mutante che ha perduto la capacità di sintetizzare un dato amminoacido – dovrebbe crescere in un terreno minimo che contiene amminoacidi, ma non in un terreno minimo che contiene vitamine, o in un terreno minimo senza aggiunte. Analogamente, i mutanti auxotrofi per una vitamina crescono solo in un terreno minimo contenente vitamine. Immaginiamo di identificare un auxotrofo per un amminoacido. Per trovare quale dei 20 amminoacidi è ri-

Cisteina

Treonina

Serina

Completo (controllo)

Asparagina

Glutammina

Acido aspartico

Minimo + vitamine

Acido glutammico

Istidina

Arginina

Prolina

Triptofano

Tirosina

Lisina

Minimo + amminoacidi

Minimo (controllo)

Fenilalanina

Metionina

Valina

Isoleucina

Leucina

Alanina

Glicina

Conidi delle colture che non crescono su terreno minimo analizzati in terreni diversamente integrati

I 20 amminoacidi

chiesto da quel ceppo per poter crescere, il ceppo viene analizzato in 20 provette, ciascuna contenente terreno minimo al quale sia stato aggiunto uno dei 20 amminoacidi. Nell’esempio della Figura 4.3 viene identificato un auxotrofo per il triptofano, perché capace di crescere solo nella provetta che contiene terreno minimo addizionato con triptofano. Caratterizzazione genetica di una catena biochimica Una volta che Beadle e Tatum ebbero isolato e identifica-

La funzione del gene

to i mutanti nutrizionali, essi analizzarono le catene biochimiche alterate. Ipotizzarono che le cellule di Neurospora, come tutte le cellule, funzionassero per interazione dei prodotti di un gran numero di geni. Inoltre essi immaginarono che Neurospora selvatica convertisse i costituenti del terreno minimo in amminoacidi e altre sostanze mediante una serie di reazioni organizzate in catene biochimiche. Quindi la sintesi dei componenti cellulari avveniva in seguito a una serie di piccoli passaggi, ciascuno catalizzato da un enzima. Come esempio dell’approccio analitico usato da Beadle e Tatum, che portò alla comprensione della relazione tra geni ed enzimi, consideriamo la dissezione genetica della catena biosintetica dell’amminoacido metionina in Neurospora crassa. Partendo da una serie di mutanti auxotrofi per metionina – che richiedono l’aggiunta di metionina al terreno minimo per crescere – l’analisi genetica (test di complementazione; vedi Capitolo 13 e Figura 13.13) identifica quattro geni: met-2+, met-3+, met-5+ e met-8+. Una mutazione in uno di questi geni dà origine ad auxotrofia per metionina. (È da notare che il numero associato a ogni gene non è in relazione con la posizione del prodotto codificato dal gene nella propria catena metabolica.) In seguito, le caratteristiche di crescita dei quattro ceppi mutanti vengono determinate in terreni addizionati con i presunti precursori della metionina – O-acetilomoserina, cistationina e omocisteina. I risultati vengono mostrati nella Tabella 4.1. Per definizione, tutti i quattro ceppi possono crescere in presenza di metionina, mentre nessuno cresce su terreno minimo non supplementato. La sequenza di passaggi nella via biochimica può essere dedotta dalla crescita con le diverse aggiunte. L’analisi si basa su alcuni principi fondamentali. Quanto più a valle un ceppo mutante viene bloccato in una catena biochimica, minore sarà il numero di composti intermedi necessari che ne permetteranno la crescita. Se un mutante blocca un passaggio precoce, un gran numero di intermedi sarà in grado di permettere la crescita del ceppo. Infatti ognuno degli intermedi successivi al passaggio bloccato potrà essere processato dagli enzimi presenti nella catena dopo il blocco, con il risultato della produzione del prodotto finale. Dunque, più in alto si trova il

blocco, maggiore è il numero degli intermedi successivi che possono dare origine al prodotto finale. Quindi, in questa analisi, non solo viene individuata una via biochimica, ma ne viene anche determinato ogni singolo passaggio controllato da un gene. Inoltre, un blocco genetico in una via biochimica può portare all’accumulo dell’intermedio immediatamente precedente al passaggio bloccato. Come viene mostrato nella Tabella 4.1, il ceppo mutante met-8 cresce quando il terreno viene addizionato con metionina, ma non quando lo è con uno qualsiasi degli intermedi della catena metabolica. Ciò indica che il gene met-8 controlla l’ultimo passaggio della catena che porta alla formazione della metionina. Il ceppo mutante met-2 cresce in un terreno al quale viene aggiunta metionina o omocisteina, quindi l’omocisteina deve precedere immediatamente la metionina nella catena metabolica e il gene met-2 deve controllare la sintesi dell’omocisteina a partire da un altro composto. Il mutante met-3 cresce in un terreno addizionato con metionina, omocisteina o cistationina, quindi la cistationina deve precedere l’omocisteina e il gene met-3 deve controllare la sintesi della cistationina da un altro composto. Il ceppo met-5 cresce in terreni supplementati con metionina, omocisteina, cistationina o O-acetilomoserina. Quindi, l’O-acetilomoserina deve precedere la cistationina nella catena biochimica e il gene met-5 deve controllare la sintesi dell’O-acetilomoserina a partire da un altro composto. La catena biosintetica della metionina della quale si parla in questo paragrafo (che è parte di una catena più lunga) è illustrata nella Figura 4.4. Il gene met-5+ codifica per l’enzima che converte l’omoserina in O-acetilomoserina, quindi un mutante per questo gene può crescere in un terreno minimo addizionato di O-acetilomoserina, cistationina, omocisteina o metionina. Il gene met-3+ codifica per l’enzima che converte l’O-acetilomoserina in cistationina, quindi il mutante met-3 può crescere su un terreno addizionato di cistationina, omocisteina o metionina, e così via. Con esperimenti di questo genere, Beadle e Tatum proposero che uno specifico gene codifichi per un determinato enzima. Questa ipotesi che un gene codifichi per

Tabella 4.1 Crescita di mutanti auxotrofi per metionina Crescita in terreno minimo addizionato con Ceppi mutanti

59

nessuna aggiunta

O-acetilomoserina

cistationina

omocisteina

metionina

Selvatico

+

+

+

+

+

met-5



+

+

+

+

met-3





+

+

+

met-2







+

+

met-8









+

60

Capitolo 4

Figura 4.4 Via di biosintesi della metionina che mostra i quattro geni che codificano per gli enzimi che catalizzano ciascuna reazione in Neurospora crassa. (I geni met-5 e met-2 sono sullo stesso cromosoma; met-3 e met-8 sono su altri due cromosomi.) Geni:

Enzimi:

Reazioni:

Omoserina

met-5+

met-3+

Omoserina transacetilasi

Cistationinaγ-sintasi

O-acetilomoserina

met-2+

Cistationasi II

* Si vedrà più avanti nel volume che alcuni enzimi sono molecole di RNA, e non proteine (vedi Capitolo 5).

Metiltetraidrofolato omocisteina transmetilasi

Omocisteina

Cistationina

Metionina

Metiltetraidrofolato

Cisteina

un enzima che catalizza una data reazione in una catena metabolica è detta ipotesi un gene-un enzima. Mutazioni geniche che determinano la perdita della funzione catalitica di un enzima portano all’accumulo dei precursori nella catena biochimica (e a possibili reazioni collaterali) e all’assenza del prodotto finale della catena. Con l’approccio descritto è quindi possibile dissezionare geneticamente una catena biochimica; attraverso lo studio dei mutanti e dei loro effetti si può determinare la sequenza dei passaggi di una catena e correlare ciascun passaggio a uno o più specifici geni. Tuttavia, in seguito i ricercatori hanno scoperto che più di un gene può controllare ogni fase di una via biochimica. Vale a dire che un enzima* può possedere due o più catene polipeptidiche, ognuna delle quali è codificata da uno specifico gene. Un esempio è l’enzima DNA polimerasi III di E. coli, che ha numerose subunità (Tabella 3.1). In tal caso, più di un gene codifica per questo enzima e, in questo modo, partecipa a definire quel passaggio del percorso biochimico. Perciò l’ipotesi un gene-un enzima venne trasformata nell’ipotesi un geneun polipeptide. Questa ipotesi non è completamente corroborata dalle attuali conoscenze. Alcuni geni infatti non codificano per proteine. E negli eucarioti l’espressione di geni che codificano per particolari proteine può risultare in più di un polipeptide. Alcuni esempi descritti verranno forniti più oltre nel testo. Le catene biochimiche sono cruciali per le funzioni delle cellule e il metabolismo di tutti gli organismi. Alcune sintetizzano composti necessari per le cellule (per esempio amminoacidi, purine, pirimidine, grassi, lipidi e vitamine), mentre altre degradano i composti in molecole più semplici, riciclando così DNA, RNA o proteine, o regolando la digestione del cibo. Dal momento che le vie biochimiche sono controllate da enzimi, esse sono sotto il controllo genico. Ma, a causa delle differenze genetiche, i percorsi biochimici non coincidono in tutti gli organismi.

met-8+

L’insieme di tutte le piccole sostanze chimiche che rappresentano intermedi o prodotti delle vie metaboliche è definito metaboloma, e lo studio del metaboloma è chiamato metabolomica. Il Focus sul genoma di questo capitolo presenta i risultati di una ricerca metabolomica che riguarda i procarioti presenti nell’intestino dei mammiferi e che dimostra come essi siano capaci di regolarne la funzionalità.

Nota chiave Una specifica correlazione tra i geni e gli enzimi era insita nell’ipotesi un gene-un enzima di Beadle e Tatum, che stabiliva che ogni gene controllasse la sintesi o l’attività di un singolo enzima. Ma un enzima può essere formato da più di un polipeptide, ognuno codificato da un gene differente. A causa di ciò, storicamente, l’ipotesi fu modificata nell’ipotesi un gene-un polipeptide. Le attuali conoscenze indicano che vi sono eccezioni a questa ipotesi.

Attività Utilizzate la procedura sperimentale di Beadle e Tatum per identificare un mutante nutrizionale nella iAttività Pathways to Inherited Enzyme Deficiencies (Vie metaboliche dei deficit enzimatici ereditari) nel sito web degli studenti.

Deficienze enzimatiche su base genetica nell’uomo Molte malattie genetiche nell’uomo sono causate da una mutazione di un singolo gene che altera la funzione di un enzima il quale, tipicamente, agisce in una via metabolica (Tabella 4.2). In genere, una deficienza enzimatica causata da una mutazione può avere conseguenze semplici o pleiotropiche (a largo raggio). Gli studi di queste malattie hanno fornito ulteriori dimostrazioni che alcuni geni codificano per enzimi. Alcuni di questi difetti genetici saranno discussi nei prossimi paragrafi.

MyLab

La funzione del gene

61

Focus sul genoma Metabolomica intestinale Parecchie specie di batteri e alcune di Archaea vivono nell’intestino dei mammiferi. L’unico Archaea abbondante è il Methanobrevibacter smithii che svolge un ruolo chiave nel metabolismo. I mammiferi non possono digerire i carboidrati complessi della dieta (le fibre), ma alcuni organismi della comunità batterica intestinale lo possono fare (mediante fermentazione). Come prodotto finale della fermentazione i batteri rilasciano un certo numero di acidi grassi a catena corta (SCFA), che i mammiferi ospiti possono assorbire e metabolizzare. Gli SCFA costituiscono fino al 10% delle calorie assorbite dall’ospite. Consumando molti dei prodotti finali della fermentazione batterica, inclusi l’idrogeno e il formiato, M. smithii fa in modo che la comunità batterica funzioni più efficientemente e incrementi il tasso di produzione degli SCFA. M. smithii e il batterio Bacteriodes thetaiotaomicron cambiano il loro stato trascrizionale e metabolico quando sono presenti entrambi nell’intestino, e questi cambiamenti migliorano la digestione delle fibre e forniscono più calorie all’ospite. Ciò è stato dimostrato sperimentalmente mediante analisi genomiche, come la trascrittomica e la metabolomica (vedi Capitolo 9). In breve, la trascrittomica è lo studio dell’espressione dei geni a livello dell’intero genoma. Il trascrittoma è tutto l’RNA espresso in una particolare condizione ed è perciò una misura di quali geni sono trascritti e quali proteine possono essere prodotte. La metabolomica è lo studio di tutte le molecole che sono intermedi o prodotti delle vie metaboliche. L’insieme di queste sostanze chimiche cellulari o extracellulari costituisce il metaboloma. Gli studi metabolomici usano tecniche chimiche per determinare l’identità delle piccole molecole organiche presenti nelle cellule o nell’ambiente extracellulare in cui esse vengono a trovarsi. Lo scopo finale è la comprensione della funzione degli enzimi cellulari e delle loro vie metaboliche. Ciò è indispensabile per la ricerca farmacologica. Per studiare l’interazione fra questi organismi e i loro ospiti, i ricercatori hanno inoculato colture di procarioti nel colon di topi germ-free. Ad alcuni topi furono somministrati sia B. thetaiotaomicron sia M. smithii (Bt/Ms), mentre ad altri di controllo furono date colture che mancavano di M. smithii.

Fenilchetonuria La fenilchetonuria (PKU; OMIM 261600) ha una frequenza di circa 1 su 12 000 nati di razza caucasica. Essa è più comunemente causata da una mutazione recessiva di un gene nel braccio lungo del cromosoma 12 (un au-

I ricercatori aspettarono parecchi giorni allo scopo di far colonizzare il colon dalle cellule, e alimentarono i topi con una dieta ricca di fruttani, una specifica classe di fibre non digeribili. La comunità intestinale Bt/Ms degradò i fruttani in modo più efficiente di quanto fece la comunità intestinale di controllo. Le analisi del trascrittoma mostrarono che, rispetto al controllo, B. thetaiotaomicron nella comunità Bt/Ms aveva incrementato la trascrizione dei geni coinvolti nella degradazione del fruttano e diminuito la trascrizione dei geni per la degradazione degli altri carboidrati complessi. B. thetaiotaomicron aveva inoltre incrementato la produzione di acetato (un SCFA). I modelli basati sulla trascrizione suggerivano che si sarebbe dovuto produrre anche più formiato, ma ciò non venne osservato. Il motivo per cui il livello del formiato non aumentava venne rilevato quando fu caratterizzata la trascrizione di M. smithii. Quando M. smithii si trova in un topo Bt/Ms, esso incrementa la trascrizione dei geni che codificano per enzimi della via biochimica del metabolismo del formiato. Presumibilmente, l’aumento della produzione del formiato da parte di B. thetaiotaomicron viene bilanciato dall’incremento del suo consumo da parte di M. smithii. Tutto considerato, l’intestino Bt/Ms metabolizzava i fruttani in modo più efficiente, poiché entrambe le specie avevano subìto cambiamenti nell’espressione dei geni e nel metabolismo per lavorare insieme nel catabolismo di questi carboidrati. I topi beneficiarono di tutta questa attività? La risposta è sì. I topi colonizzati recuperarono più calorie dal cibo dal momento che assorbirono gli SCFA rilasciati da B. thetaiotaomicron. Inoltre i ricercatori trovarono un incremento dei livelli di acetato nel sangue dei topi Bt/Ms (l’acetato è uno degli SCFA rilasciati da B. thetaiotaomicron). Questi topi Bt/Ms avevano anche più lipidi nel loro fegato e nei loro depositi adiposi. Altri studi hanno suggerito che la presenza di una grande colonia di M. smithii nell’intestino può predisporre i topi (e presumibilmente anche l’uomo) all’obesità. Perciò gli scienziati studiano il genoma di M. smithii nella speranza di trovare i geni che potrebbero essere bersaglio di farmaci appropriati per il trattamento dell’obesità.

tosoma – cioè un cromosoma diverso da un cromosoma sessuale). La mutazione è localizzata nel gene per la fenilalanina idrossilasi. L’assenza dell’attività di questo enzima previene la conversione dell’amminoacido fenilalanina nell’amminoacido tirosina (vedi Figura 4.1). La

62

Capitolo 4

Tabella 4.2 Alcune malattie genetiche umane con la deficienza enzimatica dimostrata Difetto genetico

Locus

Deficienza enzimatica

Numero accesso OMIM

Alcaptonuria

3q21-q23

Acido omogentisico ossidasi

203500

Fibrosi cistica

7q31.2

Regolatore del trasporto transmembrana della fibrosi cistica (CFTR)

602421

Cataratta

17q24

Galattochinasi

230200

Citrullinemiaa

9q34

Argininosuccinato sintetasi

215700

Intolleranza I ai disaccaridi

3q25-q26

Invertasi

222900

Intolleranza al fruttosio

9q22.3

Fruttosio-1-fosfato aldolasi

229600

Galattosemiaa

9p13

Galattosio-1-fosfato uridil transferasi

230400

1q21

Glucocerebrosidasi

230800

Xq28

Glucosio-6-fosfato deidrogenasi

305900

Malattia di Gauchera Deficienza della G6PD

(favismo)a

Malattia da accumulo di glicogeno I

17q21

Glucosio-6-fosfatasi

232200

Malattia da accumulo di glicogeno

IIa

17q25.2-q25.3

α-1,4-glucosidasi

232300

Malattia da accumulo di glicogeno

IIIa

1p21

Amilo-1, β-glucosidasi

232400

Malattia da accumulo di glicogeno IVa

3p12

Enzima di ramificazione del glicogeno

232500

Anemia emoliticaa

3p21.1, 8p21.1, 20q11.2, 1q21

Glutatione perossidasi o glutatione reduttasi o glutatione sintetasi o esochinasi o piruvato chinasi

138320, 138300, 231900, 266200

Lattasi

223000

Deficienza della lattasi intestinale (adulto) Chetoacidosia

5p13

Succinil CoA:3-chetoacido CoAtransferasi

245050

Sindrome di Lesch-Nyhana

Xq26-q27.2

Ipoxantina guanina fosforibosiltransferasi

308000

Malattia delle urine a sciroppo d’acero, tipo IAa

19q13.1-q13.2

Chetoacido decarbossilasi

248600

Fenilchetonuriaa

12q24.1

Fenilalanina idrossilasi

261600

10q25.2-q26.3

Uroporfirinogeno III sintasi

263700

14q32.1

α-1-antitripsina

107400

25-idrossicolecalciferolo 1-idrossilasi

277420

15q23-q24

Esosamminidasi A

272800

12q24-qter

ρ-idrossifenilpiruvato ossidasi

276710

Porfiria, congenita

eritropoieticaa

Enfisema polmonare Rachitismo, dipendente da vitamina D Sindrome di

Tay-Sachsa

Tirosinemia, tipo III a

Diagnosi prenatale possibile.

fenilalanina è uno degli amminoacidi essenziali, cioè si tratta di un amminoacido che deve essere incluso nella dieta in quanto l’uomo non è in grado di sintetizzarlo. La fenilalanina è richiesta per la sintesi delle proteine; tuttavia un eccesso di questo amminoacido è dannoso e viene convertito in tirosina per essere quindi ulteriormente trasformato. I bambini affetti da PKU accumulano la fenilalanina ingerita perché non sono in grado di metabolizzarla. La fenilalanina accumulata viene convertita in acido fenilpiruvico, che danneggia gravemente le cellule del sistema nervoso centrale e produce gravi sintomi:

grave ritardo mentale, crescita ridotta e morte prematura. (I bambini affetti da PKU non ne presentano i sintomi prima della nascita, perché l’eccesso di fenilalanina che si accumula viene metabolizzato dagli enzimi materni.) La PKU ha effetti pleiotropici. Un fenilchetonurico non può sintetizzare la tirosina, un amminoacido richiesto per la sintesi proteica e per la produzione degli ormoni tiroxina e adrenalina e del pigmento della pelle melanina. Questo aspetto del fenotipo non è molto grave, dato che la tirosina può essere fornita dal cibo. Tuttavia il cibo non ne contiene normalmente una grande quantità. Di conse-

La funzione del gene

guenza, le persone affette da PKU hanno relativamente poca melanina e quindi tendono ad avere la pelle molto chiara e gli occhi chiari (dal momento che la melanina contribuisce alla colorazione dell’iride). Inoltre gli individui fenilchetonurici hanno livelli relativamente bassi di adrenalina, un ormone che viene prodotto da una via biochimica che deriva dalla tirosina. I sintomi più gravi della PKU dipendono dalla quantità di acido fenilpiruvico che viene prodotto dall’accumulo di fenilalanina. Quindi la malattia può essere gestita attraverso il controllo della quantità della fenilalanina assunta attraverso la dieta. Una miscela di singoli amminoacidi con una quantità controllata di fenilalanina viene utilizzata come sostituto delle proteine nella dieta degli individui con PKU. La dieta deve conservare un livello di fenilalanalina nel sangue che sia abbastanza elevato da facilitare il normale sviluppo del sistema nervoso, ma abbastanza basso da prevenire il ritardo mentale. Il trattamento deve iniziare a 1 o 2 mesi dalla nascita, o il cervello sarà danneggiato e il trattamento risulterà inefficace. La dieta per la PKU è costosa, oltre 5000 dollari all’anno. Esistono opinioni diverse quanto alla necessità che la dieta venga continuata per tutta la vita o alla possibilità di interromperla intorno ai 10 anni di età, senza che si sviluppino in seguito danni mentali o comportamentali. Inoltre, le donne fenilchetonuriche sono invitate a proseguire la dieta per tutto il periodo riproduttivo e soprattutto durante la gravidanza per evitare potenziali danni per lo sviluppo del feto. Infatti, gli alti livelli di fenilalanina presenti nel sangue materno passano nel feto attraverso la placenta e ne impediscono il normale sviluppo del sistema nervoso, indipendentemente dal suo genotipo. Data la gravità di questa malattia, se non trattata, negli Stati Uniti tutti i neonati vengono controllati per la PKU. Il test di Guthrie viene eseguito con una goccia di sangue posta su un filtro, che viene depositato su una piastra di terreno solido che contiene il batterio Bacillus subtilis e β-2-tienilalanina. La β-2-tienilalanina inibisce la crescita del batterio. L’inibizione è impedita in presenza di fenilalanina. Quindi, la crescita del batterio indica la presenza di alti livelli di fenilalanina nel sangue e suggerisce la necessità di ulteriori accertamenti per determinare se il bambino sia affetto da PKU. Alcuni cibi e bevande che contengono il dolcificante sintetico aspartame riportano l’avvertenza che individui affetti da PKU non devono assumerli. L’aspartame è un dipeptide, composto dagli amminoacidi acido aspartico e fenilalanina. Questa combinazione segnala ai recettori del gusto che la sostanza è dolce (ma non si tratta di uno zucchero e non fornisce quindi le calorie di uno zucchero). Una volta ingerito, l’aspartame viene scisso in acido aspartico e fenilalanina, quindi può dare problemi ai fenilchetonurici. Il gene per la fenilalanina idrossilasi è stato caratte-

63

rizzato a livello molecolare. Sono state identificate oltre 400 mutazioni nel gene responsabili della perdita delle attività enzimatiche della proteina negli individui con PKU. Tali mutazioni includono quelle che alterano un amminoacido nella proteina, quelle che danno come risultato una proteina tronca e quelle che alterano lo splicing dell’mRNA trascritto dal gene (vedi Capitolo 5).

Albinismo La forma classica di albinismo (vedi Figura 11.18a; OMIM 203100) è causata da una mutazione autosomica recessiva di un gene nel braccio lungo del cromosoma 11. Circa 1 su 33 000 caucasici e 1 su 28 000 afroamericani negli Stati Uniti sono affetti da albinismo. Negli individui con albinismo il gene mutato è quello che codifica per la tirosinasi. La tirosinasi è un enzima usato nella conversione della tirosina in DOPA, dalla quale deriva il pigmento bruno chiamato melanina (vedi Figura 4.1). La melanina assorbe la luce nel campo ultravioletto (UV) e protegge la pelle dalle radiazioni nocive UV provenienti dal sole. Le persone affette da albinismo non producono melanina. Pertanto esse hanno pelle bianca e capelli bianchi, e occhi con iride che appare rossa (a causa della mancanza di pigmento) ed è altamente sensibile alla luce. (Questa forma di albinismo è detta albinismo oculocutaneo di tipo 1, o OCA1.) Vi sono almeno due altri tipi di albinismo (albinismo oculocutaneo di tipo 2 o OCA2, OMIM 203200 e albinismo oculocutaneo di tipo 3 o OCA3, OMIM 203290), causati da mutazioni in altri geni che bloccano diversi passaggi biochimici necessari per la biosintesi della melanina. Se due genitori con albinismo sono entrambi omozigoti per una mutazione in un gene differente nella via biochimica, essi possono generare un bambino normale. (Questo è un esempio di complementazione genica, discussa nel Capitolo 15.)

Sindrome di Kartagener Come nell’albinismo, parecchi geni possono essere mutati per causare una rara malattia chiamata sindrome di Kartagener (OMIM 244400), una forma di discinesia ciliare primaria. Questa malattia autosomica recessiva, che ha una frequenza di circa 1 su 32 000 nati vivi, è caratterizzata da anormalità dei seni paranasali e dei polmoni, da sterilità e, in qualche caso, da destrocardia – una condizione nella quale il cuore è spostato a destra invece che a sinistra del centro toracico. Superficialmente, senza una comprensione a livello molecolare dei geni coinvolti, questi sintomi pleiotropici sono difficilmente correlabili. Uno dei geni trovati mutati in questi individui codifica per una proteina che costituisce il “motore” dei flagelli e delle ciglia, la dineina. I motori proteici basati sulla dineina fanno scivolare i microtubuli dei flagelli e del-

64

Capitolo 4

le ciglia l’uno sull’altro per produrre il movimento di queste strutture. Senza una dineina funzionante, né i flagelli né le ciglia possono muoversi in modo appropriato. Come risultato, le infezioni dei seni paranasali e dei polmoni sono comuni negli individui con la sindrome di Kartagener, poiché essi hanno delle ciglia difettose sulla superficie delle loro vie respiratorie e, pertanto, non possono rimuovere in modo efficiente batteri e spore dal loro sistema respiratorio. La sterilità dei maschi deriva dal fatto che gli spermatozoi non riescono a muoversi; la sterilità nelle femmine deriva dal fatto che le ciglia che dovrebbero trasportare gli oociti nel tratto riproduttivo non sono in condizione di farlo. Le cause della destrocardia furono meno ovvie fino a quando non venne sviluppato un modello murino con difetti nel gene. I topi che portavano alcune mutazioni del gene sviluppavano un insieme di difetti simili, e lo studio degli embrioni di questi topi alle prime fasi dello sviluppo definì le cause della destrocardia. Nell’embrione in fase di sviluppo, i ricercatori videro che le ciglia su una struttura chiamata nodo ruotavano in senso orario e generavano un flusso extraembrionale in senso sinistrorso. Questo flusso può essere “sentito” dalle cellule circostanti, che rispondono muovendosi a destra o a sinistra, una risposta che determina i loro futuri sviluppi. Nella sindrome di Kartagener, in assenza di flusso, i tessuti si muovono in modo casuale a sinistra o a destra.

Sindrome di Tay-Sachs La sindrome di Tay-Sachs (Figura 4.5; OMIM 272800), chiamata anche idiozia amaurotica infantile, è causata da omozigosi per una rara mutazione recessiva di un gene sul braccio lungo del cromosoma 15. Sebbene la sindrome di Tay-Sachs sia rara nella popolazione generale, essa ha un’incidenza più elevata negli ebrei Ashkenazi originari dell’Europa centrale, tra i quali circa 1 bambino su 3600 ha questa malattia. Il gene difettivo negli individui con la malattia di Tay-Sachs codifica per un enzima lisosomiale. I lisosomi sono organelli circondati da membrana che si trovano nelle cellule; essi contengono 40 o più differenti enzimi digestivi che catalizzano la degradazione di acidi nucleici, proteine, polisaccaridi e lipidi. Quando un enzima del lisosoma non funziona, o funziona solo parzialmente, la normale degradazione del substrato di quell’enzima non può verificarsi. Il gene che risulta mutato negli individui con la sindrome di Tay-Sachs è HEXA, che codifica per l’enzima N-acetil-esosamminidasi A (Hex A). Questo enzima elimina il gruppo terminale N-acetilgalattosammina da un ganglioside cerebrale (Figura 4.6). (Un ganglioside fa parte di un gruppo di glicolipidi complessi che si trova soprattutto nelle membrane dei nervi.) Nei bambini affetti da malattia di Tay-Sachs l’enzima è inattivo e quindi vi è accumulo del ganglioside non proces-

Figura 4.5 Bambino affetto da malattia di Tay-Sachs.

sato nei neuroni. Ciò causa diversi sintomi clinici. Di solito il primo sintomo riconoscibile è un’insolita reazione a suoni improvvisi. Un punto color ciliegia sulla retina, circondato da un alone bianco, aiuta a effettuare una diagnosi precoce della malattia. Circa un anno dopo la nascita si verifica una rapida degenerazione neurologica allorché il ganglioside non processato si accumula e il cervello comincia a perdere il controllo delle normali funzioni e attività. Questa degenerazione produce paralisi generalizzata, cecità, perdita progressiva dell’udito e seri problemi di alimentazione. A 2 anni di età i bambini sono praticamente immobili e la morte segue a circa 3 o 4 anni, spesso per infezione respiratoria. Non è nota una cura per la sindrome di Tay-Sachs, ma, dato che possono essere identificati i portatori (eterozigoti, che hanno un allele del gene normale e uno mutato), l’incidenza di questa malattia può essere controllata.

Nota chiave Numerose malattie genetiche umane sono causate da deficit di attività enzimatiche. Queste malattie sono per la maggior parte ereditate come caratteri recessivi. Per sviluppare la malattia, un individuo deve ereditare da ciascun genitore un allele mutato per il gene responsabile della malattia, risultando omozigote per questo allele.

Controllo genetico della struttura delle proteine Anche se gli enzimi sono per la maggior parte proteine, non tutte le proteine sono enzimi. Per comprendere pienamente come funzionano i geni, considereremo di seguito le evidenze sperimentali che dimostrano che i geni sono responsabili anche della struttura delle proteine non enzimatiche, come l’emoglobina. Spesso le proteine non enzimatiche sono più facili da studiare degli enzimi. Ciò avviene perché di solito gli enzimi sono presenti in pic-

La funzione del gene a) Via metabolica normale

b) Via metabolica in individui con la malattia di Tay-Sachs Ceramide

Ceramide GalNAc

Glc

Gal

GalNAc

Gal

Glc

NAN

NAN

Ganglioside GM2

Ganglioside GM2

Enzima N-acetilesosamminidasi A (Hex A)

65

Il ganglioside GM2 si accumula e provoca la malattia di Tay-Sachs

Enzima Hex A disfunzionale

Ceramide

Gal

Glc

+

GalNAc

NAN Ganglioside GM3

GalNAc = N-acetil-D-galattosammina Gal = galattosio Glc = glucosio NAN = acido N-acetilneuramminico Ceramide = un amminoalcol legato a un acido grasso

Figura 4.6 Schema del passaggio biochimico per la conversione del ganglioside cerebrale GM2 in ganglioside GM3, catalizzata dall’enzima N-acetilesosamminidasi A (Hex A).

cole quantità nella cellula, mentre si possono trovare grandi quantità di proteine non enzimatiche, cosa che le rende più facili da isolare e purificare.

Anemia falciforme

MyLab

L’anemia falciforme (o SCA, Sickle-Cell Anemia; OMIM 603903) è una malattia genetica che è causata da alterazioni dell’emoglobina, la proteina che trasporta l’ossigeno nei globuli rossi. L’anemia falciforme fu descritta per la prima volta nel 1910 da J. Herrick. Egli scoprì che, a bassa tensione di ossigeno, i globuli rossi di individui affetti dalla malattia perdevano la loro caratteristica forma discoidale per assumere quella di una falce (Figura 4.7). I globuli rossi falciformi nimazione sono fragili e tendono a rompersi facilmente, il che deterControllo mina anemia. Inoltre, le cellugenetico della struttura e della le falciformi non sono così flessibili come quelle normali funzione delle e quindi tendono a bloccarsi proteine nei capillari piuttosto che a sgusciarvi attraverso. Di conseguenza, la circolazione del sangue viene rallentata e i tessuti risultano in deficit di ossigeno. Benché la deprivazione di ossigeno avvenga particolarmente a livello delle estremità, anche il cuore, i polmoni, il cervello, i reni, il tratto gastrointestinale, i muscoli e le articolazioni possono essere danneggiati dalla scarsità di ossigeno. Un individuo con anemia falciforme può quindi soffrire di una varietà di problemi clinici, che includono insufficienza cardiaca, polmonite, paralisi, insufficienza renale, dolori addominali e reumatismi. Nel 1949 E.A. Beet e J.V. Neel ipotizzarono in modo indipendente che la causa della forma a falce fosse dovu-

ta alla presenza di un singolo allele mutante, in forma omozigote negli individui affetti e in eterozigosi negli individui portatori (che presentano una forma più lieve di malattia, come vedremo più avanti). Nello stesso anno, Linus Pauling e i suoi collaboratori dimostrarono che l’emoglobina dei soggetti normali, di quelli affetti da anemia falciforme e dei portatori si comportava diversamente in elettroforesi – una tecnica che separa le molecole in base alla loro carica elettrica e/o massa. Nelle condizioni elettroforetiche utilizzate, entrambe le forme di emoglobina si comportavano da cationi (molecole cariche positivamente) e migravano verso il polo negativo. L’emoglobina di individui normali (chiamata Hb-A) migrava più lentamente di quella di individui affetti da anemia

Figura 4.7 Fotografia al microscopio elettronico di tre globuli rossi normali e di uno falciforme.

66

Capitolo 4 Gruppi eme

Genotipi b

Campione caricato

AbA

bAbS

bSbS

(normale) (portatori di (anemia falciforme) anemia falciforme)

Polipeptide a

Polipeptide b

Polipeptide b

Polipeptide a

Emoglobina A (Hb-A)

Direzione dell’elettroforesi

Emoglobina S (Hb-S)

Gruppi eme

Figura 4.8 Elettroforesi di varianti dell’emoglobina. Emoglobina di individui normali βAβA (a sinistra), individui βAβS portatori di anemia falciforme (al centro) e individui βSβS affetti da anemia falciforme (a destra). I due tipi di emoglobina migrano con diversa velocità nel campo elettrico a conferma di una differente struttura proteica.

Figura 4.9 La molecola dell’emoglobina. Il disegno mostra i due polipeptidi α e i due β, ciascuno associato a un gruppo eme. Ciascun polipeptide α è in contatto con ambedue i β, ma vi è un contatto molto debole fra i due polipeptidi α o fra i due polipeptidi β.

falciforme (chiamata Hb-S; Figura 4.8). L’emoglobina di individui portatori di anemia falciforme era una miscela 1:1 di Hb-A e Hb-S, indicando che gli eterozigoti producono entrambi i tipi di emoglobina. Pauling concluse che l’anemia falciforme è dovuta a una mutazione che altera la struttura chimica della molecola di emoglobina. Questo esperimento fu una delle prime rigorose dimostrazioni che la struttura delle proteine è controllata dai geni. L’emoglobina, la molecola che è alterata nell’anemia falciforme, è costituita da quattro catene polipeptidiche – due globine α e due β – ciascuna delle quali è associata a un gruppo eme (un gruppo chimico non proteico coinvolto nel legame dell’ossigeno e aggiunto a ogni polipeptide dopo che questo è stato sintetizzato; Figura 4.9). Nel 1956 V.M. Ingram analizzò alcune sequenze di amminoacidi di Hb-A e Hb-S e trovò che il difetto molecolare nell’Hb-S consiste nella sostituzione dell’acido glutammico (Glu, idrofilico con carica elettrica negativa) in sesta posizione dall’estremità N-terminale del polipeptide β con l’amminoacido neutro valina (Val, idrofobico senza carica elettrica; Figura 4.10). Questa specifica sostituzione determina un diverso ripiegamento del polipeptide β. (Nel Capitolo 6 verrà precisato che la foma tridimensionale di un polipeptide è determinata dalla sequenza dei suoi amminoacidi.) I globuli rossi del sangue

sono ricchi di emoglobina. L’emoglobina con la versione mutante del polipeptide β si aggrega facilmente, precipitando e determinando l’aspetto falciforme dei globuli rossi, più marcato negli individui affetti da anemia e più lieve nei portatori. La genetica e i prodotti dei geni coinvolti sono i seguenti. βS è l’allele mutante del polipeptide β nelle cellule con anemia falciforme, mentre l’allele normale è βA. Gli individui omozigoti βAβA producono l’emoglobina Hb-A normale con due normali catene α codificate dal gene di tipo selvatico dell’α-globina e due catene normali β codificate dall’allele βA del gene normale della β-globina. Gli individui omozigoti βSβS producono l’emoglobina difettiva Hb-S, con due catene normali α specificate dai geni di tipo selvatico dell’α-globina e due catene β anormali specificate dall’allele βS del gene mutante della β-globina: questi individui sono affetti da anemia falciforme. Gli eterozigoti βAβS producono sia Hb-A sia Hb-S e sono portatori dall’anemia falciforme. In condizioni normali, gli individui portatori di anemia falciforme mostrano usualmente pochi segni della malattia. Tuttavia, dopo una brusca caduta della tensione di ossigeno (durante la salita nell’atmosfera a bordo di un aereo non pressurizzato, in alta montagna o dopo un esercizio fisico intenso), i globuli rossi potrebbero assumere la forma a falce, con la conseguenza della manife-

Polipeptide b normale, Hb-A

1 H 3 N + Val

2 His

3 Leu

4 Thr

5 Pro

6 Glu

7 Glu

Cambia in Polipeptide b falciforme, Hb-S

H 3 N + Val

His

Leu

Thr

Pro

Val

Glu

Figura 4.10 I primi sette amminoacidi N-terminali nei polipeptidi b dell’emoglobina normale e di quella falciforme. Nel polipeptide dell’emoglobina falciforme vi è una singola sostituzione, da acido glutammico a valina, in sesta posizione.

La funzione del gene

stazione di alcuni sintomi simili a quelli degli individui con una grave anemia. L’ipotesi un gene-un polipeptide è coerente con l’esempio dell’emoglobina appena descritto poiché le proteine, come gli enzimi, possono essere costituite da più di una catena polipeptidica. Tuttavia, negli eucarioti, un processo conosciuto come splicing alternativo (vedi Capitolo 18) può dare come risultato la produzione di diversi polipeptidi a partire da un unico gene, il che rende anche l’ipotesi un gene-un polipeptide una semplificazione.

a) Catena a Normale

Posizione degli amminoacidi 1 Val

Durante valutazioni epidemiologiche nelle quali l’emoglobina estratta dai globuli rossi di soggetti della popolazione generale è stata sottoposta a elettroforesi per confrontarne la mobilità con quella della forma normale, sono state identificate più di 200 forme mutanti. La Figura 4.11 elenca alcuni di questi mutanti assieme alle sostituzioni degli amminoacidi che sono state identificate. Alcune mutazioni riguardano la catena α, altre la catena β, e vi è una grande varietà di tipi di sostituzioni. Dall’analisi dei codoni del DNA che si presume siano responsabili delle sostituzioni, è evidente che in ciascun caso è coinvolta la variazione di una singola coppia di basi. I mutanti dell’emoglobina identificati hanno effetti diversi, a seconda del tipo di amminoacido coinvolto e della sua collocazione nella catena polipeptidica. Molti hanno effetti meno drastici del mutante falciforme. Per esempio, nella molecola dell’emoglobina Hb-C lo stesso acido glutammico del polipeptide β alterato nell’anemia falciforme è sostituito dalla lisina. Se paragonata alle conseguenze della mutazione nell’emoglobina Hb-S, questa sostituzione non induce un difetto altrettanto grave, dato che entrambi gli amminoacidi sono idrofilici e quindi la conformazione dell’emoglobina non risulta drasticamente alterata. Quindi gli individui omozigoti per la mutazione βC soffrono solo di una lieve forma di anemia.

Fibrosi cistica La fibrosi cistica (CF o mucoviscidosi; OMIM 219700 e 602421) è una malattia che causa disfunzioni al pancreas, ai polmoni e all’apparato digerente in bambini e giovani. Tipica di questa malattia è la presenza di muco molto vischioso. In alcuni maschi i vasi deferenti (parte del sistema riproduttivo maschile) non si formano correttamente, causando sterilità. La fibrosi cistica viene tenuta sotto controllo battendo sul torace per facilitare l’eliminazione delle secrezioni che si accumulano nei polmoni e curando con gli antibiotici le infezioni che si sviluppano. La fibrosi cistica è una malattia con esito infausto: con le cure attuali, l’aspettativa di vita è di circa 40 anni.

2 Leu

16 Lys

30 Glu

57 Gly

68 Asn

141 Arg

Varianti Hb: HbI

Val

Leu

Asp

Glu

Gly

Asn

Arg

Hb-G Honolulu

Val

Leu

Lys

Gln

Gly

Asn

Arg

Hb Norfolk

Val

Leu

Lys

Glu

Asp

Asn

Arg

Hb-G Philadelphia

Val

Leu

Lys

Glu

Gly

Lys

Arg

1 Val

2 His

Posizione degli amminoacidi 121 6 26 63 Glu Glu His Glu

146 His

b) Catena b

Altre mutazioni dell’emoglobina

67

Normale Varianti Hb: Hb-S

Val

His

Val

Glu

His

Glu

His

Hb-C

Val

His

Lys

Glu

His

Glu

His

Hb-E

Val

His

Glu

Lys

His

Glu

His

Hb-M Saskatoon

Val

His

Glu

Glu

Tyr

Glu

His

Hb Zurich

Val

His

Glu

Glu

Arg

Glu

His

Hb-D b Punjab

Val

His

Glu

Glu

His

Gln

His

Figura 4.11 Esempi di sostituzioni amminoacidiche ritrovate (a) nei 141 amminoacidi del polipeptide della globina a e (b) nei 146 amminoacidi del polipeptide della globina b, in più varianti dell’emoglobina umana.

La fibrosi cistica è causata dall’omozigosi di una mutazione autosomica recessiva localizzata sul braccio lungo del cromosoma 7 ed è la più comune malattia autosomica recessiva letale nei caucasici, con una frequenza di 1 su 2000 nati. Si stima che circa 1 individuo caucasico su 23 sia un eterozigote. Nella popolazione afroamericana, circa 1 su 17 000 nati è affetto da fibrosi cistica e negli asiatici la frequenza è di 1 su 31 000 nati. Il prodotto genico difettivo nei pazienti affetti da fibrosi cistica non è stato identificato mediante analisi biochimica, come nel caso della fenilchetonuria e di altre malattie, ma attraverso una combinazione di tecniche genetiche e di biologia molecolare. Il gene è stato localizzato sul cromosoma 7 e quindi clonato. Nei pazienti che presentano una grave forma di fibrosi cistica, la mutazione più comune – ΔF508 (Δ = delta, “delezione”) – è una delezione di tre coppie consecutive di basi. Dato che ogni amminoacido in una proteina è codificato da tre coppie di basi nel DNA, ciò indica che nei pazienti affetti da fibrosi cistica manca un amminoacido, in questo caso la fenilalanina in posizione 508. Qual è la funzione della proteina che, quando è mutata, determina la comparsa della malattia? Data la sequenza del DNA del gene, i ricercatori hanno prima dedotto la sequenza amminoacidica e quindi previsto la tipologia e la struttura tridimensionale della proteina. L’analisi ha indicato che la proteina, lunga 1480 amminoacidi, è associata alle mem-

68

Capitolo 4 Segmenti idrofobici che attraversano la membrana

Esterno Membrana plasmatica Interno

NH2

NBF

Dominio che lega ATP

Dominio che lega ATP

NBF

Sito della mutazione DF508

COOH Sito fosforilato dalla proteina chinasi C

Sito fosforilato dalla proteina chinasi A

Figura 4.12 Struttura proposta per il regolatore del trasporto transmembrana (CFTR) della fibrosi cistica. La proteina ha due segmenti idrofobici che attraversano la membrana e dopo ciascun segmento possiedono una regione Nucleotide-Binding Fold (NBF) che lega ATP. La posizione della delezione di un amminoacido, causata dalla delezione di tre coppie di basi nel gene della fibrosi cistica, che si ritrova più frequentemente in pazienti affetti da una forma grave della malattia, si trova nel primo NBF (verso l’estremità amminoterminale); si tratta della mutazione ΔF508.

Porzione centrale della molecola

brane cellulari. La struttura proposta per la proteina – chiamata regolatore del trasporto transmembrana della fibrosi cistica (CFTR) – è illustrata nella Figura 4.12. La mutazione ΔF508 interferisce con il legame per l’adenosina trifosfato (ATP), nella regione di legame per i nucleotidi (NBF, Nucleotide-Binding Fold) situata all’estremità N-terminale della proteina. L’analisi comparativa della sequenza di amminoacidi della proteina della fibrosi cistica e delle sequenze di amminoacidi di altre proteine depositate in banca dati, ha mostrato che CFTR è omologa a una vasta famiglia di proteine coinvolte nel trasporto attivo di sostanze attraverso la membrana. Oggi sappiamo che questa proteina costituisce un canale del cloro in alcune membrane cellulari. Nelle persone con fibrosi cistica, il gene mutato determina una proteina CFTR del tutto o in parte non funzionante e ciò causa un alterato trasporto di ioni attraverso le membrane. Da ciò derivano i sintomi presentati, a partire dalla secrezione anormale di muco e dal suo accumulo. La fibrosi cistica è attualmente studiata nei topi geneticamente modificati in modo da avere lo stesso difetto nel loro gene CFTR. Si spera che, attraverso lo studio della malattia in modelli murini, i ricercatori possano ottenerne una migliore comprensione ed essere in grado di sviluppare un trattamento efficace, forse anche avvalendosi della terapia genica.

Nota chiave Dagli studi delle alterazioni nelle proteine diverse dagli enzimi – come quelle dell’emoglobina, che sono responsabili dell’anemia falciforme e di altre forme di anemia – sono state ottenute prove convincenti che i geni controllano le strutture di tutti i polipeptidi.

Consulenza genetica Abbiamo visto che molte malattie genetiche nell’uomo sono causate da difetti degli enzimi e delle proteine che dipendono da mutazioni a livello di singoli geni. Parecchie altre malattie genetiche sono originate da alterazioni cromosomiche che possono coinvolgere più geni e/o le loro regioni regolative (vedi Capitolo 16). Oggi gli scienziati hanno a disposizione una serie di strumenti tecnici e la possibilità di applicare saggi molecolari per identificare il malfunzionamento di molti enzimi e proteine o per valutare le numerose possibili modifiche del DNA associate alle malattie genetiche. Possono quindi determinare se un individuo ha una malattia genetica o se ne è portatore. La comprensione della trasmissione ereditaria, la sfida alla diagnosi e le ripercussioni di una malattia genetica a livello medico, psicologico, sociologico ed etico hanno portato alla necessità di una figura professionale di aiuto a singole persone e famiglie. Il consulente genetista offre una consulenza genetica, cioè fornisce un parere basato sulle analisi: (1) della probabilità che i pazienti abbiano un difetto genetico, o (2) del rischio che i futuri genitori possano generare un bambino con un difetto genetico. In quest’ultimo caso la consulenza genetica ha il compito di presentare le opportunità disponibili per evitare o rendere minimi questi rischi. Se viene identificato un serio difetto genetico in un feto, una delle possibili opzioni è l’aborto. La consulenza genetica dà alle persone l’opportunità di comprendere i problemi genetici che sussistono nelle loro famiglie o potrebbero aver luogo nelle loro future famiglie. La consulenza genetica richiede una vasta quantità di informazioni sull’ereditarietà nell’uomo. In molti casi, il rischio di avere un figlio con un difetto genetico

La funzione del gene

può essere stabilito in termini di probabilità precise; in altri casi, quando il ruolo dell’ereditarietà non è completamente chiaro, il rischio può essere stimato solo in termini generali e probabilistici. Il consulente genetico ha la responsabilità di fornire alle persone che lo richiedono informazioni chiare, non emotive e senza pregiudizi, basate sulla storia famigliare e su tutte le informazioni scientifiche pertinenti, in merito ai possibili rischi di far nascere un bambino con un difetto genetico. La consulenza genetica comincia generalmente con l’analisi dell’albero genealogico delle famiglie, condotta insieme all’annotazione precisa dei fenotipi di entrambe le famiglie per un certo numero di generazioni. (L’analisi degli alberi genealogici è descritta in maggior dettaglio nei Capitoli 11 e 12). L’analisi degli alberi genealogici è utilizzata per determinare la probabilità che un particolare allele sia presente nelle famiglie di entrambi i genitori. La scoperta di una condizione genetica avviene in due possibili modi, eventualmente in parallelo: analisi dei genitori per identificare i portatori (cioè gli eterozigoti per mutazioni recessive che non manifestano la malattia) o analisi fetale. Saggi che misurano l’attività di enzimi o la quantità di una data proteina possono essere utilizzati solo in quei casi nei quali il difetto genetico sia espresso nei genitori e/o nel feto. Saggi che misurano cambiamenti a carico del DNA associati alla malattia permettono di fare un’analisi genetica diretta e indipendente dall’espressione del gene nei genitori o nel feto. Benché si possano identificare i portatori di numerosi alleli mutanti e si possa determinare se il feto ha un danno genetico, in molti casi non esistono metodi per cambiare il fenotipo che ne deriva. L’identificazione dei portatori e l’analisi fetale servono soprattutto per informare i genitori dei rischi e delle probabilità di avere un figlio con un difetto.

Identificazione dei portatori L’identificazione dei portatori individua persone che sono eterozigoti per una mutazione recessiva. Il portatore eterozigote per un gene mutante ha di solito un fenotipo normale. Nel caso di una mutazione recessiva che ha conseguenze gravemente dannose per l’individuo omozigote per tale mutazione, è di grande importanza determinare se le persone che pensano di mettere al mondo un figlio siano entrambe portatrici, dato che in questa situazione un quarto dei figli manifesterebbe la malattia. L’identificazione dei portatori può essere utilizzata nei casi in cui è quantificabile un prodotto genico (proteina o enzima). In questi casi, l’individuo eterozigote dovrebbe presentare un’attività enzimatica o una quantità di proteina più o meno pari alla metà di quella trovata in individui normali, anche se ciò non è stato osservato per tutte le mutazioni. Negli altri casi, l’identifi-

69

cazione dei portatori avviene mediante tecniche che permettono un’analisi molecolare del DNA. (Esempi di questo tipo di analisi e di tecniche utilizzate verranno discussi nel Capitolo 10.)

Analisi fetale Un altro importante aspetto della consulenza genetica è la possibilità di verificare se il feto è normale. Questa analisi può essere fatta in molti casi utilizzando una procedura chiamata amniocentesi (Figura 4.13). Quando il feto si sviluppa nel sacco amniotico, è circondato dal liquido amniotico che serve ad attutire eventuali urti.

Prelievo di liquido amniotico

Centrifugazione

Sopranatante Analisi per valutare deficit enzimatici, alterazioni nelle proteine e difetti del DNA

Cellule fetali

Coltura

Analisi dei difetti cromosomici

Figura 4.13 Amniocentesi, una procedura utilizzata per la diagnosi prenatale dei difetti genetici.

70

Capitolo 4 Liquido amniotico Utero Sinfisi pubica

Placenta

Corion Cannula

Figura 4.14 Analisi dei villi coriali, una procedura utilizzata per la diagnosi prenatale precoce dei difetti genetici.

Nell’amniocentesi viene prelevato un campione del liquido amniotico inserendo con attenzione l’ago di una siringa attraverso la parete uterina materna fino all’interno del sacco amniotico. Il fluido contiene cellule che si sono sfaldate dalla pelle del feto; queste cellule possono essere coltivate in laboratorio e analizzate per individuare alterazioni o deficienze di enzimi o proteine, cambiamenti nel DNA e anormalità cromosomiche. È possibile effettuare l’amniocentesi in qualsiasi stadio della gestazione, ma la piccola quantità di liquido amniotico disponibile e i rischi per il feto la rendono impraticabile prima delle 12 settimane di gravidanza. Dal momento che l’amniocentesi è complicata e costosa, il suo uso è principalmente indicato nei casi a rischio. Un altro metodo di valutazione fetale è l’analisi dei villi coriali (Figura 4.14). L’analisi può essere effettuata tra l’8a e la 12a settimana di gravidanza, cioè più precocemente rispetto all’amniocentesi. Il corion è una membrana che circonda il feto e consiste interamente di tessuto embrionale. Un campione del tessuto dei villi coriali può essere prelevato dalla placenta attraverso l’addome (come nell’amniocentesi) oppure attraverso la vagina, utilizzando un forcipe o un catetere flessibile

sotto controllo ecografico. Una volta che si sia ottenuto un campione del tessuto, l’analisi viene effettuata direttamente su di esso. I vantaggi di questa tecnica sono che essa permette ai genitori di sapere se il feto ha un difetto genetico in un momento più precoce della gravidanza rispetto all’amniocentesi, e che non occorre coltivare le cellule per ottenere materiale sufficiente per l’analisi biochimica. Tuttavia, il rischio di mortalità del feto e di diagnosi poco accurata per la presenza di cellule materne, è più comune nell’analisi dei villi coriali che nell’amniocentesi.

Nota chiave La consulenza genetica è un parere basato sull’analisi della probabilità che i pazienti abbiano un difetto genetico o sul calcolo del rischio che futuri genitori possano generare un bambino con un difetto genetico. L’individuazione dei portatori e l’analisi del feto danno come risultato la diagnosi precoce di una malattia genetica.

La funzione del gene

71

Sommario l Esiste una relazione specifica tra geni ed enzimi, inizialmente rappresentata dall’ipotesi un gene-un enzima, che stabilisce che ogni gene controlla la sintesi o l’attività di un singolo enzima. Poiché alcuni enzimi sono costituiti da più di un polipeptide, e i geni codificano per catene polipeptidiche individuali, questa relazione fu aggiornata nell’ipotesi un gene-un polipeptide. Oggi sappiamo che non tutti i geni codificano per proteine e che alcuni geni eucariotici che codificano per proteine vengono espressi producendo più di un polipeptide. l Molte malattie genetiche umane sono causate da deficit in attività enzimatiche. La maggior parte sono ereditate come caratteri recessivi, vale a dire che per sviluppare la malattia

un individuo deve avere entrambi gli alleli mutati per il gene implicato. l Dallo studio delle alterazioni in proteine diverse dagli enzimi sono state ottenute prove convincenti che i geni controllano la struttura di tutte le proteine, non solo di quelle che svolgono una funzione enzimatica. l La consulenza genetica consiste in un’analisi del rischio che i futuri genitori possano generare un bambino con un difetto genetico e nella presentazione ai membri della famiglia delle opzioni disponibili per evitare o ridurre al minimo questi rischi. L’individuazione dei portatori e l’analisi fetale permettono una precoce individuazione di una malattia genetica.

Approccio analitico alla soluzione di problemi di genetica D4.1 Un certo numero di ceppi mutanti auxotrofi è stato isolato da un lievito selvatico aploide. Questi ceppi rispondono all’aggiunta di certi elementi nutrizionali al terreno minimo di coltura o crescendo (+) o non crescendo (0). Nella seguente tabella sono riportate le risposte di ciascun ceppo mutante per un singolo gene: Aggiunte al terreno minimo di coltura Ceppi mutanti

B

A

R

T

S

1

+

0

+

0

0

2

+

+

+

+

0

3

+

0

+

+

0

4

0

0

+

0

0

Schematizzate una via biochimica che sia in accordo con i risultati, indicando in quale punto della catena viene bloccato ciascun mutante. R4.1 I risultati da analizzare sono molto simili a quelli descritti nel testo per l’analisi di Beadle e Tatum su mutanti auxotrofi di Neurospora, sulla base dei quali essi proposero l’ipotesi un gene-un enzima. Ricordate che, più avanti nella catena metabolica un mutante risulta bloccato, tanto minori aggiunte nutrizionali dovranno essere utilizzate per farlo crescere. Dai dati riportati, dobbiamo assumere che le aggiunte nutrizionali non siano necessariamente elencate nell’ordine nel quale esse compaiono nella catena metabolica. L’analisi dei risultati indica che tutti i quattro ceppi crescono se viene dato R e non crescono se viene dato S. Da ciò possiamo concludere che R è probabilmente il prodotto finale della catena (tutti i mutanti devono crescere in presenza del prodotto finale) e che S è probabilmente il primo composto della catena

(nessuno dei mutanti dovrebbe crescere in presenza del primo composto della catena). Quindi la catena metabolica dedotta fino a questo punto è S D [B,A,T] D R dove l’ordine di B, A e T deve ancora essere determinato. Ora consideriamo ciascuno dei ceppi mutanti e vediamo come i fenotipi di crescita possano aiutare a definire la catena metabolica. Il ceppo 1 cresce solo quando gli viene fornito B o R. Quindi l’enzima difettoso nel ceppo 1 deve agire da qualche parte prima della formazione di B e R, e dopo le sostanze A, T e S. Dato che abbiamo stabilito che R è il prodotto finale della catena, possiamo proporre che B sia l’immediato precursore di R, e che il ceppo 1 non sappia produrre B. La catena deve essere quindi 1 S D [A,T] D B D R Il ceppo 2 cresce in tutti casi eccetto che in presenza di S, il primo composto della via. Quindi il difetto enzimatico nel ceppo 2 deve agire nella conversione di S nel composto successivo nella catena, che sarà A o T. Non sappiamo ancora se A o T seguono S nella catena, ma i dati di crescita ci permettono almeno di concludere dove il ceppo 2 viene bloccato nella catena e cioè: 2 1 S D [A,T] D B D R Il ceppo 3 cresce in presenza di B, R e T, ma non di A o S. Sappiamo che R è il prodotto finale ed S è il primo composto della catena. Questo ceppo mutante permette di determinare l’ordine di A e T nella via biochimica. Infatti, dato che il ceppo 3 cresce con T ma non con A, T deve essere in uno stadio successivo rispetto ad A e l’enzima difettoso in 3 deve essere incapace di convertire A in T. La catena metabolica ora è

72

Capitolo 4 2 3 1 SDADTDBDR

Il ceppo 4 può crescere solo se gli viene fornito il prodotto R, ritenuto quello terminale. Quindi il difetto enzimatico presente in tale ceppo mutato deve agire prima della formazione di R e dopo la formazione di A, T e B dal primo composto S. La mu-

tazione in 4 deve bloccare l’ultimo passaggio della catena biochimica, che converte B in R. La catena metabolica finale dedotta e le posizioni dei relativi blocchi nei mutanti sono: 2 3 1 4 SDADTDBDR

Espressione genica: la trascrizione

5

Che cosa è il dogma centrale?

Come si svolgono l’inizio, l’allungamento e la terminazione della trascrizione nei batteri?

Quali sono i quattro tipi principali di molecole di RNA nelle cellule?

Come avviene la trascrizione negli eucarioti?

Come viene sintetizzata una catena di RNA?

Come viene prodotto un mRNA funzionale dal trascritto iniziale di un gene che codifica per una proteina negli eucarioti?

Attività Molte tecniche biotecnologiche sono rese possibili dalla comprensione dell’espressione genica, il primo passaggio della quale è la trascrizione. Durante la trascrizione, l’informazione viene trasferita dalla molecola di DNA a una molecola di RNA a singolo filamento. In questo capitolo, imparerete come il DNA viene trascritto in RNA, e la struttura e le proprietà di forme differenti di RNA. Poi, nella iAttività, potrete verificare come mutazioni che alterano il processo della trascrizione possano determinare una malattia ereditaria.

La struttura, la funzione, lo sviluppo e la riproduzione di un organismo dipendono dalle proprietà delle proteine presenti in ogni cellula e tessuto. Una proteina consiste di una o più catene di amminoacidi. Ogni catena è un polipeptide, e la sequenza degli amminoacidi in un polipeptide è codificata da un gene. Quando in una cellula è necessaria una proteina, il codice genetico per la sequenza di amminoacidi di quella proteina deve essere letto dal DNA e la proteina deve essere prodotta. La sintesi proteica consiste di due fasi principali: la trascrizione e la traduzione. La trascrizione è la sintesi di un singolo filamento di RNA copiato da un segmento di DNA. Nel caso della sintesi proteica, un gene che codifica per una proteina viene trascritto in un RNA messaggero. La traduzione (sintesi proteica) è la conversione dell’informazione portata nella sequenza di basi dell’RNA messaggero nella sequenza di amminoacidi di un polipeptide. In questo capitolo descriveremo il processo della trascrizione.

Espressione genica. Il dogma centrale: schema generale Nel 1956, tre anni dopo che Watson e Crick avevano proposto il loro modello a doppia elica del DNA, Crick definì dogma centrale il processo in due fasi indicato con: DNA D RNA D proteina (cioè la trascrizione seguita dalla traduzione). La trascrizione è la sintesi di una molecola di RNA copiata da un segmento di DNA; solo uno dei due filamenti del DNA viene trascritto in un RNA. Questo è logico, perché la funzione dell’RNA nella cellula dipende dalla sua sequenza di basi, quindi un trascritto dell’altro filamento di DNA avrebbe una sequenza di RNA complementare che non potrebbe svolgere correttamente la propria funzione. La produzione di un RNA attraverso la trascrizione di un gene è una fase dell’espressione genica. Ci sono quattro tipi principali di molecole di RNA, ciascuna codificata da geni specifici, ma solo uno di essi, l’RNA messaggero (mRNA), viene tradotto. Tutte le altre classi comprendono RNA trascritti ma non tradotti in catene polipeptidiche, che hanno ruoli funzionali importanti. 1. mRNA (RNA messaggero), che codifica per la sequenza di amminoacidi di un polipeptide. Gli mRNA sono i trascritti dei geni che codificano per proteine. La traduzione di un mRNA produce un polipeptide. 2. rRNA (RNA ribosomale), che, insieme alle proteine ribosomali, costituisce i ribosomi (le strutture nelle quali viene tradotto l’mRNA). 3. tRNA (transfer RNA o RNA di trasporto), che porta gli amminoacidi al ribosoma durante la traduzione.

74

Capitolo 5

4. snRNA (small nuclear RNA; piccolo RNA nucleare), che, insieme a proteine, forma complessi che vengono usati nella maturazione degli RNA eucarioti per produrre mRNA funzionali. Nella cellula si trova un gran numero di altre piccole molecole di RNA, non codificanti (indicate come ncRNA, non coding RNA), che verranno descritte nei prossimi capitoli. Nel seguito di questo capitolo studierete il processo della trascrizione nei batteri e negli eucarioti, in particolare per quanto riguarda i geni che codificano per proteine.

Il processo della trascrizione

MyLab

Come viene sintetizzata una catena di RNA? A ogni gene sono associate sequenze chiamate elementi regolatori, che sono coinvolte nella regolazione della trascrizione. Il processo della trascrizione è catalizzato dall’enzima RNA polimerasi (Figura 5.1). (Più precisamente, l’enzima è noto come RNA polimerasi DNA-dipendente perché usa uno stampo di DNA per la sintesi di una catena di RNA.) Prima dell’ininimazione zio della trascrizione, la doppia elica di DNA deve svolLa biosintesi gersi per un breve tratto vicidell’RNA no al gene. Nei batteri, lo srotolamento del DNA viene effettuato dalla stessa RNA polimerasi; negli eucarioti, ci sono altre proteine che si legano al DNA vicino al punto d’inizio della trascrizione. Durante la trascrizione, l’RNA viene sintetizzato in direzione da 5′ a 3′. Il filamento di DNA che viene letto in direzione 3′-5′ per formare il filamento di RNA viene chiamato filamento stampo o codificante. Il filamento di DNA 5′-3′ complementare allo stampo, e con la stessa polarità del RNA prodotto, viene chiamato filamento non stampo o non codificante. Per convenzione, nella letteratura scientifica e nelle banche dati di sequenze geniche, la sequenza riportata è quella dell’elica di DNA non codificante. A partire da quest’elica, si può ricavare direttamente la sequenza del trascritto di RNA e, se si tratta di un mRNA, possono essere letti direttamente gli amminoacidi codificati in base al codice genetico.

Inizio della trascrizione

I precursori dell’RNA per la trascrizione sono i ribonucleosidi trifosfati ATP, GTP, CTP, e UTP, chiamati collettivamente NTP (Nucleoside TriPhosphates). La sintesi dell’RNA avviene mediante reazioni di polimerizzazione simili a quelle che avvengono durante la sintesi del DNA (Figura 5.2; la sintesi del DNA è mostrata nella Figura 3.3). L’RNA polimerasi sceglie il nucleotide successivo da aggiungere alla catena in base alla sua capacità di appaiarsi con la base complementare sul filamento stampo del DNA. A differenza della DNA polimerasi, l’RNA polimerasi è in grado di iniziare una nuova catena di RNA; in altre parole, non c’è bisogno di un primer o innesco. Ricordate che le catene di RNA contengono nucleotidi con la base uracile al posto della timina, e che l’uracile si appaia all’adenina. Quindi, dove c’è un nucleotide A nel filamento stampo di DNA, nella catena di RNA verrà inserito un nucleotide U invece di T. Per esempio, se la sequenza dello stampo di DNA è la seguente 3′-ATACTGGAC-5′ la catena di RNA che verrà sintetizzata in direzione da 5′ a 3′ avrà la sequenza 5′-UAUGACCUG-3′

Nota chiave La trascrizione è il processo nel quale l’informazione genetica contenuta nel DNA viene trasferita nella sequenza di basi dell’RNA. Il DNA si srotola in una corta regione vicino al gene, e una RNA polimerasi catalizza la sintesi di una molecola di RNA in direzione da 5’ a 3’ lungo il filamento stampo 3’-5’ del DNA. Solo un filamento del DNA a doppia elica viene trascritto in una molecola di RNA.

La trascrizione nei batteri Il processo della trascrizione avviene in tre fasi: inizio, allungamento e terminazione. In questo paragrafo ci occuperemo della trascrizione nella specie modello, E. coli.

Direzione della trascrizione

RNA polimerasi

Filamento non-stampo 3¢

5¢ 3¢



3¢ 5¢ Promotore

Ibrido RNA-DNA

Filamento di DNA stampo

Figura 5.1 Il processo di trascrizione. La doppia elica del DNA viene denaturata dall’RNA polimerasi nei procarioti, e da altre proteine negli eucarioti. L’RNA polimerasi catalizza quindi la sintesi di una catena di RNA a singolo filamento, a partire dal punto di “inizio della trascrizione”. La catena di RNA viene sintetizzata in direzione 5’-3’, utilizzando solo un filamento del DNA come stampo che ne stabilisce la sequenza di basi.

75

Espressione genica: la trascrizione Catena di RNA in allungamento

Filamento di DNA stampo

5¢ –O



3¢ O–

O

O O

P

P

O

O–

O–

P



–O

O

O

P O–

O

A

O

H2C

T

CH2

O

O–

O

O

O

H

P O–

O

P

O

H O

O

A

O

H2C

T

CH2

O

O O O –O

P

OH

O O–

P

O O

O

H

–O

O

RNA polimerasi

O

Formazione del legame fosfodiesterico

G

O

H2C

C

CH2

O

O

O

P

O

O–

P O–

O

O

G

O

H2C

C

CH2

O

OH

O O–

P

O O

O

H

–O

3¢ –O

O–

P O

H

O

OH

O

P

OH

O O

P

P

OH

O–

P O

H

O

O O

U

O

CH2

A

CH2

O

U

O

H2C

A

CH2

O

O

O– O OH

OH

P

O O–

O OH

O

H

OH

P

O–

O

H

3¢ Ribonucleoside trifosfato in ingresso

G

CH2

O

G

CH2

O

O

Direzione di allungamento della catena 5¢-3¢

O

P

O O–

O

O

H

P

O–

O

H

Allungamento della catena + T

O

CH2

O

–O

O

Figura 5.2 La reazione chimica catalizzata dall’RNA polimerasi e coinvolta nella sintesi di RNA sul filamento stampo di DNA.

O

P

O–

O

Qual è il meccanismo dell’inizio della trascrizione in E. coli? Facendo riferimento alla trascrizione, un gene batterico può essere suddiviso in tre regioni (Figura 5.3): 1. una sequenza, chiamata promotore, che si trova a monte del punto di inizio del gene che codifica per l’RNA. L’RNA polimerasi interagisce con il promotore. Il modo in cui avviene questa interazione fra l’RNA polimerasi e il promotore, dal punto di vista spaziale, definisce la direzione della trascrizione e, quindi, indica all’enzima quale filamento del DNA è lo stampo e dove deve iniziare la trascrizione. La se-

O–

O O

P O–

T

CH2

O

OH

O O

P

O–

O



Inizio della trascrizione: i promotori

P



quenza del promotore serve cioè a orientare l’RNA polimerasi in modo che la trascrizione cominci all’inizio del gene, e assicura che l’inizio della sintesi di ogni RNA abbia luogo nello stesso punto. Un gene con il proprio promotore è un’unità indipendente. Ciò vuol dire che il filamento della doppia elica utilizzato come stampo è gene-specifico. In altre parole, alcuni geni usano un filamento del DNA come stampo, mentre altri geni usano l’altro filamento. L’organizzazione attuale dei geni, per quanto riguarda questo aspetto, è il risultato dell’evoluzione dei genomi; 2. la sequenza che codifica per l’RNA – cioè la sequenza di DNA trascritta dall’RNA polimerasi in RNA;

Gene

5¢ DNA 3¢

Promotore Sequenza codificante per l’RNA Terminatore +1

Sito d’inizio della trascrizione A monte del gene

3¢ Filamento non codificante 5¢ Filamento stampo

Sito di terminazione della trascrizione A valle del gene

Figura 5.3 Promotore, sequenza che codifica per l’RNA e regione del terminatore di un gene. Il promotore si trova a monte della sequenza codificante, il terminatore a valle. La sequenza codificante inizia con il nucleotide +1.

76

Capitolo 5

3. un terminatore, che indica dove finisce la trascrizione. Il confronto delle sequenze che si trovano a monte delle sequenze codificanti, e lo studio degli effetti delle mutazioni di ciascuna coppia di basi a monte dei siti di inizio della trascrizione, hanno permesso di dimostrare che nella maggior parte dei promotori dei geni di E. coli sono presenti due sequenze di DNA fondamentali per specificare l’inizio della trascrizione. Queste sequenze si trovano generalmente in posizione –35 e –10, cioè 35 e 10 coppie di basi a monte rispetto al punto di inizio della trascrizione, indicato con +1. La sequenza di consenso (o consensus, cioè le basi che si trovano con frequenza maggiore in ciascuna posizione) per la regione –35 (la box –35) è 5′-TTGACA-3′. La sequenza consenso per la regione –10 (la box –10, una volta chiamata anche Pribnow box dal nome del ricercatore David Pribnow che l’ha individuata per primo) è 5′TATAAT-3′. Nei batteri è presente solo un tipo di RNA polimerasi, quindi tutte le classi di geni – geni che codificano per proteine, geni per i tRNA, e geni per gli rRNA – vengono trascritte da questo enzima. L’inizio della trascrizione di un gene richiede una forma di RNA polimerasi chiamata oloenzima (o enzima completo). L’oloenzima è formato dal nucleo (core) enzimatico dell’RNA polimerasi, costituito da due polipeptidi α, un polipeptide β e uno β′, legato a un altro polipeptide chiamato fattore sigma (σ). Il fattore sigma assicura che l’RNA polimerasi si leghi in maniera stabile solo ai promotori. Senza il fattore sigma, infatti, il nucleo enzimatico dell’RNA polimerasi si può legare a qualunque sequenza di DNA e iniziare la sintesi dell’RNA, ma in questo caso l’inizio della trascrizione non avviene nei punti giusti. L’associazione del fattore sigma con il nucleo enzimatico riduce notevolmente la capacità dell’enzima di legarsi al DNA in maniera non-specifica, e conferisce all’oloenzima la proprietà di legarsi in modo specifico al promotore. Il fattore sigma non è necessario per le fasi di allungamento e terminazione della trascrizione. L’oloenzima della RNA polimerasi si lega ai promotori della maggior parte dei geni, come è mostrato nella Figura 5.4. All’inizio, l’oloenzima prende contatto con la sequenza –35, e poi si lega all’intero promotore, mentre il DNA si trova ancora nella forma standard a doppia elica, uno stato chiamato complesso del promotore chiuso (Figura 5.4a). Quindi, l’oloenzima srotola il DNA in corrispondenza della regione –10 (Figura 5.4b). La forma srotolata del promotore è chiamata complesso del promotore aperto. Il fattore sigma dell’oloenzima ha un ruolo chiave in queste fasi, interagendo direttamente con il promotore a livello delle sequenze –35 e –10. Una volta che la RNA polimerasi è legata alla box –10, essa è orientata nel modo corretto per iniziare la trascrizione

del gene al nucleotide giusto. In questa fase, la RNA polimerasi è in contatto con circa 75 coppie di basi di DNA, dalla posizione –55 alla +20. Poiché le sequenze dei promotori sono diverse, l’efficienza del legame dell’RNA polimerasi è variabile. Ciò fa sì che l’efficienza dell’inizio della trascrizione vari da gene a gene. Per esempio, se la sequenza –10 è 5′-GATACT-3′, il tasso d’inizio della trascrizione sarà inferiore rispetto a una sequenza 5′-TATAAT-3′, perché la capacità del fattore sigma dell’RNA polimerasi di riconoscere e legare la prima sequenza è inferiore rispetto alla seconda. Come abbiamo già detto, i promotori della maggior parte dei geni di E. coli possiedono le sequenze di riconoscimento –35 e –10. Questi promotori sono riconosciuti da un fattore sigma con un peso molecolare di 70 000 Da, chiamato σ70. In E. coli ci sono altri fattori sigma, con un ruolo importante nella regolazione dell’espressione genica. Ciascun tipo di fattore sigma si lega al nucleo enzimatico dell’RNA polimerasi, e consente all’oloenzima di riconoscere promotori differenti. Per esempio, in condizioni di stress termico da alte temperature (heat-shock), e in seguito ad altri tipi di stress, nella cellula aumenta la quantità di un altro fattore sigma, σ32 (con peso molecolare di 32 000 Da), che indirizza alcune molecole di RNA polimerasi a legarsi ai promotori dei geni che codificano proteine necessarie per la risposta allo stress. Questi promotori hanno sequenze consenso di riconoscimento specifiche per il fattore σ32 in posizione –39 e –15. Ci sono numerosi altri tipi di fattori sigma con ruoli diversi. La regolazione dell’espressione dei geni batterici verrà discussa nel Capitolo 17. In sintesi, la trascrizione di molti geni batterici viene controllata attraverso l’interazione di proteine regolatrici con sequenze regolatrici che si trovano a monte della sequenza che codifica per l’RNA, vicino al promotore. Ci sono due classi di proteine regolatrici: gli attivatori stimolano la trascrizione facilitando il legame dell’RNA polimerasi o l’allungamento del filamento di RNA, mentre i repressori inibiscono la trascrizione, rendendo più difficile il legame dell’RNA polimerasi o l’allungamento del filamento di RNA.

Allungamento della catena di RNA La sintesi dell’RNA avviene in una regione di DNA che si è separata in singoli filamenti formando una bolla di trascrizione. Una volta che la sintesi sia iniziata e si sia instaurata la fase di allungamento, l’RNA polimerasi comincia a muoversi lungo il DNA e il fattore sigma viene rilasciato (Figura 5.4c). Il nucleo enzimatico è capace di completare la trascrizione del gene da solo. In cellule di E. coli che crescono a 37 °C, la trascrizione ha una velocità di circa 40 nucleotidi/s. Durante la transizione dalla fase di inizio a quella di allungamento, l’RNA polimerasi diventa più compatta, ed è in contatto con una regione di DNA più piccola. Quando la fase di allungamento è

77

Espressione genica: la trascrizione

a) Nella fase di inizio, l’oloenzima dell’RNA polimerasi riconosce dapprima la regione –35 del promotore e quindi lo lega interamente. Sequenza codificante

Promotore RNA polimerasi

Complesso del promotore chiuso







3¢ Fattore s

b) Mentre la fase di inizio procede, l’RNA polimerasi si lega più strettamente al promotore a livello della regione –10; lo srotolamento localizzato del DNA in quella regione accompagna l’evento. A questo punto, l’RNA polimerasi è orientata nel modo corretto per iniziare la trascrizione in posizione +1. Regione –35

Regione –10

Nucleotide d’inizio

3¢ 5¢ 5¢ PPP



Complesso del promotore aperto



+1

c) Dopo la polimerizzazione di 8-9 nucleotidi, il fattore sigma si dissocia dal nucleo enzimatico.

Direzione della trascrizione RNA polimerasi 3¢

5¢ 5¢





Filamento di DNA stampo

5¢ Ibrido RNA-DNA

Rilascio del fattore s

d) Mentre l’RNA polimerasi allunga la nuova catena di RNA, l’enzima srotola il DNA a valle, mantenendo una bolla di trascrizione a singolo filamento che si estende per circa 25 paia di basi. Circa 9 basi del nuovo RNA sono legate al DNA a singolo filamento nella bolla di trascrizione, e il rimanente esce dall’enzima sotto forma di filamento singolo. 3¢ 5¢ 3¢





5¢ Allungamento dell’RNA Promotore

Sequenza codificante

Figura 5.4 L’azione dell’RNA polimerasi di E. coli nelle fasi di inizio e di allungamento della trascrizione.

stabilizzata, l’RNA polimerasi è in contatto con circa 40 coppie di basi di DNA, 25 delle quali fanno parte della bolla di trascrizione. Durante la fase di allungamento il nucleo enzimatico si muove, srotolando la doppia elica di DNA davanti a sé

per esporre un nuovo segmento del DNA stampo a singolo filamento. Dietro la regione srotolata i due filamenti del DNA riformano la doppia elica (Figura 5.4d). Nella regione srotolata circa 9 nucleotidi di RNA sono appaiati al DNA, formando un ibrido temporaneo RNA-DNA;

78

Capitolo 5

il resto dell’RNA appena sintetizzato esce dall’enzima come filamento singolo (Figura 5.4d). L’RNA polimerasi ha due attività di correzione di bozze. Una di queste è simile a quella della DNA polimerasi, nella quale il nucleotide inserito erroneamente viene rimosso dall’enzima invertendo la reazione di sintesi, facendo un passo indietro, e sostituendo il nucleotide sbagliato con quello giusto. Nell’altra attività di correzione, l’enzima torna indietro di uno o più nucleotidi e taglia l’RNA in quella posizione, prima di riprendere la sintesi dell’RNA nella direzione giusta.

Terminazione della catena di RNA La fine della trascrizione dei geni batterici viene segnalata da sequenze di terminazione o terminatori. Nella terminazione della trascrizione di alcuni geni di E. coli è coinvolta una proteina, chiamata proteina Rho (ρ). I terminatori di questi geni sono chiamati terminatori Rho-dipendenti (o terminatori di tipo II). Per altri geni, è il nucleo enzimatico dell’RNA polimerasi che termina da solo la trascrizione; i terminatori per questi geni sono chiamati terminatori Rho-indipendenti (o terminatori di tipo I). I terminatori Rho-indipendenti sono costituiti da una sequenza ripetuta invertita che si trova circa 16-20 coppie di basi a monte del punto di termine della trascrizione, seguita da una serie di 4-8 coppie di basi A-T. L’RNA polimerasi trascrive la sequenza del terminatore, che fa parte integrante del gene che codifica per l’RNA. A causa della presenza della sequenza ripetuta invertita, l’RNA appena sintetizzato si ripiega a formare una struttura a forcina (Figura 5.5). La struttura a forcina determina un rallentamento, e quindi una pausa, nella sintesi dell’RNA da parte dell’RNA polimerasi. La serie di nucleotidi U a valle della forcina destabilizza l’appaiamento fra la nuova catena di RNA e il filamento stampo del DNA, e l’RNA polimerasi si dissocia dallo stampo; la trascrizione è così terminata. Le mutazioni che impediscono la formazione delSimmetria bipartita Stampo (DNA)

la forcina impediscono in modo parziale o completo la terminazione. I terminatori Rho-dipendenti sono sequenze ricche di C e povere di G, che non formano strutture a forcina come quelle dei terminatori Rho-indipendenti. La terminazione in questo caso si ottiene nel modo seguente: Rho si lega alla sequenza ricca di C del terminatore, nel trascritto a monte del sito di termine della trascrizione. Quindi Rho si muove lungo il trascritto fino a raggiungere l’RNA polimerasi, dove l’RNA appena sintetizzato è appaiato con il DNA stampo. Rho è un’elicasi, cioè un enzima capace di srotolare gli acidi nucleici a doppia elica. Quando Rho raggiunge l’RNA polimerasi, l’elicasi srotola l’elica formata fra l’RNA e il filamento stampo del DNA, usando l’idrolisi dell’ATP come fonte dell’energia necessaria. Si ha quindi il rilascio della nuova molecola di RNA, la doppia elica del DNA si riforma, e l’RNA polimerasi e Rho si dissociano dal DNA; la trascrizione è terminata.

Nota chiave In E. coli, l’inizio e il termine della trascrizione sono indicati da sequenze specifiche che fiancheggiano la regione codificante del gene. Il promotore viene riconosciuto dal fattore sigma, un componente del complesso RNA polimerasi-fattore sigma. Esistono due tipi di sequenze di terminazione, e un determinato gene può avere l’una o l’altra. Un tipo di terminatore viene riconosciuto dall’RNA polimerasi da sola, mentre l’altro tipo viene riconosciuto dall’enzima associato al fattore Rho.

La trascrizione negli eucarioti Negli eucarioti, la trascrizione è più complessa rispetto ai batteri. Ciò è dovuto al fatto che gli eucarioti possiedono tre classi differenti di RNA polimerasi, e al modo in cui vengono processati i trascritti per ottenerne le forme funzionali. In questo paragrafo ci occuperemo della trascrizione dei geni che codificano per proteine.

5¢ C C C A G C C C G C C T A A T G A G C G G G C T T T T T T T T G A A C A A A A 3¢ 3¢ G G G T C G G G C G G A T T A C T C G C C C G A A A A A A A A C T T G T T T T 5¢

Trascritto 5¢ C C C A G C C C G C C U A A U G A G C G G G C U U U U U U U U – OH 3¢ (RNA)

Il trascritto si ripiega formando la forcina di terminazione

Mutazioni A U A U

A U C

A

U G A

C –G Mutazioni G–C A C –G A U C C –G C –G A U G–C 5¢– C C C A – U U U U U U U U – OH 3¢ G

Delezione

Le RNA polimerasi eucariote Negli eucarioti, la trascrizione dei geni per i quattro tipi principali di RNA è effettuata da tre RNA polimerasi differenti. L’RNA polimerasi I, localizzata nel nucleolo, ca-

Figura 5.5 Sequenza di un terminatore Rho-indipendente e struttura dell’RNA terminato. Le mutazioni nello stelo della forcina (indicato in giallo) impediscono parzialmente o completamente la terminazione.

Espressione genica: la trascrizione

talizza la sintesi di tre degli RNA che si trovano nei ribosomi: le molecole di rRNA 28S, 18S, e 5,8S. (I valori S indicano il coefficiente di sedimentazione delle molecole di rRNA durante la centrifugazione, e danno un’indicazione molto approssimativa della dimensione delle molecole.) L’RNA polimerasi II, localizzata nel nucleoplasma, sintetizza gli RNA messaggeri (mRNA) e alcuni piccoli RNA nucleari (snRNA). L’RNA polimerasi III, che si trova anch’essa nel nucleoplasma, sintetizza: (1) gli RNA transfer (tRNA); (2) l’rRNA 5S, una piccola molecola di rRNA presente in tutti i ribosomi; e (3) gli snRNA non sintetizzati dall’RNA polimerasi II. Tutte le RNA polimerasi eucariote sono costituite da più subunità. Per esempio, l’RNA polimerasi II del lievito è formata da 12 subunità e ha una struttura a forma di U; l’estremità aperta della U guida la polimerasi mentre si muove lungo il DNA (Figura 5.6). Le RNA polimerasi II eucariote di altre specie hanno una struttura simile. Le RNA polimerasi batteriche sono più piccole, ma hanno una struttura abbastanza simile a quella delle RNA polimerasi eucariote.

Nota chiave In E. coli, un’unica RNA polimerasi sintetizza gli mRNA, i tRNA e gli rRNA. Gli eucarioti hanno tre RNA polimerasi nucleari distinte, ciascuna delle quali trascrive tipi di geni diversi: l’RNA polimerasi I trascrive i geni per gli RNA ribosomali 28S, 18S e 5,8S; l’RNA polimerasi II trascrive i geni per gli mRNA e alcuni snRNA; e l’RNA polimerasi III trascrive i geni per l’rRNA 5S, i tRNA, e i rimanenti snRNA.

La trascrizione dei geni che codificano per proteine da parte dell’RNA polimerasi II In questo paragrafo descriveremo la successione degli eventi molecolari coinvolti nella trascrizione dei geni che codificano per proteine da parte dell’RNA polimerasi II. I geni eucarioti trascritti dall’RNA polimerasi II hanno specifiche sequenze del promotore ma, contrariamente ai geni batterici, non hanno specifiche sequenze di terminazione. Il prodotto della trascrizione è una molecola di mRNA precursore (pre-mRNA) – un trascritto che deve essere modificato, processato, o entrambe le cose, per produrre una molecola di mRNA matura e funzionale che possa essere tradotta in un polipeptide. Promotori ed enhancer I promotori dei geni che codificano per proteine possono essere analizzati principalmente in due modi. Un modo consiste nell’esaminare gli effetti di mutazioni che causano la delezione o il cambiamento di coppie di basi nella sequenza a monte del punto d’inizio della trascrizione, e verificare se nei mutanti si abbia un’alterazione della trascrizione. Le mutazioni

79

Figura 5.6 Struttura tridimensionale dell’RNA polimerasi II del lievito. Ciascun colore rappresenta un polipeptide differente.

che alterano in maniera significativa la trascrizione permettono di individuare elementi importanti dei promotori. Il secondo modo consiste nel confrontare le sequenze di DNA a monte di un certo numero di geni che codificano per proteine, e vedere se si individuano regioni con sequenze simili. I risultati di questi esperimenti hanno dimostrato che i promotori dei geni che codificano per proteine coprono una regione di circa 200 coppie di basi a monte del sito d’inizio della trascrizione, e contengono vari elementi di sequenza. Nel promotore possono essere distinte due regioni: (1) il nucleo del promotore; e (2) gli elementi prossimali. Il nucleo del promotore è costituito da una serie di elementi che agiscono in cis necessari perché la sintesi dell’RNA possa iniziare nel punto giusto. (Cis vuol dire “dalla stessa parte”. Una sequenza che agisce in cis influenza solo l’attività di un gene che si trova sulla stessa molecola di DNA.) Questi elementi si trovano di solito non più di 50 paia di basi a monte del sito d’inizio della trascrizione. Gli elementi del nucleo del promotore meglio caratterizzati sono: (1) una corta sequenza chiamata Inr (Iniziatore), che comprende il sito d’inizio della trascrizione (definito +1); e (2) la TATA box o elemento TATA (chiamata anche box Goldberg-Hogness, dai nomi dei suoi scopritori), localizzata all’incirca in posizione –30. La TATA box ha una sequenza di consenso di sette nucleotidi: 5′-TATAAAA-3′. Gli elementi Inr e TATA specificano dove si deve assemblare l’apparato della trascrizione, e determinano dove essa avrà inizio. Tuttavia, in assenza di altri elementi, la trascrizione avviene solo a un livello molto basso. Gli elementi prossimali del promotore si trovano a monte della TATA box, nella regione che va da –50 a –200 nucleotidi dal sito d’inizio della trascrizione. Fra questi elementi abbiamo, per esempio la CAAT (“cat”) box, denominata in base alla sua sequenza consenso e localizzata in posizione –75; e la GC box, che ha la sequen-

80

Capitolo 5

Focus sul genoma La ricerca dei promotori I promotori sono ovviamente importanti per la funzione genica. Precedentemente in questo capitolo abbiamo definito le sequenze consenso per i promotori e altre regioni regolatrici a monte, per esempio le box TATA e CAAT. Le sequenze di questi elementi, così come la loro distanza relativa l’uno rispetto all’altro e rispetto al sito d’inizio della trascrizione, sono importanti dal punto di vista funzionale. Non tutti i geni mostrano nei loro promotori una corrispondenza precisa con queste sequenze, o

za consenso 5′-GGGCGG-3′ e che si trova in posizione –90. Sia la CAAT box sia la GC box funzionano in entrambi gli orientamenti (cioè la loro sequenza può essere orientata nello stesso senso rispetto alla trascrizione, o nel senso opposto). Mutazioni in ciascuno di questi elementi (o in altri elementi prossimali non menzionati) determinano una marcata diminuzione della frequenza d’inizio della trascrizione a partire dal promotore, indicando che essi hanno un ruolo nel determinare l’efficienza del promotore stesso. I promotori possono contenere varie combinazioni degli elementi del nucleo e prossimali, che nell’insieme ne determinano la funzionalità. Gli elementi prossimali sono importanti nel determinare come e quando un gene è espresso. La chiave di questa regolazione è rappresentata da proteine regolatrici chiamate attivatori, che determinano l’efficienza dell’inizio della trascrizione. Per esempio, geni che sono espressi in tutti i tipi cellulari per le funzioni di base – detti geni housekeeping – hanno elementi prossimali riconosciuti da attivatori presenti in tutti i tipi cellulari. Esempi di geni housekeeping sono il gene per l’actina e il gene per l’enzima glucosio 6-fosfato deidrogenasi. Al contrario, geni che sono espressi solo in tipi cellulari particolari, o in un momento particolare, hanno gli elementi prossimali dei promotori riconosciuti da attivatori presenti in quei tipi cellulari o in quelle particolari condizioni. Altre sequenze – gli enhancer (stimolatori) – sono necessarie per ottenere il livello massimo di trascrizione di un gene. Gli enhancer sono un altro tipo di elemento che agisce in cis. Per definizione, gli enhancer funzionano sia a monte sia a valle rispetto al sito d’inizio della trascrizione – anche se, di solito, si trovano a monte del gene che controllano, a volte anche a migliaia di coppie di basi di distanza. In altre parole, gli enhancer modulano la trascrizione a distanza. Gli enhancer contengono una varietà di elementi costituiti da corte sequenze, alcuni dei quali sono uguali a quelli che si trovano nei promotori. Gli attivatori si legano anche a queste sequenze, e forma-

perché si legano meno bene all’apparato della trascrizione, o perché altre proteine aiutano l’RNA polimerasi a legarsi. Uno dei primi obiettivi della genomica è stato l’analisi delle sequenze per ricercare possibili promotori, al fine di identificare i geni associati a quelle sequenze. Anche la ricerca di cornici di lettura aperte (ORF, Open Reading Frames), descritte nel Capitolo 6, e di regioni contenenti i segnali di terminazione permettono l’individuazione di sequenze geniche nel genoma.

no complessi con altre proteine. Il DNA che contiene gli enhancer viene portato vicino al DNA del promotore, al quale è legato il complesso della trascrizione, stimolando al massimo livello la trascrizione di quel particolare gene. Nel Capitolo 18 verranno discussi in maggior dettaglio gli attivatori, i promotori, gli enhancer, e come vengono regolati i geni che codificano per proteine negli eucarioti. Il Focus sul genoma di questo capitolo descrive come i ricercatori identificano i promotori nelle sequenze di DNA genomico. Inizio della trascrizione Un preciso inizio della trascrizione di un gene che codifica per una proteina prevede l’assemblaggio sul nucleo del promotore dell’RNA polimerasi II e di un certo numero di altre proteine, chiamate fattori generali di trascrizione (GTF). Contrariamente alle RNA polimerasi batteriche, nessuna delle tre RNA polimerasi eucariote si può legare direttamente al DNA. Particolari GTF si legano prima, e reclutano l’RNA polimerasi formando un complesso. Successivamente si legano altri GTF, e la trascrizione può avere inizio. I GTF sono identificati da un numero, che si riferisce all’RNA polimerasi con la quale interagiscono, e da una lettera che indica l’ordine con il quale sono stati scoperti. Per esempio, TFIID è il quarto fattore di trascrizione generale scoperto (come indicato dalla lettera D), che interagisce con l’RNA polimerasi II. Nel caso dei geni che codificano per proteine, i GTF e l’RNA polimerasi II si legano in vitro agli elementi del promotore secondo un ordine specifico per formare il complesso d’inizio della trascrizione completo, chiamato anche complesso di pre-inizio (PIC) perché è pronto a iniziare la trascrizione (Figura 5.7). Come abbiamo detto in precedenza, il legame degli attivatori agli elementi prossimali del promotore e agli enhancer determina l’efficienza complessiva dell’inizio della trascrizione a livello di un particolare promotore. Mentre gli esperimenti effettuati in vitro indicano che l’assemblaggio dei GTF e dell’RNA polimerasi II

Espressione genica: la trascrizione Assemblaggio del complesso di pre-inizio TFIID

TAFs TBP

TATA box

Punto d’inizio della trascrizione

TFIID si lega alla TATA box per formare il complesso d’inizio preliminare

TFIIA TFIIB

TATA box TFIIF

RNA polimerasi II

81

Figura 5.7 Assemblaggio del complesso d’inizio della trascrizione. Il fattore TFIID si lega per primo alla TATA box per formare il complesso d’inizio preliminare. TFIID è costituito da più subunità, fra le quali la proteina che lega la TATA box (TBP), che riconosce la sequenza della TATA box, e numerose altre proteine chiamate fattori associati alla TBP (TAF). In vitro, il complesso TFIID-TATA box costituisce il sito di legame per l’aggiunta in sequenza di altri fattori di trascrizione. Inizialmente, si legano TFIIA e poi TFIIB, seguiti dalla RNA polimerasi II e da TFIIF, per formare il complesso minimo d’inizio della trascrizione. (La RNA polimerasi II, come tutte le RNA polimerasi eucariote, non può riconoscere direttamente gli elementi del promotore e legarvisi.) In seguito, si legano TFIIE e TFIIH per formare il complesso d’inizio della trascrizione completo, chiamato anche complesso di preinizio (PIC). A questo punto, l’attività di elicasi di TFIIH srotola il DNA del promotore, e la trascrizione può iniziare.

RNA polimerasi II

Complesso minimo d’inizio della trascrizione

La struttura e la produzione degli mRNA eucarioti

Nelle cellule procariote e in quelle eucariote gli mRNA maturi, biologicamente attivi, sono costituiti da tre parti principali (Figura 5.8): (1) una regione non tradotta al 5„ (5„ TFIIH UnTranslated Region o 5„ UTR, chiamata anche sequenza leader) all’estremità 5′; (2) la sequenza che codinimazione RNA polimerasi II fica per la proteina, che specifica la La produzione Complesso d’inizio sequenza degli amdell’mRNA della trascrizione minoacidi di una negli eucarioti completo (= complesso di pre-inizio) TATA box proteina durante la traduzione; e (3) una sequenza non tradotta al 3„ (3„ UTR, chiamata anche sequenza traisul promotore avviene secondo un ordine sequenziale, in ler). La sequenza 3′ UTR può contenere informazioni vivo la situazione è meno chiara. Alcuni dati indicano che determinano la stabilità di quel particolare mRNA che il complesso d’inizio prende contatto con il promo- (vedi Capitolo 18). La produzione dell’mRNA è diversa nei batteri e netore come un complesso unico. In ogni caso, l’inizio della trascrizione in vivo è chiaramente più complicato a gli eucarioti. Nei batteri (Figura 5.9a), il trascritto di causa dell’organizzazione del cromosoma in nucleosomi RNA funziona direttamente come molecola di mRNA; la sequenza di coppie di basi di un gene batterico è cioè (questo aspetto verrà affrontato nel Capitolo 18). colineare con quella dell’mRNA tradotto. Inoltre, dal momento che i batteri sono privi di nucleo, un mRNA inizia a essere tradotto sui ribosomi prima che la sua traSul sito web dedicato agli studenti, scoprite scrizione sia stata completata; questo processo viene come mutazioni in diverse regioni del gene della chiamato accoppiamento di trascrizione e traduzione. β-globina influenzino la trascrizione dell’mRNA e Negli eucarioti (Figura 5.9b), l’RNA trascritto (il prela produzione della β-globina nella iAttività mRNA) viene modificato nel nucleo durante il processaInvestigating Transcription in Beta-Thalassemia mento dell’RNA per produrre un mRNA maturo. Inoltre, Patients (Studiare la trascrizione nei pazienti afprima di essere tradotto l’mRNA deve migrare dal nufetti da beta-talassemia). cleo al citoplasma (dove si trovano i ribosomi). Quindi, TATA box

TFIIE

Attività

MyLab

MyLab

82

Capitolo 5

mRNA 5¢



Regione non tradotta al 5¢ (5¢ UTR)

Regione non tradotta al 3¢ (3¢ UTR)

Sequenza che codifica per la proteina

Inizio della traduzione

Figura 5.8 Struttura generale dell’mRNA presente sia nei batteri sia nelle cellule eucariote.

Fine della traduzione

Produzione dell’mRNA maturo negli eucarioti A differenza degli mRNA batterici, gli mRNA eucariotici vengono modificati a entrambe le estremità, 5′ e 3′. Inoltre, una scoperta particolarmente interessante nella storia della genetica molecolare si ebbe nel 1977, quando Richard Roberts, Tom Broker, e Louie Chow – e, separatamente, Philip Sharp e Susan Berger – dimostrarono che i geni di

alcuni virus animali contengono sequenze interne che non sono espresse come sequenze di amminoacidi delle proteine da essi codificate. In seguito, lo stesso fenomeno fu osservato negli eucarioti. Sappiamo ora che, negli eucarioti in generale, i geni che codificano per proteine contengono di solito sequenze che non codificano per amminoacidi, chiamate introni, interposte fra le altre sequenze che si trovano nell’mRNA, gli esoni. Il termine introne deriva infatti da intervening sequence (letteralmente, “sequenza interposta”) – cioè una sequenza che non viene tradotta in una sequenza di amminoacidi – e il termine esone deriva da expressed sequence (letteralmente, “sequenza espressa”). Gli esoni comprendono le sequenze UTR in 5′ e in 3′, e le regioni che codificano per gli amminoacidi. Durante il processamento del pre-mRNA per formare la molecola di mRNA matura, gli introni vengono rimossi. Roberts e Sharp hanno ricevuto nel 1993 il Premio Nobel per la Fisiologia o Medicina per le loro scoperte indipendenti dei geni dotati di introni.

Figura 5.9 Processi necessari per la sintesi di un mRNA funzionale nei batteri e negli eucarioti. (a) Nei batteri, l’mRNA sintetizzato dalla RNA polimerasi non deve subire una maturazione prima di essere tradotto dai ribosomi. Inoltre, dato che non c’è una membrana nucleare, la traduzione dell’mRNA può avere inizio mentre la trascrizione è ancora in corso, determinando l’accoppiamento della trascrizione e

della traduzione. (b) Negli eucarioti, il trascritto primario di RNA è una molecola di mRNA precursore (pre-mRNA), che viene processato nel nucleo attraverso l’aggiunta di un cappuccio all’estremità 5’ e di una coda di poli(A) all’estremità 3’, e la rimozione degli introni. La traduzione può avvenire solo quando l’mRNA maturo sia stato trasportato nel citoplasma.

un mRNA eucariote viene sempre trascritto completamente, e poi processato, prima di essere tradotto. Un’altra differenza fondamentale fra mRNA batterici ed eucarioti consiste nel fatto che gli mRNA batterici sono spesso policistronici, cioè contengono l’informazione per codificare gli amminoacidi di più di un gene, mentre gli mRNA eucarioti sono di solito monocistronici, cioè contengono l’informazione per codificare un solo gene. Il sistema eucariote permette più livelli successivi di controllo dell’espressione genica, il che è particolarmente importante in organismi multicellulari, più complessi.

a) Batterio

b) Eucariote

DNA Nucleo RNA polimerasi mRNA precursore (pre-mRNA) 3¢ 5¢ Processamento (cappuccio in 5¢, coda di poli(A) in 3¢, rimozione degli introni) mRNA 5¢

Polipeptide sintetizzato Ribosoma

Citoplasma

RNA polimerasi

.. . AAA. .. A AA

AA A. ..



Espressione genica: la trascrizione

Modifica all’estremità 5„ Quando l’RNA polimerasi II ha sintetizzato circa 20-30 nucleotidi di pre-mRNA, l’estremità 5′ dell’mRNA viene modificata dall’aggiunta di un cappuccio (cap). La formazione del cappuccio consiste nell’aggiunta, da parte di un enzima specifico, di un nucleotide guaninico – più comunemente una 7-metil guanosina (m7G) – all’estremità 5′ mediante un legame insolito 5′-5′, anziché un legame 5′-3′ (Figura 5.10). Il processo viene chiamato capping al 5„. Anche gli zuccheri dei due nucleotidi successivi vengono modificati per metilazione. Il cappuccio al 5′ rimane durante tutto il processamento del pre-mRNA ed è presente nell’mRNA maturo, che viene così protetto dalla degradazione da parte delle esonucleasi grazie al legame insolito 5′-5′. Il cappuccio al 5′ è importante anche per legare il ribosoma nella fase iniziale della traduzione.

O

Nucleotide guanina

H2N

O

2



1¢ 3¢



OH OH O

Inizio dell’mRNA O–

P

O

O O

O–

P O

O

O–

P O 5¢ CH2

O

A o G 1¢

4¢ 3¢

O O

P O–



O

CH3 5¢ O CH2

O

Base

Gruppi metilici



4¢ 3¢

O

...

Modifica all’estremità 3„ La maggior parte dei premRNA eucarioti viene modificata all’estremità 3′ dall’aggiunta di una sequenza di circa 50-250 nucleotidi adeninici, chiamata coda di poli(A). Per la coda di poli(A) non c’è un DNA stampo, ed essa rimane durante il processamento del pre-mRNA per formare l’mRNA maturo. Le molecole di mRNA con la coda di poli(A) all’estremità 3′ vengono chiamate mRNA poli(A)+. La coda di poli(A) è necessaria perché l’mRNA possa essere esportato in maniera efficiente dal nucleo al citoplasma. Una volta nel citoplasma, la coda di poli(A) protegge l’estremità 3′ dell’mRNA ostacolando una prematura degradazione da parte delle esonucleasi. La coda di poli(A) ha anche un ruolo importante nell’inizio della traduzione da parte dei ribosomi, e nella regolazione della stabilità dell’mRNA. L’aggiunta della coda di poli(A) definisce l’estremità 3′ di un filamento di mRNA, ed è associata con la terminazione della trascrizione dei geni che codificano per proteine. L’aggiunta della coda di poli(A) viene segnalata quando la trascrizione dell’mRNA oltrepassa un sito chiamato sito poli(A) (sito di poliadenilazione), che si trova circa 10-30 nucleotidi a valle della sequenza consenso di poliadenilazione 5′-AAUAAA-3′. A questo punto una serie di proteine, fra le quali la proteina CPSF (Cleavage and Polyadenylation Specificity Factor o fattore di specificità per il taglio e la poliadenilazione), la proteina CstF (Cleavage stimulation Factor o fattore di stimolazione del taglio) e due fattori di taglio (cleavage factor protein), CFI e CFII, si legano all’RNA e lo tagliano in corrispondenza del sito poli(A) (Figura 5.11a). In seguito, l’enzima poli(A) polimerasi (PAP), legato al CPSF, catalizza l’aggiunta di nucleotidi A all’estremità 3′ dell’RNA, usando come substrato l’ATP, per formare la coda di poli(A). Non appena la coda di poli(A) sia stata sintetizzata, viene legata da molecole della proteina che lega il poli(A) (PABII). Nel frattempo, l’RNA polimerasi II sta ancora sintetizzando l’RNA, anche se, ovviamente, questo RNA non

N

N 5¢ CH

Gruppo metilico

CH3

+

N

HN

83



O

CH3 o H

Figura 5.10 Struttura del cappuccio all’estremità 5’ di un mRNA eucariote. Il cappuccio è prodotto dall’aggiunta di un nucleotide guanina e di due gruppi metilici.

fa parte dell’mRNA. I geni che codificano per proteine non hanno sequenze di terminazione specifiche, come avviene nei batteri. (I geni eucarioti trascritti dall’RNA polimerasi I e III hanno invece terminatori specifici.) Come avviene allora la terminazione dopo il sito poli(A)? Sono stati proposti numerosi modelli. Secondo uno di essi, un’esonucleasi 5′-3′ si lega all’RNA dopo il sito poli(A), e ne inizia la degradazione. Quando raggiunge l’RNA polimerasi II, la degradazione stimola in qualche modo la terminazione della trascrizione, probabilmente destabilizzando il complesso enzima-fattori di trascrizione-DNA. Gli introni I pre-mRNA contengono spesso un certo numero di introni. Per produrre un mRNA maturo, che possa essere tradotto nel polipeptide codificato dal gene, gli introni devono essere escissi da ciascun pre-mRNA. La molecola di mRNA maturo contiene quindi le sequenze degli esoni del gene, contigue le une alle altre e non più separate dalle sequenze degli introni. Quando gli introni furono scoperti, i ricercatori sapevano che il nucleo conteneva un gran numero di moleco-

84

Capitolo 5 Figura 5.11 Schema della formazione dell’estremità 3’ dell’mRNA e dell’aggiunta della coda di poli(A) nei mammiferi. Negli eucarioti, la formazione dell’estremità 3’ di un mRNA viene prodotta dal taglio della catena di RNA nascente. (a) Taglio della catena di pre-mRNA. CPSF si lega al segnale AAUAAA, e CstF si lega a una sequenza ricca in GU o in U (GU/U) a valle del sito poli(A). CPSF e CstF si legano anche fra di loro, formando un’ansa nell’RNA. CFI e CFII si legano all’RNA e lo tagliano. (b) Aggiunta della coda di poli(A). La poli(A) polimerasi aggiunge la coda di poli(A) alla quale si legano proteine specifiche.

a) Taglio del pre-mRNA Pre-mRNA 5¢ AAUA

AA

CPSF Taglio CstF CFI GU/U

CFII RNA polimerasi

3¢ DNA Sintesi dell’RNA

b) Aggiunta della coda di poli(A) Pre-mRNA 5¢ AAUA



AA

PAP

PABII

Taglio

CFII

PABII AA AAAAA

AA

A

GU/U

Coda di poli(A) che viene sintetizzata

A

CFI

AAA

CstF

AAAAAAA

CPSF

RNA polimerasi

3¢ DNA Sintesi dell’RNA

le di RNA di varie dimensioni, note come RNA nucleari eterogenei (hnRNA), e fu proposto, correttamente, che le molecole di pre-mRNA facessero parte degli hnRNA. Nel 1978 il gruppo di Philip Leder studiava il gene della β-globina in cellule di topo in coltura. Questo gene codifica per la β-globina, un polipeptide di 146 amminoacidi che fa parte della molecola dell’emoglobina. I ricercatori isolarono una molecola di hnRNA da 1,5 kb, che era il pre-mRNA della β-globina. Come l’mRNA maturo di 0,7 kb, il pre-mRNA ha un cappuccio all’estremità 5′, e una coda di poli(A) all’estremità 3′. Il gruppo di Leder dimostrò che il pre-mRNA da 1,5 kb è colineare con il gene che lo codifica, mentre non lo è l’mRNA da 0,7 kb della β-globina. L’interpretazione di questi risultati data dagli scienziati fu che il gene della β-globina avesse un introne di circa 800 coppie di basi. La trascri-

zione del gene produceva un pre-mRNA di 1,5 kb, contenente sia le sequenze degli esoni sia quella dell’introne. Questo RNA si trova solo nel nucleo. La sequenza dell’introne viene eliminata nel corso del processamento, e le regioni degli esoni adiacenti vengono unite a formare un mRNA maturo. (Ricerche successive hanno dimostrato che il gene della β-globina contiene in realtà due introni; il secondo introne, più piccolo, non era stato individuato nella ricerca precedente.) Al tempo di questa scoperta, gli scienziati ritenevano che la sequenza di un gene fosse completamente colineare con la sequenza di amminoacidi della proteina da esso codificata. Scoprire che i geni potevano essere frammentati fu quindi una grossa sorpresa. Si è trattato di una di quelle scoperte estremamente significative che hanno cambiato il nostro modo di vedere i geni. Negli anni suc-

Espressione genica: la trascrizione

cessivi alla scoperta degli introni, abbiamo appreso che molti geni eucarioti contengono introni. Gli introni sono invece rari nei procarioti, dove li si trova solo in alcuni geni per tRNA ed rRNA.

Nota chiave I trascritti dei geni che codificano per proteine sono gli RNA messaggeri o i loro precursori. Queste molecole sono lineari e mostrano un’ampia variabilità di lughezza a seconda della dimensione del polipeptide che specificano e della presenza o meno di introni. Gli mRNA procarioti non vengono modificati una volta trascritti, mentre molti mRNA eucarioti vengono modificati dall’aggiunta di un cappuccio all’estremità 5’ e di una coda di poli(A) all’estremità 3’. Molti pre-mRNA eucarioti contengono introni, che devono essere escissi dal trascritto di mRNA per formare una molecola di mRNA matura e funzionale. I segmenti separati dagli introni sono chiamati esoni.

MyLab

85

teine. I cinque snRNA principali sono U1, U2, U4, U5 e U6; ciascuno di essi è associato a un certo numero di proteine per formare le snRNP. Gli snRNA U4 e U6 si trovano insieme nella stessa snRNP (snRNP U4/U6), e gli altri si trovano ciascuno in una snRNP propria. Ci sono almeno 105 copie per cellula di ogni tipo di snRNP. La Figura 5.13 mostra un modello semplificato dei vari passaggi dello splicing di due esoni separati da un introne. 1. La snRNP U1 si lega al sito di splicing al 5′ dell’introne. Questo legame è il risultato dell’appaiamento fra l’snRNA U1 della snRNP e la sequenza del sito di giunzione al 5′. 2. La snRNP U2 si lega a una sequenza chiamata sequenza del punto di ramificazione, situata a monte del sito di splicing al 3′. Questo legame avviene grazie all’appaiamento tra le basi dell’snRNA U2 della snRNP e la sequenza del punto di ramificazione. 3. Una snRNP U4/U6 e una snRNP U5 interagiscono, e così associate si legano alle snRNP U1 e U2, determinando il ripiegamento dell’introne e posizionando i suoi due siti di splicing vicini l’uno all’altro. 4. La snRNP U4 si dissocia, e si ha la formazione dello spliceosoma attivo. 5. Le snRNP nello spliceosoma tagliano l’introne dall’esone 1 a livello del sito di splicing in 5′, e l’estremità 5′ dell’introne, ora libera, si lega a uno specifico nucleotide A nella sequenza del punto di ramificazione. A causa della sua somiglianza con il lazo dei cowboy, la struttura risultante è chiamata struttura di RNA a lazo (lariat). Il punto di ramificazione nell’RNA che produce questa struttura comprende un insolito legame fosfodiesterico 2′-5′, fra l’ossidrile in 2′ dell’adenosina nella sequenza del punto di ramifi-

Processo di maturazione del pre-mRNA La produzione di RNA messaggeri dai geni con introni prevede la trascrizione del gene da parte dell’RNA polimerasi II, l’aggiunta del cappuccio in 5′ e nimazione della coda di poli(A) per proSplicing durre la molecola di predell’RNA mRNA, e il processo di maturazione del pre-mRNA nel nucleo per rimuovere gli introni e unire gli esoni fra di loro per formare l’mRNA maturo (Figura 5.12). Un tipico introne inizia con la sequenza 5′-GU, e finisce con AG-3′, anche se per specificare la giunzione fra un introne e un esone sono necessari più nucleotidi. Nel nuSequenza che codifica per l’RNA cleo, gli introni del pre-mRNA vengono rimossi, e gli esoni DNA uniti, mediante il processo di Trascrizione da parte dell’RNA polimerasi II. Promotore splicing (taglio) dell’mRNA. Il cappuccio in 5¢ viene aggiunto quando sono Gli eventi dello splicing hanno stati sintetizzati 20-30 nucleotidi del pre-mRNA. Aggiunta della coda di poli(A) in 3¢. luogo in un complesso chiamato spliceosoma, formato dal preCoda di poli(A) Cappuccio Esone Introne Esone Introne Esone mRNA legato a piccole partiPre-mRNA 5¢ AAAAAAA...3¢ celle nucleari ribonucleopro5¢ UTR Splicing dell’RNA: 3¢ UTR teiche (snRNP). Le snRNP sorimozione no costituite da piccoli RNA nudegli introni cleari (snRNA) associati a proSequenza che codifica per la proteina mRNA

Figura 5.12 Sequenza delle fasi di formazione dell’mRNA eucariote. Non tutte le fasi sono necessarie per tutti gli mRNA.

AAAAAAA...3¢

5¢ Traduzione

Polipeptide

86

Capitolo 5 Adenina del punto di ramificazione

RNA 5¢ Esone 1 GU

Introne

A

Giunzione di splicing in 5¢

U1 L’snRNP U1 si lega all’estremità 5¢ dell’introne 5¢

GU U1 U2 L’snRNP U2 si lega al punto di ramificazione



AG Esone 2 3¢

Giunzione di splicing in 3¢

GU U1

A

AG



U2 A

AG



U5

U6

U6

U6

U4

U4

U5

U4

U1 UG U4 U6 U5 U2

Le snRNP U4/U6 e U5 si legano a U1 e U2 e si forma un’ansa

L’estremità 5 ¢ dell’introne si lega A alla A del punto di ramificazione e forma una struttura a lazo

5¢ Gli esoni vengono uniti

AG

3¢ U4

L’snRNP U4 viene rilasciata Spliceosoma attivo



U1 UG U6

U5

U2 A

AG



Splicing

Esone 1

U2 U1

Esone 2

Introne

U6 GU

mRNA maturo

snRNP GU

Introne

A

U1 5¢ AG 3¢

U5 U2

Nelle varie fasi dello splicing, le snRNP agiscono attraverso interazioni RNA-RNA, RNA-proteina e proteinaproteina. Esempi di interazioni RNA-RNA sono quelle fra l’snRNA U1 e l’RNA al sito di splicing in 5′, fra l’snRNA U2 e l’RNA della sequenza del punto di ramificazione, e fra l’snRNA U6 e l’snRNA U2. Il Box 5.1 riassume i risultati di alcuni studi di mutazioni che hanno permesso di individuare le interazioni RNA-RNA. Nel Capitolo 18 si vedrà che lo splicing è un processo regolato e che, in alcuni casi, dallo stesso gene vengono prodotti mRNA differenti mediante un processo chiamato splicing alternativo. Una conseguenza dello splicing alternativo è che dallo stesso gene possono essere prodotti polipeptidi differenti. Questi polipeptidi avranno regioni di similarità, ma non saranno identici; avranno cioè funzioni diverse. Per esempio, le proteine del muscolo prodotte attraverso lo splicing alternativo potranno avere un funzionamento ottimale in tessuti diversi, come il muscolo cardiaco, il muscolo liscio, e così via.

U5

A AG L’introne escisso a forma di lazo forma ancora un complesso con le snRNP

RNA intronico rilasciato a forma di lazo

Figura 5.13 Modello della rimozione di un introne da parte dello spliceosoma. All’estremità 5’ di un introne c’è la sequenza GU e all’estremità 3’ la sequenza AG. Vicino all’estremità 3’ dell’introne c’è un nucleotide A localizzato nella sequenza del punto di ramificazione, che nei mammiferi è YNCURAY, dove Y = pirimidina, N = qualsiasi base, R = purina e A = adenina, e nel lievito è UACUAAC (la A in corsivo nelle due sequenze è la base alla quale si lega l’estremità 5’ dell’introne). Con l’aiuto delle snRNP, la rimozione dell’introne inizia con un taglio a livello della prima giunzione esoneintrone. La G all’estremità 5’ libera dell’introne si ripiega su se stessa e forma un legame insolito 2’-5’ con la A della sequenza del punto di ramificazione. Questa reazione produce un intermedio a forma di lazo. La rimozione dell’introne è completata dal taglio alla giunzione introne-esone in 3’ e dalla ligazione dei due esoni.

U6

cazione e il gruppo fosfato in 5′ della guanosina all’estremità dell’introne. La A mantiene il legame normale 3′-5′ con i nucleotidi adiacenti dell’introne. 6. Successivamente, lo spliceosoma elimina l’introne (ancora in forma di lazo), tagliandolo in corrispondenza del sito di giunzione in 3′, e infine unisce gli esoni 1 e 2. A questo punto le snRNP vengono rilasciate. Il processo viene ripetuto per ogni introne.

Accoppiamento della maturazione del pre-mRNA alla trascrizione e all’esportazione dell’mRNA dal nucleo Ricerche effettuate negli ultimi anni hanno dimostrato che l’espressione di un gene eucariote che codifica per una proteina – dalla trascrizione fino alla produzione di una proteina funzionale – è un processo continuo, piuttosto che una serie di eventi indipendenti. I risultati fondamentali a sostegno di questa visione comprendono il fatto che le proteine responsabili delle varie fasi del processo sono collegate dal punto di vista funzionale e, talvolta, strutturale; e che la regolazione del processo avviene a livello di fasi diverse. Inoltre, è particolarmente importante il fatto che l’apparato coinvolto nel processo sia conservato nell’evoluzione, dal lievito all’uomo. In breve, per l’espressione di un gene eucariote che codifica per una proteina, la trascrizione è accoppiata alla maturazione del pre-mRNA, che a sua volta è accoppiata all’esportazione dell’mRNA dal nucleo attraverso i pori nucleari.

Espressione genica: la trascrizione

Box 5.1

87

Identificazione attraverso l’analisi mutazionale delle interazioni RNA-RNA nello splicing del pre-mRNA

Dal punto di vista concettuale, è stato semplice dimostrare che le interazioni RNA-RNA erano importanti nello splicing dell’RNA attraverso l’isolamento di mutazioni geniche difettive nello splicing del pre-mRNA. Molti di questi mutanti avevano alterazioni delle sequenze introniche critiche per lo splicing del pre-mRNA, cioè a livello dei siti di splicing al 5’ e al 3’, e della sequenza del punto di ramificazione. (Questi mutanti hanno aiutato a stabilire il ruolo di queste sequenze nello splicing del premRNA.) I ricercatori ipotizzarono che per il riconoscimento delle tre sequenze fossero importanti gli snRNA delle snRNP. Questa ipotesi è sostenuta da modelli secondo i quali i mutanti con alterazioni nelle sequenze di splicing dovrebbero, in teoria,

Nota chiave Gli introni vengono rimossi dal pre-mRNA in una serie ben definita di passaggi. La rimozione degli introni inizia con il taglio del pre-mRNA a livello del sito di giunzione al 5’. L’estremità 5’ libera dell’introne si ripiega su se stessa, e si lega a un sito a monte del sito di splicing al 3’. Il taglio in corrispondenza di questo sito di giunzione rilascia l’introne, che ha assunto una forma a lazo. Una volta escisso l’introne, gli esoni che lo fiancheggiavano vengono uniti insieme. La rimozione degli introni dal pre-mRNA eucariote ha luogo nel nucleo, in complessi chiamati spliceosomi, che sono costituiti da numerose snRNP legate in maniera specifica a ciascun introne. La maturazione del pre-mRNA negli eucarioti è accoppiata sia alla trascrizione, sia all’esportazione dell’mRNA dal nucleo, come parte di un processo continuo di espressione di un gene che codifica per una proteina.

Auto-splicing (self-splicing) degli introni In alcune specie di protozoi ciliati del genere Tetrahymena, il gene per l’rRNA 28S, che si trova nella subunità maggiore del ribosoma (vedi Capitolo 6), è interrotto da un introne di 413 paia di basi. La trascrizione di questo gene produce un pre-rRNA analogo a una molecola di pre-mRNA, nel senso che l’introne deve essere eliminato per produrre un rRNA funzionale. L’escissione di questo introne – chiamato oggi introne di gruppo I – avviene mediante una reazione indipendente da proteine nella quale l’RNA dell’introne si ripiega a formare una struttura secondaria che promuove la sua stes-

stabilire un legame molto più debole con le molecole di snRNA rispetto alle sequenze normali. Una conferma sperimentale delle interazioni fra gli snRNA e le sequenze di RNA degli introni è venuta dall’ottenimento di snRNA mutanti che ripristinavano un legame forte. La sequenza di splicing mutante veniva cioè usata per disegnare snRNA con mutazioni compensative specifiche, in modo che il legame dell’snRNA mutante con la sequenza di splicing mutante fosse forte come quello dell’snRNA normale con la sequenza di splicing normale. Nei mutanti compensativi l’attività di splicing del gene mutante era ripristinata, e questo forniva l’evidenza funzionale dell’importanza di interazioni specifiche RNA-RNA nello splicing del pre-mRNA.

sa eliminazione. Il processo, chiamato auto-splicing, è stato scoperto nel 1982 da Tom Cech e dal suo gruppo di ricerca. Per questa scoperta, Cech ha ricevuto il Premio Nobel per la Chimica nel 1989. La Figura 5.14 mostra uno schema della reazione di auto-splicing dell’introne di gruppo I nel pre-rRNA di Tetrahymena. Il processo si svolge nel modo seguente: 1. il pre-rRNA viene tagliato a livello del sito di splicing al 5′ e viene aggiunta una guanosina all’estremità 5′ dell’introne; 2. l’introne viene tagliato a livello del sito di splicing al 3′; 3. i due esoni vengono uniti; 4. l’introne escisso circolarizza e forma una molecola a lazo, che viene tagliata per produrre un RNA circolare e un corto frammento di RNA lineare. L’attività di auto-splicing della sequenza di RNA dell’introne non rientra nella definizione di un’attività enzimatica. Ovvero, anche se l’RNA svolge la reazione, esso non viene rigenerato nella sua forma originaria alla fine della reazione stessa, come avviene con gli enzimi proteici. È stato possibile produrre in laboratorio forme modificate dell’RNA dell’introne di Tetrahymena e di altri RNA capaci di auto-splicing in grado di funzionare in modo catalitico. Questi RNA enzimatici sono chiamati ribozimi; essi sono utili dal punto di vista sperimentale, per tagliare molecole di RNA in corrispondenza di sequenze specifiche. L’auto-splicing dell’introne del pre-rRNA di Tetrahymena è stato il primo esempio di quello che oggi si chiama auto-splicing degli introni di gruppo I. Gli introni del gruppo I sono rari. Altri introni di gruppo I che

88

Capitolo 5

Figura 5.14 La reazione di auto-splicing per gli introni di gruppo I nel pre-rRNA di Tetrahymena.

Pre-rRNA di Tetrahymena per l’rRNA 28S 413 nucleotidi Introne

Esone 1 5¢

Esone 2

A



G

Taglio alla giunzione di splicing in 5¢ e aggiunta di una G all’estremità 5¢ dell’introne

G

mostrano auto-splicing sono stati trovati in geni nucleari per rRNA, in alcuni geni mitoEsone 2 Esone 1 Introne condriali che codificano per proteine, e in al- 5¢ 3¢ + 5¢ G A 3¢ G cuni geni di batteriofagi che codificano per Taglio alla giunzione di splicing in 3¢ Ligazione degli esoni tRNA e proteine. Un’altra classe di introni caRilascio dell’introne paci di auto-splicing è quella degli introni di Esone 1 Esone 2 gruppo II. Questi introni, che usano per l’au- 5¢ + 5¢ G A 3¢ G 3¢ rRNA 28S to-splicing un meccanismo molecolare diverCircolarizzazione so da quello degli introni di gruppo I, si trovadell’introne no in alcuni geni dei batteri e degli organelli G A di protisti, funghi, alghe, e piante. La scoperta che l’RNA può funzionare Il taglio dell’introne come una proteina è stata una pietra miliare produce un frammento lineare e uno circolare della biologia, e ha rivoluzionato le teorie sull’origine della vita. Le teorie precedenti proponevano infatti che per la replicazione + G A delle prime molecole di acidi nucleici fossero necessarie le proteine. L’attuale ipotesi del mondo a RNA propone invece che una forma di vita basata sull’RNA, nella quale l’RNA avreb- risultante avrà quindi una sequenza di basi che non corbe svolto le reazioni catalitiche necessarie per la vita nel- risponde alla sequenza di coppie di basi del DNA che la la cellula primitiva, fungendo nello stesso tempo da mo- codifica. lecola custode dell’informazione gentica, abbia preceduLa correzione dell’RNA è stata scoperta a metà degli to quella attuale, basata sul DNA. anni ottanta del secolo scorso in alcuni mRNA mitocondriali dei tripanosomi, i protozoi parassiti che causano la malattia del sonno. Per esempio, nella Figura 5.15 sono Nota chiave riportate le sequenze del gene COIII, che codifica per la subunità III della citocromo ossidasi, e dei suoi trascritti In alcuni RNA precursori, esistono sequenze intronidi mRNA, nei protozoi Trypanosoma brucei (Tb), che di RNA che si ripiegano in una struttura seconCrithridia fasciculata (Cf), e Leishmania tarentolae (Lt). daria in grado di eliminarsi da sola, in un processo Sebbene le sequenze degli mRNA siano molto simili fra chiamato auto-splicing. La reazione di auto-splicing i tre organismi, solo le sequenze geniche di Cf e Lt sono non richiede l’intervento di proteine. colineari con gli mRNA corrispondenti. Sorprendentemente, il gene di Tb ha una sequenza che non può proCorrezione (editing) dell’RNA durre l’mRNA per il quale esso apparentemente codifiLa correzione dell’RNA consiste nell’inserzione o nel- ca. Le differenze fra i due consistono nella presenza la delezione post-trascrizionale di nucleotidi, o nella nell’mRNA di nucleotidi U che non sono codificati nel conversione di una base in un’altra. La molecola di RNA DNA, e di nucleotidi T nel DNA che non si trovano nel G

Regione del trascritto del gene COIII DNA di Tb

G G T T T T T GG

A GG

G

GT T T TG

G

G

A

A

GA

GAG

RNA di Tb

u u G u G U U U U U GG u u u A GG u u u u u u u G u u G

UUG u u G u u u u G u A u u A u GA u u GAG u

DNA di Cf

T T T T T A T T T T GA T T T CG T T T T T T T T T A T G

T G T A T T A T T T G T GC T T T GA T CCGC T

DNA di Lt

T T T T T A T T T T GA T T T CG T T T T T T T T T A T G

T G T T T T A T T T A T G T T A T G A G T A GG A

Proteina di Tb

Leu Cys Phe Trp Phe Arg Phe Phe Cys Cys

Figura 5.15 Confronto delle sequenze del DNA del gene per la subunità III della citocromo ossidasi (COIII) nei protozoi Trypanosoma brucei (Tb), Crithridia fasciculata (Cf) e Leishmania tarentolae (Lt), allineate con l’mRNA conservato di Tb.

Cys Cys Phe Val Leu Trp Leu Ser

I nucleotidi U aggiunti al trascritto dalla correzione dell’RNA sono indicati con le lettere minuscole (u). Le T nel DNA stampo di Tb che non sono presenti nel trascritto sono indicate in marrone.

Espressione genica: la trascrizione

trascritto. Una volta sintetizzato, il trascritto del gene COIII di Tb viene sottoposto a correzione per aggiungere nucleotidi U nelle posizioni appropriate, e rimuovere i nucleotidi U codificati dai nucleotidi T del DNA. Come indicato nella figura, le inserzioni di nucleotidi U sono molto numerose. L’entità dei cambiamenti è ancora più evidente quando si esamini l’intera sequenza: più del 50% dell’mRNA maturo è costituito da nucleotidi U aggiunti dopo la trascrizione. Questo processo di correzione dell’RNA deve essere accurato, in modo da ricostruire la sequenza appropriata per la traduzione della proteina. In questo processo è coinvolta una molecola speciale di RNA, chiamata RNA guida (gRNA). Il gRNA si appaia con il trascritto di mRNA e lo taglia, fungendo quindi da stampo per i nucleotidi U mancanti, e riunendo nuovamente insieme il trascritto mediante ligazione.

89

La correzione dell’RNA non è limitata ai tripanosomi. Nel micomicete Physarum polycephalum singoli nucleotidi C vengono aggiunti, dopo la trascrizione, in molte posizioni in numerosi trascritti di mRNA mitocondriale. Nelle piante superiori, le sequenze di molti mRNA mitocondriali e cloroplastici vengono corrette attraverso cambiamenti da C a U. La sostituzione di C con U è coinvolta anche nella formazione di un codone d’inizio AUG a partire dal codone ACG in alcuni mRNA cloroplastici in numerose piante superiori. Nei mammiferi, la correzione da C a U si verifica nell’mRNA codificato dal gene nucleare per l’apolipoproteina B, e determina la formazione tessuto-specifica di un codone di stop. Sempre nei mammiferi, una correzione da A a G ha luogo nell’mRNA del recettore del glutammato, e in numerosi tRNA si ha correzione delle pirimidine.

Sommario l La trascrizione è il processo nel quale l’informazione genetica del DNA viene copiata nella sequenza di basi dell’RNA. Il DNA si srotola in una corta regione vicino a un gene, e una RNA polimerasi catalizza la sintesi di una molecola di RNA in direzione 5′-3′. Solo un filamento della molecola di DNA a doppia elica viene trascritto in una molecola di RNA. l La trascrizione delle quattro classi principali di geni produce gli RNA messaggeri (mRNA), gli RNA transfer (tRNA), gli RNA ribosomali (rRNA) e i piccoli RNA nucleari (snRNA). Gli snRNA si trovano unicamente negli eucarioti, mentre le altre tre classi si trovano sia nei procarioti sia negli eucarioti. Solo l’mRNA viene tradotto per produrre una proteina. l In E. coli, per l’inizio della trascrizione dei geni che codificano per proteine è necessario che un complesso costituito dall’RNA polimerasi e dal fattore sigma si leghi al promotore. Una volta iniziata la trascrizione, il fattore sigma si dissocia e la sintesi dell’RNA viene completata dal nucleo enzimatico dell’RNA polimerasi. Il termine della trascrizione è segnalato da sequenze di DNA specifiche. l Nei batteri, un’unica RNA polimerasi sintetizza mRNA, tRNA, ed rRNA. Gli eucarioti hanno tre RNA polimerasi distinte, localizzate nel nucleo, ciascuna delle quali trascrive differenti tipi di geni; l’RNA polimerasi I trascrive i geni per gli RNA ribosomali 18S, 5,8S, e 28S; l’RNA polimerasi II trascrive i geni per gli mRNA e alcuni geni per gli snRNA; e l’RNA polimerasi III trascrive i geni per gli rRNA 5S, i tRNA, e gli altri snRNA. l Le RNA polimerasi eucariote sono incapaci di legarsi direttamente ai promotori. Perché la trascrizione possa avere ini-

l l

l

l

zio, quindi, i fattori generali di trascrizione si legano per primi e poi reclutano l’RNA polimerasi per formare un complesso. Altri fattori di trascrizione si legano in seguito e la trascrizione può cominciare. Gli mRNA hanno tre parti principali: una regione non-tradotta al 5′ (UTR), la sequenza che codifica per gli amminoacidi, e la regione non tradotta al 3′. Nei procarioti, il trascritto genico funziona direttamente come molecola di mRNA, mentre negli eucarioti l’RNA trascritto deve essere modificato nel nucleo per produrre l’mRNA maturo. Le modifiche comprendono l’aggiunta di un cappuccio all’estremità 5′ e di una coda di poli(A) all’estremità 3′, e la rimozione degli introni. La rimozione degli introni e l’unione degli esoni vengono effettuate dagli spliceosomi, grazie a interazioni specifiche di snRNP con il pre-mRNA. L’mRNA potrà funzionare solo quando tutte le fasi della maturazione siano state completate; a quel punto, una volta esportato dal nucleo, potrà essere tradotto. In alcuni organismi dotati di introni, le sequenze del premRNA si ripiegano a formare una struttura secondaria che si elimina da sola, un processo chiamato auto-splicing. Questo processo non prevede l’intervento di enzimi proteici. In alcuni organismi, la correzione dell’RNA inserisce o elimina nucleotidi, o converte una base in un’altra dopo la trascrizione di un RNA. La molecola di RNA funzionale risultante ha una sequenza di basi che non corrisponde alla sequenza codificante del DNA. Molti degli RNA che subiscono la correzione sono codificati dal genoma dei mitocondri e dei cloroplasti.

Approccio analitico alla soluzione di problemi di genetica D5.1 Due molecole di RNA che abbiano sequenze di basi complementari possono ibridare formando una struttura a dop-

pia elica, proprio come il DNA. Supponete che, in una particolare regione del genoma di un dato batterio, un filamento di

90

Capitolo 5

DNA venga trascritto per produrre l’mRNA per la proteina A, e l’altro venga trascritto nell’mRNA per la proteina B. a. Pensate che ci sarebbero problemi nell’espressione di questi geni? b. Che cosa succederebbe alla proteina B se una mutazione avesse modificato la struttura della proteina A? R5.1 a. L’mRNA A e l’mRNA B avrebbero sequenze complementari, quindi potrebbero ibridare l’uno con l’altro e non essere più disponibili per la traduzione. b. Ogni mutazione nel gene A sarebbe anche una mutazione nel gene B, quindi anche la proteina B potrebbe essere anormale. D5.2 Confrontate i due eventi seguenti, prendendone in esame le possibili conseguenze. Nell’evento 1, durante la replicazione

viene inserito nel DNA un nucleotide sbagliato, che non viene corretto dalla correzione di bozze o dai sistemi di riparazione prima della replicazione successiva. Nell’evento 2, il nucleotide sbagliato viene inserito in un mRNA durante la trascrizione. R5.2 Assumendo che si verifichi in un gene, il risultato dell’evento 1 sarebbe una mutazione. L’errore sarebbe ereditato dalle generazioni successive, e avrebbe effetto sulla struttura di tutte le molecole di mRNA trascritte da quella regione; quindi, tutte le molecole della proteina corrispondente potrebbero esserne influenzate. Il risultato dell’evento 2 sarebbe un solo mRNA aberrante, che potrebbe quindi produrre poche molecole proteiche aberranti. Nella cellula ci sarebbero comunque altre molecole normali di proteina, perché sarebbero stati trascritti altri mRNA normali. L’mRNA anormale verrebbe degradato rapidamente. L’errore a livello dell’mRNA non sarebbe ereditario.

Espressione genica: la traduzione

6

Qual è la composizione chimica di una proteina?

Come inizia la sintesi polipeptidica sul ribosoma?

Qual è la struttura di una proteina?

Come viene allungata la catena polipeptidica sul ribosoma?

Qual è la natura del codice genetico?

Come termina la traduzione di un polipeptide a partire da un RNA messaggero (mRNA)?

Quali sono la struttura e la funzione dell’RNA transfer (tRNA)?

Come vengono smistate le proteine nella cellula?

Quali sono la struttura e la funzione dell’RNA ribosomale (rRNA)?

Attività Cambiare soltanto una lettera di una parola può cambiarne completamente il significato. Tale azione può, a sua volta, modificare il senso della frase che contiene la parola stessa. Negli organismi viventi, una sequenza di tre nucleotidi (le “lettere”) codifica per un amminoacido (la “parola”). Gli amminoacidi sono uniti tra di loro a formare dei polipeptidi (le “frasi”); in questo capitolo verrà spiegato il processo mediante il quale le “lettere” nucleotidiche vengono tradotte nelle “frasi” polipeptidiche. Una delle applicazioni più importanti della ricerca sul genoma umano è l’uso dell’informazione di sequenza per rintracciare le cause delle malattie genetiche. Nella iAttività di questo capitolo verrà studiata parte del gene responsabile della fibrosi cistica, la malattia genetica letale più comune negli Stati Uniti, cercando di identificarne le possibili cause.

I geni contenuti nel genoma di una cellula codificano le informazioni per le proteine presenti nella cellula stessa. L’espressione di un gene che codifica per una proteina avviene mediante la trascrizione del gene in un mRNA (vedi Capitolo 5), seguita dalla traduzione dell’mRNA; quest’ultima comporta la conversione della sequenza di basi dell’mRNA nella sequenza amminoacidica di un polipeptide. L’informazione contenuta nella sequenza di basi che codifica la sequenza amminoacidica di un poli-

peptide viene definita codice genetico. In questo capitolo si acquisiranno informazioni circa la struttura delle proteine e le modalità con cui la sequenza nucleotidica di un mRNA viene tradotta nella sequenza amminoacidica di un polipeptide.

Le proteine La struttura chimica delle proteine Le proteine sono composti organici azotati ad alto peso molecolare dalla composizione e dalla forma complesse. Una proteina è formata da una o più subunità macromolecolari dette polipeptidi, a loro volta formate da subunità più piccole, gli amminoacidi. Ciascun tipo di cellula possiede un insieme di proteine caratteristico che si rende responsabile delle proprietà funzionali di quella particolare categoria cellulare. A eccezione della prolina, tutti gli amminoacidi presentano una struttura comune, mostrata nella Figura 6.1. Tale struttura consiste di un atomo di carbonio centrale (carbonio α), al quale sono legati un gruppo amminico (NH2), un gruppo carbossile (COOH) e un atomo di idrogeno. Al valore di pH che si trova comunemente nella cellula, i gruppi %NH2 e %COOH degli amminoacidi liberi sono carichi, a dare rispettivamente JNH3+ e JCOO– (come illustrato nella Figura 6.1). Al carbonio α è legato anche il gruppo R, che è specifico per ogni amminoacido e conferisce a esso le sue proprietà caratteristiche. I polipeptidi differiscono per la sequenza e le

92

Capitolo 6 Atomo di carbonio a

R

Gruppo R (varia a seconda dell’amminoacido)

H

+

O

Ca

H

N H

Gruppo amminico



C H

O Gruppo carbossile

Le strutture comuni a tutti gli amminoacidi

Figura 6.1 La formula di struttura generale di un amminoacido.

proporzioni degli amminoacidi; la sequenza amminoacidica, e quindi la sequenza dei gruppi R, determina le proprietà chimiche di ciascun polipeptide. Nelle cellule viventi vengono utilizzati 20 amminoacidi per formare le proteine: i loro nomi, le abbreviazioni a una e a tre lettere e le strutture chimiche vengono riportati nella Figura 6.2. In base alle proprietà del loro gruppo R, i 20 amminoacidi vengono suddivisi in amminoacidi acidi, basici, neutri polari e neutri non polari. Gli amminoacidi all’interno di un polipeptide sono uniti dal legame peptidico, un legame covalente che si forma tra il gruppo carbossilico di un amminoacido e il gruppo amminico dell’amminoacido adiacente (Figura 6.3). Tutti i polipeptidi presentano un gruppo amminico libero a un’estremità (definita N-terminale o amminoterminale) e un gruppo carbossilico libero all’altra estremità (denominata C-terminale o carbossi-terminale). L’estremità N-terminale è considerata l’inizio della catena polipeptidica, poiché rappresenta l’estremità che viene sintetizzata per prima durante la traduzione di una molecola di mRNA.

La struttura molecolare delle proteine Le proteine possiedono quattro livelli di organizzazione strutturale (Figura 6.4). 1. La struttura primaria di una catena polipeptidica è la sequenza degli amminoacidi che la compongono (Figura 6.4a). La sequenza amminoacidica è direttamente determinata dalla sequenza nucleotidica del gene che codifica per il polipeptide. 2. La struttura secondaria di una proteina è rappresentata dall’avvolgimento e dal ripiegamento in molteplici forme di una porzione della catena polipeptidica (Figura 6.4b). La struttura secondaria è il risultato della formazione di legami deboli, come i legami idrogeno o elettrostatici, che si formano tra i gruppi %NH e %CO di amminoacidi che si trovano vicini nella catena. Il particolare tipo di struttura secondaria

che si osserva in un polipeptide, o in una porzione di un polipeptide, dipende principalmente dalla sequenza amminoacidica del polipeptide o della regione del polipeptide. Un tipo di struttura secondaria che si trova in regioni ricche di polipeptidi è l’α-elica (vedi Figura 6.4b), una struttura scoperta da Linus Pauling e Robert Corey nel 1951. La possibile formazione di un’α-elica dipende dai gruppi R presenti in una regione del polipeptide. Si notino il legame idrogeno tra il gruppo %NH di un amminoacido (coinvolto in un legame peptidico) e il gruppo %CO (anch’esso coinvolto in un legame peptidico) di un amminoacido che si trova a quattro amminoacidi di distanza lungo la catena. La formazione ripetuta di questo legame risulta nell’avvolgimento a elica della catena. Analogamente a quanto si verifica in tutti gli altri tipi di struttura secondaria, il contenuto in regioni ad α-elica di una proteina è variabile. Un altro tipo di struttura secondaria è il foglietto β; quest’ultimo è formato da una o più catene polipeptidiche ripiegate a zigzag in cui regioni o catene parallele sono unite tramite legami idrogeno. Molte proteine contengono un misto di regioni ad α-elica e a foglietto β. 3. La struttura terziaria di una proteina (Figura 6.4c) è la struttura tridimensionale di una singola catena polipeptidica. La forma tridimensionale di un polipeptide viene spesso definita conformazione. La struttura terziaria è determinata dalla distribuzione dei gruppi R lungo la catena polipeptidica. In altri termini, questo tipo di conformazione rappresenta il risultato delle interazioni tra i gruppi R. Tali interazioni comprendono legami idrogeno, interazioni ioniche, ponti disolfuro e forze di van der Waals. La struttura terziaria che si forma tipicamente in ambiente acquoso presenta i gruppi carichi e polari sulla superficie esterna e i gruppi non polari su quella interna. Nella Figura 6.4c viene illustrata la struttura terziaria della catena polipeptidica β dell’emoglobina. (Il Premio Nobel per la Chimica del 1962 fu conferito a Max Perutz e Sir John Kendrew per i loro studi sulla struttura delle proteine, mentre quello del 1972 venne assegnato a Christian Anfinsen per i suoi studi sulla ribonucleasi, l’enzima in grado di degradare l’RNA, in particolar modo per quelli volti a comprendere il nesso tra la sequenza amminoacidica e la conformazione biologicamente attiva di tale molecola.) 4. La struttura quaternaria è il complesso di catene polipeptidiche in una proteina costituita da più subunità; pertanto, essa è una caratteristica esclusiva delle proteine formate da più di una catena polipeptidica (Figura 6.4d). Il ripiegamento di una proteina in una struttura quaternaria consegue alle interazioni tra i

Espressione genica: la traduzione Acidi

93

Basici

H3N H



+

C

H3N+ H

O CH2

Acido aspartico (Asp) (D)

C



OOC

H3N H +

C



O CH2

CH2

Lisina (Lys) (K)

+NH 3

(CH2)3 CH2



O

OOC

C



O

OOC

H3N+ H

Acido glutammico (Glu) (E)

C

C

(CH2)2

CH2

H

NH

N

C

+

NH3

Arginina (Arg) (R)



OOC H3N+ H

Neutri non polari

C

H3N+ H C

CH2



OOC



C

CH2

N

N

HC

N

CH

OOC

Triptofano (Trp) (W)

HC

C

Istidina (His) (H)

H

H H3N+ H C

Neutri polari Fenilalanina (Phe) (F)

CH2

H3N+ H

–OOC

H3N

+

C H C



OOC

C

H3N+ H Alanina (Ala) (A)

CH3



C

OOC

OOC

CH3

H3N+ H

CH2



C

H3N+ H CH2

Isoleucina (Ile) (I)

CH2

OOC

Leucina (Leu) (L)

–OOC

Metionina (Met) (M)



H2C C H

NH2

Asparagina (Asn) (N)

S

Prolina (Pro) (P)

H

gruppi R e i gruppi %NH e %CO dei legami peptidici presenti su diversi polipeptidi. Nella Figura 6.4d viene mostrata la struttura quaternaria di una proteina eteromultimerica (etero, “diverse”; multimerica, “molte subunità”), l’emoglobina, che rappresenta la molecola deputata al trasporto dell’ossigeno nel sangue. Essa è costituita da quattro catene polipeptidiche

(CH2)2

C

NH2

Glutammina (Gln) (Q)

O

H3N+ H C

N+ CH2

C O

C

COO–

C

CH2



H3N+ H

CH3 CH2 H

Treonina (Thr) (T)

H C

CH3

OH

CH3

OOC

CH3

H3N+ H

H

C

H3N+

CH

OOC

H

C

CH3



C

H



CH3

OOC

–OOC

Valina (Val) (V)

CH



C

H3N+ H CH3 CH

Serina (Ser) (S)

OH

CH2



OOC H3N+ H

Tirosina (Tyr) (Y)

H3N+ H



C

OH

OOC

Glicina (Gly) (G)

H

CH2

OOC

CH2

SH

Cisteina (Cys) (C)

Figura 6.2 Le strutture dei 20 amminoacidi normalmente presenti in natura, ordinati secondo le loro proprietà chimiche. Accanto al nome di ciascun amminoacido sono riportate le abbreviazioni a una lettera e a tre lettere.

(due polipeptidi α di 141 amminoacidi e due polipeptidi β di 146 amminoacidi), ciascuna delle quali è associata a un gruppo funzionale eme, responsabile del legame con l’ossigeno. Nella struttura quaternaria dell’emoglobina ciascuna catena α è in contatto con una catena β, mentre le interazioni tra le due catene α e le due catene β sono molto scarse.

94

Capitolo 6 Amminoacido R1 H3N+

Amminoacido H

O

C

+

C O–

H

Gruppo carbossile

H3N+

C

Gruppo R 2 amminico

Polipeptide

O

H2O H3N+

C O–

Per molti anni si è pensato che la sola sequenza amminoacidica fosse sufficiente a spiegare in che modo una proteina si ripiegasse nel proprio stato funzionale. È noto come il ripiegamento dei polipeptidi avvenga cotraduzionalmente; nello specifico, questi ultimi si ripiegano durante il processo di traduzione anziché dopo il loro distacco dal ribosoma. Chiaramente, la formazione delle diverse strutture proteiche viene determinata dalle caratteristiche della sequenza amminoacidica. Tuttavia, il ripiegamento di molte proteine nel loro stato funzionalmente attivo dipende dalla presenza di una o più proteine della famiglia delle chaperonine (definite anche chaperon molecolari). Le chaperonine agiscono in modo analogo agli enzimi, nel senso che interagiscono con le proteine di cui devono facilitare il ripiegamento – l’interazione è determinata dalla sequenza amminoacidica

R N

R

C H

N

C C

H

O Legame idrogeno

a) Struttura primaria. La sequenza degli amminoacidi in una catena polipeptidica.

O

C

C

H

H N

C

H

R2

Legame Estremità peptidico amminoterminale (N-terminale)

Figura 6.3 La formazione del legame peptidico.

H

R1

O C O– Estremità carbossiterminale (C-terminale)

della proteina –, ma non diventano parte della proteina funzionale prodotta. Una descrizione dettagliata delle chaperonine esula dagli scopi di questo volume.

Nota chiave Una proteina è formata di una o più subunità molecolari definite polipeptidi, a loro volta costituite da subunità più piccole, gli amminoacidi, legate tra loro da legami peptidici a formare lunghe catene. La sequenza amminoacidica primaria di una proteina determina la sua struttura secondaria, terziaria e quaternaria e, quindi, il suo stato funzionale.

La natura del codice genetico In che modo i nucleotidi di una molecola di mRNA specificano la sequenza amminoacidica di una proteina? Avendo a disposizione quattro nucleotidi diversi (A, C, G, U), qualora si trattasse di un codice a una sola lettera, potrebbero essere codificati soltanto quattro amminoacidi. Diversamente, se fosse un codice a due lettere, potrebbero essere codificati 16 (4 × 4) amminoacidi. Un codice a tre lettere, invece, genera 64 (4 × 4 × 4) codici possibili, più di quanto sia necessario per codificare i 20 amminoacidi

Eme

Polipeptide a

Polipeptide b

b) Struttura secondaria. Il ripiegamento e l’avvolgimento di una singola catena polipeptidica in una grande varietà di forme. (Qui è mostrata la struttura ad a-elica.)

Figura 6.4 I quattro livelli di struttura delle proteine.

c) Struttura terziaria. Lo specifico ripiegamento tridimensionale della catena polipeptidica. (Qui è mostrata la catena del polipeptide d) Struttura quaternaria. b dell’emoglobina.) L’aggregazione di più catene polipeptidiche che costituiscono una proteina multimerica. (Qui è mostrata l’emoglobina, formata da due catene a, due catene b e quattro gruppi eme.)

95

Espressione genica: la traduzione

presenti nelle cellule viventi. Dal momento che esistono solo 20 diversi amminoacidi, il presupposto dell’esistenza di un codice a tre lettere suggerisce, come in effetti avviene, che alcuni amminoacidi possano essere codificati da più di un codone.

Il codice genetico è un codice a triplette La prova che il codice genetico è un codice a triplette, ovvero che un gruppo di tre nucleotidi (un codone) di un mRNA codifica per un amminoacido di una catena polipeptidica, venne da esperimenti genetici effettuati sul batteriofago T4 da Francis Crick, Leslie Barnett, Sidney Brenner e R. Watts-Tobin nei primi anni sessanta del XX secolo. T4 è un fago virulento, il che significa che quando infetta E. coli va incontro al ciclo litico, generando una progenie di 100-200 fagi che vengono rilasciati al momento della lisi cellulare. Alcuni mutanti di T4 presentano alterazioni del ciclo litico; in particolare, i mutanti rII producono placche chiare nel ceppo di E. coli B, mentre il ceppo selvatico r + forma placche torbide. Inoltre, sempre in contrasto con il ceppo r +, i mutanti rII non sono in grado di andare incontro al ciclo litico nel ceppo di E. coli K12(λ). Crick e i suoi colleghi partirono da un ceppo mutante rII prodotto mediante il trattamento del ceppo r + con il mutageno proflavina, un composto chimico che induce mutazioni (questo argomento verrà discusso in maggior dettaglio nel Capitolo 7). La proflavina determina l’inserzione o la delezione di una coppia di basi nel DNA. Quando tali mutazioni si verificano a carico della porzione di un gene che codifica per un amminoacido, costituiscono mutazioni frameshift (mutazioni per scivolamento della fase di lettura). Al fine di chiarire gli effetti di queste ultime, si consideri una serie di “parole” di tre nucleotidi che viene letta dal macchinario traduzionale per assemblare la catena polipeptidica corretta. L’aggiunta o la perdita di una singola coppia di basi in questa regione determina un’alterazione della lettura delle parole che seguono il punto in cui è avvenuta l’inserzione o la delezione; di conseguenza, la sequenza alterata codificherà per un gruppo di amminoacidi diversi. Crick e i suoi colleghi dedussero che, se il fenotipo mutante rII era dovuto a una inserzione o a una delezione, il trattamento con proflavina del mutante rII avrebbe potuto far revertire la mutazione allo stato selvatico r +. Il processo per cui un mutante ritorna allo stato selvatico viene definito reversione e il ceppo selvatico ottenuto in questo modo è detto revertante. Se la mutazione originale era un’inserzione, avrebbe potuto essere corretta da una delezione, così come, se era una delezione, avrebbe potuto essere corretta da un’inserzione. I ricercatori isolarono un certo numero di ceppi r + revertanti piastrando una popolazione di fagi mutanti rII trattati con proflavina su E. coli K12(λ), su cui solo gli r + possono andare in-

contro al ciclo litico dando origine a placche. Questo approccio rese agevole la selezione e l’isolamento dei pochi revertanti r + prodotti dal trattamento con proflavina. Alcuni revertanti derivarono da una correzione esatta della mutazione originale, cioè una delezione per un’inserzione o un’inserzione per una delezione. Un secondo gruppo di revertanti risultò molto più utile per stabilire la natura del codice genetico; esso si originava da una seconda mutazione all’interno del gene rII, molto vicina, ma distinta, rispetto al sito di mutazione originario. Per esempio, se la prima mutazione era rappresentata dalla delezione di una singola coppia di basi, la reversione comportava l’inserzione di una coppia di basi nelle immediate vicinanze. La Figura 6.5a mostra un ipotetico frammento di DNA: si consideri, ai fini della discussione, che il codice sia a triplette. In tal caso, l’mRNA trascritto dal DNA sarebbe ACG ACG ACG, e così via, dando origine a un polipeptide formato da una sequenza di amminoacidi identici – treonina – ciascuno codificato da ACG. Questa è la fase di lettura di partenza, ovvero quei codoni, le “parole”, che vengono letti in sequenza per codificare gli amminoacidi. Qualora il

a) Selvatico DNA

5¢ 3¢

mRNA



AC G AC G AC G AC G AC G TGC TGC TGC TGC TGC

3¢ 5¢

AC G AC G AC G AC G AC G



... T h r T h r T h r T h r T h r ...

Polipeptide

b) Mutazione frameshift per delezione A delezione T DNA

5¢ 3¢

AC G C G A C G AC G A C G A TGC GCT GCT GCT GCT

3¢ 5¢

mRNA

5¢ A C G C G A C G A C G A C G A



Polipeptide

... T h r A r g A r g A r g A r g ...

c) Reversione di una mutazione per delezione mediante inserzione G inserzione C DNA

5¢ A C G C G A C G G A G C A C G 3¢ T G C G C T G C C T G C T G C

3¢ 5¢

mRNA

5¢ A C G C G A C G G A C G A C G



Polipeptide

... T h r A r g A r g T h r T h r ...

Figura 6.5 Reversione di una mutazione frameshift per delezione dovuta a una mutazione per inserzione che si verifica nelle vicinanze. (a) Sequenze ipotetiche del DNA normale, del trascritto di mRNA e del polipeptide nel selvatico. (b) Effetto di una delezione sulla sequenza amminoacidica del polipeptide. La fase di lettura viene alterata. (c) Reversione della delezione a opera di una mutazione per inserzione. La fase di lettura viene ripristinata, lasciando solo un breve tratto di amminoacidi errati.

96

Capitolo 6

trattamento con proflavina determRNA normale AU G AC A C AU A AC G G CU U C G UA U G GU G U G A A minasse la delezione della seconda Amminoacidi M e t T h r H i s A s n G l y P h e V a l Tr p C y s G l u coppia di basi A-T, l’mRNA sarebbe letto come ACG CGA CGA 3 mutazioni di segno + e così via, dando un polipeptide che comincia con l’amminoacido +A +U +C codificato da ACG (treonina) seguito da una sequenza di ammiAU G AU C AC A UAC AC G G C A U U C G UA U G G U G U G A A mRNA noacidi codificati dalla tripletta riM e t I l e T h r Ty r T h r A l a P h e V a l Tr p C y s G l u Amminoacidi petuta CGA (arginina) (Figura 6.5b); in altri termini, si verificheAmminoacidi errati nel polipeptide rebbe una mutazione frameshift Figura 6.6 perché i codoni che seguono il Esempio ipotetico di come tre mutazioni per inserzione (+) vicine ripristinino punto in cui si è verificata la delela fase di lettura corretta, garantendo una funzione normale, o quasi, della prozione sono cambiati. Nello specifiteina. Le mutazioni sono qui indicate a livello dell’mRNA. co, in conseguenza di tale mutazione, dopo il codone ACG la fase di lettura del messaggio è ora costituita da una sequenza di dificante per questo filamento di mRNA, si otterrà un codoni CGA, in cui è ancora riconoscibile la sequenza frammento di 33 nucleotidi codificante per 11 ammiripetuta ACG, con la A come ultima lettera e con CG noacidi, uno in più rispetto al frammento originario. come prime due lettere del codone CGA. Questa muta- Tuttavia, gli amminoacidi tra la prima e la terza inserzione può revertire aggiungendo una coppia di basi nel- zione non sono gli stessi codificati dall’mRNA selvatile vicinanze: per esempio, l’inserzione di una coppia G- co. In pratica, la fase di lettura è corretta prima della priC dopo il GC della terza tripletta genera un mRNA che ma e dopo la terza inserzione; gli amminoacidi non corviene letto come ACG CGA CGG ACG ACG e così via retti posti tra esse potrebbero dare un fenotipo revertan(Figura 6.5c). Ciò dà origine a un polipeptide costituito te non del tutto selvatico. in modo preponderante dall’amminoacido codificato da Crick e colleghi scoprirono che la combinazione di ACG (treonina), ma con due amminoacidi errati, quelli tre mutazioni + o di tre mutazioni – vicine dava revertancodificati da CGA e CGG (in entrambi i casi arginina). ti r +. Nessun’altra combinazione, all’infuori di quelle La seconda mutazione ha pertanto ricostituito la fase di che erano basate su multipli di tre, diede lo stesso risultalettura corretta producendo un polipeptide quasi di tipo to. La conclusione più semplice a cui giunsero per spieselvatico. Fino a quando gli amminoacidi non corretti gare questo fenomeno fu che il codice genetico è un coincorporati nella piccola regione compresa tra le due dice a triplette. mutazioni non hanno effetto significativo sulla funzionalità del polipeptide, il doppio mutante avrà un fenotiLa decifrazione del codice genetico po normale o vicino alla normalità. In simboli, le inserzioni verranno indicate come mu- La relazione esatta che lega i 64 codoni ai 20 amminoatazioni + e le delezioni come mutazioni –. Il passo se- cidi fu determinata dagli esperimenti svolti prevalenteguente di Crick e colleghi consistette nel combinare in mente nei laboratori di Marshall Nirenberg e H. vario numero mutazioni rII geneticamente distinte dello Ghobind Khorana, che condivisero con Robert Holley stesso segno (cioè o tutte mutazioni + o tutte –)* per ve- il Premio Nobel per la Fisiologia o Medicina del 1968. rificare se vi fossero combinazioni in grado di far rever- Per questi esperimenti risultò essenziale l’uso di sistemi tire i fenotipi rII. La Figura 6.6 fornisce una presenta- di sintesi proteica cell-free, contenenti ribosomi, tRNA zione ipotetica del tipo di risultati ottenuti e mostra gli legati ai rispettivi amminoacidi e tutti i fattori proteici effetti delle mutazioni solo a livello dell’mRNA. La fi- necessari per la sintesi dei polipeptidi, assemblati a pargura mostra un frammento di mRNA di 30 nucleotidi tire da componenti isolati e purificati da E. coli. Per miche codifica per 10 amminoacidi del polipeptide. Se si surare l’incorporazione di amminoacidi nelle proteine aggiungono tre coppie di basi in prossimità del DNA co- di nuova sintesi si fece ricorso ad amminoacidi marcati radioattivamente. Uno degli approcci volti a stabilire quali codoni codi* Crick e i suoi colleghi non sapevano se un mutante rII risultasse ficassero quali amminoacidi consistette nel sintetizzare da una mutazione + o –. Sapevano però quali dei loro ceppi mumRNA contenenti uno, due o tre tipi diversi di basi e neltanti rII con una singola mutazione fossero di un segno e quali di segno opposto. I mutanti di un segno (per esempio, +) potevano l’aggiungerli a sistemi di sintesi proteica cell-free, anaessere revertiti dalla ricombinazione con mutanti co-infettanti di lizzando poi i polipeptidi prodotti. Quando l’mRNA sintetico conteneva un unico tipo di base, i risultati erano segno opposto (ovvero –), e viceversa.

Espressione genica: la traduzione

privi di incertezze. Un poli(U)mRNA sintetico, per esempio, dirigeva la sintesi di un polipeptide costituito da una catena di fenilalanine. Dal momento che il codice genetico è a triplette, questo risultato indicava che UUU è un codone per la fenilalanina. Allo stesso modo, un poli(A)mRNA sintetico dirigeva la sintesi di una polilisina, e un poli(C) quella della poliprolina, indicando che AAA è un codone per la lisina e che CCC è un codone per la prolina. I risultati ottenuti con un poli(G) non furono conclusivi, dal momento che quest’ultimo si ripiega su sé stesso e non può pertanto venire tradotto in vitro. Furono anche analizzati mRNA sintetici prodotti dall’incorporazione casuale di due basi diverse (definiti copolimeri casuali). Per esempio, le molecole di poli(AC) contengono gli otto diversi codoni CCC, CCA, CAC, ACC, CAA, ACA, AAC e AAA. Nel sistema di sintesi proteica cell-free, i poli(AC)mRNA sintetici diedero origine a polipeptidi contenenti asparagina, glutammina, istidina e treonina, oltre alla lisina attesa per la presenza dei codoni AAA e alla prolina attesa per la presenza dei codoni CCC. Le proporzioni di asparagina, glutammina, istidina e treonina incorporate nei polipeptidi prodotti dipendevano dal rapporto A/C usato per produrre l’mRNA e vennero sfruttate per dedurre informazioni circa i codoni specifici per questi amminoacidi. Per esempio, dato che un copolimero casuale AC contenente A in misura molto maggiore di C dava come risultato un’incorporazione di asparagina molto maggiore che non di istidina, i ricercatori conclusero che l’asparagina viene codificata da due A e da una C e l’istidina da due C e da una A. Con esperimenti di questo tipo fu determinata la composizione in basi (ma non la sequenza) dei codoni specifici per un certo numero di amminoacidi. Diversamente, un altro approccio sperimentale utilizzò copolimeri sintetici di sequenza nota. Per esempio, quando un copolimero di sequenza 5′-UCUCUCUCUC3′ venne utilizzato in un sistema di sintesi proteica cellfree, fu possibile osservare che il polipeptide risultante possedeva uno schema amminoacidico ripetuto di leucina-serina-leucina-serina. Da questo risultato i ricercatori conclusero che UCU e CUC codificavano per leucina e serina, sebbene da tale dato non fosse possibile determinare l’amminoacido specifico codificato da ciascuno dei due codoni. Un ulteriore tipo di approccio utilizzò un saggio di legame ai ribosomi, sviluppato nel 1964 da Nirenberg e Philip Leder. Questo saggio si basa sul fatto che, in assenza di sintesi proteica, molecole di tRNA specifiche si legano a complessi formati da ribosomi e mRNA. Per esempio, quando un codone sintetico di mRNA, UUU, viene miscelato con dei ribosomi, forma un complesso UUU-ribosoma e solamente il tRNA.Fen (ovvero quel tRNA che trasporta la fenilalanina all’mRNA e che porta l’anticodone AAA) si lega al codone UUU. La scoperta di tale capacità dei trinucleotidi di legare i codoni rese

97

possibile la determinazione della relazione specifica tra molti codoni e gli amminoacidi per i quali essi codificano. Si noti che, in questo particolare approccio, risulta determinata la sequenza nucleotidica specifica del codone. Mediante il saggio di legame ai ribosomi, Niremberg e Leder chiarirono molti dubbi sorti utilizzando gli altri approcci. Per esempio, si scoprì che UCU codificava per la serina e CUC per la leucina. Complessivamente, mediante questo metodo vennero individuati circa 50 codoni. In definitiva, nessuno dei singoli approcci permise l’identificazione certa di tutti i codoni, ma l’informazione ottenuta mediante i diversi metodi sperimentali consentì di assegnare 61 codoni ai 20 amminoacidi presenti in tutte le cellule viventi; gli altri 3 codoni non codificano amminoacidi (Figura 6.7).* Ciascun codone viene scritto così come appare nell’mRNA e viene letto in direzione 5′-3′.

Le caratteristiche del codice genetico Le caratteristiche del codice genetico sono le seguenti. 1. Il codice è a triplette. Ogni codone dell’mRNA che codifica per un amminoacido in una catena polipeptidica è formato da tre nucleotidi. 2. Il codice non ha segni di interpunzione, ovvero viene letto in modo continuo. L’mRNA viene letto in maniera continua, tre nucleotidi per volta, senza saltare alcun nucleotide del messaggio. 3. Il codice non ha sovrapposizioni. L’mRNA viene letto in gruppi successivi di tre nucleotidi. 4. Il codice è quasi universale. Quasi tutti gli organismi condividono lo stesso linguaggio genetico. Tale linguaggio è arbitrario, nel senso che sono possibili molti altri codici, ma la grande maggioranza degli organismi condivide questo (ciò costituisce una prova rilevante del fatto che tutti gli organismi viventi condividono un antenato comune). Pertanto, è possibile isolare l’mRNA da un organismo, tradurlo mediante il macchinario isolato da un altro organismo e produrre la proteina così come se fosse stata tradotta nell’organismo di partenza. Il codice non è, tuttavia, completamente universale. Per esempio, i mitocondri di alcuni organismi, come i mammiferi, possiedono * Altri due amminoacidi raramente presenti nelle proteine sono codificati da triplette del codice genetico. La selenocisteina è presente in tutti e tre i domini della vita ed è codificata dalla tripletta UGA, che normalmente rappresenta un codone di stop. Tuttavia, la codifica di questo amminoacido non è diretta, ma necessita della presenza di una sequenza specifica nell’mRNA che guidi la tripletta UGA a codificare per la selenocisteina. L’amminoacido pirrolisina si trova negli enzimi coinvolti nella produzione del metano di alcuni archeobatteri. In questi microrganismi, la pirrolisina viene codificata dalla tripletta UAG, che normalmente rappresenta un codone di stop.

98

Capitolo 6

UUU Phe UUC (F) U

Prima lettera

C

Tyr (Y)

UGU UGC

Cys (C)

U C

UAA Stop

UGA Stop

A

UCG

UAG Stop

UGG

Trp (W)

G

CUU

CCU

CAU

CCC Pro CCA (P)

CAC

His (H)

CGU

CUC Leu CUA (L) CUG

CCG

CAA CAG

Gln (Q)

CGA CGG

ACU

AAU AAC

Asn (N)

AGU

ACC Thr ACA (T)

AUG Met (M)

ACG

AAG

GUU

GCU

GAU

GUC Val GUA (V)

GCC Ala GCA (A)

GAC

GUG

GCG

GAG

UUA Leu UUG (L)

AUC

G

UAU UAC

Ser UCA (S)

AUU A

UCU UCC

G

Ile (I)

AUA

AAA

GAA

Lys (K)

CGC

AGC AGA AGG

Asp (D)

GGU

Glu (E)

GGA

GGC GGG

U Arg (R)

C A G

Ser (S) Arg (R)

U C

Terza lettera

Seconda lettera C A

U

A G

U Gly (G)

C A G

= codone di terminazione (stop)

= codone di inizio

Figura 6.7 Il codice genetico. Dei 64 codoni, 61 codificano per uno dei 20 amminoacidi. Gli altri 3 codoni sono codoni di terminazione e non codificano per alcun amminoacido. La tripletta AUG, uno dei 61 codoni codificanti per un amminoacido, viene usata per l’inizio della sintesi proteica.

minime variazioni del codice, così come il genoma nucleare del protozoo Tetrahymena. 5. Il codice è degenerato. Tranne due eccezioni (AUG, unico codone specifico per la metionina, e UGG, unico codone specifico per il triptofano), per ogni amminoacido è presente più di un codone. Questa capacità di codifica multipla viene definita degenerazione o ridondanza del codice, e nel suo ambito è possibile individuare alcuni comportamenti precisi (vedi Figura 6.7). Nello specifico, se i primi due nucleotidi di un codone sono uguali e la terza lettera è U o C, esso codifica sempre per lo stesso amminoacido. Per esempio, UUU e UUC codificano per la fenilalanina e CAU e CAC codificano per l’istidina. Inoltre, quando i primi due nucleotidi sono identici e la terza lettera è A o G, spesso l’amminoacido codificato è lo stesso. Per esempio, UUA e UUG codificano per la leucina e AAA e AAG codificano per la lisina. In pochi casi, quando i primi due amminoacidi di un codone sono identici e la base in terza posizione è U, C, A o G, spesso l’amminoacido codificato è lo stesso. Per esempio, CUU, CUC, CUA e CUG codificano tutti per la leucina. 6. Il codice ha dei segnali di inizio e di fine. Nel codice sono contenuti segnali specifici per l’inizio e la fine della sintesi proteica. Sia negli eucarioti sia nei pro-

carioti AUG (metionina) è quasi sempre il codone di inizio della sintesi proteica. Soltanto 61 dei 64 codoni codificano per amminoacidi: tali codoni vengono definiti codoni senso (vedi Figura 6.7). Gli altri tre codoni – UAG (chiamato anche codone “ambra”), UAA (“ocra”) e UGA (“opale”) – non codificano per nessun amminoacido e in cellule normali non esiste alcun tRNA che rechi l’anticodone appropriato (durante la sintesi proteica, l’anticodone si appaia con il codone dell’mRNA grazie alla complementarità delle basi). Questi tre codoni sono i codoni di stop, chiamati anche codoni nonsenso o codoni di terminazione, e vengono utilizzati per segnalare la fine della traduzione di una catena polipeptidica. Pertanto, quando si legge una particolare sequenza di mRNA, si cerca un codone di stop posto a distanza di un multiplo di tre nucleotidi – ossia nella stessa fase di lettura – dal codone di inizio AUG per stabilire dove termini la sequenza codificante per gli amminoacidi del polipeptide. Una sequenza di questo tipo viene anche denominata Open Reading Frame (ORF). 7. Nell’anticodone avviene il fenomeno del vacillamento. Dal momento che 61 codoni senso codificano per amminoacidi nell’mRNA, esiste un totale di 61 molecole di tRNA che potrebbero portare gli anticodoni appropriati. Secondo l’ipotesi del vacillamento, proposta da Francis Crick, l’insieme dei 61 codoni senso può essere letto da meno di 61 tRNA diversi, a causa delle proprietà di appaiamento delle basi nell’anticodone (Tabella 6.1). Nello specifico, la base all’estremità 5′ dell’anticodone (complementare alla base all’estremità 3′, ovvero alla terza lettera) non è sottoposta a restrizioni dal punto di vista tridimensionale come le altre due basi. Questa caratteristica permette un appaiamento delle basi meno preciso, cosicché la base all’estremità 5′ dell’anticodone può appaiarsi con più di una base all’estremità 3′ del codone: in altre parole, può vacillare. Come illustra la Tabella 6.1, una singola molecola di tRNA può ricoTabella 6.1 Vacillamento del codice genetico Nucleotide all’estremità 5„ dell’anticodone

Nucleotide all’estremità 3„ del codone

G

può appaiarsi con

UoC

C

può appaiarsi con

G

A

può appaiarsi con

U

U

può appaiarsi con

AoG

I (inosina)

può appaiarsi con

A, U o C

Espressione genica: la traduzione

99

Focus sul genoma Altri codici genetici Il codice genetico è quasi universale. Quanto differiscono, e dove sono presenti, altri codici genetici? La divergenza maggiore si riscontra nei genomi degli organelli cellulari. In particolare, considerando i codici genetici (12, all’inizio del 2008) degli organelli noti (mitocondri e cloroplasti), 53 dei 64 codoni sono identici in tutti i 12 codici. Le differenze si riscontrano esclusivamente a livello di 11 codoni, per un totale di sole 28 differenze. Quattordici delle 28 variazioni note riguardano i codoni di stop; nello specifico, tali differenze possono riguardare o un codone il quale, nel codice genetico maggiormente diffuso, codifica per un amminoacido e che, in virtù delle suddette variazioni, si comporta come un codone di stop, o uno dei tre codoni di stop (del codice genetico principale) che modifica la propria funzione, codificando per un amminoacido. Le altre variazioni riguardano la corrispondenza di uno o più codoni a un amminoacido invece che a un altro. La maggiore differenza nota riguarda il genoma dei mitocondri di lievito, in cui la tri-

noscere al massimo tre codoni diversi. La Figura 6.8 fornisce un esempio di come un singolo tRNA per la leucina possa leggere due diversi codoni per la leucina grazie al vacillamento dell’appaiamento tra basi. Una caratteristica del codice genetico, qui solo accennata, è rappresentata dalla parziale universalità di quest’ultimo. Il Focus sul genoma del presente capitolo sviluppa

Attività MyLab

Attraverso la iAttività Determining Causes of Cystic Fibrosis (Stabilire le cause della fibrosi cistica), presente nel sito web degli studenti, imparerete a usare l’informazione di sequenza per rintracciare parte del gene responsabile della fibrosi cistica.

pletta UGA codifica per il triptofano, invece che per uno stop, e la “N” della tripletta CTN rappresenta una qualsiasi delle quattro basi che codificano per la treonina, invece che per la leucina. I genomi nucleari presentano un numero notevolmente inferiore di variazioni. Sono note solo sei differenze, che colpiscono unicamente tre codoni; queste ultime sono tutte presenti a livello dei codoni che fungono da segnali di stop nel codice principale e tutte sono variazioni che corrispondono a mutazioni a carico di un gene del tRNA, in seguito a cui viene alterata la posizione di una base nell’anticodone del tRNA. Esiste una sorprendente quantità di differenze nei codoni di inizio. È vero che la maggior parte dei geni inizia la traduzione su un codone AUG, ma sia nel genoma mitocondriale sia in quello nucleare è stato osservato che almeno sette altri codoni fungono da codoni di inizio per alcune proteine. Tali sequenze sono tutte simili, tranne una, al codone AUG a livello di due delle tre basi della tripletta.

questo aspetto e descrive le variazioni del codice che sono state identificate nei genomi.

La traduzione: il processo di sintesi proteica La sintesi proteica ha luogo sui ribosomi, dove viene tradotto il messaggio genetico codificato dall’mRNA. L’mRNA viene tradotto in direzione 5′→3′ e il polipeptide viene sintetizzato dall’estremità N-terminale a quella C-terminale. Gli amminoacidi giungono al ribosoma legati a molecole di tRNA.

Leu 3¢



Leu tRNA per la leucina identici





Nota chiave Il codice genetico è un codice a triplette in cui ogni codone (l’insieme di tre basi adiacenti) di un mRNA codifica per un amminoacido. Il codice è degenerato: alcuni amminoacidi sono codificati da più di un codone. Il codice genetico non è sovrapposto ed è quasi universale. Codoni specifici segnalano l’inizio e la fine della sintesi proteica.

G A G mRNA 5¢ ...

C U C

Appaiamento normale ... 3¢

5¢ ...

G A G

Appaiamento C U U vacillante ... 3¢

Figura 6.8 Esempio di vacillamento nell’appaiamento tra basi. Due diversi codoni per la leucina (CUC, CUU) possono essere letti dalla stessa molecola di tRNA per la leucina, in contrasto con le normali regole di appaiamento tra le basi.

100

Capitolo 6

a) Struttura a trifoglio del tRNA



U GMe G A UG CC C C D I C GG G G G G DA GMe2

G G G C G

3¢ A C C A C C U G C

b) Schema della struttura tridimensionale a forma di L di un tRNA; qui è rappresentato il tRNA per la fenilalanina di lievito Alanina

C U C C C

Estremità 5¢ A C C Estremità 3¢ (per l’attacco dell’amminoacido) Ansa III

U G U

Ansa IV

Py U

C

A

Ansa I

A GGC C IV

UC C GG C T A D G G III A G G G ψ

U II U I G C

y

G C

IMe Anticodone

Ansa dell’anticodone (ansa II)

c) Modello molecolare spaziale del tRNA per la fenilalanina di lievito

Estremità 3¢ (per l’aggiunta dell’amminoacido)

Ansa dell’anticodone

Figura 6.9 RNA transfer. Py = pirimidina. Basi modificate: I = inosina, T = ribotimidina, Ψ = pseudouridina, D = diidrouridina, GMe = metilguanosina, GMe2 = dimetilguanosina, IMe = metilinosina.

L’RNA transfer (o RNA di trasporto) Durante la traduzione dell’mRNA, ciascun RNA transfer (tRNA) porta al ribosoma un amminoacido specifico da aggiungere alla catena polipeptidica in via di sinte-

si. La corretta sequenza amminoacidica di un polipeptide si ottiene mediante: (1) il legame di ogni amminoacido a un tRNA specifico; (2) il legame tra il codone dell’mRNA e l’anticodone complementare del tRNA. La struttura dell’RNA transfer I tRNA sono lunghi dai 75 ai 90 nucleotidi e ciascuno possiede una sequenza diversa. Le differenze nella sequenza nucleotidica giustificano la capacità di una particolare molecola di tRNA di legare un amminoacido specifico. La sequenza nucleotidica di tutti i tRNA può ripiegarsi formando la cosiddetta struttura a trifoglio (Figura 6.9a). Tale struttura deriva dall’appaiamento tra le basi complementari di diverse porzioni della molecola che genera quattro “steli” a doppio filamento separati da quattro anse: I, II, III e IV. L’ansa II contiene la sequenza trinucleotidica dell’anticodone la quale, durante la traduzione, si appaia con la sequenza trinucleotidica del codone dell’mRNA grazie alla complementarità delle basi. Tale appaiamento codone-anticodone è fondamentale per l’inserimento dell’amminoacido codificato dall’mRNA nella catena polipeptidica in via di sintesi. Le Figure 6.9b e 6.9c illustrano la struttura terziaria del tRNA per la fenilalanina di lievito; il modello molecolare spaziale rappresenta la struttura tridimensionale attiva nelle cellule. Tutti gli altri tRNA esaminati mostrano strutture simili, a forma di L capovolta, in cui l’estremità 3′ dell’RNA, quella a cui si attacca l’amminoacido, si trova all’estremità opposta della L rispetto all’ansa che reca l’anticodone.

Espressione genica: la traduzione

Tutte le molecole di tRNA possiedono la sequenza 5′CCA-3′ all’estremità 3′ e presentano anche numerose basi modificate chimicamente da reazioni enzimatiche: esistono quadri di modificazioni differenti per ogni tipo di tRNA (esempi di basi modificate vengono riportati nella Figura 6.9a). I geni degli RNA transfer I geni dei tRNA batterici sono presenti nel genoma in singola copia o al massimo in poche copie, mentre i geni dei tRNA eucarioti sono presenti in copie multiple. Per esempio, il rospo artigliato del Sud Africa Xenopus laevis possiede circa 200 copie di ciascun gene per i tRNA. I geni per i tRNA batterici vengono trascritti dall’unica RNA polimerasi presente nei batteri, mentre i geni per i tRNA eucarioti vengono trascritti dall’RNA polimerasi III. La trascrizione dei geni per i tRNA sia nei batteri sia negli eucarioti produce molecole di precursori dei tRNA (pretRNA), ciascuna delle quali presenta alle due estremità sequenze aggiuntive che vengono rimosse dopo la trascrizione. In seguito, si verificano l’aggiunta della sequenza 5′-CCA-3′ all’estremità 3′ e la modificazione delle basi lungo tutta la molecola. In certi eucarioti alcuni geni per i tRNA contengono introni. L’introne si trova quasi sempre tra il primo e il secondo nucleotide in posizione 3′ rispetto all’anticodone. La rimozione degli introni avviene con un meccanismo diverso da quello dello splicing del pre-mRNA. Il riconoscimento dell’anticodone del tRNA da parte del codone dell’mRNA Il fatto che il codone dell’mRNA riconosca l’anticodone del tRNA e non l’amminoacido da esso trasportato venne dimostrato da G. von Ehrenstein, B. Weisblum e S. Benzer, che legarono in vitro la cisteina al tRNA.Cys (questa terminologia indica l’amminoacido codificato dall’anticodone del tRNA, in questo caso la cisteina) e, successivamente, convertirono chimicamente la cisteina in alanina. L’alanil-tRNA.Cys risultante (costituito dall’alanina legata al tRNA recante l’anticodone complementare al codone codificante per la cisteina) fu usato nella sintesi in vitro dell’emoglobina. In vivo, le catene α e β dell’emoglobina contengono una cisteina ciascuna. Tuttavia, quando venne analizzata l’emoglobina prodotta in vitro, su entrambe le catene, nella posizione normalmente occupata dalla cisteina, fu rinvenuto l’amminoacido alanina. Tale risultato poteva soltanto indicare che l’alanil-tRNA.Cys aveva letto il codone per la cisteina e aveva inserito l’amminoacido che trasportava, in questo caso l’alanina. Pertanto, i ricercatori conclusero che la specificità di riconoscimento del codone risiede nella molecola di tRNA e non nell’amminoacido da essa trasportato. Il caricamento del tRNA con l’amminoacido L’amminoacido corretto viene legato al tRNA da un enzima

101

detto amminoacil-tRNA sintetasi. Questo processo viene definito amminoacilazione, o caricamento, e produce un amminoacil-tRNA (o tRNA carico). L’amminoacilazione ricava energia dall’idrolisi dell’ATP. Esistono 20 differenti amminoacil-tRNA sintetasi, una per ciascuno dei 20 diversi amminoacidi. Ogni enzima riconosce particolari caratteristiche strutturali del tRNA, o dei tRNA, che amminoacila. La Figura 6.10 mostra il caricamento di una molecola di tRNA a produrre un valina-tRNA (Val-tRNA). In primo luogo, l’amminoacido e l’ATP si legano all’amminoacil-tRNA sintetasi specifica. L’enzima quindi catalizza una reazione in cui l’ATP viene idrolizzato ad AMP, che si lega all’amminoacido dando origine a un amminoacil-AMP. In seguito, la molecola di tRNA si lega all’enzima, che trasferisce l’amminoacido dall’amminoacil-AMP al tRNA rilasciando l’AMP. Successivamente, l’enzima rilascia la molecola di amminoaciltRNA. Dal punto di vista chimico, l’amminoacido si attacca all’estremità 3′ del tRNA mediante un legame covalente tra il gruppo carbossilico dell’amminoacido e il gruppo 3′-OH o 2′-OH del ribosio dell’adenina che si trova all’estremità 3′ di tutti i tRNA (Figura 6.11).

Nota chiave Tutte le molecole di tRNA convogliano al ribosoma un amminoacido specifico da aggiungere alla catena polipeptidica in via di sintesi. L’amminoacido viene legato al tRNA da un’amminoacil-tRNA sintetasi amminoacido-specifica. Tutti i tRNA hanno lunghezza simile (75-90 nucleotidi), una sequenza 5’-CCA-3’ all’estremità 3’, presentano un certo numero di modificazioni delle basi tRNA-specifiche e una struttura terziaria affine. L’anticodone di un tRNA è specifico per l’amminoacido da esso trasportato e si appaia con il codone complementare di una molecola di mRNA. Le molecole di tRNA attive dal punto di vista funzionale sono prodotte dal processamento dei trascritti di pre-tRNA dei geni per i tRNA (evento che rimuove le sequenze aggiuntive presenti a entrambe le estremità), dall’aggiunta della sequenza CCA all’estremità 3’ e dalla modificazione di alcune basi tramite catalisi enzimatica. In alcuni geni per i tRNA di determinati eucarioti sono presenti introni, che vengono rimossi nel corso del processamento della molecola di tRNA.

I ribosomi La sintesi proteica avviene sui ribosomi, presenti a migliaia in tutte le cellule. I ribosomi si legano all’mRNA e facilitano il legame tra tRNA ed mRNA, consentendo la sintesi proteica.

102

Capitolo 6

Figura 6.10 Il caricamento (amminoacilazione) di una molecola di tRNA da parte dell’amminoacil-tRNA sintetasi a produrre un amminoacil-tRNA (tRNA carico).

Val Amminoacido l Va

L’amminoacido e l’ATP si legano all’enzima

P

P

P

P

P A L’enzima catalizza il legame dell’amminoacido all’AMP, a formare un amminoacil-AMP. Nella reazione si perdono due gruppi fosfato

P A ATP

Amminoacil-tRNA sintetasi L’enzima ritorna al suo stato originale

P

P

l Va

P A

Val

PA AMP

L’aa-tRNA e l’AMP vengono C A A rilasciati aa-tRNA-enzima

Val

tRNA scarico aa-AMP-enzima CAA

l Va

CAA Amminoacil-tRNA (aa-tRNA)

P A

L’enzima trasferisce l’amminoacido dall’amminoacil-AMP al tRNA, formando un amminoacil-tRNA (aa-tRNA)

R Gruppo R Gruppo amminico

H3 N+

CH C O

O Gruppo carbossilico

Amminoacido legato mediante il gruppo carbossilico al ribosio dell’ultimo ribonucleotide della catena del tRNA

OH

Adenina

CH2

O

O O

O–

P O

Nucleotidi citosina

Gli ultimi 3 nucleotidi di tutti i tRNA sono -CCA-3¢

C C 5¢

Anticodone

Figura 6.11 Attacco di un amminoacido a una molecola di tRNA. In una molecola di amminoacil-tRNA (tRNA carico), il gruppo carbossilico dell’amminoacido è legato al gruppo 3’-OH o 2’-OH dell’adenina 3’ terminale del tRNA.

Il tRNA scarico si lega all’enzima

CAA

L’RNA ribosomale e i ribosomi Sia nei procarioti sia negli eucarioti, i ribosomi sono costituiti da due subunità di dimensioni diverse – la subunità maggiore e la subunità minore – ciascuna delle quali è formata da un complesso di molecole di RNA e proteine. Ciascuna subunità contiene una o più molecole di rRNA e un gran numero di proteine ribosomali. Il ribosoma batterico ha una dimensione di 70S ed è formato da una subunità 50S (subunità maggiore) e da una subunità 30S (subunità minore)* (Figura 6.12). I ribosomi eucarioti sono più grandi e più complessi di quelli dei procarioti e variano in dimensione e composizione nei diversi organismi. I ribosomi di mammifero, per * Il valore S è la misura della velocità di sedimentazione in centrifuga. La velocità di sedimentazione di un oggetto non dipende solo dalla sua massa, ma anche dalla sua conformazione tridimensionale. In particolare, considerati due oggetti con uguale massa ma diversa conformazione, il più compatto sedimenterà più velocemente e avrà perciò un valore di S maggiore rispetto a quello meno compatto. Per quanto riguarda i ribosomi, ne deriva che 50S + 30S ≠ 70S, dato che, quando le due subunità si uniscono a formare un ribosoma completo, la conformazione diventa meno compatta e la sedimentazione risulta più lenta rispetto a quanto atteso dalla somma delle due subunità.

Espressione genica: la traduzione rRNA 16S

tRNA rRNA 5S

rRNA 23S

Proteine ribosomali della subunità maggiore

Proteine ribosomali della subunità minore Subunità 30S

Subunità 50S Ribosoma 70S

Figura 6.12 Modello molecolare di un ribosoma batterico completo (70S). Il ribosoma mostrato è quello di Thermus thermophilus. Si possono vedere gli RNA e le proteine delle due subunità, oltre al tRNA nel suo sito di legame.

103

minore. I ribosomi eucarioti contengono quattro molecole di rRNA – l’rRNA 28S, l’rRNA 5,8S e l’rRNA 5S nella subunità maggiore, e l’rRNA 18S nella subunità minore. Le molecole di rRNA svolgono un ruolo strutturale nel ribosoma e un ruolo funzionale nelle diverse fasi della traduzione. Durante la traduzione, l’mRNA passa attraverso la subunità ribosomale minore (Figura 6.14). Siti specifici del ribosoma legano i tRNA in fasi diverse della sintesi proteica: il sito A (amminoacilico), dove si lega un amminoacil-tRNA entrante, il sito P (peptidilico), dove si trova il tRNA recante la catena polipeptidica in via di sintesi, e il sito E (di uscita), a livello del quale un tRNA è incanalato nel percorso che dal sito P lo porta a lasciare il ribosoma. I siti P e A sono costituiti da regioni appartenenti sia alla subunità maggiore sia a quella minore, mentre il sito E è una porzione della subunità maggiore. Verranno fornite ulteriori informazioni circa questi siti nei prossimi tre paragrafi, che descrivono le fasi della traduzione.

I geni per gli RNA ribosomali Nei procarioti e negli eucarioti le regioni del DNA contenenti i geni per gli rRNA vengono definite DNA ribosomale (rDNA) o esempio, hanno una dimensione di 80S e sono formati da unità di trascrizione dell’rRNA. E. coli possiede sette una subunità maggiore di 60S e da una subunità minore unità di trascrizione dell’rRNA sparse nel suo cromosodi 40S. ma. Ogni unità di trascrizione dell’rRNA contiene una Ogni subunità ribosomale contiene una o più mole- copia delle sequenze codificanti degli rRNA 16S, 23S e cole di rRNA specifiche e diverse proteine ribosomali 5S, posizionate nell’ordine 16S-23S-5S. Vi è un unico (Figura 6.13; rappresentate anche nel modello molecola- promotore per ogni unità di trascrizione dell’rRNA e la re riportato nella Figura 6.12). I ribosomi batterici con- trascrizione da parte dell’RNA polimerasi produce una tengono tre molecole di rRNA – l’rRNA 23S e l’rRNA molecola di rRNA precursore (pre-rRNA) con orga5S nella subunità maggiore e l’rRNA 16S nella subunità nizzazione 5′-16S-23S-5S-3′ e provvisto di sequenze non costituite da rRNA, definite sequenze spaziaa) trici, poste dopo ogni sequenza di rRNA e alle estremità 5′ e 3′. Il processamento da parte di Ribosoma batterico (70S) (2,5 µ 106 dalton) rRNA 23S (2904 nt) ribonucleasi specifiche rimuove gli spaziatori, + consentendo il rilascio dei tre rRNA. Le proteirRNA 5S (120 nt) + ne ribosomali si associano alla molecola di 31 proteine pre-rRNA non appena essa viene trascritta, Subunità 50S formando un grosso complesso ribonucleoprorRNA 16S (1542 nt) teico. Il processamento del trascritto avviene a + livello di tale complesso e le associazioni spe21 proteine cifiche degli rRNA con le proteine ribosomali Subunità 30S generano le subunità ribosomali funzionali. b) La maggior parte degli eucarioti possiede Ribosoma di mammifero rRNA 28S (4718 nt) molte copie dei geni che codificano per i quat(80S) (4,2 µ 106 dalton) + tro tipi di rRNA 18S, 5,8S, 28S e 5S. I geni derRNA 5,8S (160 nt) + gli rRNA 18S, 5,8S e 28S si trovano adiacenti rRNA 5S (120 nt) uno all’altro nell’ordine 18S-5,8S-28S e cia+ Subunità 60S

49 proteine rRNA 18S (1874 nt) + 33 proteine

nt = nucleotidi

Subunità 40S

Figura 6.13 Composizione del ribosoma completo e delle subunità ribosomali delle cellule batteriche (a) e di mammifero (b).

104

Capitolo 6 Catena polipeptidica nascente Amminoacido Subunità maggiore

Sito di uscita (E)

tRNA

Sito peptidilico (P) Sito amminoacilico (A)

Subunità minore

mRNA

...

...





Figura 6.14 Struttura del ribosoma in cui sono visibili il percorso dell’mRNA attraverso la subunità minore, i tre siti di legame del tRNA nelle diverse fasi della sintesi proteica e il punto di uscita della catena polipeptidica di nuova sintesi.

scuna unità costituita dai tre geni è generalmente ripetuta in tandem dalle 100 alle 1000 volte (a seconda dell’organismo), formando uno o più gruppi (cluster) di unità ripetute di rDNA. In conseguenza dell’attività di trascrizione delle unità ripetute, si forma un nucleolo intorno a ogni cluster. Di solito, i diversi nucleoli si fondono costituendo un unico nucleolo. Ogni unità ripetuta di rDNA eucariote viene trascritta dall’RNA polimerasi I producendo una molecola di pre-rRNA caratterizzata da un’organizzazione 5′18S-5,8S-28S-3′ e da sequenze spaziatrici tra gli rRNA e alle estremità 5′ e 3′. Il processamento da parte di ribonucleasi specifiche genera i tre rRNA mediante la rimozio-

Nota chiave I ribosomi sono formati da due subunità di dimensioni diverse, ciascuna delle quali contiene una o più molecole di RNA e proteine ribosomali. I tre rRNA procarioti e tre dei quattro rRNA eucarioti vengono codificati a livello delle unità di trascrizione dell’rRNA. Il quarto rRNA eucariote viene invece codificato da geni distinti. La trascrizione delle unità trascrizionali dell’rRNA da parte dell’RNA polimerasi produce molecole di pre-rRNA, che vengono processate a dare rRNA maturi attraverso la rimozione delle sequenze spaziatrici. Il processamento avviene in complessi costituiti dal pre-rRNA, da proteine ribosomali e da altre proteine, e rappresenta una parte della serie di eventi che conducono alla formazione delle subunità ribosomali mature.

ne delle sequenze spaziatrici. Gli eventi di processamento del pre-rRNA avvengono in complessi formati dal pre-rRNA, dall’rRNA 5S e dalle proteine ribosomali. L’rRNA 5S viene prodotto mediante la trascrizione dei geni degli rRNA 5S (comunemente localizzati in una sede diversa del genoma) da parte dell’RNA polimerasi III. Durante il processamento del pre-rRNA i complessi vanno incontro a cambiamenti conformazionali, con la conseguente formazione delle subunità ribosomali funzionali 60S e 40S, che vengono successivamente trasportate nel citosol. È importante sottolineare la differenza tra introni e spaziatori. La rimozione degli spaziatori rilascia gli RNA fiancheggianti, che rimangono separati. Al contrario, la rimozione di un introne determina l’unione (splicing) delle due sequenze di RNA che fiancheggiano l’introne.

L’inizio della traduzione Le tre fasi fondamentali della sinnimazione tesi proteica – inizio, allungamento e terminazione – sono simili nei Inizio della batteri e negli eucarioti. In questo traduzione paragrafo e nei due successivi tali fasi verranno trattate in modo sequenziale e, in particolare, l’attenzione verrà incentrata sui processi che avvengono in E. coli. Nella discussione verranno sottolineate le differenze significative nella traduzione tra batteri ed eucarioti. L’inizio comprende tutte le fasi che precedono la formazione del legame peptidico tra i primi due amminoacidi della catena polipeptidica e coinvolge una molecola di mRNA, un ribosoma, uno specifico tRNA iniziatore, i fattori di inizio proteici (IF) e il GTP (guanosinatrifosfato). L’inizio nei batteri Nei batteri, il primo stadio dell’inizio della traduzione è l’interazione della subunità ribosomale 30S (minore), a cui sono legati IF-1 e IF-3, con la regione dell’mRNA che contiene il codone d’inizio AUG (Figura 6.15). IF-3 facilita il legame della subunità all’mRNA e impedisce il legame tra la subunità ribosomale 50S e la subunità 30S. Il codone di inizio AUG da solo non è sufficiente per indicare il punto in cui la subunità 30S dovrebbe legarsi all’mRNA, ma è richiesta anche la presenza di una sequenza a monte (sul versante 5′ del leader dell’mRNA) del codone AUG, definita sito di legame al ribosoma (RBS). Negli anni settanta del XX secolo John Shine e Lynn Dalgarno ipotizzarono che la sequenza RBS, ricca in purine (5′-AGGAGG-3′ o una sequenza simile), e talvolta altri nucleotidi presenti nella stessa regione potessero appaiarsi a una regione complementare ricca in pirimidine (contenente sempre la sequenza 5′-UCCUCC-3′) a livello dell’estremità 3′ terminale dell’rRNA 16S (Figura

MyLab

Espressione genica: la traduzione

IF-3

Figura 6.15 Inizio della sintesi proteica nei batteri. Il complesso di inizio 30S è formato da una subunità ribosomale 30S, dall’mRNA, dall’fMet-tRNA iniziatore e dai fattori di inizio. Successivamente si lega la subunità ribosomale 50S, formando il complesso di inizio 70S. Durante questo evento vengono rilasciati i fattori di inizio e si verifica l’idrolisi del GTP.

IF-1 Sequenza di Shine-Dalgarno

Subunità ribosomale 30S La subunità ribosomale 30S si lega all’mRNA

AU G

mRNA 5¢

AU G

mRNA 5¢

IF-3

105



3¢ IF-1 fMet 3¢ 5¢

Il tRNA iniziatore si lega al complesso subunità ribosomale 30S-mRNA GTP

fMet 3¢ 5¢

Shine-Dalgarno di un mRNA presenta una mutazione che riduce in modo significativo, o impedisce del tutto, il possibile appaiamento con la sequenza dell’rRNA 16S, l’mRNA mutato non può essere tradotto. Analogamente, la traduzione dell’mRNA non può avvenire nel caso in cui si verifichi una mutazione a carico della sequenza dell’rRNA complementare alla sequenza di Shine-Dalgarno. Dal momento che era possibile contestare tali osservazioni considerando che la perdita di traducibilità in seguito a mutazione in uno dei due RNA può essere determinata da effetti non correlati alla perdita di complementarità tra le due regioni di RNA, venne eseguito un esperimento più elegante. In particolare, vennero indotte nella sequenza di Shine-Dalgarno alcune mutazioni in grado di impedire l’appaiamento con la sequenza selvatica di rRNA e nella sequenza di rRNA furono introdotte delle mutazioni “compensanti”, in modo che le due sequenze mutate potessero appaiarsi. In questo caso, la traduzione dell’mRNA avveniva normalmente, dimostrando l’importanza dell’appaiamento tra le due regioni di RNA. (Questo tipo di esperimento, in cui vengono introdotte delle mutazioni compensanti in due sequenze che si suppone interagiscano tra loro, è stato utilizzato in numerosi altri sistemi per indagare i ruoli delle interazioni specifiche nelle funzioni biologiche.)

fMet-tRNA iniziatore IF-2

UAC

fMet-tRNA iniziatore

GTP UAC

IF-2

AU G

mRNA 5¢ IF-3

3¢ IF-1

Complesso di inizio 30S

Legame della subunità ribosomale 50S Subunità ribosomale 50S

IF-2 IF-1 IF-3 GDP + P

Sito P fMet 3¢ 5¢ Sito E

Sito A UAC

mRNA 5¢

AU G



Complesso di inizio 70S

a) Sequenza all’estremità 3¢ dell’rRNA 16S 3¢

b) Esempio di appaiamento tra l’estremità 3¢ dell’rRNA 16S e la sequenza nucleotidica a monte del codone AUG di un mRNA Sequenza di Shine-Dalgarno 5¢

Codone di inizio

U G UAC UA AGGAG G U U G U AU G G A AC A AC G C

A UU C C U C C A



Estremità 3¢ dell’rRNA 16S

UA

6.16). Joan Steitz fu la prima a dimostrare sperimentalmente tale appaiamento. La regione RBS dell’mRNA oggi è comunemente nota come la sequenza di ShineDalgarno. La maggior parte delle sequenze RBS si trova tra gli 8 e i 12 nucleotidi a monte del codone di inizio. Il modello prevede che la formazione di coppie di basi complementari tra l’mRNA e l’rRNA 16S consenta alla subunità ribosomale minore di localizzare sull’mRNA la sequenza corretta per l’inizio della sintesi proteica. Evidenze di tipo genetico supportano questo modello. Se la sequenza di



AU U C C U C C AUAG

G

Figura 6.16 Sequenze coinvolte nel legame dei ribosomi all’mRNA nel processo di inizio della sintesi proteica nei procarioti.



106

Capitolo 6

Lo stadio seguente nell’inizio della traduzione è il legame di un tRNA iniziatore particolare al codone di inizio AUG a cui è legata la subunità 30S. Sia nei procarioti sia negli eucarioti, AUG codifica per la metionina: in entrambe le classi di organismi, pertanto, le proteine di nuova sintesi iniziano con la metionina. In molti casi la metionina viene successivamente rimossa. Nei batteri, il tRNA iniziatore è il tRNA.fMet che possiede l’anticodone 5′-CAU-3′ per legarsi al codone di inizio AUG. Questo tRNA trasporta una forma di metionina modificata, la formilmetionina (fMet), nella quale al gruppo amminico della metionina è stato aggiunto un gruppo formilico. Nello specifico, in primo luogo la metionil-tRNA sintetasi catalizza l’aggiunta della metionina al tRNA e, successivamente, l’enzima transformilasi aggiunge alla metionina il gruppo formilico. La molecola risultante è denominata fMet-tRNA.fMet (questa nomenclatura indica che il tRNA è specifico per il legame della fMet e che reca attaccata la fMet). Si noti che, quando sulla molecola di mRNA si incontra un codone AUG che non sia nella posizione iniziale della sequenza codificante, viene utilizzato un tRNA diverso, denominato tRNA.Met, per inserire una metionina in quel punto della catena polipeptidica. Questo tRNA viene caricato dalla stessa amminoacil-tRNA sintetasi che agisce sul tRNA.fMet, producendo il Met-tRNA.Met. Tuttavia, il tRNA.Met e il tRNA.fMet vengono codificati da geni diversi e possiedono sequenze nucleotidiche distinte. Più oltre nel presente capitolo verrà illustrato come i due tRNA siano usati in modo diverso. Il tRNA iniziatore, fMet-tRNA.fMet, viene portato al complesso subunità 30S-mRNA da IF-2, che trasporta anche una molecola di GTP. Il tRNA iniziatore si lega alla subunità a livello del sito P. In seguito verrà spiegato che, successivamente, tutti gli amminoacil-tRNA che giungono al ribosoma si legano al sito A. Tuttavia, il legame di IF-1 alla subunità 30S blocca il sito A in modo che solo il sito P risulti disponibile per il legame con il tRNA iniziatore. A questo punto si è formato il complesso di inizio 30S, costituito dall’mRNA, dalla subunità 30S, dal tRNA iniziatore e dai fattori di inizio (vedi Figura 6.15). In una fase successiva, si verifica il legame della subunità ribosomale 50S, evento che determina l’idrolisi del GTP e il rilascio dei tre fattori di inizio. Il complesso finale viene definito complesso di inizio 70S (vedi Figura 6.15). L’inizio negli eucarioti Negli eucarioti l’inizio della traduzione è simile a quanto avviene nei batteri, anche se è più complesso e coinvolge molti più fattori di inizio, noti come fattori di inizio eucarioti (eIF). Le differenze principali sono le seguenti: (1) la metionina iniziatrice non è modificata, nonostante esista anche in questo caso un tRNA iniziatore specifico che la porta al ribosoma, e (2) le sequenze di Shine-Dalgarno non sono presenti sugli mRNA eucarioti, in quanto il ribosoma eucariote uti-

lizza un altro meccanismo per riconoscere il codone di inizio AUG. Inizialmente, un fattore di inizio eucariote eIF-4F – un multimero di numerose proteine, tra cui eIF4E, la Cap Binding Protein (CBP) – si lega al cap all’estremità 5′ dell’mRNA (vedi Capitolo 5). Successivamente, si crea un complesso formato dalla subunità ribosomale 40S, dal Met-tRNA iniziatore, da diverse proteine eIF e dal GTP che, insieme ad altri eIF, si sposta lungo l’mRNA alla ricerca del codone di inizio AUG; quest’ultimo si trova inserito all’interno di una corta sequenza – nota come sequenza di Kozak (da Marilyn Kozak) – che lo identifica come codone di inizio. Questo processo viene definito modello a scansione per l’inizio della traduzione. Il codone AUG corretto è quasi sempre il primo codone AUG a partire dall’estremità 5′ dell’mRNA ma, per agire da codone di inizio, deve trovarsi all’interno di una sequenza appropriata. Una volta trovato questo AUG, la subunità 40S si lega a esso, seguita dalla subunità 60S che spiazza gli eIF (tranne eIF-4F, necessario per il successivo inizio della traduzione), formando il complesso di inizio 80S, con il Met-tRNA iniziatore legato all’mRNA nel sito P del ribosoma. Anche la coda di poli(A) dei messaggeri eucarioti svolge un ruolo nella traduzione. La proteina di legame al poli(A) II (PABPII; vedi Figura 5.11b), legata alla coda di poli(A), si lega anche a eIF-4G, una delle proteine di eIF-4F del cap, portando così l’estremità 3′ dell’mRNA in prossimità dell’estremità 5′. In questo modo la coda di poli(A) stimola l’inizio della traduzione.

L’allungamento della catena polipeptidica La fase successiva all’inizio delnimazione la traduzione è l’allungamento. La Figura 6.17 mostra gli eventi Allungamento che si verificano durante l’allundella catena gamento – l’aggiunta di un ampolipeptidica minoacido alla volta alla catena polipeptidica in crescita – così come avvengono nei batteri. Questa fase è costituita da tre passaggi: 1. legame dell’amminoacil-tRNA (tRNA carico) al ribosoma a livello del sito A; 2. formazione di un legame peptidico; 3. migrazione (traslocazione) del ribosoma lungo l’mRNA, un codone alla volta. Come l’inizio della traduzione, anche l’allungamento necessita di fattori proteici accessori, denominati fattori di allungamento (EF), e del GTP. Negli eucarioti il processo si svolge in modo simile. Il legame dell’amminoacil-tRNA All’inizio della fase di allungamento, l’anticodone dell’fMet-tRNA è unito mediante legami idrogeno al codone di inizio AUG in

MyLab

Espressione genica: la traduzione Figura 6.17 Fase di allungamento della traduzione nei batteri. Per quanto riguarda le proteine EF-Tu ed EF-Ts, la “u” sta per “instabile” (unstable), mentre la “s” sta per “stabile” (stable).

Rigenerazione da parte di Ts del complesso EF-Tu-GTP Ts GTP

GDP Complesso EF-Tu-Ts

Ser Ts GTP

Peptidil-tRNA legato al sito P

Ts

EF-Tu

Ciclo di scambio EF-Tu-Ts

AG G

GDP

Ser fMet

P

Sequenza di Shine-Dalgarno Sito A vuoto

Sito E

AG G 2

UAC 5¢ mRNA 1

AU G U C C A AG Codone: 1 Non appena si è formato il complesso di inizio 70S, l’fMet-tRNA.fMet si lega al codone AUG nel sito P (peptidilico) del ribosoma.

2



3

fMet

La molecola successiva di amminoacil-tRNA (Ser-tRNA.Ser), complessata con il fattore di allungamento Tu (EF-Tu) e il GTP, si lega al codone esposto (UCC) nel sito A (amminoacilico) del ribosoma. 5¢

Il ciclo di allungamento si ripete fino a incontrare un codone di stop.

UAC AG G

Codone: 1

2



3

Si forma il legame peptidico tra i due amminoacidi adiacenti, catalizzato dalla peptidil-transferasi. Gli amminoacidi uniti risultano attaccati al tRNA sul sito A, formando un peptidil-tRNA.

fMet

Legame peptidico

fMet

Centro della peptidiltransferasi

Ser

Ser

AU G U C C A AG

mRNA 3

6

107

Ser

Sito E vuoto AG G AU G U C C A AG

5¢ 5

UAC AG G 3¢

AU G U C C A AG



2 Codone: 1 3 Quando la traslocazione è completata e il peptidil-tRNA si trova nel sito P, il tRNA scarico viene rilasciato dal sito E e il ribosoma è pronto per un altro ciclo di allungamento.

Codone: 1 La traslocazione richiede EF-G e GTP e si verifica con lo spostamento del ribosoma di un codone verso destra e con il movimento del peptidil-tRNA dal sito A al sito P. Il tRNA scarico si muove fMet dal sito P al sito E.

2



3

4

Ser Ciclo EF-G

Sito A vuoto

UAC



UAC AG G AU G U C C A AG Codone: 1

corrispondenza del sito P del ribosoma (Figura 6.17, punto 1). Il codone successivo dell’mRNA si trova sul sito A; nella Figura 6.17 questo codone (UCC) codifica per la serina (Ser). Successivamente, l’amminoacil-tRNA appropriato (in questo caso, Ser-tRNA.Ser) si lega al codone esposto nel sito A (Figura 6.17, punto 2). Questo amminoaciltRNA viene trasportato al ribosoma legato a EF-TuGTP, complesso formato dal fattore proteico di allungamento EF-Tu e da una molecola di GTP. Quando l’am-

2

3

Complesso EF-G-GTP

EF-G 3¢ GDP + P

GTP

minoacil-tRNA si lega al codone nel sito A, l’idrolisi del GTP determina il rilascio di EF-Tu-GDP. EF-Tu viene riciclato, come mostra la Figura 6.17, punto 2. Inizialmente, un secondo fattore di allungamento, EF-Ts, si lega a EF-Tu e determina lo spostamento del GDP. In seguito, il GTP si lega al complesso EF-Tu-EF-Ts generando il complesso EF-Tu-GTP con il rilascio simultaneo di EF-Ts. Un amminoacil-tRNA si lega a EF-TuGTP e tale complesso può legarsi al sito A del ribosoma quando risulta esposto il codone complementare. Negli

108

Capitolo 6

eucarioti il processo è molto simile: eEF-1A svolge il ruolo di EF-Tu, mentre eEF-1B svolge il ruolo di EF-Ts. La formazione del legame peptidico Il ribosoma mantiene i due amminoacil-tRNA dei siti P e A nella posizione corretta affinché si possa formare il legame peptidico tra i due amminoacidi (Figura 6.17, punto 3). I due passaggi coinvolti nella formazione di un legame peptidico sono mostrati nella Figura 6.18. In primo luogo viene rotto il legame tra l’amminoacido e il tRNA nel sito P; in questo caso, la rottura avviene tra la fMet e il suo tRNA. La seconda fase consiste nella formazione del legame peptidico tra la fMet, ormai libera, e la Ser attaccata al tRNA nel sito A; tale reazione è catalizzata dalla peptidil-transferasi. Per molti anni si è pensato che questa attività enzimatica fosse il risultato dell’interazione tra alcune proteine ribosomali della subunità 50S, finché nel 1992 Harry Noller e i suoi collaboratori scoprirono che, rimuovendo gran parte delle proteine dalla subunità ribosomale 50S, e lasciando soltanto l’RNA ribosomale, si poteva ancora misurare un’attività peptidil-transferasica. Questa attività veniva inoltre inibita dagli antibiotici cloramfenicolo e carbomicina, entrambi noti per la loro specifica attività inibitoria nei confronti della peptidil-transferasi. Infine, l’attività peptidil-transferasica veniva persa quando l’rRNA era trattato con ribonucleasi T1, che degrada l’RNA, ma non le proteine. Tali risultati suggerirono che la molecola di rRNA 23S della subunità ribosomale maggiore fosse intimamente coinvolta nell’attività peptidil-transferasica, e che la molecola stessa potesse in effetti costituire l’enzima. In questo caso, dunque, l’rRNA agirebbe come un ribozima (un RNA catalitico; vedi

Capitolo 5). Dall’analisi della struttura ad alta risoluzione della subunità ribosomale maggiore si è dedotto che la peptidil-transferasi consiste esclusivamente di RNA. L’RNA ribosomale interagisce anche con i tRNA quando essi si legano e vengono rilasciati dal ribosoma. Pertanto, al contrario di quanto ipotizzato in passato, le proteine ribosomali costituiscono le unità strutturali che facilitano l’organizzazione dell’rRNA negli elementi funzionali chiave dei ribosomi. Una volta formato il legame peptidico (vedi Figura 6.17, punto 3), nel sito P rimane un tRNA privo di amminoacido (un tRNA scarico), mentre il tRNA nel sito A, ora detto peptidil-tRNA, è attaccato ai primi due amminoacidi della catena polipeptidica, in questo caso fMet-Ser. La traslocazione Nell’ultima fase del ciclo di allungamento, la traslocazione (Figura 6.17, punto 4), il ribosoma si sposta di un codone lungo l’mRNA verso l’estremità 3′. Nei batteri, la traslocazione richiede l’attività di un altro fattore proteico di allungamento, EF-G. Un complesso EF-G-GTP si associa al ribosoma, il GTP viene idrolizzato e il ribosoma si sposta, mentre il tRNA scarico viene rimosso dal sito P. È possibile che l’idrolisi del GTP modifichi la struttura di EF-G, facilitando l’evento di traslocazione. La traslocazione negli eucarioti è simile; il fattore di allungamento è in questo caso eEF-2, che agisce in modo analogo a EF-G. Il tRNA scarico si sposta dal sito P e si lega in modo transiente al sito E della subunità ribosomale 50S, bloccando il legame del successivo amminoacil-tRNA al sito A finché la traslocazione non è completata e il peptidiltRNA non è legato in modo corretto al sito P. Successivamente alla realizzazione di tali eventi, il tRNA scarico

a) Amminoacil-tRNA adiacenti legati all’mRNA sul ribosoma

b) Dopo la formazione del legame peptidico, nel sito P si trova un tRNA scarico e nel sito A un tRNA con due amminoacidi legati tra loro (dipeptidil-tRNA) CH3

Subunità 50S

CH2

Peptidiltransferasi

S

O

CH2 O C H

H N

C

C H

H

CH2OH

CH2 C

O

O

Sito P

H2N

C H





C

O

O

H N

CH2 C H

O C NH C H

Formazione del legame peptidico catalizzata dalla peptidil-transferasi

OH



Sito A

CH2OH C

O

O



Sito E



Legame peptidico

S CH3

H2O

UAC

AG G

AU G

UCC

Subunità 30S Codone nel sito P con fMet-tRNA.fMet

A AG

Codone nel sito A con Ser-tRNA.Ser



Codone successivo (lisina)



Codone nel sito P con il tRNA scarico

Figura 6.18 La formazione del legame peptidico tra i primi due amminoacidi (fMet e Ser) di una catena polipeptidica è catalizzata sul ribosoma dalla peptidil-transferasi.

UAC

AG G

AU G

UCC

A AG 3¢ mRNA

Sito A con un dipeptidiltRNA; in questo caso, fMet-Ser-tRNA.Ser

Espressione genica: la traduzione

MyLab

109

viene rilasciato dal ribosoma. Dopo la Polipeptide 5 ribosomi che stanno Catene completo leggendo lo stesso RNA polipeptidiche traslocazione, EF-G viene rilasciato e poi in maniera sequenziale nascenti riciclato, come mostrato nella Figura 6.17, punto 5. Durante la fase di traslocazione il Codone 50S di inizio peptidil-tRNA resta associato al suo codoAUG ne sull’mRNA e, poiché il ribosoma si è UAG 5¢ 3¢ mRNA spostato, viene ora a trovarsi nel sito P (da tRNA Codone di stop qui il nome di sito peptidilico). 30S Movimento del ribosoma Dopo il termine della traslocazione, il sito A è libero. Un amminoacil-tRNA re- Figura 6.19 cante l’anticodone corretto si lega al nuo- Diagramma di un polisoma: diversi ribosomi che traducono lo stesso mRNA in maniera sequenziale. vo codone esposto a livello del sito A, reiterando il processo già descritto. L’intero processo si ripete finché la traduzione termina a livello di ne di stop grazie all’aiuto di proteine denominate fattori un codone di stop (Figura 6.17, punto 6). di rilascio (RF), che possiedono una forma che simula Sia nei batteri sia negli eucarioti, una volta che il ri- quella del tRNA, comprese le regioni che riconoscono i bosoma si è mosso dal sito di inizio sull’mRNA, si veri- codoni (Figura 6.20, punto 2), e che avviano una serie di fica un altro evento di inizio. L’intero processo si ripete eventi specifici della terminazione. E. coli possiede tre finché, tipicamente, non si arriva alla traduzione simulta- RF, due dei quali riconoscono i codoni di stop: RF1 riconea dello stesso mRNA da parte di diversi ribosomi. Il nosce UAA e UAG, mentre RF2 riconosce UAA e UGA complesso che si forma tra una molecola di mRNA e tut- (nella figura viene illustrato il legame tra RF1 e UAG). Il ti i ribosomi che la stanno traducendo simultaneamente legame di RF1 o di RF2 a un codone di stop induce la viene definito poliribosoma, o polisoma (Figura 6.19). peptidil-transferasi a tagliare il polipeptide dall’mRNA a Ogni ribosoma di un polisoma traduce l’intero mRNA e livello del sito P (Figura 6.20, punto 3). Il polipeptide laproduce un polipeptide completo. I poliribosomi consen- scia quindi il ribosoma. tono la produzione rapida ed efficiente di un gran numeSuccessivamente, RF3-GDP si lega al ribosoma, stiro di polipeptidi da un singolo mRNA. molando il rilascio dell’RF dal codone di stop e dal ribosoma (Figura 6.20, punto 4). Il GTP sostituisce quindi il GDP su RF3 e quest’ultimo idrolizza il GTP, evento che permette il rilascio di RF3 dal ribosoma. Nota chiave Una fase aggiuntiva importante è rappresentata dallo La traduzione è un processo complesso che richiede smantellamento del complesso rimanente formato dalle molti RNA, fattori proteici ed energia. Il codone di subunità ribosomali, dall’mRNA e dal tRNA scarico, afinizio AUG (metionina) segnala l’inizio della tradufinché il ribosoma e il tRNA possano essere riciclati. In zione sia nei procarioti sia negli eucarioti. L’alfattore di riciclaggio del ribosoma (RRF) – la il E. coli lungamento è dovuto alla formazione di un legame cui forma mima quella di un tRNA – si lega al sito A peptidico tra l’amminoacido attaccato al tRNA nel (Figura 6.20, punto 5). In seguito, si verifica il legame di sito A del ribosoma e il polipeptide in via di sintesi EF-G, che causa la traslocazione del ribosoma e, di conattaccato al tRNA nel sito P. La traslocazione avvieseguenza, lo spostamento di RRF nel sito P e del tRNA ne quando il tRNA nel sito P, ormai scarico, viene riscarico nel sito E (Figura 6.20, punto 6). L’RRF rilascia lasciato dal ribosoma e quest’ultimo si sposta di un il tRNA scarico ed EF-G rilascia l’RRF, provocando la codone lungo l’mRNA. La terminazione è il risultato dissociazione delle due subunità ribosomali dall’mRNA dell’interazione tra un fattore di rilascio proteico e (Figura 6.20, punto 7). un codone di stop. Negli eucarioti, il termine della traduzione è simile a quanto avviene nei batteri. In questo caso, un solo fattore di rilascio – il fattore di rilascio 1 eucariote (eRF1) – ricoLa fine della traduzione nosce tutti e tre i codoni di stop ed eRF3 induce gli evenLa fine della traduzione vie- ti di terminazione. Negli eucarioti si verifica il riciclaggio nimazione ne segnalata da uno dei tre del ribosoma, ma non esiste un equivalente dell’RRF. codoni di stop (UAG, UAA e Come spiegato precedentemente, il polipeptide si riTerminazione UGA), uguali nei procarioti e piega durante il processo di traduzione. Nel Box 6.1 vendella traduzione negli eucarioti (Figura 6.20, gono descritte ricerche recenti che dimostrano come due punto 1). I codoni di stop non codificano per alcun am- polipeptidi con sequenza amminoacidica identica possaminoacido e, pertanto, nella cellula non esistono tRNA no ripiegarsi in modo da produrre polipeptidi con struttucon i relativi anticodoni. Il ribosoma riconosce un codo- re e funzioni diverse.

110

Capitolo 6 Ser

fMet Molti amminoacidi

Sito P Lys 1

Incontro con un codone di stop



UUC A AG UAG

...

UUC A AG UAG

5¢ ...



RRF



Fattore di rilascio (RF1) Ser

Il fattore di rilascio (RF1) si lega al codone di stop

6

fMet Peptidiltransferasi

Lys

RF1 UUC A AG UA G

5¢ ...

Ser

Lys



EF-G-GTP si lega al ribosoma. L’idrolisi del GTP a GDP provoca la traslocazione del ribosoma, portando l’RRF nel sito P e il tRNA nel sito E

OC

La catena polipeptidica è stata rilasciata

L’RRF induce il rilascio del tRNA scarico; successivamente, EF-G induce il rilascio dell’RRF e le due subunità ribosomali si dissociano dall’mRNA

RF1 5¢ ...

UUC A AG UA G



mRNA 5¢



RRF

tRNA scarico 7

GDP

RRF EF-G

UUC A AG UA G

5¢ ...

fMet

Rilascio della catena polipeptidica

HO 3

Sito E

Codone di stop

mRNA RF1

Il fattore di riciclaggio del ribosoma (RRF) si lega al sito A

Sito A

Sito E

2

5

EF-G UU

C

GDP

50S

Sito E

Sito P

Sito A

AG A AG U



...

RF1 4

Legame di RF3-GDP, che causa il rilascio di RF1. Il GDP viene sostituito dal GTP, la cui idrolisi determina il rilascio di RF3.



...

30S

RF3–GDP

UUC A AG UA G



RF3

Lo smistamento delle proteine nella cellula Nei batteri e negli eucarioti alcune proteine possono essere secrete, mentre negli eucarioti altre devono essere posizionate in diversi compartimenti cellulari come il

Figura 6.20 Terminazione della traduzione. Il ribosoma riconosce un codone di stop (UAG) con l’aiuto dei fattori di rilascio. Un fattore di rilascio legge il codone di stop, scatenando una serie di eventi di terminazione specifici che portano al rilascio del polipeptide completato. In seguito, le subunità ribosomali, l’mRNA e il tRNA scarico si separano. Nei batteri questo evento è stimolato dal fattore di riciclaggio del ribosoma (RRF) e da EF-G.

nucleo, i mitocondri, i cloroplasti e i lisosomi. Lo smistamento delle proteine nei compartimenti appropriati è sotto il controllo genetico, mediato da sequenze segnale specifiche (o “leader” delle proteine) che le dirigono negli organelli corretti. Allo stesso modo, nei batteri alcune proteine si localizzano nella membrana, mentre

Espressione genica: la traduzione

Box 6.1

111

Stessa sequenza amminoacidica, differenti strutture e funzioni

In questo capitolo è stato spiegato che la sequenza amminoacidica di un polipeptide viene determinata dalla sequenza dei codoni nell’mRNA la quale, a sua volta, è legata alla sequenza delle coppie di basi della regione codificante di un gene. È stato inoltre riportato che la sequenza amminoacidica di un polipeptide determina la modalità di ripiegamento dello stesso e, quindi, la sua struttura tridimensionale e funzionale. Per decenni gli scienziati hanno creduto che ciò fosse vero. Tuttavia, nuove ricerche hanno dimostrato come sia possibile che due polipeptidi con sequenze amminoacidiche identiche assumano conformazioni diverse e, di conseguenza, svolgano funzioni differenti. In che modo può realizzarsi tale condizione? Una delle caratteristiche del codice genetico di cui si è discusso è la degenerazione, in virtù della quale per molti amminoacidi esiste più di un codone codificante (Figura 6.7). Pertanto, una variazione in una coppia di basi nella regione codificante di un gene potrebbe sostituire un codone dell’mRNA con un altro che codifica per lo stesso amminoacido. Tale mutazione puntiforme viene definita mutazione silente e in questo caso il nuovo codone viene denominato sinonimo rispetto al codone selvatico. Due codoni codificanti per lo stesso amminoacido possono però avere effetti diversi sulla traduzione. Vale a dire che le molecole di amminoaciltRNA non sono presenti tutte in ugual quantità. Se il codone sinonimo viene letto da un amminoacil-tRNA relativamente raro, mentre il codone selvatico viene letto da un amminoacil-tRNA comune, la velocità di traduzione lungo il codone sarà più lenta nel caso dell’mRNA mutato rispetto all’mRNA selvatico. Qual è l’importanza di tale evento? In questo capitolo è stato spiegato che il

altre vengono secrete. Di seguito verranno descritte brevemente le modalità con cui si realizza la secrezione delle proteine da parte di una cellula eucariote. Tali proteine transitano attraverso il reticolo endoplasmatico (RE) e l’apparato del Golgi. Nel 1975, Gunther Blobel, Bernhard Dobberstein e i loro collaboratori scoprirono che le proteine secrete e altre proteine smistate dal Golgi contengono inizialmente degli amminoacidi aggiuntivi a livello di estremità ammino-terminale. Gli studi di Blobel portarono alla formulazione dell’ipotesi del segnale, secondo la quale le proteine smistate dal Golgi si legano mediante un’estensione idrofobica ammino-terminale (la sequenza segnale) alla membrana del RE. In seguito, avvengono la rimozio-

ripiegamento del polipeptide non rappresenta unicamente una proprietà del polipeptide stesso; al contrario, spesso tale processo di ripiegamento coinvolge proteine accessorie, come le chaperonine, e si verifica durante la traduzione, piuttosto che dopo la fine della sintesi del polipeptide. Circa 20 anni fa, alcuni ricercatori ipotizzarono che le velocità di traduzione delle regioni di alcuni polipeptidi nella cellula influenzassero le modalità di ripiegamento degli stessi. È noto che la velocità di spostamento del ribosoma lungo un particolare mRNA non è costante. Alcune ricerche recenti hanno prodotto risultati che supportano tale ipotesi. I ricercatori hanno studiato due diverse mutazioni silenti nel gene umano MDR1 (gene della resistenza multipla ai farmaci); questo gene codifica per un trasportatore di membrana, definito glicoproteina-P, il quale agisce come una pompa per trasportare fuori della cellula diversi tipi di farmaci. L’entità della sua azione può quindi alterare l’efficacia di particolari terapie farmacologiche, compresi alcuni trattamenti chemioterapici. Tutte le mutazioni silenti sostituiscono un codone che viene letto rapidamente durante la traduzione con uno che viene letto lentamente. Le glicoproteine-P prodotte nelle cellule mutate possedevano strutture diverse rispetto alla proteina selvatica, mostrando, in particolare, alterazioni nei siti di legame di farmaci e di inibitori degli stessi. Pertanto, polipeptidi con la stessa sequenza amminoacidica possono realmente ripiegarsi in modo differente nel corso della loro traduzione, generando polipeptidi con strutture e funzioni diverse. Ciò significa che le mutazioni silenti possono influenzare la progressione di una malattia, nonché le modalità con cui i pazienti rispondono ai trattamenti farmacologici.

ne e la degradazione di questa estensione (Figura 6.21). Per questo lavoro Blobel vinse il Premio Nobel per la Fisiologia o Medicina nel 1999. La sequenza segnale di una proteina destinata al RE consta di circa 15-30 amminoacidi all’estremità N-terminale. Quando la sequenza segnale viene tradotta ed esposta sulla superficie del ribosoma, una particella di riconoscimento del segnale (SRP, un complesso di RNA e proteine) citoplasmatica si lega a essa e blocca l’ulteriore traduzione dell’mRNA finché il complesso polipeptide nascente-SRP-ribosoma-mRNA non raggiunge il RE legandosi a esso (vedi Figura 6.21). La SRP si lega a un recettore SRP nella membrana del RE, promuovendo un forte legame del ribosoma al RE, il rilascio

112 5¢ c

Capitolo 6

ap

Il peptide segnale emerge dal ribosoma e viene legato dalla SRP; la traduzione si blocca

mRNA Ribosoma all’inizio della traduzione

Il peptide segnale viene rimosso dal polipeptide, la cui sintesi continua

La traduzione è completata; le subunità ribosomali stanno per dissociarsi AAA 3¢

Peptide segnale

Particella di riconoscimento del segnale (SRP) a de bran Mem

La SRP si lega al suo recettore; la traduzione riprende indirizzando il polipeptide nel lume del RE

l RE

Peptide segnale

Peptidasi del segnale Recettore SRP

Peptide segnale legato alla peptidasi del segnale Polipeptide completo rilasciato nel RE

Spazio delle cisterne del RE

Figura 6.21 Modello per il trasporto delle proteine all’interno del reticolo endoplasmatico negli eucarioti.

della SRP e la ripresa della traduzione. Il polipeptide nascente si estende attraverso la membrana del reticolo nello spazio delle cisterne. Non appena la sequenza segnale viene a trovarsi interamente all’interno delle cisterne del RE, viene rimossa dal polipeptide dall’enzima peptidasi del segnale. Quando il polipeptide intero si trova completamente all’interno delle cisterne del RE, viene di solito modificato mediante l’aggiunta di specifici gruppi glucidici dando origine a una glicoproteina. Le glicoproteine vengono poi trasferite all’interno di vescicole all’apparato del Golgi, dove avviene la maggior parte del loro smistamento. Le proteine destinate a essere secrete, per esempio, vengono immagazzinate in vescicole secretorie, le quali migrano verso la superficie della cellula, dove si fondono con la membrana plasmatica rilasciando il loro contenuto proteico all’esterno della cellula.

Nota chiave Le proteine eucariote che entrano nel reticolo endoplasmatico possiedono sequenze segnale alla loro estremità N-terminale che le indirizzano in questo organello. La sequenza segnale si lega dapprima a una particella di riconoscimento del segnale (SRP), bloccando la traduzione. Successivamente, il complesso si lega a un recettore SRP presente sulla membrana esterna del RE, la traduzione riprende e il polipeptide viene traslocato nello spazio delle cisterne del RE. Una volta nel RE, la sequenza segnale viene rimossa dalla peptidasi del segnale. Le proteine vengono infine smistate dal complesso di Golgi verso le loro destinazioni finali.

Sommario l Una proteina è formata da una o più subunità definite polipeptidi, ciascuna a sua volta composta da subunità più piccole, gli amminoacidi. Gli amminoacidi di un polipeptide sono uniti insieme mediante legami peptidici. l La sequenza amminoacidica di una proteina (la sua struttura primaria) ne determina la struttura secondaria, terziaria e quaternaria e, nella maggior parte dei casi, lo stato funzionale. l Il codice genetico è un codice a triplette, in cui ciascun codone di tre nucleotidi di un mRNA codifica per un ammi-

noacido o segnala la terminazione della traduzione. Alcuni amminoacidi sono codificati da più di un codone. Tre codoni vengono utilizzati per la terminazione della sintesi del polipeptide nel corso della traduzione. Il codice è pressoché universale e viene letto senza interruzioni lungo codoni successivi non sovrapposti. l L’mRNA viene tradotto in una catena polipeptidica sui ribosomi. Gli amminoacidi necessari per la sintesi del polipeptide giungono al ribosoma su molecole di tRNA. La traduzione della sequenza amminoacidica corretta è garantita

Espressione genica: la traduzione dal legame specifico di ogni amminoacido al suo particolare tRNA e dal legame specifico tra il codone dell’mRNA e l’anticodone complementare del tRNA. l Nei batteri e negli eucarioti AUG (metionina) rappresenta il codone di inizio per l’avvio della traduzione. Nei batteri l’inizio della sintesi proteica richiede una sequenza a monte del codone AUG, a cui si lega la subunità minore del ribosoma. Questo tratto a monte di AUG è la sequenza di ShineDalgarno, che si lega in maniera specifica all’estremità 3′ dell’rRNA 16S della subunità ribosomale minore, determinandone l’associazione con l’mRNA. Negli mRNA eucarioti non esiste alcuna sequenza equivalente dal punto di vista funzionale; i ribosomi vengono invece caricati sull’mRNA a livello dell’estremità 5′ e lo percorrono verso l’estremità 3′, iniziando la traduzione a livello del primo codone AUG. l Sia nei batteri sia negli eucarioti l’inizio della sintesi proteica richiede dei fattori proteici, definiti fattori di inizio (IF). Questi ultimi si legano al complesso mRNA-ribosoma durante la fase di inizio e si dissociano non appena è iniziata la sintesi della catena polipeptidica. l L’allungamento della catena proteica comporta la formazione di un legame peptidico tra l’amminoacido sul tRNA

113

nel sito A del ribosoma e il polipeptide nascente sul tRNA nel sito P adiacente. Una volta formato il legame peptidico, il ribosoma trasloca di un codone lungo l’mRNA preparandosi all’arrivo del tRNA successivo. Il tRNA entrante con il suo amminoacido si lega al codone successivo occupando il sito A. Fattori proteici, denominati fattori di allungamento (EF), svolgono ruoli importanti in questa fase della traduzione. l La traduzione prosegue finché non viene raggiunto un codone di stop (UAG, UAA o UGA) sull’mRNA. Tali codoni vengono letti da fattori proteici di rilascio e il polipeptide viene rilasciato dal ribosoma. Successivamente, gli altri componenti del macchinario di sintesi proteica si dissociano e vengono riciclati in altri eventi di traduzione. l Negli eucarioti le proteine si trovano libere nel citoplasma oppure sono posizionate in diversi compartimenti cellulari, come il nucleo, i mitocondri, i cloroplasti e le vescicole secretorie. Esistono dei meccanismi che smistano le proteine nel compartimento cellulare appropriato. Per esempio, le proteine che devono essere secrete possiedono sequenze segnale N-terminali che facilitano il loro ingresso nel reticolo endoplasmatico al fine del loro smistamento successivo nell’apparato del Golgi e oltre.

Approccio analitico alla soluzione di problemi di genetica D6.1 a. Quanti dei 64 codoni si possono ottenere a partire dai tre nucleotidi A, U e G? b. Quanti dei 64 codoni si possono ottenere a partire dai quattro nucleotidi A, U, G e C, con una o più C in ciascun codone? R6.1 a. Questa domanda si riferisce al calcolo delle probabilità. Ci sono quattro basi, pertanto la probabilità di trovare una citosina nella prima posizione di un codone è 1/4. All’inverso, la probabilità di trovare una base diversa dalla citosina in prima posizione è 1 – 1/4 = 3/4. Le stesse probabilità si applicano per le altre due posizioni nel codone. Pertanto, la probabilità di avere un codone privo di citosina è (3/4)3 = 27/64. b. Questa domanda si riferisce alla frequenza relativa di codoni che possiedono una o più citosine. Abbiamo già calcolato la probabilità che un codone non possieda citosina, pertanto tutti i codoni rimanenti possiedono una o più citosine. La risposta a questa domanda è quindi (1 – 27/64) = 37/64. D6.2 In alcuni degli esperimenti volti a decifrare il codice genetico si utilizzarono dei copolimeri casuali. Per ognuna delle seguenti miscele di ribonucleotidi, indicate i codoni attesi e le relative frequenze e fornite le proporzioni attese di amminoacidi che si troverebbero in un polipeptide la cui sintesi fosse diretta dal copolimero in un sistema di sintesi proteica cell-free. a. 2 U : 1 C b. 1 U : 1 C : 2 G

R6.2 a. La probabilità di trovare una U in ogni posizione del codone è 2/3, e la probabilità di trovare una C è 1/3. Perciò, i codoni, le loro frequenze relative e gli amminoacidi per cui codificano sono: UUU UUC UCC UCU CUU CUC CCU CCC

= = = = = = = =

(2/3)(2/3)(2/3) (2/3)(2/3)(1/3) (2/3)(1/3)(1/3) (2/3)(1/3)(2/3) (1/3)(2/3)(2/3) (1/3)(2/3)(1/3) (1/3)(1/3)(2/3) (1/3)(1/3)(1/3)

= = = = = = = =

8/27 4/27 2/27 4/27 4/27 2/27 2/27 1/27

= = = = = = = =

0,296 = 0,148 = 0,0741 = 0,148 = 0,148 = 0,0741 = 0,0741 = 0,037 =

29,6% Phe 14,8% Phe 7,41% Ser 14,8% Ser 14,8% Leu 7,41% Leu 7,41% Pro 3,7% Pro

In totale, 44,4% Phe, 22,21% Ser, 22,21% Leu, 11,11% Pro. (Il totale non è esattamente 100 a causa degli errori di arrotondamento.) b. La probabilità di trovare una U in ogni posizione del codone è 1/4, la probabilità di trovare una C è 1/4 e la probabilità di trovare una G è 1/2. Pertanto, i codoni, le loro frequenze relative e gli amminoacidi per cui codificano sono: UUU UUC UCU UCC CUU CUC CCU CCC UUG

= = = = = = = = =

(1/4)(1/4)(1/4) (1/4)(1/4)(1/4) (1/4)(1/4)(1/4) (1/4)(1/4)(1/4) (1/4)(1/4)(1/4) (1/4)(1/4)(1/4) (1/4)(1/4)(1/4) (1/4)(1/4)(1/4) (1/4)(1/4)(1/2)

= = = = = = = = =

1/64 1/64 1/64 1/64 1/64 1/64 1/64 1/64 2/64

= = = = = = = = =

1,56% Phe 1,56% Phe 1,56% Ser 1,56% Ser 1,56% Leu 1,56% Leu 1,56% Pro 1,56% Pro 3,13% Leu

114

Capitolo 6 UGU UGG GUU GUG GGU GGG CCG CGC CGG GCC GCG

= = = = = = = = = = =

(1/4)(1/2)(1/4) (1/4)(1/2)(1/2) (1/2)(1/4)(1/4) (1/2)(1/4)(1/2) (1/2)(1/2)(1/4) (1/2)(1/2)(1/2) (1/4)(1/4)(1/2) (1/4)(1/2)(1/4) (1/4)(1/2)(1/2) (1/2)(1/4)(1/4) (1/2)(1/4)(1/2)

= = = = = = = = = = =

2/64 4/64 2/64 4/64 4/64 8/64 2/64 2/64 4/64 2/64 4/64

= = = = = = = = = = =

3,13% Cys 6,25% Trp 3,13% Val 6,25% Val 6,25% Gly 12,5% Gly 3,13% Pro 3,13% Arg 6,25% Arg 3,13% Ala 6,25% Ala

GGC UCG UGC CUG CGU GUC GCU

= = = = = = =

(1/2)(1/2)(1/4) (1/4)(1/4)(1/2) (1/4)(1/2)(1/4) (1/4)(1/4)(1/2) (1/4)(1/2)(1/4) (1/2)(1/4)(1/4) (1/2)(1/4)(1/4)

= = = = = = =

4/64 2/64 2/64 2/64 2/64 2/64 2/64

= = = = = = =

6,25% Gly 3,13% Ser 3,13% Cys 3,13% Leu 3,13% Arg 3,13% Val 3,13% Ala

In totale, 3,12% Phe, 6,25% Ser, 9,38% Leu, 6,25% Pro, 6,26% Cys, 6,25% Trp, 12,51% Val, 25% Gly, 12,51% Arg, 12,51% Ala.

Mutazione, riparazione del DNA ed elementi trasponibili

7

La variazione genetica è il risultato di adattamento o di mutazione casuale?

Come avviene la riparazione del DNA?

Qual è l’effetto delle mutazioni sulla struttura e sulla funzione dei polipeptidi?

Che cosa sono gli elementi trasponibili?

Come possono revertire le mutazioni?

In che modo gli elementi trasponibili si muovono nel genoma?

Come si possono indurre mutazioni nel DNA?

Quali elementi trasponibili si trovano nei batteri?

Come possono essere individuati potenziali mutageni?

Quali elementi trasponibili si trovano negli eucarioti?

Come possono essere riconosciuti i mutanti?

Attività Una mutazione in un gene può provocare un cambiamento in un fenotipo. Quali tipi di mutazioni si possono verificare nel nostro DNA? E quali effetti possono avere sulla salute? Nella prima iAttività di questo capitolo analizzerete i possibili rischi per la salute di mutazioni indotte dalla contaminazione delle acque. In una seconda iAttività osserverete un altro modo in cui il DNA può modificarsi. Negli anni quaranta del secolo scorso, Barbara McClintock scoprì che i “geni saltatori”, o elementi trasponibili, possono dare origine a mutazioni geniche, alterare l’espressione genica e produrre diversi tipi di mutazioni cromosomiche. In questa iAttività, avrete l’opportunità di esplorare ulteriormente come un elemento trasponibile di E. coli si muova da un sito a un altro.

Il DNA può essere modificato in diversi modi, per cambiamenti spontanei, errori nella replicazione, o azione delle radiazioni o di particolari sostanze chimiche. A seconda della lunghezza del tratto di DNA oggetto di mutazione si parla di mutazioni puntiformi o cromosomiche. Le mutazioni puntiformi sono cambiamenti che riguardano solo una o poche coppie di basi; le mutazioni cromosomiche coinvolgono interi cromosomi o loro porzioni. Quando le mutazioni coinvolgono interi genomi, quindi implicano variazioni nell’intero assetto cro-

mosomico, si parla di mutazioni genomiche. In questo capitolo tratteremo le mutazioni puntiformi, mentre le altre mutazioni saranno descritte nel Capitolo 16. Una mutazione puntiforme può cambiare il fenotipo dell’organismo colpito se si verifica nella regione codificante di un gene o nelle sequenze che lo regolano. Quindi, le mutazioni puntiformi che hanno rivestito una particolare importanza per i genetisti sono le mutazioni geniche, che hanno effetti sulla funzione dei geni. Una mutazione genica può alterare il fenotipo cambiando la funzione di una proteina, come illustrato nella Figura 7.1. In questo capitolo esamineremo alcuni meccanismi che causano mutazioni puntiformi, alcuni sistemi di riparazione del danno genetico e alcuni metodi utilizzati per rilevare mutanti genetici. Nello studio delle specifiche mutazioni puntiformi occorre tener presente che le mutazioni sono la principale fonte di variabilità genetica in una specie, e quindi sono elementi importanti nel processo evolutivo. Cambiamenti genetici possono anche avvenire quando particolari elementi genetici presenti nei cromosomi dei procarioti e degli eucarioti si muovono da una posizione a un’altra nel genoma. Questi elementi genetici mobili sono noti come elementi trasponibili, poiché il termine riflette gli eventi di trasposizione (cambiamento di posizione) associati a questi elementi. La loro scoperta fu una grande sorpresa che modificava la visione classica dei geni e dei genomi e introduceva un nuovo feno-

116

Capitolo 7 Gene normale

DNA

Evento mutazionale

Prodotto genico normale

Fenotipo normale

Prodotto genico anormale (parzialmente funzionante o non funzionante) o assente

Fenotipo alterato

Trascrizione e traduzione

Gene mutato

meno da prendere in considerazione nella formulazione di teorie sull’evoluzione dei genomi. In questo capitolo analizzeremo la natura degli elementi trasponibili e come essi si spostano nel genoma.

Mutazione del DNA Adattamento versus selezione Nella prima parte del XX secolo esistevano due scuole di pensiero opposte a proposito della variazione dei caratteri ereditari. Alcuni genetisti credevano che la variabilità tra gli organismi fosse dovuta a mutazioni spontanee e casuali che alcune volte avevano carattere adattativo. Altri credevano invece che la variabilità fosse conseguente ad adattamento, cioè che l’ambiente inducesse un cambiamento ereditabile. La teoria dell’adattamento si ricollega alla teoria lamarckiana, che prevede l’ereditabilità dei caratteri acquisiti. Alcune osservazioni ottenute in esperimenti con i batteri diedero vigore al dibattito. Per esempio, se una coltura derivata da una singola cellula di E. coli viene piastrata in presenza di una grande quantità di batteriofago T1 virulento, la maggior parte delle cellule verrà lisata. Tuttavia, poche cellule sopravviveranno e daranno origine a colonie resistenti al fago T1. Il carattere della resistenza è ereditabile. I sostenitori della teoria dell’adattamento ritenevano che il carattere della resistenza fosse comparso come conseguenza della presenza del fago T1 nell’ambiente. Quelli della teoria della mutazione spontanea sostenevano che le mutazioni avvengono casualmente, cosicché, in una popolazione di cellule sufficientemente ampia, in ogni momento alcune cellule andrebbero incontro a mutazione diventando, per esempio, resistenti al fago T1, pur non essendone mai state in contatto. Quindi, se in un momento successivo venisse aggiunto il fago, verrebbe operata una selezione delle cellule resistenti a T1. L’acquisizione della resistenza a T1 venne utilizzata da Salvador Luria e Max Delbrück nel 1943 per determinare quale, fra il meccanismo della mutazione spontanea e quello dell’adattamento, fosse corretto. Il test da essi ideato è noto come test di fluttuazione. Consideriamo una popolazione di E. coli originatasi per divisione da un’unica cellula (Figura 7.2). Assumiamo che il fago T1 venga aggiunto dopo 4 generazioni, quando vi sono 16 cellule (nell’esperimento reale il numero delle cellule era

Figura 7.1 Concetto di mutazione nella regione di un gene che codifica per una proteina. (Si noti che non tutte le mutazioni causano un’alterazione delle proteine e non tutte le mutazioni avvengono nella regione codificante.)

molto più alto). Se la teoria dell’adattamento fosse corretta, una certa frazione delle cellule della quarta generazione sarebbe indotta in quel momento a diventare resistente a T1 (Figura 7.2a). Di particolare importanza è il fatto che quella frazione sarebbe identica per tutte le colture dello stesso tipo, perché l’adattamento non ha inizio prima dell’aggiunta del fago T1. Al contrario, se fosse corretta la teoria della mutazione spontanea, il numero di cellule della quarta generazione resistenti al fago T1 dipenderebbe da quando è comparsa nella coltura una mutazione casuale che conferisce resistenza a T1. Nel nostro esempio, se l’evento mutazionale è avvenuto nella terza generazione, 2 cellule su 16 della quarta generazione saranno resistenti (Figura 7.2b); se invece la mutazione è avvenuta nella prima generazione, saranno resistenti 8 cellule su 16 della quarta generazione (Figura 7.2b). Il concetto base è che, se la teoria della mutazione spontanea è corretta, dovrebbe esserci una fluttuazione nel numero di cellule resistenti a T1 in quarta generazione, perché la mutazione verso la resistenza a T1 è avvenuta casualmente nella popolazione e non necessita del contatto con il fago. Luria e Delbrück dimostrarono una larga variabilità nel numero di colonie resistenti al fago ottenute in identiche colture. Questi risultati sostenevano l’ipotesi secondo cui il meccanismo di mutazione era di tipo casuale e non adattativo.

Nota chiave Le mutazioni possono dare origine a variazioni dei caratteri ereditabili. La variabilità genetica non è un effetto dell’adattamento indotto dall’ambiente, ma origina da mutazioni casuali e spontanee che l’ambiente seleziona.

Definizione delle mutazioni Una mutazione è un’alterazione della sequenza di basi nel DNA. Una cellula con una mutazione è una cellula mutante. Se una mutazione avviene in una cellula somatica (negli organismi pluricellulari), si tratta di una mutazione somatica – quindi, le caratteristiche mutanti si mani-

Mutazione, riparazione del DNA ed elementi trasponibili a)

Tempo

Aggiunta del fago T1 b)

Tempo

Aggiunta del fago T1

Generazione

Generazione

0

0

1

1

2

2

3

3

4

4

Generazione

Generazione

0

0

1

1

2

2

3

3

4

4

Figura 7.2 Rappresentazione di una popolazione in divisione di E. coli selvatico, sensibile al fago T1. Alla quarta generazione viene aggiunto il fago T1. (a) Se la teoria dell’adattamento fosse corretta, le cellule muterebbero solo con l’aggiunta del fago T1, quindi la frazione di cellule resistenti nelle colture duplicate sarebbe la stessa. (b) Se fosse corretta la teoria della mutazione casuale, le cellule muterebbero indipendentemente

festano solo nell’individuo in cui è avvenuta la mutazione, ma non vengono trasmesse alla generazione successiva. Al contrario, una mutazione nella linea germinale di organismi che si riproducono sessualmente – una mutazione della linea germinale – può essere trasmessa attraverso i gameti alla generazione successiva, dando origine a un individuo mutato sia nelle cellule somatiche sia nelle germinali. Due diversi termini vengono utilizzati per dare una misura quantitativa dell’occorrenza di mutazioni. Il tasso di mutazione è la probabilità che si verifichi un particolare tipo di mutazione in funzione del tempo, come il numero di mutazioni per coppia di nucleotidi per generazione, o il numero per gene per generazione. La frequenza di mutazione è il numero di casi di un particolare tipo di mutazione, espresso come proporzione di cellule o di individui nella popolazione, come il numero di mutazioni per 100 000 organismi o il numero per 1 milione di gameti. Tipi di mutazioni puntiformi Le mutazioni puntiformi possono essere divise in due grandi categorie: le sostituzioni di coppie di basi e le inserzioni o delezioni di coppie di basi. Una mutazione per sostituzione di una coppia di basi è un cambiamento nel DNA tale che una coppia di basi viene rimpiazzata da un’altra. Vi sono due tipi di tali sostituzioni. Una mutazione per transizione (Figura 7.3a) è una mutazione che sostituisce una coppia di basi purina-pirimidina con un’altra coppia

117

dalla presenza del fago T1 e quindi la frazione di cellule resistenti sarebbe diversa nelle colture duplicate. A sinistra: se una cellula muta diventando resistente al fago T1 nella terza generazione, 2 cellule su 16 della quarta generazione saranno resistenti al fago. A destra: se una cellula diventa resistente al fago T1 nella prima generazione, 8 cellule su 16 della quarta generazione saranno resistenti a T1.

purina-pirimidina, per esempio A-T con G-C. In particolare, ciò significa che la purina in un filamento di DNA (A nell’esempio) è sostituita da un’altra purina, mentre la pirimidina sul filamento complementare (T, la base appaiata ad A) è scambiata con un’altra pirimidina. Una mutazione per transversione (Figura 7.3b) è una mutazione che sostituisce una coppia purina-pirimidina con una coppia pirimidina-purina, come G-C con C-G o A-T con C-G. Nello specifico, questo significa che la purina su un filamento di DNA (A nel secondo esempio) è sostituita da una pirimidina (C), mentre la pirimidina sul filamento complementare (T, la base appaiata ad A) è cambiata in una purina (G) in grado di appaiarsi con la pirimidina alterata. Le mutazioni per sostituzione di una coppia di basi in geni codificanti per una proteina possono essere definite a seconda dell’effetto che hanno sulla sequenza di amminoacidi. A seconda di come la base sostituita viene tradotta secondo il codice genetico, la mutazione potrà avere effetti che vanno da nessun cambiamento nella proteina, a un cambiamento poco rilevante, a uno con conseguenze gravi. Una mutazione missenso (Figura 7.3c) è una mutazione genica nella quale una sostituzione di una coppia di basi nel DNA causa un cambiamento nel codone dell’mRNA, con il risultato che nel polipeptide viene inserito un amminoacido differente. Il fenotipo potrà cambiare o meno a seconda del tipo di amminoacido inserito. Nella Figura 7.3c, una transizione da A-T a G-C cambia

118

Capitolo 7 Sequenza di parte di un gene normale

a) DNA

b)

Mutazione per transizione (da A-T a G-C in questo esempio) 5¢ 3¢

3¢ 5¢

T C T C A A A A A T T T A CG AGAG T T T T T A A A T GC

5¢ 3¢

3¢ 5¢

T C T C A AGA A T T T A CG AGAG T T C T T A A A T GC

Mutazione per transversione (da C-G a G-C in questo esempio) 5¢ 3¢

c)

Sequenza di un gene mutato

3¢ 5¢

T C T C A A A A A T T T A CG AGAG T T T T T A A A T GC

5¢ 3¢

3¢ 5¢

T C T GA A A A A T T T A CG AGA C T T T T T A A A T GC

Mutazione missenso (sostituzione di un amminoacido con un altro; qui una transizione da A-T a G-C cambia il codone per la lisina in quello per l’acido glutammico) 5¢ 3¢

T C T C A A A A A T T T A CG AGAG T T T T T A A A T GC

3¢ 5¢

5¢ 3¢

T C T C A AGA A T T T A CG AGAG T T C T T A A A T GC

3¢ 5¢

mRNA 5′

UCUCAAAAAUUUACG

3′

5′

UCUCAAGAAUUUACG

3′

DNA

Proteina

...

Ser

Gln

Lys Phe Thr

...

...

Ser

Gln Glu Phe Thr

Figura 7.3 Tipi di mutazioni per sostituzione di una coppia di basi. La trascrizione del segmento mostrato produce un mRNA con sequenza 5’…UCUCAAAAAUUUACG…3’, che codifica per …-Ser-Gln-LysPhe-Thr-…

...

o UGA). Per esempio, nella Figura 7.3d, una transversione da A-T a T-A cambia il DNA da 5′-AAA-3′ a 3′-TTT-5′

5′-TAA-3′ , 3′-ATT-5′

e

ciò modifica il codone dell’mRNA da 5′-AAA-3′ (lisina) a d) Mutazione nonsenso (sostituzione di un amminoacido con un codone di stop; qui una mutazione per transversione da A-T a T-A cambia il codone per la lisina 5′-UAA-3′, che è un codone di nel codone di stop UAA) stop. Una mutazione nonsenso dà 5¢ 3¢ 5¢ 3¢ T C T C A A A A A T T T A CG T C T C A A T A A T T T A CG origine alla terminazione premaAGAG T T T T T A A A T GC AGAG T T A T T A A A T GC 3¢ 5¢ 3¢ 5¢ tura della catena polipeptidica, UCUCAAAAAUUUACG UCUCAAUAAUUUACG 5′ 5′ 3′ 3′ quindi, invece del prodotto com... Ser Gln Lys Phe Thr ... ... Ser Gln Stop pleto, verrà rilasciato dai ribosomi un frammento troncato del polie) Mutazione neutra (sostituzione di un amminoacido con un altro con proprietà chimiche simili; qui una mutazione per transizione da A-T a G-C cambia il codone peptide, spesso non funzionale, per la lisina in uno per l’arginina) (Figura 7.4). 5¢ 3¢ 5¢ 3¢ T C T C A A A A A T T T A CG T C T C A A AGA T T T A CG Una mutazione neutra (FiguAGAG T T T T T A A A T GC AGAG T T T C T A A A T GC 3¢ 5¢ 3¢ 5¢ ra 7.3e) è una sostituzione di una UCUCAAAAAUUUACG UCUCAAAGAUUUACG 5′ 5′ 3′ 3′ coppia di basi in un gene che cam... Ser Gln Arg Phe Thr ... ... Ser Gln Lys Phe Thr ... bia un codone nelnimazione f) Mutazione silente (cambiamento nel codone che non comporta un cambiamento l’mRNA, dell’amminoacido; qui una mutazione da A-T a G-C in terza posizione del codone Mutazioni forma un codone che codifica ancora per la lisina) ma l’amminonsenso 5¢ 3¢ 5¢ 3¢ T C T C A A A A A T T T A CG T C T C A A A AG T T T A CG noacido riAGAG T T T T T A A A T GC AGAG T T T T C A A A T GC e mutazioni 3¢ 5¢ 3¢ 5¢ sultante non UCUCAAAAAUUUACG UCUCAAAAGUUUACG nonsenso 5′ 5′ 3′ 3′ determina ... Ser Gln Lys Phe Thr ... ... Ser Gln Lys Phe Thr ... di tipo alcuna altesoppressore razione nelg) Mutazione frameshift (inserzione o delezione di una o più coppie di basi che la funzione alterano la fase di lettura; qui l’inserzione di una coppia di basi G-C scombina il messaggio a valle della glutammina) della proteina prodotta. Una mutazione neutra è un tipo di mutazio5¢ 5¢ 3¢ T C T C A A A A A T T T A CG T C T C A A G A A A T T T A C G 3¢ AGAG T T T T T A A A T GC A G A G T T C T T T A A A T G C 5¢ 3¢ 3¢ 5¢ ne missenso, nella quale il codone UCUCAAAAAUUUACG U C U C A A G A A A U U U A C G 3′ 5′ 5′ 3′ mutato codifica per un amminoa... Ser Gln Lys Phe Thr ... ... Ser Gln Glu Ile Tyr ... cido diverso, ma chimicamente equivalente a quello originario. Nella Figura 7.3e, una transizione da A-T a G-C 5′-AAA-3′ 5′-GAA-3′ il DNA da , cambiando una cambia un codone da 5′-AAA-3′ (lisina) a 5′-AGA-3′ a 3′-CTT-5′ 3′-TTT-5′ (arginina). Dato che arginina e lisina hanno proprietà base del codone dell’mRNA da una purina all’altra. In simili – entrambi sono amminoacidi basici – la funzioquesto caso il codone dell’mRNA varia da 5′-AAA-3′ ne della proteina può non essere alterata in modo significativo. (lisina) a 5′-GAA-3′ (acido glutammico). Una mutazione silente (Figura 7.3f) – nota anche Una mutazione nonsenso (Figura 7.3d) è una mutazione genica nella quale un cambiamento in una cop- come mutazione sinonima – è una mutazione che cambia pia di basi altera un codone di mRNA per un ammi- una coppia di basi in un gene, ma il codone alterato noacido in un codone di stop (nonsenso: UAG, UAA nell’mRNA codifica per lo stesso amminoacido nella

MyLab

Mutazione, riparazione del DNA ed elementi trasponibili Gene normale che codifica per una proteina Filamento stampo di DNA

3′

GGA TTC

mRNA

Gene mutato

Evento mutazionale 5′ 3′

5′

5′

GGA ATC

Trascrizione e traduzione

5'

119

Trascrizione e traduzione

5'

5'

GGA UUC CCU AAG

3′

GGA CCU UAG

mRNA 5′

Codone senso

Fattore di rilascio 3′ Codone alterato nonsenso

La traduzione si interrompe prematuramente

La traduzione prosegue

Si forma un polipeptide incompleto Si forma un polipeptide completo

Figura 7.4 Mutazione nonsenso e sue conseguenze sulla traduzione.

proteina. La proteina in questo caso è ovviamente identica a quella selvatica. Per esempio, nella Figura 7.3f, una mutazione silente è causata dalla transizione da A-T a GC che cambia il codone 5′-AAA-3′ in 5′-AAG-3′, entrambi codificanti per la lisina. Le mutazioni silenti avvengono spesso attraverso cambiamenti a carico della terza posizione – oscillante – di un codone. Ciò è comprensibile alla luce del fenomeno noto come degenerazione del codice genetico (vedi Figura 6.7 e Capitolo 6). Se una o più coppie di basi vengono aggiunte o delete da un gene che codifica per una proteina, la fase di lettura dell’mRNA risulterà cambiata dal punto della mutazione in poi. Per esempio, l’aggiunta o la delezione di una coppia di basi fanno slittare la fase di lettura della regione a valle dell’mRNA di una base, cosicché vengono incorporati nel polipeptide amminoacidi sbagliati dal punto della mutazione in poi. Questo tipo di mutazione, detto mutazione frameshift o scivolamento della cornice di lettura (Figura 7.3g), di solito rende non funzionale la proteina. Spesso, le mutazioni frameshift generano nuovi codoni di stop, che daranno origine a una proteina troncata; in alternativa possono far continuare la sintesi oltre il normale codone di stop, dando origine a un polipeptide più lungo del normale; oppure possono determinare un’alterazione significativa della sequenza di amminoacidi di un polipeptide. Nella Figura 7.3g, l’inserzione di una coppia di basi G-C altera il messaggio a valle del codone che specifica la glutammina. Dato che ogni codone consiste di tre basi, lo scivolamento della cornice di lettura origina dall’inserzione o dalla delezione di un numero di basi nel DNA non divisibile per tre. Se la delezione o l’inserzione riguardano una o più triplette nel

DNA, non ci sarà frameshift ma la delezione o l’inserzione del numero corrispondente di amminoacidi. Le mutazioni frameshift sono state uno degli elementi che hanno permesso di determinare che il codice genetico è basato su triplette (Capitolo 6). In conclusione, le mutazioni sono classificate sulla base dell’effetto sul DNA (puntiformi o cromosomiche, sostituzione o inserzione/delezione, transizione o transversione) o sulla proteina codificata (nonsenso, missenso, neutra, silente e frameshift). Le mutazioni possono essere classificate anche sulla base della causa di insorgenza (spontanee o indotte), come vedremo più avanti.

Nota chiave La mutazione è il processo che altera la sequenza di coppie di basi in una molecola di DNA. Le mutazioni che alterano una singola coppia di basi del DNA vengono chiamate mutazioni per sostituzione di basi. Mutazioni per sostituzione di basi e inserzioni/delezioni di una singola coppia di basi vengono definite mutazioni puntiformi. Le mutazioni che interessano la sequenza dei geni sono dette mutazioni geniche.

Reversioni e mutazioni di tipo soppressore Le mutazioni puntiformi possono essere divise in due classi in base ai loro effetti sul fenotipo: (1) le mutazioni in avanti causano un cambiamento dal gene selvatico al mutante; (2) le mutazioni per reversione (note anche come reversioni o mutazioni di ritorno) determinano

120

Capitolo 7

una modifica di un gene mutato agendo nello stesso sito della prima mutazione cosicché la sua funzione ritorna quella del gene selvatico. La reversione di una mutazione nonsenso, per esempio, avviene quando un cambiamento di una coppia di basi in corrispondenza di un codone nonsenso nell’mRNA ne ripristina uno che può nuovamente codificare per un amminoacido. Se la reversione riporta alla codifica dell’amminoacido originale presente nel selvatico, la mutazione è una vera reversione. Se la reversione porta alla codifica di un amminoacido diverso, la mutazione è una reversione parziale, che può però restaurare parzialmente o completamente la funzionalità della proteina. La reversione di mutazioni missenso può avvenire nello stesso modo. Gli effetti di una mutazione possono essere ridotti o aboliti da una mutazione di tipo soppressore, che è una mutazione in un sito diverso da quello della mutazione originaria. La mutazione di tipo soppressore maschera o compensa gli effetti della prima mutazione, ma non la fa revertire. Le mutazioni di tipo soppressore possono avvenire all’interno dello stesso gene nel quale si trova la prima mutazione ma in un sito diverso (soppressori intragenici), oppure in un gene diverso (soppressori intergenici). Sia i soppressori intragenici sia quelli intergenici agiscono riducendo o eliminando l’effetto deleterio della mutazione originale. Tuttavia, il meccanismo di azione dei due tipi di soppressori è completamente diverso. I soppressori intragenici agiscono alterando un diverso nucleotide all’interno dello stesso codone nel quale è avvenuta la mutazione originale, oppure alterando un nucleotide in un differente codone. Un esempio del secondo caso è la soppressione di una mutazione frameshift per inserzione di una coppia di basi mediante una delezione di una coppia di basi nelle vicinanze (vedi Capitolo 6; Figura 6.5). La soppressione intergenica avviene come risultato di una seconda mutazione in un gene diverso. I geni che causano la soppressione di mutazioni in altri geni vengono chiamati geni soppressori. Per esempio, nel caso dei soppressori di mutazioni nonsenso, specifici geni codificanti per tRNA mutano in modo che i loro anticodoni riconoscano come codificante per un amminoacido anche un codone di stop nell’mRNA. Di conseguenza, invece di terminare precocemente la sintesi della catena polipeptidica in corrispondenza del codone nonsenso, il tRNA alterato (soppressore) inserisce un amminoacido in quella posizione e questo amminoacido può riportare alla funzionalità totale o parziale del polipeptide. Questo processo di soppressione non è molto efficiente, ma lo è a sufficienza per produrre una quantità di polipeptide funzionale e far revertire, almeno parzialmente, il fenotipo. Vi sono tre classi di soppressori nonsenso, una per ogni tipo di codone di stop UAG, UAA e UGA. Se, per

esempio, un gene per un tRNA per la tirosina (che ha l’anticodone 3′-AUG-5′) muta cosicché il tRNA abbia l’anticodone 3′-AUC-5′, il tRNA mutato (che continua a portare tirosina) leggerà il codone nonsenso 5′-UAG-3′. Così, anziché terminare la traduzione, verrà inserita una tirosina in quel punto della proteina (Figura 7.5). Tuttavia si pone un problema: se la mutazione del gene codificante per lo specifico tRNA per la tirosina fa sì che il suo anticodone sia complementare a un codone nonsenso, esso non potrà leggere il codone originale, specifico per l’amminoacido che trasporta. La soluzione di questo problema viene dalla scoperta che i tRNA soppressori di nonsenso vengono prodotti di solito per mutazione in geni di tRNA che sono ridondanti nel genoma. In altre parole, due o più geni diversi codificano tutti per la stessa specie di tRNA per la tirosina. Se avviene una mutazione in uno di questi geni ridondanti, gli altri geni che specificano lo stesso tRNA continuano a produrre molecole che interpretano il normale codone per la tirosina.

Nota chiave Le reversioni sono mutazioni che avvengono nel medesimo sito di una mutazione originale e determinano il cambiamento del genotipo da mutante a selvatico. Una mutazione di tipo soppressore è una mutazione in un secondo sito che ristabilisce completamente o parzialmente la funzione che era stata alterata dalla prima mutazione. I soppressori intragenici sono mutazioni di tipo soppressore che avvengono all’interno dello stesso gene nel quale era avvenuta la prima mutazione, ma in un sito differente. I soppressori intergenici sono mutazioni di tipo soppressore che avvengono in un gene soppressore – cioè un gene diverso da quello nel quale era avvenuta la mutazione originaria.

Mutazioni spontanee o indotte La mutagenesi, il processo responsabile della creazione di mutazioni, può avvenire spontaneamente o essere indotta. Le mutazioni spontanee avvengono naturalmente. Le mutazioni indotte avvengono quando un organismo è esposto deliberatamente o casualmente ad agenti fisici o chimici, noti come mutageni, che interagiscono con il DNA causando mutazioni. Le mutazioni indotte avvengono di solito con frequenza molto maggiore delle mutazioni spontanee e perciò si sono dimostrate molto utili negli studi di genetica. Mutazioni spontanee Tutti i tipi di mutazioni puntiformi possono avvenire spontaneamente. Le mutazioni

Mutazione, riparazione del DNA ed elementi trasponibili Gene normale che codifica per una proteina Filamento 3′ stampo di DNA

Evento mutazionale 5′ 3′

GGA TTC

Gene mutato

Trascrizione e traduzione dell’mRNA con il codone nonsenso

Lys

mRNA

5′

Tyr

5′

GGA UUC CCU AAG

5′

GGA ATC

Trascrizione e traduzione

5′

121

5′

3′

mRNA

5′

5′

G G A AU C CCU UAG

Anticodone alterato dalla mutazione nel gene per il tRNA 3′ Codone alterato in codone nonsenso

Codone senso La traduzione prosegue

Non vi è terminazione precoce della traduzione

Si forma un polipeptide completo

Viene sintetizzato un polipeptide completo con un amminoacido non corretto

Figura 7.5 Meccanismo di azione di un soppressore intergenico di mutazione nonsenso, dovuto a mutazione in un gene per un tRNA. In questo esempio, un gene per un tRNA.Tyr, mutato in modo

spontanee possono avvenire durante la replicazione del DNA o nelle altre fasi della crescita e della divisione cellulare. Le mutazioni spontanee possono anche essere causate da movimenti di elementi genetici trasponibili, argomento che verrà trattato più oltre in questo capitolo. Nell’uomo, il tasso di mutazione spontanea di geni singoli varia tra 10–4 e 4 × 10–6 per gene per generazione. Per gli eucarioti in generale, il tasso di mutazione spontanea è compreso tra 10–4 e 10–6 per gene per generazione, e per i batteri e i fagi il tasso è compreso tra 10–5 e 10–7 per gene per generazione. (Le frequenze di mutazioni spontanee in loci specifici per diversi organismi sono riportate in Tabella 21.6). Questi valori di tassi e frequenza di mutazione si riferiscono alle mutazioni che si fissano nel DNA, cioè divengono ereditabili. La maggior parte degli errori che avvengono spontaneamente è corretta dai sistemi di riparazione del DNA, che verranno trattati più oltre in questo capitolo. Solo pochi rimangono non corretti, come cambiamenti permanenti. Errori nella replicazione del DNA Le mutazioni per sostituzione di coppie di basi – cioè le mutazioni puntiformi che implicano cambiamenti da una coppia di basi a un’altra – possono avvenire se si verifica un appaiamento errato durante la replicazione del DNA. Chimicamente, ogni base può esistere in stati alternativi, detti tautomeri. Quando una base cambia stato si dice che ha cambiato forma tautomerica. Nel DNA, la forma usuale di ogni base è quella chetonica, che è responsabile del

che l’anticodone del tRNA vari da 3’-AUG-5’ a 3’-AUC-5’, può leggere un codone nonsenso UAG, inserendo tirosina nella posizione corrispondente del polipeptide.

normale appaiamento, secondo Watson e Crick, di T con A e C con G (Figura 7.6a). Tuttavia, un appaiamento errato può avvenire se la base si trova in una forma tautomerica rara, detta enolica. Le Figure 7.6b e 7.6c mostrano gli appaiamenti errati causati da purine o da pirimidine nello stato tautomerico raro. La Figura 7.7 illustra come una mutazione può essere conseguenza di un appaiamento errato derivante dalla transizione di una base a un suo raro stato tautomerico. In questo esempio, la forma tautomerica rara della T forma un appaiamento errato con la G del filamento complementare del DNA. Se l’appaiamento errato non viene riparato, una mutazione per transizione da G-C ad A-T avrà luogo nel successivo ciclo di replicazione. Durante la replicazione possono avvenire spontaneamente piccole inserzioni e delezioni (Figura 7.8). Queste possono aver luogo a causa di un anomalo avvolgimento che interessa o lo stampo di DNA o il filamento in crescita, generalmente in regioni dove vi sono sequenze formate da una base ripetuta. Se l’ostacolo si trova sullo stampo, la DNA polimerasi salta la o le basi interessate, e ciò causerà una mutazione per delezione. Se la DNA polimerasi sintetizza una o più basi che non sono presenti sullo stampo, questo nuovo DNA ridondante rappresenterà un’inserzione. Se avvengono nella regione codificante di un gene strutturale, queste inserzioni o delezioni nel DNA daranno luogo a mutazioni frameshift, a meno che le basi inserite o delete siano 3 o un suo multiplo.

122

Capitolo 7 Figura 7.6 Appaiamenti delle basi nel DNA che seguono o non seguono la regola di Watson e Crick.

a) Normale appaiamento secondo Watson e Crick tra le forme normali delle pirimidine e delle purine H

H CH3

T

H

O H

N

N H

N

H

N N

A

N

N

dR

O

N H

N

N N

G

N

dR

N

dR

H

O

C

H

dR

N H

O H

N H

b) Appaiamento che non segue la regola di Watson e Crick tra pirimidine normali e forme rare delle purine H

H

T

H

H

O

N H

N

O

CH3

H

N N

G

N dR

O

H

N

N

C N H N

H

dR

N

N H

N

dR

N

dR

N

N

A

O

H

H

Timina normale

Rara forma enolica della guanina

Citosina normale

Rara forma imminica dell’adenina

c) Appaiamento che non segue la regola di Watson e Crick tra forme rare delle pirimidine e purine normali H

H

C

H

H

N

N H

N

N

H

N

A

N dR

CH3

N

N O

T

H

dR

H

O

N H

N

O

N

N dR

H

N

G

dR

N O

H

N H

Rara forma imminica della citosina

a)

Adenina normale

Rara forma enolica della timina

Guanina normale

b)

c)

d)

La guanina si appaia con la T

Appaiamento errato G-T dopo la replicazione

Transizione da G-C ad A-T dopo un’ulteriore replicazione

AC TG

ACGT C TGT AG

ACA TC Mutante TGT AG Replicazione del DNA

TC G AG C

3¢ Replicazione del DNA ACGT C TGCAG 3¢ 5¢ DNA parentale 5¢

G T AT C G

ACGT C T G C A G Selvatico

Figura 7.7 Produzione di una mutazione causata da appaiamento errato conseguente a un’eccezione alla regola di Watson e Crick. I dettagli sono spiegati nel testo.

A CGT C T GCAG Prima generazione della progenie

ACGT C Selvatico TGCAG ACGT C T G C A G Selvatico Seconda generazione della progenie

Gli errori della replicazione possono essere riparati dai sistemi di correzione degli appaiamenti errati (che prenderemo in esame più oltre in questo capitolo). Cambiamenti chimici spontanei La depurinazione e la deamminazione di particolari basi sono due dei più comuni eventi chimici che producono mutazioni spontanee. Nella depurinazione una purina viene rimossa dal

DNA, attraverso la rottura del legame che la lega al desossiribosio, generando pertanto un sito apurinico. La depurinazione avviene perché il legame covalente tra lo zucchero e la base purinica è molto meno stabile di quello tra una pirimidina e lo zucchero e tende a rompersi. Normalmente una cellula di mammifero perde migliaia di purine per depurinazione in un ciclo cellulare. Se queste lesioni non sono riparate, viene a mancare una base

123

Mutazione, riparazione del DNA ed elementi trasponibili Filamento neosintetizzato



Filamento stampo 3¢

5¢ ...

3¢ ...

... ...

3¢ AG T C G C A T AG T T T C A G C G T A T C A AA AACGTCGA TC

3¢ AG T C G C A T AG T T T C A G C G T A T C A A A ACGTCGATC A

... 5¢ Protrusione del filamento stampo



...



...

... 5¢ Protrusione del filamento neosintetizzato 3¢

T AG T C G C A T AG T T T T T C A G C G T A T C A A A AACGTCGATC

Inserzione di una base nel nuovo filamento

Delezione di una base nel nuovo filamento 5¢ ...

3¢ ...

AG T C G C A T AG T T T T G C AG C T AG T C AG C G T A T C AA AA C G T C GA T C A

... 5¢

... 3¢



...

... 5¢



...

T AG T C G C A T AG T T T T T G C AG C T AG T C AG C G T A T C AA AAA C G T C GA T C

... 3¢ ... 5¢

Figura 7.8 Origine spontanea di mutazioni per inserzione o delezione in seguito a un errato posizionamento del DNA durante la replicazione.

che serva da stampo per la base complementare durante la replicazione del DNA e ciò farà sì che la DNA polimerasi si arresti o si dissoci dal DNA. La deamminazione è la rimozione di un gruppo amminico da una base. Per esempio la deamminazione della citosina produce uracile (Figura 7.9a), che non è una normale base del DNA, anche se è una normale base dell’RNA. Un sistema di riparazione rimuove la maggior parte dell’uracile nel DNA, minimizzando quindi le conseguenze mutazionali della deamminazione della citosina. Tuttavia, se l’uracile non viene rimosso, un’adenina verrà incorporata durante la replicazione nella posizione complementare del filamento neosintetizzato, determinando una mutazione di C-G in T-A per transizione. Il DNA dei procarioti e degli eucarioti contiene una piccola quantità della base modificata 5-metilcitosina (5mC) (Figura 7.9b) in sostituzione della citosina standard. La deamminazione della 5mC produce timina (Figura 7.9b), determinando il cambiamento dalla coppia G-5mC in G-T. Se tale appaiamento scorretto non è riparato, al successivo ciclo di replicazione G sarà uno stampo per C, mentre T deteminerà l’incorporazione di A nel filamento di nuova sintesi. La conseguenza è che una delle molecole sintetizzate avrà il normale appaiamento G-C, mentre l’altra, mutante, porterà A-T. Di conseguenza, la deamminazione della 5mC determina mutazioni per transizione da G-C ad A-T. Dato che una grande quantità di altri tipi di mutazioni è corretta da meccanismi di riparazione, ma le mutazioni per deamminazione di 5mC lo sono molto meno, i punti del genoma dove si trovano 5mC sono spesso punti caldi mutazionali (hot spots), cioè nucleotidi in corrispondenza dei quali la mutazione avviene con una frequenza superiore alla media.

Mutazioni per depurinazione e deamminazione possono essere riparate dal sistema di escissione di basi (vedi più avanti nel presente capitolo). Mutazioni indotte Si possono indurre mutazioni esponendo gli organismi a mutageni fisici, come le radiazioni, o a mutageni chimici. Le mutazioni indotte deliberatamente hanno avuto, e continuano ad avere, un ruolo importante nello studio della genetica. Dato che il tasso di mutazione spontanea è basso, i genetisti generalmente utilizzano mutageni per elevare la frequenza di mutazione, così da ottenere un numero significativo di organismi mutati nel gene che stanno studiando.

a) Deamminazione della citosina a uracile NH2 N3 2

4

5

1 6

N

O

O H

H

N3

Deamminazione

4

H 5

2 1 6

H

O

N

H

Uracile

Citosina

b) Deamminazione della 5-metilcitosina (5mC) a timina Gruppo metilico

NH2 N3 2

O

4 1

N

5

O H

CH3

N3

Deamminazione

6

2

H

5-metilcitosina (5mC)

O

CH3

4 5 1

6

N

H

Timina (T)

Figura 7.9 Cambiamenti nelle basi del DNA in seguito a deamminazione.

124

Capitolo 7 O C

H N3 C O

O

4

2

5 6

1

N

C

CH3

H3C

+

C C5 C

C H

H

4

6

O

UV H 3

N

2

C

1

N

CH3 CH3 H

C N3 C

O

O

4

2 1

5

C

C5

6

C

C6

N

Timina

O

C 4

1

N H

Timina

O H 3

N

2

C O

O

4

4

5

5

6

6 1

3 2 1

H Dimero di timina

Figura 7.10 Produzione di dimeri di timina per irraggiamento con luce ultravioletta. I due componenti del dimero sono legati covalentemente e ciò crea una distorsione della doppia elica del DNA in quel punto.

Radiazioni Tutti gli esseri viventi sono esposti in modo continuo a radiazioni. Le sorgenti di radiazioni alle quali siamo esposti sono di diversa natura. Tra le sorgenti naturali vanno menzionati i raggi cosmici che provengono dallo spazio, il radon e i prodotti del decadimento radioattivo dei radioisotopi presenti nelle rocce e nel suolo. Tra le sorgenti di origine antropica troviamo i raggi X (per esempio per usi medici), orologi con quadrante fosforescente e altri apparecchi simili. Le radiazioni possono essere di tipo non ionizzante o ionizzante. Un evento di ionizzazione si realizza quando l’energia è sufficiente a sottrarre un elettrone da un orbitale atomico e quindi a rompere un legame covalente. Fatta eccezione per la luce ultravioletta (UV), le radiazioni non ionizzanti non sono in grado di indurre mutazioni; al contrario, tutti i tipi di radiazioni ionizzanti, quali raggi X, raggi cosmici e radon, sono mutageni. La luce UV induce mutazioni aumentando l’energia chimica di alcune molecole, come le basi pirimidiniche del DNA. Uno degli effetti delle radiazioni UV sul DNA è la formazione di legami chimici anormali tra molecole di pirimidina adiacenti sullo stesso filamento della doppia elica. Questi legami vengono indotti principalmente tra timine adiacenti, formando quelli che vengono chiamati dimeri di timina (Figura 7.10), normalmente indicati come TˆT. (Vengono prodotti anche appaiamenti CˆC, CˆT e TˆC, ma con frequenza molto inferiore.) Questo appaiamento inusuale causa una protrusione del filamento di DNA e impedisce il normale appaiamento delle T con le corrispondenti A del filamento opposto. La replicazione non riesce a procedere oltre la lesione e quindi, se il numero dei dimeri non riparati è notevole, la cellula morirà. Le radiazioni ionizzanti penetrano nei tessuti e collidono con le molecole, rimuovendo gli elettroni dalla loro orbita e creando ioni. Gli ioni possono rompere i legami covalenti, inclusi quelli zucchero-fosfato dello scheletro del DNA. In effetti, le radiazioni ionizzanti sono la principale causa di complesse mutazioni cromosomiche nell’uomo. Alte dosi di radiazioni ionizzanti causano letalità cellulare: da ciò deriva il loro utilizzo terapeutico nel trattamento di alcune forme di cancro. A dosi inferiori, vengono di solito prodotte mutazioni puntiformi con una frequenza che è direttamente proporzionale alla do-

se utilizzata. Le radiazioni ionizzanti possono anche indurre rotture cromosomiche, le cui conseguenze verranno descritte nel Capitolo 16. È inoltre importante tenere presente che per molti organismi, uomo incluso, l’effetto delle radiazioni ionizzanti è cumulativo. È interessante anche notare che alcuni organismi sono altamente resistenti al danno da radiazioni. La genetica di questo fenotipo in uno di tali organismi, appartenente agli Archaea è descritta nel Focus sul genoma di questo capitolo. I raggi X sono un tipo di radiazione ionizzante che è stato utilizzato per indurre mutazioni negli esperimenti di laboratorio. Proprio per i lavori pionieristici condotti in questo campo negli anni trenta del secolo scorso, Hermann Joseph Müller ricevette il Premio Nobel per la Fisiologia o Medicina nel 1946 per “la scoperta della produzione di mutazioni attraverso esposizione a raggi X”. Il radon è un gas radioattivo inerte e invisibile, privo di odore e sapore. Il decadimento del radon è associato alla produzione di radiazioni ionizzanti in grado di indurre mutazioni. Negli Stati Uniti, il radon è la seconda più frequente causa di tumore dei polmoni dopo il fumo di sigaretta. Il numero di morti per cancro polmonare causato da esposizione a radon è superiore ai 20 000 casi per anno, rappresentando la sesta causa principale di morte tra tutte le forme di tumore. Il radon è un agente mutageno prodotto del decadimento radioattivo dell’uranio presente, anche se in piccole quantità, praticamente in tutti i tipi di rocce e di terreno. Poiché anche alcuni materiali utilizzati nella costruzione di case contengono uranio, l’esposizione al radon non può essere evitata neanche negli ambienti domestici e di lavoro, dove tra l’altro, trattandosi di ambienti chiusi, il gas tende ad accumularsi. Inoltre, la contemporanea esposizione ad altri mutageni ambientali, capaci di agire come carcinogeni (cioè di indurre tumori), aumenta la probabilità di sviluppare un tumore polmonare. Essendo ormai accertata la pericolosità del radon per la salute umana, sono stati fissati standard nazionali sulla sicurezza per l’esposizione al radon, e resi disponibili una serie di strumenti domestici per il rilevamento del gas e sistemi per la ventilazione. Come per altri mutageni, anche i danni al DNA indotti dal radon possono essere riparati, entro certi limiti di dosaggio e tempo di esposizione, dai normali meccanismi di ripara-

Mutazione, riparazione del DNA ed elementi trasponibili

125

Focus sul genoma Radioresistenza nei Bacteria: Conan il batterio Deinococcus radiodurans è un archeobatterio altamente resistente alle radiazioni. Questa resistenza è comune a molti membri del gruppo DeinococcusThermus al quale D. radiodurans appartiene. Anche Thermus acquaticus è un membro di questo gruppo e lo incontreremo nel Capitolo 8 quando parleremo della reazione a catena della polimerasi (PCR), una tecnica per l’amplificazione in vitro del DNA. I membri di questo gruppo possono sopravvivere a dosi acute di radiazioni ionizzanti anche superiori a 10 000 gray, dove un gray (Gy) è definito come l’assorbimento di un joule (J) di energia da una massa di 1 kilogrammo. Questi Archaea possono inoltre sopravvivere anche a esposizioni croniche di radiazioni ionizzanti pari a 60 Gy/ora e a dosi di luce UV di 1 kJ/m2. Per un confronto si tenga conto che una dose di 60 Gy può uccidere il comune batterio E. coli, mentre 10 Gy sono sufficienti per uccidere un uomo. Tutti i membri del gruppo Deinococcus-Thermus vivono in ambienti caratterizzati da elevate temperture, crescendo in modo ottimale a temperature superiori ai 50 °C. Lunghi periodi di essiccazione sono altresì ben tollerati da questi organismi. Attraverso la genetica classica sono stati identificati numerosi geni necessari per la radioresistenza di D. radiodurans. Quindi sono stati isolati mutanti con minore resistenza alle radiazioni. I geni selvatici corrispondenti alle forme mutanti sono stati clonati e sequenziati, e molti di essi si sono dimostrati simili a geni della riparazione del DNA di altri organismi, incluso E. coli. Sorprendentemente, geni ortologhi di E. coli (geni in un’altra specie evoluti da un antenato comune) introdotti in mutanti di D. radiodurans erano in grado di ripristinare livelli di radioresistenza comparabili a quelli del ceppo selvatico.

zione cellulari. Adottare misure per limitare l’esposizione al gas rientra negli scopi di specifiche commissioni

Nota chiave Le radiazioni possono causare danni genetici producendo specie chimiche che danneggiano il DNA (come nel caso dei raggi X) o inducendo la formazione di legami inusuali tra le basi del DNA, come i dimeri di timina (nel caso dei raggi ultravioletti). Se i danni indotti dalle radiazioni non vengono riparati, possono dare origine a mutazioni o morte cellulare. Le radiazioni possono anche indurre frammentazione dei cromosomi.

Questo risultato suggerì che questi geni fossero necessari, ma non sufficienti, per determinare la radioresistenza. Per approfondire ulteriormente le cause della radioresistenza, D. radiodurans fu scelto come uno dei primi genomi da sequenziare. Questo portò a definire un genoma piuttosto piccolo, costituito da circa 3,38 milioni di coppie di basi (Mb). (Il genoma di E. coli è circa 1,5 volte più grande, mentre quello umano lo è 1000 volte.) In D. radiodurans fu messo in evidenza un grande cromosoma circolare e tre minicromosomi o plasmidi – due dei tre sono molto più grandi della maggior parte dei plasmidi noti (raggiungono infatti quasi la taglia del cromosoma stesso) e sono chiamati megaplasmidi. Gli scienziati che studiano questi organismi utilizzano la trascrittomica per identificare geni che in seguito a irraggiamento risultano trascritti ad alti livelli e la proteomica per caratterizzare l’abbondanza, il tipo e la funzione delle proteine all’interno di questi organismi. Tuttavia, con questi approcci non si è riusciti a definire quali geni siano responsabili della radioresistenza di D. radiodurans. Recentemente altri membri del gruppo Deinococcus-Thermus sono stati sequenziati, inclusi Deinococcus geothermalis e due ceppi di Thermus thermophilus, tutti ceppi radioresistenti. I genomi sono stati confrontati, mediante un approccio di genomica comparativa (vedi Capitolo 9), con quelli di procarioti non radioresistenti. Questo lavoro ha permesso ai ricercatori di identificare diversi geni presenti nei membri del gruppo Deinococcus-Thermus e assenti nei genomi di procarioti non radioresistenti. Gli scienziati stanno valutando ora se questi particolari geni possano spiegare perché Deinococcus radiodurans possa sopravvivere a dosi così massicce di radiazioni.

nominate per la tutela della salute pubblica. Gli effetti carcinogeni di alcuni tipi di radiazioni, incluse la luce UV e le radiazioni ionizzanti, verranno discussi nel Capitolo 20. Mutageni chimici I mutageni chimici includono sia sostanze naturali sia sostanze sintetiche. Questi mutageni possono essere raggruppati in due classi in base al loro meccanismo d’azione: gli analoghi delle basi e gli agenti intercalanti inducono mutazioni durante la replicazione, mentre gli agenti che modificano le basi possono indurre mutazioni in ogni stadio del ciclo cellulare. Gli analoghi delle basi sono basi molto simili a quelle normali che si trovano nel DNA. Come queste ultime, essi esistono in stati tautomerici normali e rari. In

126

MyLab

Capitolo 7

ciascuno di questi stati l’analogo delle basi si appaia con una diversa base normale del DNA. Dato che gli analoghi delle basi sono simili alle basi azotate normali, possono essere incorporati nel DNA al LORO posto durante la replicazione. Un mutageno analogo delle basi è il 5-bromouracile (5BU), che ha una residuo di bromo al posto del gruppo metilico della timina. Nello nimazione stato normale, il 5BU assomiglia alla timina e si appaia con Effetto mutal’adenina nel DNA (Figura geno del 5BU 7.11a). Nel suo stato raro, si appaia con la guanina (Figura 7.11b). Il 5BU induce mutazioni perché può cambiare forma tautomerica una volta che è stato incorporato nel DNA (Figura 7.11c). Se il 5BU è incorporato nel suo stato normale, si appaia con l’adenina. Se quindi passa allo stato raro durante la replicazione, si appaia con la guanina. Nel successivo ciclo di replicazione la coppia 5BU-G darà luogo a una coppia C-G, anziché T-A. Con questo processo viene prodotta una mutazione per transizione da T-A a C-G. Il 5BU può anche indurre una mutazione per transizione da C-G a T-A se viene prima incorporato nel DNA allo

stato raro e poi passa al suo stato normale durante la replicazione (Figura 7.11c). Quindi le mutazioni indotte da 5BU possono andare incontro a reversione in seguito a un secondo trattamento con 5BU. Non tutti gli analoghi delle basi sono mutageni. Per esempio, uno dei farmaci approvati per la cura di pazienti affetti da AIDS, l’AZT (azidotimidina), è un analogo della timidina ma non è mutageno, perché non dà luogo ad alterazioni nell’appaiamento delle basi. Gli agenti che modificano le basi sono molecole che agiscono come mutageni modificando direttamente la struttura chimica e le proprietà delle basi. La Figura 7.12 mostra l’azione di tre tipi di mutageni che agiscono in questo modo: un agente deamminante, un agente idrossilante e un agente alchilante. L’acido nitroso, HNO2 (Figura 7.12a), è un agente deamminante che rimuove gruppi amminici (–NH2) dalle basi guanina, citosina e adenina. Il trattamento della guanina con acido nitroso produce xantina, ma, dato che questa base purinica ha le stesse proprietà di appaiamento della guanina, non viene indotta una mutazione (Figura 7.12a, parte 1). Quando la citosina è trattata con acido nitroso, viene prodotto uracile (Figura 7.12a, parte 2),

a) Appaiamento del 5BU nel suo stato normale Br

O

C 5

H

C

Br

N

4

3 1

H

C

6

N

b) Appaiamento del 5BU nel suo stato raro

H N C N

6

H

2

N

C

1

C

C H

8C

H

O

N

C

3

C

N

H

N

C C

H

C

C

N

C O

O

O C

N N

Legame della base allo zucchero

H

C

9 4

2

Legame della O base allo zucchero

5

7

C

H

H

N

N

N H

5-bromouracile (si comporta come la timina; stato normale)

Adenina (stato normale)

5-bromouracile (si comporta come la citosina; stato raro)

Guanina (stato normale)

c) Azione mutagena del 5BU Mutazione per transizione da A-T a G-C T A

Aggiunta di 5BU

Replicazione del DNA

T A

Transizione del 5BU allo stato raro

5BU A 5BU è incorporato nello stato normale Replicazione del DNA

5BU G T A

Aggiunta di 5BU Replicazione del DNA

C G

Transizione del 5BU allo stato normale

5BU G 5BU è incorporato nello stato raro Replicazione del DNA

5BU A

Replicazione del DNA

Mutazione per transizione da G-C ad A-T C G

Transizione del 5BU allo stato normale

5BU A 5BU A

C G

Replicazione del DNA

Figura 7.11 Effetti mutageni dell’analogo delle basi 5-bromouracile (5BU).

C G Mutazione per transizione da T-A a C-G

T A Mutazione per transizione da C-G a T-A

127

Mutazione, riparazione del DNA ed elementi trasponibili Base originale a)

1)

Mutageno

N

H

Base modificata

Base accoppiata

O

H

C N H

dR

2)

C

N

3

Citosina

Acido nitroso (HNO2)

N

O ....H N

H

3N

H

1

N N

H...N

dR

C-G

T-A

H

A-T

G-C

dR

C-G

T-A

G-C

A-T

N

N

N O

3)

H

O Uracile

dR

Citosina

Adenina H

H N

H

N H

O ... H N

N

H

C N

1

dR

H

1

dR

H

dR

O H

N H

H

N

Acido nitroso (HNO2)

N

Adenina

H O N H

3

H Idrossilammina (NH2OH)

N

1

N

N O

dR

H N

H N

H...N N H

O dR Idrossilamminocitosina

Citosina

dR Citosina

N–... H N

3N

H

1

N

O

Ipoxantina

H

C C

H

H

H

C

N H... N

N

N

H

C

dR

3

b)

Nessuna

N

C O

H

C

C

H Xantina

H

H H

C

N H ...N

N dR

N H Guanina

H

C

Acido nitroso (HNO2)

C

N

O ... H N

N

H

N

Transizione predetta

Adenina

c) N

H

O 6

N

1N H

dR N

Metilmetano sulfonato (MMS) (agente alchilante)

C

N

H

O CH3

dR

1

H Guanina

N ...H

C

N

C

H

3

N

N H

CH3 C

6

N

O

N

N H .....O dR H O6-metilguanina Timina

Figura 7.12 Azione di tre agenti modificatori di base: (a) acido nitroso, (b) idrossilammina, e (c) metilmetano sulfonato.

che si appaia con l’adenina, producendo una transizione da C-G a T-A durante la replicazione. Analogamente, l’acido nitroso modifica l’adenina producendo ipoxantina, una base che si appaia con la citosina piuttosto che con la timina, dando luogo a una mutazione per transizione da A-T a G-C (Figura 7.12a, parte 3). Una mutazione indotta da acido nitroso può revertire a seguito di un secondo trattamento con lo stesso mutageno. L’idrossilammina (NH2OH) è un agente mutageno idrossilante che reagisce specificamente con la citosina, modificandola per aggiunta di un gruppo ossidrilico (OH), cosicché essa può appaiarsi con l’adenina invece

che con la guanina (Figura 7.12b). Le mutazioni indotte dall’idrossilammina sono solo transizioni da C-G a T-A e non possono quindi essere revertite da un secondo trattamento con questo agente chimico. Tuttavia, lo possono essere mediante un trattamento con altri mutageni (quali 5BU e acido nitroso) che causano mutazioni per transizione da T-A a C-G. Il metilmetano sulfonato (MMS) fa parte di un gruppo diverso di agenti alchilanti che introducono gruppi alchilici (per esempio –CH3, –CH2CH3) nelle basi in un certo numero di siti (Figura 7.12c). Molte mutazioni indotte dagli agenti alchilanti sono dovute all’aggiunta di

128

Capitolo 7

gruppi alchilici all’ossigeno in posizione 6 della guanina a produrre O6-alchilguanina. Per esempio, dopo trattamento con MMS, alcune copie di guanina vengono metilate come O6-metilguanina. La guanina metilata si appaia alla timina, invece che alla citosina, dando transizioni da G-C ad A-T (Figura 7.12c). Gli agenti intercalanti – quali la proflavina, l’acridina e il bromuro d’etidio (comunemente usato per colorare il DNA nell’elettroforesi su gel) – si inseriscono (intercalano) tra basi adiacenti in uno o entrambi i filamenti del DNA, causando un rilassamento dell’elica (Figura 7.13). Se l’agente intercalante si inserisce tra due coppie di basi adiacenti di un filamento di DNA che serve da stampo per la sintesi di un nuovo DNA (Figura 7.13a), nel nuovo filamento di DNA verrà inserita una base in più in corrispondenza dell’agente intercalante (scelta a caso: G nella figura). In seguito a un ulteriore ciclo di replicazione, dopo che l’agente intercalante è stato perso, il risultato sarà un’inserzione di una coppia di basi (C-G nella Figura 7.13a). Se l’agente intercalante si inserisce al posto di una base nel nuovo filamento di DNA (Figura 7.13b), quando la doppia elica si replica dopo che l’agente intercalante è stato perso, si avrà una delezione di una coppia di basi (T-A nella Figura 7.13b). a) Mutazione per inserzione Molecola di agente intercalante Filamento stampo del DNA 5¢ Nuovo filamento di DNA 3¢

ATCAG T TACT TAGTCGAATGA 0,68 nm

3¢ 5¢

Base casuale inserita di fronte all’agente intercalante; qui si tratta di G Successiva replicazione del nuovo filamento 5¢ 3¢

ATCAGCT TACT TAGTCGAATGA

3¢ 5¢

Risultato: mutazione frameshift dovuta all'inserzione di una coppia di basi (C-G) b) Mutazione per delezione Filamento stampo del DNA 5¢ Nuovo filamento di DNA 3¢

A T CAGT T AC T TAGTC ATGA

3¢ 5¢

Agente intercalante Replicazione del nuovo filamento dopo la perdita dell’agente intercalante 5¢ 3¢

A T CAGT AC T T AGT CA TGA

3¢ 5¢

Figura 7.13 Mutazioni per intercalazione. (a) Mutazione frameshift per inserzione, causata dall’inserimento dell’agente intercalante nel filamento stampo. (b) Mutazione frameshift per delezione, causata dall’inserimento dell’agente intercalante nel filamento neosintetizzato.

Se l’inserzione o la delezione di una coppia di basi avvengono in un gene che codifica per una proteina, ne risulterà una mutazione frameshift. Dato che gli agenti intercalanti possono indurre sia inserzioni sia delezioni di basi, tali mutazioni possono revertire a seguito di un trattamento con questi stessi agenti.

Nota chiave Le mutazioni possono essere indotte dall’esposizione ad agenti mutageni chimici. I mutageni chimici agiscono in modi diversi, per esempio sostituendo le basi normali durante la replicazione del DNA, modificando le basi chimicamente e intercalandosi tra basi adiacenti durante la replicazione.

Mutagenesi sito-specifica in vitro Le mutazioni spontanee o indotte non avvengono in geni specifici, ma sono normalmente distribuite a caso nel genoma. Tuttavia, molti genetisti desiderano studiare gli effetti di mutazioni in geni di particolare interesse. Con l’avvento della tecnologia del DNA ricombinante, è possibile clonare i geni e produrre grandi quantità di un dato DNA per l’analisi e la manipolazione. Ciò significa che è ora possibile mutare un gene in posizioni specifiche attraverso la mutagenesi sito-specifica in vitro e poi reintrodurre il gene mutato nella cellula per esaminare gli effetti fenotipici provocati dalla mutazione in vivo. Queste tecniche hanno reso possibile ai genetisti lo studio, per esempio, di geni con funzione ignota e di sequenze specifiche coinvolte nella regolazione dell’espressione genica. Mutageni chimici ambientali Ogni giorno siamo ampiamente esposti a una grande varietà di sostanze chimiche presenti nell’ambiente. Queste sostanze possono essere di origine naturale, come quelle sintetizzate da piante e da animali che consumiamo come cibo, o di origine antropica, come medicinali, cosmetici, additivi alimentari, pesticidi e composti industriali. La nostra esposizione a queste sostanze avviene soprattutto attraverso l’ingestione dei cibi, il contatto epidermico e l’inalazione. Molti di questi prodotti chimici sono, o possono essere, mutageni. Affinché un mutageno chimico possa indurre alterazioni nel DNA, è necessario che esso penetri nella cellula e nel nucleo, cosa che non è possibile per molte sostanze chimiche. Alcune molecole vengono convertite in un mutageno dal nostro metabolismo. Ovvero, quando ne viene valutata l’attività mutagena originale, per esempio in batteri, non si hanno mutazioni. Al contrario, se tali molecole sono processate nell’organismo, vengono trasformate in mutageni. Per esempio il benzopirene, un idrocarburo policiclico aromatico presente in fumo di

Mutazione, riparazione del DNA ed elementi trasponibili

129

di carta da filtro impregnato con la sostanza in esame viene deposto sulla piastra, che viene incubata per una notte prima di contare le colonie che sono cresciute. In parallelo, vengono allestite piastre di controllo prive della sostanza in esame. Dal momento che gli auxotrofi per istidina (his) richiedono la presenza di istidina per crescere nel terreno di coltura, mentre le cellule normaIl test di Ames: identificazione di potenziali muta- li (his+) non ne hanno bisogno, la selezione dei revertangeni Alcuni prodotti chimici inducono mutazioni che ti viene effettuata su un terreno privo di istidina. Dopo possono dar origine a crescita di un periodo adeguato di incubazione, nelle piastre di nimazione tipo tumorale o cancerosa. controllo saranno comparse alcune colonie, dovute alQuesti prodotti sono una sotto- l’insorgenza di mutazioni spontanee che revertono batIl protocollo classe di mutageni detti carcino- teri del ceppo his al tipo selvatico. Nel caso di sostanze del test di geni. Le mutazioni sono di solito non mutagene, il numero di colonie è circa lo stesso nelAmes sostituzioni di coppie di basi, che le piastre in cui è stata aggiunta la sostanza in esame riproducono mutazioni missenso o spetto alle piastre di controllo (prive della sostanza). nonsenso, oppure inserzioni o delezioni, che producono Invece, un risultato positivo al test di Ames si ottiene se, nelle vicinanze del disco impregnato della sostanza in mutazioni frameshift. Analizzare direttamente i prodotti chimici per verifi- esame, si ottiene un numero più elevato di colonie recare la loro capacità di indurre tumori negli animali è vertanti (ritornate allo stato selvatico). Il test di Ames è così semplice che viene usato di lungo e dispendioso. Tuttavia, basandosi sul fatto che la maggior parte dei carcinogeni è mutagena, Bruce Ames routine in molti laboratori nel mondo e ha permesso di sviluppò un test indiretto, semplice e poco costoso per identificare molti mutageni, comprese molecole di intesaggiare i mutageni. Il test di Ames verifica la capacità resse industriale e agricolo. Per esempio, lo Ziram, che di una sostanza di far ritornare selvatici ceppi mutanti di è utilizzato in agricoltura come fungicida, dà un risultato positivo al test di Ames sia per le sostituzioni di base Salmonella typhimurium. Nel test di Ames circa 108 cellule di batteri auxotro- sia per le mutazioni frameshift, se sono presenti gli enfi per istidina (mutanti his) vengono seminate in una zimi epatici, mentre dà risultato negativo se l’estratto S9 piastra priva di istidina, in presenza o in assenza di una è assente. Quindi, questa sostanza è verosimilmente tramiscela di enzimi epatici di ratto, topo o criceto (Figura sformata in cancerogeno da enzimi metabolici. Sebbene 7.14). Si adoperano enzimi epatici, chiamati estratto S9, il test di Ames sia un eccellente indicatore per stabilire perché molte sostanze chimiche, come già detto, non so- se una sostanza è carcinogena, un risultato negativo del no mutagene di per sé, ma vengono convertite in muta- test non esclude che una sostanza lo sia. Per esempio, il geni (e carcinogeni) nel fegato e in altri tessuti. Un disco nitrobenzene è negativo al test di Ames sia in presenza sia in assenza di estratto S9. Il nitrobenzene è usato principalmente per fabbricare l’anilina, che è utilizzata per la sintesi del poliuretano. Anche lo stirene, usato nella produzione di polimeri di polistirene e resine, dà un risultato negativo con o senza l’estratto S9, anche se test su animali hanno indicato Risultato positivo che è carcinogeno. A causa di risultati come questi, il test di Ames non può essere Sostanza chimica in esame Estratto S9 l’unico test utilizzato per determinare se aggiunta sul filtro un composto è mutageno. Infine, il test di Ames permette una quantificazione utilizzando diverse concentrazioni di sostanze chimiche per proIncubazione durre una curva dose-risposta. Usando questo approccio, si può confrontare la Ceppo his di Miscela piastrata mutagenicità relativa di diverse sostanze. S. typhimurium sigaretta, catrame, fumi di scarico delle autovetture e cibo cotto alla brace, non è un mutageno. Tuttavia il suo metabolita benzopirene diol-epossido è sia un mutageno sia un carcinogeno. Molti altri idrocarburi policiclici aromatici divengono mutageni se sono attivati dai processi metabolici.

MyLab

sul terreno senza istidina

Risultato negativo

Figura 7.14 Test di Ames per verificare la potenziale mutagenicità di composti chimici.

130

Capitolo 7

Attività MyLab

Ora tocca a voi indagare i problemi di salute che minacciano gli abitanti di Russellville. Effettuate il vostro test di Ames nella iAttività A toxic town (La città tossica) nel sito dedicato.

Identificazione delle mutazioni Col tempo i genetisti hanno compiuto grandi progressi nella comprensione di come avvengano i processi normali studiando i relativi mutanti difettivi. I ricercatori hanno utilizzato mutageni per indurre mutazioni con una frequenza più elevata rispetto a quelle spontanee. Tuttavia, i mutageni modificano coppie di basi a caso, indipendentemente da dove sono localizzate nel materiale genetico. Una volta avvenute, le mutazioni devono essere identificate per poter essere studiate. Mutazioni in organismi aploidi sono facilmente identificabili, dato che vi è una sola copia del genoma. In organismi diploidi come Drosophila, le mutazioni dominanti sono identificate facilmente e anche le mutazioni recessive legate al sesso possono esserlo perché sono espresse in metà dei figli maschi nati da una femmina eterozigote mutata. Tuttavia, le mutazioni recessive autosomiche possono essere identificate solo se la mutazione è allo stato omozigote. L’identificazione di mutazioni nell’uomo è molto più difficile che in Drosophila perché i genetisti non possono realizzare incroci controllati. Le mutazioni dominanti possono, ovviamente, essere identificate facilmente, ma altri tipi di mutazioni possono essere rivelati solo dall’analisi dell’albero genealogico o da analisi diretta biochimica o molecolare. Fortunatamente, per alcuni organismi di interesse genetico – in particolare microrganismi – le procedure di selezione e analisi hanno storicamente aiutato i genetisti a ottenere particolari mutanti di interesse da una popolazione eterogenea. Qui di seguito è riportata una breve descrizione di alcune di queste procedure. Mutanti visibili Le mutazioni visibili alterano la morfologia o l’aspetto fisico di un organismo. Esempi di mutazioni visibili sono il colore degli occhi o la forma delle ali in Drosophila, il colore del pelo negli animali (per esempio, gli organismi albini), la grandezza delle colonie nel lievito e la morfologia di placca nei batteriofagi. Poiché le mutazioni visibili sono, per definizione, facilmente identificabili, la selezione viene fatta semplicemente per osservazione. Mutanti nutrizionali Una mutazione nutrizionale o auxotrofa altera la capacità di un organismo di sintetizzare una particolare molecola essenziale per la crescita (vedi Capitolo 4). I mutanti auxotrofi sono facilmente

identificabili in microrganismi quali E. coli e i lieviti, che crescono in terreni semplici e definiti, partendo dai quali sintetizzano tutte le molecole essenziali per la loro crescita. Diverse procedure di selezione e analisi permettono di isolare i mutanti auxotrofi. Una semplice procedura chiamata semina in replica può essere utilizzata per analizzare mutanti auxotrofi di microrganismi che crescono formando colonie in terreno solido (Figura 7.15). In questa tecnica, campioni di una coltura di un organismo o un tipo di cellule, che sono eventualmente stati sottoposti all’azione di mutageni, vengono seminati in un terreno contenente tutti i possibili fattori nutritivi per il mutante di interesse. Per esempio, se vogliamo isolare un mutante auxotrofo per l’arginina, allestiremo una coltura in una piastra di terreno minimo contenente arginina (vedi Figura 7.15). In questo terreno cresceranno i selvatici e i mutanti auxotrofi per l’arginina, ma non altri mutanti auxotrofi. Le colonie presenti

Superficie di velluto (sterile) premuta sulla piastra madre

Il velluto con le cellule provenienti dalle colonie originarie viene premuto su una piastra di terreno

Crescita delle colonie Piastra madre originale (terreno completo)

Presente su terreno completo

Replica (terreno minimo)

Mancante sulla replica

Mutante auxotrofo

Figura 7.15 Tecnica della semina in replica per identificare i ceppi mutanti di microrganismi che crescono in colonie.

Mutazione, riparazione del DNA ed elementi trasponibili

sulla piastra vengono trasferite per stampo su un velluto sterile. Vengono poi create delle repliche della disposizione originaria delle colonie premendo delicatamente sul velluto nuove piastre. Se la nuova piastra contiene terreno minimo, le cellule selvatiche cresceranno, ma i mutanti auxotrofi non potranno farlo. Dal confronto delle colonie cresciute sulla piastra originale di terreno minimo più arginina con quelle cresciute nella replica su terreno minimo, i ricercatori possono identificare facilmente le probabili colonie auxotrofe per arginina. Queste possono essere prelevate dalla piastra madre e coltivate per essere meglio caratterizzate. Mutanti condizionali I prodotti di molti geni – DNA polimerasi ed RNA polimerasi, per esempio – sono importanti per la crescita e la divisione delle cellule, e il silenziamento della loro funzione mediante mutazione è tipicamente letale. La struttura e la funzione di questa classe di geni possono essere studiate inducendo mutazioni condizionali, che riducono l’attività dei prodotti genici soltanto in certe condizioni. Un comune tipo di mutazione condizionale è una mutazione termosensibile. Nel lievito, per esempio, possono essere isolati molti mutanti sensibili alla temperatura, che possono crescere normalmente a 23 °C, ma crescono molto lentamente o non crescono affatto a 36 °C. La sensibilità al calore dipende di solito da una mutazione missenso che causa il cambiamento di un amminoacido nella sequenza di una proteina, cosicché la proteina assume una conformazione non funzionale alla temperatura più elevata. Per isolare le mutazioni termosensibili nei microrganismi, vengono utilizzate essenzialmente le stesse procedure usate per le mutazioni auxotrofe. Per esempio, il metodo della semina in replica può selezionare mutanti termosensibili quando le repliche vengono incubate a una temperatura più elevata rispetto alla piastra madre. In questo caso, i mutanti cresceranno sulla piastra madre, ma non sulla replica. Mutanti di resistenza Nei microrganismi, come E. coli, lieviti o in cellule in coltura da tessuti, possono essere indotte mutazioni per resistenza a particolari virus, sostanze chimiche o antibiotici. Per esempio, per E. coli sono stati realizzati mutanti resistenti al fago T1 (si veda la discussione all’inizio di questo capitolo) e alcuni mutanti resistenti agli antibiotici, come la streptomicina. Nel lievito, per esempio, esistono mutanti resistenti a fungicidi come la nistatina. Selezionare i mutanti resistenti è semplice. Per isolare mutanti di E. coli resistenti all’azide, per esempio, le cellule trattate con un mutageno vengono piastrate in un terreno che contiene l’azide e le colonie capaci di crescere saranno resistenti. Analogamente, i mutanti antibiotico-resistenti di E. coli possono essere selezionati seminando le cellule in un terreno che contiene l’antibiotico.

131

Nota chiave Un certo numero di procedure di analisi è stato sviluppato per identificare le cellule mutate in una popolazione cellulare eterogenea.

Le mutazioni dinamiche Abbiamo visto finora come una mutazione insorga per errori di replicazione del DNA o per danni dovuti all’esposizione a radiazioni ionizzanti o ad agenti chimici, non correttamente riparati. Tali mutazioni possono modificare un solo nucleotide o coinvolgere una sequenza più o meno estesa di DNA ma, in ogni caso, sono trasmesse invariate alle generazioni successive. L’analisi di sequenza del DNA ha permesso di rilevare l’esistenza di un particolare tipo di mutazioni geniche definite dinamiche, perché in grado di modificarsi nel tempo (nello stesso individuo) e tra generazioni. Queste mutazioni consistono in variazioni nel numero di ripetizioni di brevi sequenze di DNA altamente ripetute (generalmente triplette di nucleotidi o trinucleotidi, ma in alcuni casi anche tetranucleotidi) e sono responsabili di patologie ereditarie nell’uomo, definite genericamente patologie da espansioni di triplette. Le triplette ripetute sono normalmente polimorfiche e stabili entro un certo valore soglia di ripetizioni, caratteristico di ogni malattia. Al di sotto di tale soglia, le ripetizioni non sono sufficienti a causare un fenotipo patologico, perché non alterano l’espressione o la funzione del prodotto genico; si parla in questo caso di premutazione. Tuttavia, in alcuni alleli le ripetizioni diventano instabili, cioè sono soggette a espandersi. Una volta superata una determinata lunghezza (caratteristica di ogni patologia) la funzione del gene viene compromessa e i sintomi della malattia cominciano a manifestarsi. Maggiore è il numero di ripetizioni, maggiore sarà la gravità della malattia e minore l’età di insorgenza. I meccanismi che sono alla base dell’instabilità e quindi dell’espansione non sono stati del tutto definiti. Studi in vitro hanno suggerito che sia il risultato di errori che insorgono durante la sintesi del DNA, per slittamento della DNA polimerasi (replication slippage). A causa delle sequenze ripetute, infatti, i due filamenti complementari non si appaiano perfettamente; le regioni a singolo filamento si ripiegano a formare strutture a forcina causando una seconda replicazione del filamento stampo e un aumento di ripetizioni sul filamento neosintetizzato (Figura 7.16). La mutazione quindi si origina nel corso della replicazione del DNA, durante la mitosi o la meiosi. Nel primo caso si avrà un’instabilità mitotica che porterà a un’espansione della mutazione nelle cellule somatiche e a una comparsa o progressione della malattia in età più avanzata (accompagnata anche

132

Capitolo 7 1

2

4

3

5

6

7

8

a)

G T C G T C G TC G T C G T C G T C G T C G T C C A G C A G CAG CAG CAG CAG CAG

b)

GT C GTC C A G C AG

1

3

2

4

5

6

7

GT C GT C G T C GT C GT C CAG C A G C A G

C A G C A G

C

G A

1

c)

3

2

GT C GTC C A G C AG 1

2

4

5

6

7

GT C GT C G T C GT C GT C CA G CA G CA G CA G CA G

C C 8 A7 G G C C 4A A6 G G

9

10

11

12

3A

G

C

313200), l’atassia spinocerebellare 1 e 3 (SCA1, OMIM 164400 e SCA3, OMIM 109150) e la malattia di Huntington (HD, OMIM 143100; Capitolo 13), in cui l’espansione avviene durante la meiosi paterna. In che modo l’espansione delle triplette influenza la funzione del gene in cui sono presenti? Nel caso in cui le ripetizioni si trovino nella regione genica codificante, come nella Corea di Huntington, le triplette aggiunte comportano delle ripetizioni del relativo aminoacido (in questo caso la glutammina). La nuova proteina non solo interferisce con la proteina normale ma subisce un guadagno di funzione a causa della mutazione perché diventa tossica per la cellula. Nel caso in cui le ripetizioni siano invece presenti nelle regioni geniche non codificanti (regioni regolative, introni o sequenze geniche non tradotte), come nella sindrome dell’X fragile, l’effetto della mutazione consiste in una perdita di funzione della proteina. La sindrome dell’X fragile è stata la prima malattia correlata con le espansioni di triplette. È la forma più comune di ritardo mentale ereditario dopo la sindrome di Down. È causata da ripetizioni del trinucleotide CGG nel gene FMR-1 (Fragile X Mental Retardation-1; OMIM 309550), localizzato in corrispondenza del sito fragile dell’X (vedi capitolo 16). Individui normali hanno una media di 29 ripetizioni CGG (lo spettro varia da 6 a 54) nella regione 5ʹ non tradotta del gene FMR-1, cioè la regione che, nell’mRNA, precede la regione codificante per gli amminoacidi. I maschi trasmettitori fenotipicamente normali e le loro figlie, come anche alcune femmine portatrici, hanno un numero significativamente più alto di ripetizioni CGG, da 55 a 200 copie. Questo aumento del numero di ripetizioni costituisce, come detto in precedenza, una premutazione e gli individui che la possiedono non manifestano sintomi della sindrome dell’X fragile. Maschi e femmine con la sindrome dell’X fragile hanno invece un numero superiore di ripetizioni CGG, da 200 a 1300 copie, che sono considerate le mutazioni complete. Il gene FMR-1 codifica per una proteina, FMRP, che lega gli RNA. In base al modello attuale, FMRP regola la traduzione di mRNA bersaglio, nella cellula, legandosi a essi e bloccando la sintesi proteica. Studi recenti hanno dimostrato che FMRP è attiva nelle sinapsi cerebrali, regolando la funzionalità delle connessioni tra neuroni. Gli individui affetti da questa sindrome non producono questa proteina dal momento che in soggetti con mutazione piena il nucleotide C della tripletta CGG ripetuta

DNA stampo DNA neosintetizzato

A 5

Figura 7.16 Aumento delle ripetizioni di una tripletta a causa dello slittamento dei filamenti durante la replicazione. (a) Il filamento di DNA stampo viene copiato durante il processo replicativo. (b) Durante la replicazione, sul filamento neosintetizzato si forma una forcina per appaiamenti intramolecolari tra le basi. (c) Lo slittamento tra i filamenti fa si che una parte del DNA stampo sia copiata due volte, determinando la sintesi di un elica con un numero aumentato di ripetizioni.

da una eterogeneità fenotipica). Nel secondo caso si avrà un’instabilità meiotica con conseguente aumento di espansioni durante la gametogenesi maschile o femminile. (Anche il crossing-over ineguale – vedi Capitolo 16 – può contribuire ad aumentare l’instabilità delle sequenze ripetute durante la meiosi.) Di conseguenza, un individuo con una premutazione ha figli che, avendo ereditato un numero maggiore di ripetizioni, sono maggiormente a rischio di avere la mutazione e di sviluppare la malattia con sintomi più gravi e in età più precoce. Questo fenomeno, osservabile nell’ereditarietà di tali patologie, è detto anticipazione genetica. Malattie genetiche associate a questo tipo di mutazione sono: la sindrome dell’X fragile (o sindrome di Martin-Bell, OMIM 300624; vedi anche Capitolo 16) e la distrofia miotonica (MD, OMIM 160900), in cui l’espansione avviene durante la meiosi materna; malattie neurodegenerative associate all’espansione della tripletta CAG come l’atrofia muscolare spinale e bulbare (denominata anche malattia di Kennedy, OMIM

Mutazione, riparazione del DNA ed elementi trasponibili a)

133

Alleli FMR-1 normali (CGG)6-59 ATG 1

38 kb

TAA

2 3 4 5 6 7 8 9 10 11

1314 1516

17

Trascrizione mRNA

b)

Alleli FMR-1 premutati (CGG)60-200 ATG

TAA

Trascrizione mRNA Alleli FMR-1 mutanti c)

(CGG)> 200 CH3 CH3 CH3

ATG

TAA

Assenza di trascrizione

Figura 7.17 Posizione e numero di ripetizioni CGG negli alleli normali (a), premutati (b) e mutati (c) per il gene FMR-1. Il promotore dell’allele mutato è fortemente metilato e ciò determina il blocco della trascrizione.

viene estesamente metilato provocando il silenziamento del gene FMR-1 (Figura 17.17). La perdita dell’attività genica a livello neuronale influenza il controllo della plasticità sinaptica ed è la causa del ritardo mentale.

Nota chiave Le mutazioni dinamiche sono un tipo particolare di mutazioni geniche, riscontrate solo nell’uomo, dovute alla ripetizione di brevi triplette nucleotidiche all’interno di una regione genica (codificante o non codificante). Tali mutazioni, causate da errori della DNA polimerasi durante la replicazione del DNA, sono instabili e possono espandersi nel tempo e in generazioni successive. Il numero di ripetizioni è proporzionale alla gravità dei sintomi della malattia causata da tali mutazioni.

terazioni del DNA che non sono state corrette dai diversi sistemi di riparazione. Pertanto “mutazione = danno al DNA – riparazione del DNA”. Specialmente in caso di alte dosi di mutageni, il danno può essere considerevole. Se i sistemi di riparazione non riescono a riparare correttamente tutte le lesioni, il risultato è una cellula (o un organismo) mutante o, in caso di molte lesioni residue, la morte della cellula (o dell’organismo). Possiamo raggruppare i sistemi di riparazione in due grandi categorie in base al modo di operare. I sistemi di riparazione per correzione diretta correggono le regioni danneggiate riportando il DNA alle condizioni precedenti, mentre i sistemi di riparazione per escissione rimuovono la regione danneggiata e poi colmano la discontinuità risultante risintetizzando il DNA. Di seguito sono descritti alcuni sistemi di riparazione.

Correzione diretta dei danni al DNA

Riparazione dei danni al DNA La mutazione del DNA, sia spontanea sia indotta, è corretta nelle cellule eucariote e procariote da diversi sistemi enzimatici che si occupano della riparazione del danno. Quelle che noi osserviamo come mutazioni sono al-

Riparazione conseguente all’attività di correzione di bozze della DNA polimerasi Nei geni batterici, la frequenza di sostituzione di coppie di basi varia da 10–7 a 10–11 errori per generazione. D’altra parte, la DNA polimerasi compie errori nell’inserire nucleotidi con una frequenza di 10–5 errori per generazione. La maggior

134

Capitolo 7

parte della differenza tra i due valori è dovuta all’attività esonucleasica di correzione di bozze in direzione da 3′ a 5′ della stessa polimerasi, sia nei procarioti sia negli eucarioti (vedi Capitolo 3). Quando viene inserito un nucleotide scorretto, l’errore viene spesso scoperto dalla polimerasi, che torna indietro a rimuovere il nucleotide sbagliato e quindi riprende la direzione di sintesi. L’importanza dell’attività esonucleasica da 3′ a 5′ della DNA polimerasi nel mantenere basso il tasso di mutazione è dimostrata dalle mutazioni di geni mutatori in E. coli. Ceppi che recano mutazioni nei geni mutatori mostrano una frequenza di mutazione complessiva molto più elevata del normale. Queste mutazioni alterano proteine che normalmente esercitano funzioni richieste per un’accurata replicazione del DNA. Per esempio, il gene mutD di E. coli codifica per la subunità ε della DNA polimerasi III, il suo più importante enzima di replicazione. I mutanti mutD mancano dell’attività di correzione di bozze da 3′ a 5′, cosicché molti nucleotidi, inseriti in modo non corretto, non vengono sostituiti. Riparazione dei dimeri di pirimidina indotti da UV I dimeri di timina (o di altre pirimidine) indotti dai raggi UV (Figura 7.10) vengono riportati direttamente alla forma originale attraverso la fotoriattivazione o riparazione mediante luce, ovvero grazie all’esposizione alle lunghezze d’onda tra 320 e 370 nm. La fotoriattivazione avviene grazie a un enzima chiamato fotoliasi (codificato dal gene phr) che, attivato da un fotone di luce, scinde il dimero. Ceppi che portano una mutazione nel gene phr sono difettivi nel sistema di fotoriparazione. La fotoliasi è stata rilevata nei procarioti e negli eucarioti inferiori, ma non nell’uomo. Riparazione dei danni da alchilazione Gli agenti alchilanti trasferiscono gruppi alchilici (generalmente metilici o etilici) alle basi. Il mutageno MMS, per esempio, metila l’ossigeno del carbonio 6 nella guanina (Figura 7.12c). In E. coli questo danno da alchilazione può essere riparato da un enzima chiamato O6-metilguanina metiltransferasi, codificato dal gene ada (la stessa funzione nell’uomo è svolta dal prodotto del gene MGMT). L’enzima rimuove il gruppo metilico dalla guanina, riportando la base alla sua forma originale. Un sistema simile è in grado di riparare anche le timine alchilate. Mutazioni dei geni che codificano per questi enzimi di riparazione causano un aumento delle mutazioni spontanee.

Riparazione per escissione Molte lesioni interessano uno solo dei due filamenti della molecola di DNA. In questo caso, il danno può essere rimosso e il filamento di DNA non danneggiato viene utilizzato come stampo per la sintesi di un filamento corretto. In relazione al tipo di danno, l’escissione può

estendersi da singole basi a molti nucleotidi. Ognuno dei sistemi di riparazione per escissione implica uno specifico meccanismo per il riconoscimento della lesione che è in grado di riparare. Riparazione per escissione di basi Il danno a livello di basi o nucleotidi singoli viene generalmente riparato mediante la loro rimozione seguita dall’inserzione della base o del nucleotide corretti. Nel sistema di riparazione per escissione di basi, l’enzima glicosilasi riconosce il danno e rimuove la base danneggiata tagliando il legame tra la base e il desossiribosio. Altri enzimi intervengono e tagliano lo scheletro zucchero-fosfato immediatamente prima e dopo lo zucchero ormai privo della base, liberando lo zucchero e lasciando una discontinuità nella catena del DNA. L’interruzione viene quindi colmata con il nucleotide corretto da una DNA polimerasi di riparazione e dalla ligasi, usando come stampo il filamento di DNA complementare. Le mutazioni causate da depurinazione e deamminazione sono esempi di danni al DNA che possono essere rimossi dal sistema di riparazione per escissione di basi. Riparazione per escissione di nucleotidi Nel 1964, due gruppi di scienziati – R.P. Boyce e P. HowardFlanders, e R. Setlow e W. Carrier – isolarono alcuni mutanti di E. coli sensibili alla luce UV, che dopo irraggiamento mostravano un tasso di mutazione al buio superiore al normale. Questi mutanti furono chiamati uvrA (uvr significa “riparazione UV”). I mutanti uvrA possono riparare i dimeri di timina solo in presenza di luce, ovvero sono dotati di un sistema di riparazione basato sulla fotoriattivazione. Tuttavia, E. coli uvrA+ (selvatico) può riparare i dimeri di timina al buio. Dato che il normale sistema di fotoriattivazione non può operare al buio, i ricercatori supposero che dovesse esistere un altro sistema di riparazione, che non richiedeva la luce per agire. Il nuovo sistema fu chiamato di riparazione al buio o di riparazione per escissione, e viene oggi di norma indicato come sistema di riparazione per escissione di nucleotidi (NER). Il sistema NER in E. coli corregge anche altre distorsioni indotte nell’elica del DNA. Il sistema lavora come schematizzato nella Figura 7.18 e richiede quattro proteine – UvrA, UvrB, UvrC e UvrD – codificate dai geni uvrA, uvrB, uvrC e uvrD. Un complesso formato da due proteine UvrA e una proteina UvrB scorre lungo il DNA (Figura 7.18, fase 1). Quando il complesso riconosce un dimero di pirimidina o un’altra grave distorsione nel DNA, le subunità UvrA si dissociano e la proteina UvrC si lega a UvrB nella sede della lesione (Figura 7.18, fase 2). Il complesso UvrBC legato alla lesione opera due tagli: uno circa quattro nucleotidi oltre il sito danneggiato, in direzione 3′ (operato da UvrB) e un altro circa sette nucleotidi prima della lezione, in direzione 5′ (operato da UvrC) (Figura 7.18, fa-

Mutazione, riparazione del DNA ed elementi trasponibili Dimero di timina 1

2

UvrAB passa in rassegna e individua i danni nel DNA

5¢... 3¢...

A A Complesso UvrAB

UvrA viene rilasciata; UvrC si lega

5¢... 3¢...

Tagli in posizione 5¢ e 3¢ rispetto al danno

5¢... 3¢...

TT

... 5¢

A A

C

C

TT

TT

5

5¢... 3¢...

La DNA polimerasi I riempie la lacuna

5¢... 3¢...

... 3¢

B

... 5¢ C

D Uvr D

Taglio in 3¢

Taglio in 5¢ UvrD si lega e svolge la regione tra i due tagli, rilasciando il frammento danneggiato

... 3¢

B

Taglio in 3¢ C

B

4

UvrC

... 5¢

Taglio in 5¢ 3

... 3¢

B

... 3¢

TT

... 5¢ TT DNA polimerasi I

... 3¢ ... 5¢

135

Figura 7.18 Riparazione per escissione di nucleotidi (NER) dei dimeri di pirimidine e di altre distorsioni indotte nel DNA.

Molti appaiamenti errati tra le basi, presenti nel DNA dopo la replicazione, possono essere corretti da un sistema di riparazione chiamato riparazione degli errori di appaiamento diretta dalla metilazione. Questo sistema riconosce gli appaiamenti errati, elimina le basi appaiate scorrettamente e quindi procede con la sintesi riparativa. In E. coli i prodotti di tre geni – mutS, mutL e mutH – sono coinvolti nelle fasi iniziali di questo processo (Figura 7.19). All’inizio, la proteina codificata dal gene mutS, ovvero MutS, si lega alle basi appaiate in modo errato (Figura 7.19, fase 1). Quindi, il sistema riconosce quale sia la base corretta (la base sul filamento parentale) e quale quella errata (la base sul filamento neosintetizzato). In E. coli, le due eliche sono distinte dalla metilazione della A nella sequenza GATC. Questa sequenza ha un asse di simmetria; cioè è uguale dal 5′ al 3′ su en-

DNA ligasi

trambe le eliche, a dare 6

La DNA ligasi unisce i segmenti di DNA; la riparazione è completata

5¢... 3¢...

se 3). UvrB viene quindi rilasciata e UvrD si lega al taglio in 5′ (Figura 7.18, fase 4). UvrD è un’elicasi che svolge la regione tra i tagli, rilasciando un corto segmento a singolo filamento. La DNA polimerasi I riempie la regione mancante operando nella direzione da 5′ a 3′ (Figura 7.18, fase 5), e la DNA ligasi salda il filamento (Figura 7.18, fase 6). Il sistema di riparazione per escissione è stato rilevato nella maggior parte degli organismi che sono stati studiati. Nel lievito e nei mammiferi almeno 12 geni codificano per le proteine coinvolte in questo sistema di riparazione. Riparazione degli errori di appaiamento diretta dalla metilazione Malgrado la funzione di correzione di bozze da parte della DNA polimerasi, un numero significativo di errori di appaiamento rimane non corretto al completamento della replicazione. Nel nuovo ciclo di replicazione, in mancanza di una riparazione, questi errori saranno fissati come mutazioni.

... 3¢ ... 5¢

5′-GATC-3′ . 3′-CTAG-5′

Entrambe le A in questa sequenza sono metilate. Tuttavia, dopo la replicazione, il filamento parentale ha la A metilata nella sequenza GATC, mentre la A nella sequenza GATC del filamento di DNA neosintetizzato non viene metilata se non qualche tempo dopo la sintesi. Quindi, la proteina MutS, legata all’appaiamento errato, forma un complesso con le proteine MutL e MutH (codificate, rispettivamente, da mutL e mutH), in modo da portare la sequenza GATC non metilata vicino al sito di appaiamento errato (Figura 7.19, fase 2). La proteina MutH taglia il filamento di DNA non metilato nel sito GATC, l’appaiamento errato viene eliminato da un’esonucleasi (Figura 7.19, fase 3), e la discontinuità è riparata dalla DNA polimerasi III e dalla ligasi (Figura 7.19, fase 4). La riparazione degli errori di appaiamento avviene anche negli eucarioti. Tuttavia, non è chiaro come il nuovo filamento di DNA venga distinto da quello parentale (in questo caso non c’è metilazione). Nell’uomo sono stati identificati quattro geni, chiamati hMSH2, hMLH1, hPMS1 e hPMS2; hMSH2 è omologo a mutS di E. coli e gli altri tre geni hanno omologia con mutL

136

Capitolo 7 Filamento stampo con la base corretta

N6-metil adenina

5¢... 3¢...

1

... 3¢

CH3

GA T C C T AG

3¢ 5¢

... ...

Forca di replicazione

Filamento stampo di DNA





DNA neosintetizzato con la base non corretta

Adenina non metilata

... 5¢ Filamento neosintetizzato di DNA

MutS si lega all’appaiamento errato 5¢...

CH3



GA T C C T AG

3¢...



MutS

MutH 2

MutS legata all’appaiamento errato forma un complesso con MutL e MutH in modo da portare la sequenza GATC non metilata vicino all’appaiamento errato

3

MutH taglia il filamento di DNA non metilato, e una esonucleasi elimina un tratto di DNA neosintetizzato che contiene l’appaiamento errato

4

La DNA polimerasi III e la ligasi riparano l’interruzione, introducendo le basi corrette

CH3

GA T C C T AG MutS

CH3

GA T C C T AG

CH3

GA T C C T AG

di E. coli. I geni sono noti come geni mutatori perché la loro perdita di funzione causa un accumulo di mutazioni nel genoma (vedi Capitolo 20). Mutazioni in uno qualunque dei quattro geni coinvolti nella riparazione degli appaiamenti errati nell’uomo conferiscono un fenotipo di predisposizione ereditaria a una forma di cancro del colon, chiamata cancro ereditario non-poliposico del colon (HNPCC, OMIM 120435). Sintesi translesionale del DNA e risposta SOS Danni al DNA che impediscono ai complessi di replicazione di procedere oltre la loro sede possono essere letali se non vengono riparati. Fortunatamente esiste un processo, che è l’ultima spiaggia, chiamato sintesi translesionale del DNA, che permette alla replicazione di procedere oltre le lesioni. Il processo coinvolge una speciale classe di DNA polimerasi che sono sintetizzate solo in risposta ai danni del DNA. In E. coli, la presenza di questi danni nel DNA induce un complesso sistema, chiamato risposta SOS. (Il nome deriva dal fatto che il sistema viene indotto come risposta estrema di emergenza a un danno al DNA.) La risposta SOS permette alla cellula di sopravvivere a eventi che altrimenti sarebbero letali; tuttavia spesso ciò avviene a spese dell’insorgenza di nuove mutazioni.

Figura 7.19 Meccanismo di riparazione dell’appaiamento errato di basi. L’enzima di riparazione degli appaiamenti errati riconosce quale filamento reca la base errata identificando lo stato di metilazione di una sequenza GATC in prossimità. Se la sequenza non è metilata, un segmento di quel filamento di DNA, che contiene la base errata, viene escisso e sostituito da nuovo DNA.

In E. coli, due geni controllano il sistema SOS: lexA e recA. La risposta SOS funziona in questo modo. In 5¢ ... assenza di danni nel DNA, la proteina LexA, codificata dal gene lexA, ... reprime la trascrizione di circa 17 geni, che codificano per proteine 3¢ implicate nella riparazione di diversi tipi di danno al DNA. Raggiunta 5¢ ... la soglia di danno del DNA, viene attivata la proteina RecA, codificata ... dal gene recA. RecA attivata stimola la proteina LexA ad autoscinder3¢ si, il che a sua volta elimina la repressione dei geni per la riparazio5¢ ... ne. Di conseguenza, questi geni vengono espressi e si ha la ripara... zione del DNA. Una volta che il danno è stato riparato, la proteina RecA è inattivata e la proteina LexA di nuova sintesi reprime i geni per la riparazione. Tra i prodotti genici sintetizzati durante la risposta SOS vi è la DNA polimerasi per la sintesi translesionale di DNA. Questa polimerasi continua la replicazione in corrispondenza e oltre le lesioni, anche se nel farlo incorpora uno o più nucleotidi che non sono specificati dal fiMutL



Nota chiave Le mutazioni determinano un danno al DNA. Sia i procarioti sia gli eucarioti possiedono vari sistemi di riparazione che fanno fronte a diversi tipi di danno al DNA. Tutti i sistemi utilizzano specifici enzimi per compiere le correzioni. Senza tali sistemi di riparazione delle lesioni, esse si accumulerebbero e potrebbero essere letali per la cellula e per l’organismo. Non tutte le lesioni vengono riparate; di conseguenza le mutazioni si manifestano, ma con frequenze relativamente basse. Ad alte dosi di mutageni, i sistemi di riparazione non sono in grado di correggere tutti i danni al DNA e ciò può portare alla morte della cellula.

Mutazione, riparazione del DNA ed elementi trasponibili

lamento stampo. Questi nucleotidi non si appaiano con quelli dello stampo; quindi, il sistema SOS è intrinsecamente un sistema mutageno, perché alcuni danni vengono introdotti nel DNA quando SOS è attivato. Tuttavia, queste mutazioni sono meno gravi rispetto alle mutazioni potenzialmente letali causate da un DNA non completamente replicato.

137

Malattie genetiche umane derivanti da mutazioni che interessano i sistemi di replicazione e di riparazione del DNA Alcune malattie umane sono state attribuite a difetti nella replicazione o nella riparazione del DNA; alcuni esempi sono riportati nella Tabella 7.1. Per esempio, lo

Tabella 7.1 Esempi di alcuni mutanti spontanei nell’uomo difettivi nella replicazione o nella riparazione del DNA Malattia e tipo di ereditarietà

Sintomi

Funzioni coinvolte

Localizzazione cromosomicaa e numero OMIM

Xeroderma pigmentoso (XP) – autosomico recessivo

Sensibilità alla luce con lentiggini e tumori cutanei; letale in età relativamente giovane come conseguenza dello sviluppo di tumori maligni

Meccanismi di riparazione del DNA danneggiato da irradiazione con UV o esposizione a sostanze chimiche

9q34.1 – 278700

Atassia telangectasia (AT) – autosomica recessiva

Difetto nella coordinazione muscola- Meccanismi di riparazione delle rotre; predisposizione a infezioni respi- ture a doppio filamento del DNA ratorie; progressiva atrofia muscolare spinale in una frazione significativa dei pazienti nella seconda e terza decade di vita; marcata ipersensibilità alle radiazioni ionizzanti; predisposizione al cancro; alta frequenza di rotture cromosomiche che determinano traslocazioni e inversioni

11q22.3 – 208900

Anemia di Fanconi (AF) – autosomica recessiva

Anemia aplasticab; variazioni nella pigmentazione della pelle; malformazione di cuore, rene e arti; la leucemia è una complicazione letale; anormalità genitali frequenti nei maschi; rottura spontanea dei cromosomi

Riparazione replicativa del DNA, mancata eliminazione di lesioni interfilamento o da sostanze chimiche; è stato ipotizzato che nei pazienti affetti da AF siano alterati un’esonucleasi necessaria per la riparazione, una DNA ligasi e il trasporto degli enzimi di riparazione

16q24.3 – 227650

Sindrome di Bloom (BS) – autosomica recessiva

Difetti di crescita pre- e postnatali; malattie cutanee dovute a fotosensibilità; predisposizione al cancro; instabilità dei cromosomi; lo sviluppo del diabete mellito è frequente nella seconda e terza decade di vita

Allungamento delle catene di DNA durante la replicazione; il gene candidato è omologo dell’elicasi Q di E. coli

15q26.1 – 210900

Sindrome di Cockayne (CS) – autosomica recessiva

Nanismo; precoce aspetto senile; atro- Lo specifico difetto molecolare fia oculare; sordità; sensibilità alla luce è ignoto, ma potrebbe implicare la risolare; ritardo mentale; arti spropor- parazione associata alla trascrizione zionatamente lunghi; la contrattura alle ginocchia ne causa l’aspetto ad arco; morte precoce

Cancro del colon non-poliposico ereditario (HNPCC) – autosomico dominante

Tendenza ereditaria allo sviluppo di cancro colorettale non poliposico

a b

Si sviluppa un difetto nella riparazione degli appaiamenti errati quando l’unico allele selvatico dell’eterozigote va incontro a mutazione; è stato dimostrato che l’omozigosi per uno qualsiasi dei quattro geni (hMSH2, hMLH1, hPMS1 e hPMS2, noti come geni mutatori) dà origine a HNPCC

Se esistono vari gruppi di complementazione, è indicata la posizione del difetto più comune. Individui affetti da anemia aplastica producono una quantità nulla o scarsa di eritrociti.

5 – 216400

Nan2p22-p21 – 114500

138

Capitolo 7

Figura 7.20 Un individuo con xeroderma pigmentoso.

xeroderma pigmentoso (XP, OMIM 278700; Figura 7.20) è causato da una mutazione recessiva in omozigosi a carico di un gene della riparazione. Persone affette da questa malattia letale sono fotosensibili e le parti della loro epidermide che vengono esposte alla luce presentano pigmentazione intensa, lentiggini e crescita di escrescenze che possono diventare maligne. I pazienti affetti da XP hanno difetti nella riparazione per escissione del danno causato dalla luce UV o da alcuni specifici agenti chimici. Quindi, individui con xeroderma pigmentoso sono incapaci di riparare i danni causati al DNA da radiazioni UV e spesso muoiono a causa di tumori conseguenti a questi danni.

Elementi trasponibili In questo paragrafo esamineremo la natura degli elementi trasponibili e come essi causino cambiamenti genetici.

Le caratteristiche generali degli elementi trasponibili Gli elementi trasponibili sono componenti normalmente presenti e ubiquitarie dei genomi dei procarioti e degli eucarioti. Sono classificati in due classi principali, in base al modo in cui si muovono da un sito all’altro del genoma. Una classe – presente sia nei procarioti sia negli eucarioti – è composta da elementi che si spostano sotto forma di segmenti di DNA. I membri dell’altra classe – presente solo negli eucarioti – sono imparentati con i retrovirus e si muovono attraverso un intermedio a RNA. Dapprima viene realizzata una copia in RNA di quell’elemento, quindi l’RNA funge da stampo per un DNA che viene integrato in una nuova posizione nel genoma.

Nei batteri gli elementi trasponibili possono spostarsi in posizioni nuove sullo stesso cromosoma oppure su plasmidi o cromosomi fagici, mentre negli eucarioti gli elementi trasponibili possono muoversi sia in posizioni diverse sullo stesso cromosoma, sia su cromosomi diversi. Sia nei procarioti sia negli eucarioti gli elementi trasponibili si inseriscono in nuove posizioni sul cromosoma, con le quali non hanno omologia di sequenza; la trasposizione quindi è un processo diverso dalla ricombinazione omologa (che avviene tra sequenze di DNA corrispondenti) ed è chiamata ricombinazione non omologa. Gli elementi trasponibili sono importanti per i cambiamenti genetici che causano. Per esempio, possono produrre mutazioni inserendosi nei geni (un processo noto come mutagenesi inserzionale), possono aumentare o diminuire l’espressione genica inserendosi nelle sequenze di regolazione genica (per esempio alterando le funzioni di un promotore oppure stimolando l’espressione di un gene attraverso l’azione di promotori presenti sull’elemento) e, per effetto del meccanismo di trasposizione, possono produrre vari tipi di mutazioni cromosomiche. D’altra parte, è probabile che gli elementi trasponibili abbiano contribuito all’evoluzione dei genomi di procarioti ed eucarioti grazie ai riarrangiamenti cromosomici che hanno prodotto. La frequenza della trasposizione varia a seconda del particolare elemento considerato, ma è di solito molto bassa. Se fosse alta, i cambiamenti genetici causati dalla trasposizione sarebbero probabilmente letali.

Gli elementi trasponibili dei batteri Due esempi di elementi trasponibili nei batteri sono le sequenze di inserzione (IS) e i trasposoni (Tn). Le sequenze di inserzione Una sequenza di inserzione (IS) o elemento IS è l’elemento trasponibile più semplice che si possa trovare in un batterio. Un elemento IS contiene solo i geni necessari per la mobilizzazione dell’elemento e la sua inserzione in una nuova localizzazione nel genoma. Gli elementi IS sono componenti normali dei cromosomi e dei plasmidi batterici. Furono scoperti per la prima volta in E. coli a nimazione causa del loro effetto sull’espressione di tre geni che controllano Sequenze il metabolismo dello zucchero di inserzione galattosio. Alcune mutazioni che nei batteri influenzavano l’espressione di questi geni non possedevano le caratteristiche tipiche di mutazioni puntiformi o di delezioni, ma determinavano l’inserzione in un gene di un frammento di DNA lungo circa 800 coppie di basi. Questo particolare segmento di DNA è ora chiamato sequenza di inserzione 1, o più semplicemente IS1 (Figura 7.21), e l’inserzione di IS1 nel genoma è un esempio di un evento di trasposizione.

MyLab

Mutazione, riparazione del DNA ed elementi trasponibili Sequenza di inserzione, IS1 Gene per la trasposasi

IR

stessa sequenza si trova a ciascuna estremità della IS, ma con orientamento opposto. Le sequenze ripetute invertite di IS1 sono lunghe 23 coppie di basi (Figura 7.21). Quando gli elementi IS si integrano a caso nel cromosoma, essi producono spesso delle mutazioni, interrompendo la sequenza codificante di un gene oppure alterandone le sequenze di regolazione. I promotori contenuti negli elementi IS possono a loro volta alterare l’espressione dei geni adiacenti. Inoltre, la presenza di un elemento IS nel cromosoma può causare mutazioni, come delezioni o inversioni nel DNA adiacente. Infine, delezioni e inversioni possono anche avvenire in seguito a crossingover tra due elementi IS duplicati nello stesso genoma. La trasposizione di un elemento IS richiede l’azione di un enzima definito trasposasi, codificato dallo stesso elemento IS. La trasposasi riconosce le sequenze IR dell’elemento per dare inizio alla trasposizione. Ogni elemento IS ha una sua frequenza di trasposizione caratteristica, che varia tra 10–5 e 10–7 per generazione. La Figura 7.22 mostra come un elemento IS si inserisca in un nuovo punto del cromosoma con il quale non ha omologia di sequenza, definito sito bersaglio. Inizialmente viene prodotto un taglio asimmetrico nel sito bersaglio e l’elemento IS vi si inserisce, unendosi alle estremità a singolo filamento. La DNA polimerasi e la DNA ligasi colmano la lacuna prodotta, realizzando un ele-

IR

5′

GGTGATGCTGCCAACT TACTGAT

3′

5′

ATCAATAAGT TGGAGTCAT TACC

3′

3′

CCACTACGACGGT TGAATGACTA

5′

3′

TAGT TAT TCAACCTCAGTAATGG

5′

139

Figura 7.21 La sequenza di inserzione (IS) dell’elemento trasponibile IS1. L’elemento IS è lungo 768 coppie di basi e ha una ripetizione invertita (IR) a ciascuna estremità. Sotto l’elemento sono indicate le sequenze delle ripetizioni invertite terminali (IR) di 23 coppie di basi.

In E. coli ci sono numerose IS (per esempio IS1, IS2, e IS10R), ognuna delle quali è presente anche in 30 copie per genoma ed è caratterizzata da una lunghezza definita e da una sequenza nucleotidica unica. IS1, per esempio, ha una lunghezza di 768 coppie di basi ed è presente nel cromosoma di E. coli in un numero di 4-19 copie. Considerando globalmente i batteri, gli elementi IS variano in dimensione tra 768 e oltre 5000 coppie di basi e sono presenti nella maggior parte delle cellule. Tutti gli elementi IS hanno alle estremità terminali delle sequenze ripetute invertite (IR) identiche o non del tutto identiche, di dimensioni comprese tra le 9 e le 41 coppie di basi. Questo significa che essenzialmente la IS

C T G A A C T G T 3′ G A C T T G A C A 5′

5′ A C A G T T C A G 3′ T G T C A A G T C IR

IR

Inserzione di un elemento IS nel DNA cromosomico Sito bersaglio Taglio

DNA cromosomico

T CG A T A GC T A

5′ 3′

3′ 5′

Taglio Elemento IS inserito 5′ 3′

T CG A T A C A G T T C A G TGT CA AGT C

C TGA AC TGT G A C T T G A C A A GC T A

IR

IR Spazi vuoti riempiti da DNA polimerasi e DNA ligasi

DNA ospite 5′ 3′

T CG A T A C A G T T C A G A GC T A T G T C A A G T C Nuovo DNA

3′ 5′

Nuovo DNA C T G A A C T G T T CG A T G A C T T G A C A A GC T A

IR

IR

3′ 5′

DNA ospite

Sequenza duplicata nel sito bersaglio

Figura 7.22 Il processo di integrazione di un elemento IS nel DNA cromosomico. In seguito all’evento di integrazione, il sito bersaglio si duplica e produce ripetizioni che rappresentano un bersaglio diretto. In questo modo un elemento IS integrato è caratterizzato dalle proprie sequenze terminali ripetute invertite (IR), fiancheggiate dalle sequenze ripetute dirette

del bersaglio. L’integrazione comporta la produzione di tagli sfalsati nel sito bersaglio dell’ospite. Dopo l’inserimento dell’IS gli spazi vuoti vengono riempiti per azione della DNA polimerasi e della DNA ligasi. (Nota: le sequenze di basi delle IR hanno solo uno scopo illustrativo e non sono uguali a quelle reali né nell’ordine né nella lunghezza.)

140

Capitolo 7

a)

b) Trasposone Tn10

Trasposone Tn3 4957 bp

9300 bp 1400 bp

IS10L Ripetizione invertita dell’elemento IS

6500 bp

Gene per la resistenza alla tetraciclina (TcR)

tnpA

1400 bp IS10R Ripetizione invertita dell’elemento IS

Trasposasi Ripetizione invertita di sinistra (38 pb)

tnpB

Resolvasi

bla β-lattamasi Ripetizione invertita di destra (38 pb)

mRNAs

Elementi IS invertiti

Figura 7.23 La struttura dei trasposoni batterici. (a) Il trasposone composito Tn10. Le caratteristiche generali di un trasposone composito sono una regione centrale che porta uno o più geni, per esempio per la resistenza ad antibiotici, fiancheggiata da elementi IS diretti o invertiti. Il trasposone Tn10 è lungo 9300 coppie di basi e consiste di una regione centrale non ripetuta di DNA, lunga 6500 coppie di basi e contenente il gene per la resistenza alla tetraciclina, fiancheggiata a ciascuna estremità da elementi IS lunghi 1400 coppie di basi, IS10L e IS10R, in orientamento inverso. Gli elementi IS

mento IS integrato, con due ripetizioni dirette del sito bersaglio che lo fiancheggiano. In questo caso, dirette significa che le due sequenze hanno lo stesso orientamento (Figura 7.22). Le ripetizioni dirette sono definite anche come duplicazioni del sito bersaglio. La loro dimensione è specifica per l’elemento IS, anche se generalmente si tratta di brevi sequenze (4-13 coppie di basi). I trasposoni Come un elemento IS, un trasposone (Tn) è un segmento di DNA mobile che contiene i geni necessari per la sua integrazione e il suo spostamento in altre posizioni sul cromosoma. Tuttavia un trasposone è più complesso di un elemento IS, poiché contiene geni addizionali. Ci sono due tipi di trasposoni nei batteri: i trasposoni compositi e quelli non compositi (Figura 7.23). I trasposoni compositi (Figura 7.23a), esemplificati da Tn10, sono trasposoni complessi, con una regione centrale che contiene geni (per esempio geni per la resistenza ad antibiotici), fiancheggiata da entrambi i lati da elementi IS (chiamati anche moduli IS). I trasposoni compositi possono essere lunghi alcune migliaia di coppie di basi. Gli elementi IS sono entrambi dello stesso tipo e sono chiamati ISL (left, “sinistra”) e ISR (right, “destra”). A seconda del trasposone, ISL e ISR possono avere uno stesso oppure un inverso orientamento reciproco. Poiché gli elementi IS hanno delle sequenze terminali ripetute invertite, anche i trasposoni compositi hanno delle estremità ripetute invertite. La trasposizione dei trasposoni compositi avviene per le funzioni fornite dai moduli IS. Uno o entrambi i moduli forniscono la trasposasi, che riconosce le sequen-

hanno essi stessi delle sequenze ripetute invertite terminali. (b) La struttura del trasposone non composito Tn3. Il trasposone Tn3, lungo 4957 coppie di basi, contiene nella sua regione centrale tre geni che codificano per altrettanti enzimi: bla che codifica per una β-lattamasi (che inattiva antibiotici come la penicillina e l’ampicillina), tnpA che codifica per la trasposasi, e tnpB che codifica per la resolvasi. Trasposasi e resolvasi sono coinvolte nel processo traspositivo. Tn3 ha delle sequenze terminali ripetute invertite di 38 coppie di basi che non assomigliano a quelle degli elementi IS.

ze invertite degli elementi IS a ciascuna estremità del trasposone e inizia la trasposizione (come avviene per gli elementi IS). La trasposizione di Tn10 è rara, verificandosi una volta in 107 generazioni cellulari. Come gli elementi IS, i trasposoni compositi producono duplicazioni del sito bersaglio dopo la trasposizione. Per esempio, Tn10 produce una duplicazione di 9 coppie di basi. Anche i trasposoni non compositi (Figura 7.23b), dei quali Tn3 è un esempio rappresentativo, contengono geni, quali quelli che conferiscono la resistenza ad antibiotici. Tuttavia essi non terminano con degli elementi IS. Possiedono comunque le sequenze ripetute invertite terminali, necessarie per la trasposizione. Gli enzimi per la trasposizione sono codificati dai geni della regione centrale dei trasposoni non compositi. La trasposasi catalizza l’inserzione di un trasposone in un nuovo sito e la resolvasi è un enzima coinvolto in un particolare evento di ricombinazione associato alla trasposizione. Analogamente ai trasposoni compositi, i trasposoni non compositi causano duplicazioni dei siti bersaglio. Per esempio, Tn3 produce una duplicazione di 5 coppie di basi quando si inserisce nel genoma. Nella Figura 7.24 è illustrato il meccanismo di cointegrazione relativo alla trasposizione di un trasposone da un DNA a un altro (per esempio, da un plasmide al cromosoma batterico o viceversa). Simili eventi possono avvenire tra due siti dello stesso cromosoma. Inizialmente, il DNA donatore, che contiene l’elemento trasponibile, si fonde col DNA ricevente a formare un cointegrato. Per il modo in cui ciò avviene, l’elemento trasponibile viene duplicato e ciascuna copia si localizza a livello di una giunzione tra DNA donatore e DNA rice-

Mutazione, riparazione del DNA ed elementi trasponibili DNA ricevente

DNA donatore + IR’s

Elemento trasponibile

Sequenza bersaglio

Il DNA donatore e il ricevente vengono aperti dalla trasposasi nel punto indicato dalle frecce e si fondono

Le regioni a singolo filamento vengono colmate per replicazione del DNA e ciò realizza una copia del trasposone e della sequenza bersaglio. Si forma un cointegrato

Cointegrato

141

sposone stesso. Questo meccanismo traspositivo è chiamato trasposizione conservativa (non replicativia) (chiamata anche trasposizione taglia e incolla). In altre parole, il trasposone viene perso dalla posizione originaria dalla quale si muove. Tn10 traspone in maniera conservativa. Come avviene per gli elementi IS, anche la trasposizione dei trasposoni può causare mutazioni. L’inserzione di un trasposone nel modulo di lettura di un gene lo stravolge, determinando una mutazione con perdita della funzione di quel gene. L’inserzione nella regione di regolazione di un gene può determinare una variazione nel livello della sua espressione, dipendente dai promotori presenti nel trasposone e dal loro orientamento rispetto al gene. Delezioni e inserzioni sono altri eventi che possono derivare dall’attività dei trasposoni e da crossing-over tra trasposoni duplicati nel genoma.

Attività Nella iAttività The genetics shuffle (Il rimescolamento della genetica) nel sito dedicato agli studenti, sarete un ricercatore in un laboratorio di genetica che studia il modo in cui viene trasposto il trasposone Tn10.

Gli elementi trasponibili degli eucarioti Risoluzione: la ricombinazione tra elementi trasponibili duplicati produce due molecole di DNA, ciascuna con un elemento trasponibile

Figura 7.24 Modello cointegrativo della trasposizione replicativa di un elemento trasponibile. Un DNA donatore contenente l’elemento trasponibile si fonde con il DNA accettore. Durante la fusione l’elemento trasponibile viene replicato, cosicché il prodotto è una molecola di cointegrazione con un elemento trasponibile a ciascuna estremità della giunzione tra DNA donatore e DNA ricevente. La molecola di cointegrazione viene risolta per ricombinazione in due molecole, ciascuna con una copia dell’elemento trasponibile.

vente. Successivamente, la ricombinazione tra gli elementi trasponibili duplicati risolve il cointegrato in due prodotti, ciascuno con una copia dell’elemento trasponibile. Poiché l’elemento trasponibile si duplica, il processo viene indicato col nome di trasposizione replicativa (chiamata anche trasposizione copia e incolla). Tn3 e i trasposoni non compositi correlati si muovono attraverso trasposizione replicativa. Un secondo meccanismo di trasposizione prevede il movimento del trasposone in una nuova posizione, dello stesso o di una altro DNA, senza la replicazione del tra-

Elementi trasponibili sono stati individuati in molti eucarioti e sono stati studiati soprattutto nel lievito, in Drosophila, nel mais e nell’uomo. Generalmente, la loro struttura e la loro funzione sono molto simili a quelle viste negli elementi trasponibili dei procarioti. Gli elementi trasponibili funzionali degli eucarioti hanno geni che codificano per gli enzimi necessari per la trasposizione e possono integrarsi nei cromosomi in siti diversi. Quindi questi elementi possono influenzare la funzione di ogni gene. Di solito, gli effetti vanno dall’attivazione alla repressione dei geni adiacenti, alle mutazioni cromosomiche, come duplicazioni, delezioni, inversioni, traslocazioni o rotture. Quindi, come avviene per gli elementi IS e i trasposoni batterici, la trasposizione di elementi trasponibili all’interno di un gene causa di solito mutazioni. L’interruzione della sequenza codificante di un gene determina tipicamente una mutazione nulla, che elimina totalmente l’espressione del gene. Se un elemento trasponibile si inserisce nel promotore di un gene, l’efficienza di questo promotore può essere diminuita o annullata. Alternativamente, il trasposone può fornire esso stesso un promotore e determinare un aumento dell’espressione genica. Caratteristiche generali dei trasposoni vegetali Analogamente ad alcuni elementi trasponibili illustrati in precedenza, quelli delle piante possiedono sequenze ripetute invertite (IR) alle loro estremità e generano corte ripetizioni dirette del DNA del sito bersaglio in fase di integrazione.

MyLab

142

MyLab

Capitolo 7

Gli elementi trasponibili sono stati particolarmente ben studiati nel mais. I genetisti hanno identificato numerose famiglie di elementi trasponibili. Ogni famiglia è formata da una serie di elementi trasponibili con caratteristiche proprie per numero, tipo e localizzazione. Ogni famiglia è formata da due tipologie: gli elementi autonomi, che possono trasporre da soli, e gli elementi non autonomi, che non possono trasporre da soli perché mancano del gene per la trasposizione. Gli elementi non autonomi hanno bisogno di un elemento autonomo che supplisca le funzioni mancanti. Spesso un elemento non autonomo è un derivato difettivo dall’elemento autonomo della famiglia. Quando un elemento autonomo è inserito in un gene ospite, l’allele mutante che ne deriva è instabile, poiché l’elemento può essere escisso e trasposto in una nuova posizione. Questo evento di trasposizione determina il ripristino della funzione del gene. La frequenza di trasposizione al di fuori del gene è maggiore della frequenza di reversione spontanea tipica di una mutazione puntiforme. L’allele prodotto per inserzione di un elemento trasponibile autonomo è indicato come allele mutabile. Al contrario, gli alleli mutanti per inserzione di un elemento non autonomo sono stabili, perché l’elemento non è in grado di trasporre da solo al di fuori del gene. Se però un elemento autonomo della stessa famiglia è presente o viene introdotto nello stesso genoma, esso può fornire gli enzimi necessari per la trasposizione, e

nimazione Elementi trasponibili nelle piante

Box 7.1

quindi anche l’elemento non autonomo può trasporre e spostarsi nel genoma. Elementi trasponibili nel mais: gli studi di McClintock Negli anni quaranta e cinquanta del secolo scorso, Barbara McClintock realizzò una serie di eleganti esperimenti di genetica utilizzando il mais (Zea mays), che la portarono a ipotizzare l’esistenza di quelli che chiamò “elementi di controllo”, che modificavano o sopprimevano l’attività genica nel mais e si spostavano nel genoma. Decenni dopo è stato dimostrato che gli elementi di controllo erano elementi trasponibili. Per i suoi studi che la portarono alla “scoperta di elementi genetici mobili”, nel 1983 Barbara McClintock venne insignita del Premio Nobel per la Fisiologia o Medicina. Un’affascinante biografia di Barbara McClintock è riportata nel Box 7.1. Gli studi di McClintock furono incentrati sulla genetica della pigmentazione delle cariossidi del mais. La sintesi del pigmento rosso degli antociani, che dà un intenso colore viola alla cariosside, è regolata dalla funzione coordinata di numerosi geni. Mutazioni a carico di ciascuno di questi geni causano la formazione di una cariosside non pigmentata. McClintock concentrò la sua attenzione su quelle cariossidi che, anziché essere completamente pigmentate o completamente incolori, esibivano delle macchie di colore su una cariosside bianca (Figura 7.25). Le era noto che questo fenotipo dipendeva da mutazioni instabili. Studi accurati di genetica e di citologia portarono McClintock a concludere che il fenotipo a macchie non era dovuto all’effetto di mutazioni di

Barbara McClintock (1902-1992)

La vita di Barbara McClintock ha accompagnato la storia della genetica del ventesimo secolo. Barbara McClintock nacque ad Hartford, in Connecticut negli Stati Uniti d’America, da Sara Handy McClintock, pianista, poetessa e pittrice, e da Thomas Henry McClintock, medico. Entrambi i genitori avevano idee poco convenzionali circa l’educazione dei figli: erano più preoccupati di che cosa i bambini volevano e potevano essere, piuttosto che di che cosa dovevano essere. Durante le scuole superiori, Barbara scoprì la scienza e che amava imparare e soprattutto capire come funzionassero le cose. McClintock fiorì, sia dal punto di vista sociale sia da quello intellettuale, alla Cornell University. Apprezzava la vita sociale, ma i temi portanti della sua vita erano già diventati il piacere della solitudine e l’immensa gioia che provava nell’imparare, conoscere e capire. Le decisioni che ella prese durante gli anni universitari erano in linea con la sua adamantina individualità e autosufficienza. Dopo un corso di genetica particolar-

Barbara McClintock nel 1947.

mente interessante, che seguì durante il primo anno all’università, il suo professore la esortò a seguire anche i corsi avanzati della stessa materia, e da

Mutazione, riparazione del DNA ed elementi trasponibili allora in poi cominciò a considerarla come una dottoranda. Al termine del corso di laurea, non c’erano più dubbi nella sua mente: avrebbe proseguito gli studi in genetica. Alla Cornell, la genetica era insegnata nel Dipartimento di incroci vegetali, che non accettava dottorandi di sesso femminile. Per superare questo ostacolo, McClintock si iscrisse al Dipartimento di botanica, con indirizzo principale citologia, e genetica e zoologia come materie accessorie. Cominciò a lavorare come assistente retribuita con il citologo Lowell Randolph. McClintock e Lowell non andarono d’accordo e presto sciolsero il loro rapporto di lavoro, ma, come ebbe a scrivere Marcus Rhoades, collega e amico per tutta la vita di McClintock, “la loro breve collaborazione fu di grande importanza, perché diede vita alla citogenetica del mais”. McClintock scoprì che i cromosomi della metafase o tarda profase nella prima mitosi delle microspore erano di gran lunga migliori per la valutazione citologica dei cromosomi degli apici radicali. Nel giro di poche settimane fu in grado di produrre dei disegni accurati dei cromosomi del mais, che pubblicò su Science. Questo rappresentò il primo importante contributo di McClintock alla genetica del mais e pose le fondamenta per una vera e propria esplosione di scoperte che mettevano in relazione il comportamento dei cromosomi con le caratteristiche genetiche dell’organismo, definendo così il nuovo campo della citogenetica. McClintock conseguì il PhD nel 1927 e divenne assistente alla Cornell, continuando a lavorare con il mais. Il gruppo di genetica del mais della Cornell non era grande e includeva il Prof. R.A. Emerson, fondatore della genetica del mais, la stessa McClintock, George Beadle, C.R. Burnham, Marcus Rhoades e Lowell Randolph, insieme ad alcuni dottorandi. Stando a tutte le testimonianze, McClintock fu la vera forza ispiratrice di questo gruppo di talenti. Nel 1929, al gruppo si aggiunse una nuova dottoranda, Harriet Creighton, che fu diretta personalmente da McClintock. Il loro lavoro dimostrò per la prima volta che la ricombinazione genetica era dovuta a un effettivo scambio fisico di materiale genetico tra cromosomi. La relazione del loro lavoro, pubblicata nel 1931, rappresentò forse il primo contributo determinante di McClintock alla scienza della genetica. Nonostante la fama di McClintock stesse crescendo, ella non aveva ancora un incarico fisso. La Cornell non aveva docenti di sesso femminile in un campo che non fosse quello dell’economia domestica, quindi le sue prospettive erano deprimenti. Aveva già raggiunto notorietà internazionale, ma, in quanto donna, aveva pochissime speranze di ottenere una posizione accademica permanente presso un’università in cui si svolgesse della ricerca di alto livello. R.A.

143

Emerson ottenne un finanziamento biennale della Fondazione Rockefeller che le permise di svolgere il proprio lavoro in modo indipendente. McClintock era scoraggiata e risentita per questa disparità di trattamento e di prospettive rispetto ai suoi colleghi uomini. Il suo straordinario talento e le sue notevoli scoperte erano largamente riconosciuti, ma molti dei suoi colleghi la trovavano difficile, in gran parte per la sua mente brillante e la sua insofferenza per i lavori e i ragionamenti di second’ordine. Nel 1936, Lewis Stadler riuscì a convincere l’Università del Missouri a offrirle un posto di professore aggregato. McClintock accettò la posizione e cominciò a studiare il comportamento dei cromosomi del mais danneggiati per irraggiamento con raggi X. Tuttavia, poco dopo il suo arrivo nel Missouri aveva compreso che la sua era da considerarsi una posizione particolare, che la escludeva dalle normali attività accademiche, compresi i Consigli di facoltà. Nel 1941 prese un periodo di congedo dall’università e partì con l’intenzione di non farvi ritorno. Scrisse al suo amico Marcus Rhoades, che era in procinto di recarsi a Cold Spring Harbor, nello Stato di New York, per far crescere il suo mais durante l’estate. Grazie ai buoni uffici di Milislav Demerec (membro e successivamente direttore del Dipartimento di genetica della Carnegie Institution di Washington, allora il più importante laboratorio di genetica a Cold Spring Harbor), McClintock venne invitata e le venne offerta una posizione annuale in ricerca. Sebbene esitante, accettò, così come fece quando più tardi Demerec le propose un incarico come membro permanente del gruppo di ricerca, anche se non era ancora del tutto sicura di rimanere. La sua avversione per qualsiasi forma di impegno fisso era un dato di fatto: ella stessa asseriva che non sarebbe mai diventata una scienziata nel mondo attuale dei finanzimenti, perché non avrebbe potuto legarsi a un progetto di ricerca scritto. Era l’inatteso ad affascinarla ed era sempre pronta a inseguire qualsiasi cosa risultasse fuori dal previsto. McClintock tuttavia si fermò alla Carnegie fino al 1967. Qui McClintock continuò i suoi studi sul comportamento dei cromosomi danneggiati. Nel 1944 fu eletta membro dell’Accademia Nazionale delle Scienze, e nel 1945 presidente della Società Genetica d’America. Negli stessi due anni pubblicò l’osservazione di “un interessante tipo di comportamento dei cromosomi” che era dovuto alla perdita ripetuta di uno dei cromosomi rotti da parte delle cellule durante lo sviluppo. La stranezza che la colpì fu che in questo particolare caso era sempre il cromosoma 9 a rompersi, e sempre nello stesso punto. McClintock chiamò il sito cromosomico instabile Dissociazione (Ds), in quanto “la conseguenza più immediatamente riconoscibile della sua azione è questa dissociazione”. Presto stabilì che il locus Ds

144

Capitolo 7

sarebbe stato “soggetto a mutazione per dissociazione solo quando fosse presente un particolare fattore dominante” e definì questo fattore Attivatore (Ac), in quanto attivava la rottura del cromosoma nel locus Ds. Inoltre ella arrivò alla straordinaria conclusione che Ac non era richiesto solo per la rottura del cromosoma mediata da Ds, ma era in grado di destabilizzare mutazioni precedentemente stabili. Oltre a questo, osservazione assolutamente senza precedenti, il locus Ds per la rottura del cromosoma poteva “cambiare la propria posizione sul cromosoma”, un fenomeno che chiamò trasposizione. Inoltre, ottenne evidenze che il locus Ac era richiesto per la trasposizione di Ds e che, come il locus Ds stesso, anche il locus Ac era mobile. In capo ad alcuni anni aveva stabilito, al di là di ogni ragionevole dubbio, che sia Ac sia Ds erano non soltanto in grado di cambiare posizione sulla mappa genetica, ma anche capaci di inserirsi all’interno di altri loci a dare mutazioni instabili. Il lavoro venne presentato al Simposio di Cold Spring Harbor del 1951. Le reazioni alla presentazione di McClintock variarono dal perplesso all’ostile. In seguito, ella pubblicò diversi lavori su riviste scientifiche con comitato di valutazione ma, dalla scarsità di richieste di copie di quei lavori, dedusse un’ugualmente fredda accoglienza da parte del resto della comunità scientifica alla sconvolgente notizia che i geni potevano muoversi. Il lavoro di McClintock l’aveva ormai portata al di fuori della corrente principale nella ricerca scientifica, ed ella aveva perso la capacità di comunicare con i suoi colleghi. Come McClintock stessa aveva ammesso, non aveva mai posseduto il dono dell’esposizione scritta né il talento di riuscire a spiegare in modo semplice dei fenomeni complessi. Ma forse esistevano dei motivi più profondi per il suo isolamento: la nozione stessa che i geni potessero muoversi si trovava in forte contrapposizione con la visione delle normali relazioni tra geni che accompagnava la costruzione di mappe di concatenazione e la mappatura fisica dei geni sui cromosomi. Il concetto che elementi genetici potessero spostarsi avrebbe incontrato delle forti resistenze qualunque fosse stato l’autore che l’avesse proposto. McClintock era molto frustrata dalla sua incapacità di comunicare, ma era così affascinata dalla storia della trasposizione che si andava sviluppando sotto i suoi occhi, che questo bastò a mantenerla al lavoro sull’argomento al più alto livello possibile di sforzo mentale e fisico. All’epoca del suo formale pensionamento, aveva accumulato una grande quantità di conoscenze circa il comportamento genetico di due famiglie ben distinte di elementi genetici trasponibili. Più o meno nel momento in cui il suo lavoro attivo terminava, gli elementi genetici trasponibili cominciarono a mostrarsi in un organismo dopo l’altro.

Queste scoperte avvenivano in un’epoca del tutto diversa: nei due decenni che erano passati tra la prima scoperta della trasposizione e la sua riscoperta, la genetica aveva attraversato un cambiamento profondo, come quello che la rivoluzione citogenetica aveva apportato nella seconda e terza decade del secolo. Il DNA era stato identificato come il materiale genetico, la maniera in cui l’informazione genetica era codificata nei geni era stata decifrata, ed erano stati pianificati metodi per isolare e studiare geni singoli. I geni non rappresentavano più entità astratte riconoscibili solo attraverso le conseguenze delle loro alterazioni o perdite: erano dei frammenti reali di acido nucleico che potevano essere isolati, visualizzati, alterati e reintrodotti negli organismi. Quando gli elementi trasponibili del mais furono clonati e iniziò la loro analisi molecolare, l’importanza della scoperta della trasposizione effettuata da McClintock fu universalmente riconosciuta e l’apprezzamento pubblico cominciò a crescere. Ella ricevette la National Medal of Science nel 1970, venne proclamata Prize Fellow Laureate della MacArthur Foundation e ricevette il Lasker Basic Medical Research Award, e nel 1982 condivise l’Horwitz Prize. Infine nel 1983, trentacinque anni dopo la pubblicazione delle prime evidenze della trasposizione, McClintock conseguì il Premio Nobel per la Fisiologia o Medicina. McClintock era sicura che sarebbe morta a 90 anni e pochi mesi dopo il suo novantesimo compleanno se ne andò, tranquillamente, come una foglia al giungere dell’autunno. Che cosa abbia rappresentato Barbara McClintock e quale sia il suo lascito è espresso in maniera eloquente in alcune righe scritte molti anni prima dal suo amico e sostenitore Marcus Rhoades, la cui morte precedette la sua di pochi mesi: Una delle cose più importanti circa gli studi di straordinaria bellezza di Barbara McClintock è che essi derivarono esclusivamente dalla sua fatica. Senza aiuti tecnici di alcun tipo, ma per unica virtù della sua illimitata energia, della sua totale devozione per la scienza, della sua originalità, del suo ingegno e della sua intelligenza pronta e vivace, ha compiuto una serie di importanti scoperte senza uguali nella storia della citogenetica. Esperta sperimentatrice, maestra nell’interpretazione dei dettagli citologici, teorica brillante, ella ha avuto un ruolo penetrante e illuminante nello sviluppo della citologia e della genetica.

Adattato con il permesso di Nina Fedoroff e per gentile concessione della National Academy of Sciences, Washington, DC.

Mutazione, riparazione del DNA ed elementi trasponibili

Figura 7.25 Cariossidi di mais, alcune delle quali presentano macchie di colore prodotte da cellule nelle quali un elemento genetico trasponibile è fuoriuscito per trasposizione da un gene per il colore, ripristinando la funzionalità del gene. Le cellule nella zona incolore della cariosside non hanno il pigmento perché un gene per il colore continua a essere inattivato dalla presenza di un elemento trasponibile al suo interno.

tipo convenzionale (come quelle puntiformi), ma era piuttosto il risultato di un elemento di controllo, che noi ora sappiamo essere un trasposone. La spiegazione per le cariossidi a macchie studiate da McClintock è la seguente: se una pianta di mais ha l’allele selvatico C, la cariosside è viola; le mutazioni che determinano l’allele c (colorless, “incolore”) bloccano la produzione di pigmento e la cariosside è quindi incolore. Durante lo sviluppo della cariosside si hanno dei feno-

145

meni di reversione che danno origine a una macchia colorata. Quanto più precocemente l’evento di reversione ha luogo durante lo sviluppo della cariosside, tanto più ampia sarà la macchia di colore. McClintock giunse alla conclusione che la mutazione originaria c era dovuta a un “elemento di controllo mobile”, nella terminologia moderna un trasposone, chiamato Ds per “dissociazione”, inseritosi nel gene C (Figure 7.26a e 7.26b). Ora sappiamo che Ds è un elemento non autonomo. Per la trasposizione di Ds nel gene è indispensabile un altro elemento di controllo mobile, un elemento autonomo chiamato Ac per “attivazione”. Ac può promuovere la trasposizione di Ds al di fuori del gene c (con un’escissione perfetta), che dà luogo al fenotipo di reversione che presenta una macchia colorata (Figura 7.26c). L’aspetto importante delle conclusioni di McClintock sta nel fatto che a quell’epoca non si pensava affatto all’esistenza di elementi genetici trasponibili, ma anzi il genoma era visto come un’entità molto statica, per quanto concerne la posizione dei geni sui cromosomi. Elementi genetici trasponibili sono stati individuati e studiati ampiamente solo di recente e soltanto nel 1983 si è avuta la prova diretta dell’esistenza degli elementi genetici mobili proposti da McClintock.

La famiglia di elementi trasponibili Ac-Ds nel mais La famiglia di elementi di controllo Ac-Ds è stata studiata in dettaglio. L’elemento autonomo Ac è lungo 4563 coppie di basi, con corte sequenze terminali invertite e un singolo gene codificante per la trasposasi. In seguito all’evento di inserzione, nel sito bersaglio esso dà origine a una duplicazione diretta lunga 8 coppie di basi. Gli elementi Ds sono a) Cariossidi viola eterogenei per lunghezza e sequenza Ac Ds C nucleotidica, ma hanno tutti le stesse Il gene C normale promuove IR terminali di Ac, dato che molti di esla produzione del pigmento si hanno avuto origine in seguito a delezioni e riarrangiamenti complessi di b) Cariossidi incolori Attiva la diversa lunghezza a carico di Ac. Come trasposizione di Ds Ds traspone dentro C risultato di questi processi, gli elementi Ds non posseggono un gene per la traAc Ds C sposasi completo, quindi non possono traferirsi da soli. Ds Gene c interrotto (mutante)

Ac

c) Cariossidi a macchie Attiva la trasposizione di Ds fuori da C in poche cellule durante lo sviluppo della cariosside

Ac Reversione della mutazione da c a C Ac

Ds Gene c mutante

C Gene C normale

Figura 7.26 La colorazione della cariosside e gli effetti di elementi trasponibili nel mais. (a) Le cariossidi viola derivano dall’azione di un gene C attivo. (b) Cariossidi incolori sono prodotte quando l’elemento trasponibile Ac attiva la trasposizione di Ds e Ds si inserisce in C, causando una mutazione. (c) Le cariossidi a macchie derivano dalla reversione della mutazione c durante lo sviluppo della cariosside, quando Ac attiva la trasposizione di Ds al di fuori del gene C.

146

Capitolo 7 Sito donatore

Figura 7.27 Il meccanismo di trasposizione di Ac. (a) La trasposizione in un sito accettore già replicatosi non porta a un aumento netto del numero di elementi Ac nel genoma. (b) La trasposizione in un sito accettore non replicatosi porta all’aumento netto del numero di elementi Ac, quando la regione del cromosoma che contiene l’elemento Ac appena trasposto si replica.

Ac L'elemento Ac è replicato nel sito donatore

Replicazione del DNA Ac

a) Trasposizione in un sito accettore già replicatosi Sito accettore

b) Trasposizione in un sito accettore non replicatosi

Sito donatore

Sito donatore

Ac

Ac

Sito accettore

Ac Trasposizione

Ac

Sito donatore vuoto

Trasposizione Completamento della replicazione

Ac

Completamento della replicazione

Sito donatore vuoto

Ac

Sito accettore

Sito donatore

Ac

Ac

Ac Sito donatore vuoto

Sito donatore vuoto Nessun aumento netto del numero di elementi Ac

Aumento netto del numero di elementi Ac

La trasposizione dell’elemento Ac avviene solo durante la replicazione cromosomica ed è il risultato di un meccanismo di trasposizione “taglia e incolla” (conservativa) (Figura 7.27). Supponiamo che sul cromosoma ci sia un’unica copia di Ac, in una posizione chiamata sito donatore. In seguito alla replicazione della regione cromosomica che contiene Ac si originano due copie di Ac, una per ogni cromatide. I risultati della trasposizione di Ac sono di due tipi, a seconda che la trasposizione avvenga in un sito cromosomico replicato oppure non replicato. Se uno dei due elementi Ac traspone in un sito già replicato (Figura 7.27a) un sito donatore su un cromatidio viene lasciato vuoto, mentre un elemento Ac rimane nel sito donatore omologo, sull’altro cromatidio. L’elemento Ac che traspone si inserisce in un nuovo sito ricevente, già replicatosi, che si trova spesso sullo stesso cromosoma. Nella Figura 7.27a il sito di inserzione è mostrato sullo stesso cromatidio dove si trova l’elemento parentale Ac. Quindi, nel caso di trasposizione in un sito già replicatosi, non c’è un aumento netto del numero di elementi Ac nel genoma. La Figura 7.27b illustra la trasposizione di un elemento Ac in un sito cromosomico non replicatosi. Come nel caso precedente, uno dei due elementi Ac traspone, lasciando un sito donatore vuoto su uno dei cromatidi e un elemento Ac nel sito donatore omologo sull’altro cromatidio. Questa volta però l’elemento che traspone si inserisce in un sito accettore vicino che deve essere ancora replicato. Quando questa regione cromosomica si repli-

ca, si ottiene una copia dell’Ac trasposto su ciascuno dei cromatidi, che si aggiunge alla copia originale di Ac presente nel sito donatore di uno dei cromatidi. Quindi, nel caso di trasposizione in un sito accettore non replicatosi, si ha un aumento netto del numero di elementi Ac. La maggior parte degli elementi Ds traspone nello stesso modo di quelli Ac e le funzioni necessarie per la trasposizione sono fornite da un elemento Ac presente nel genoma.

Nota chiave Il meccanismo di trasposizione degli elementi trasponibili delle piante è molto simile a quello della trasposizione degli elementi IS o dei trasposoni batterici. Gli elementi trasponibili si integrano in un sito bersaglio, mediante un meccanismo preciso che fa sì che gli elementi integrati siano fiancheggiati da una breve duplicazione del DNA del sito bersaglio, di lunghezza caratteristica. Molti elementi trasponibili delle piante sono presenti in famiglie, costituite da elementi autonomi in grado di dirigere la propria trasposizione, e da elementi non autonomi, che possono trasporre solo se vengono attivati da un elemento autonomo della stessa famiglia, presente nel genoma. La maggior parte degli elementi non autonomi ha avuto origine da elementi autonomi per delezioni interne o per riarrangiamenti strutturali complessi.

Mutazione, riparazione del DNA ed elementi trasponibili

Gli elementi trasponibili Ty nel lievito Un elemento trasponibile Ty è lungo circa 5900 coppie di basi e include due sequenze terminali ripetute dirette, chiamate lunghe ripetizioni terminali (LTR) o delta (δ). Ogni sequenza delta contiene un promotore e una sequenza riconosciuta dagli enzimi di trasposizione. Gli elementi Ty codificano per un singolo mRNA di 5700 nucleotidi, che incomincia in corrispondenza del promotore della sequenza delta in posizione 5′ (Figura 7.28). Questo mRNA trascritto contiene due moduli di lettura aperti (ORF, Open Reading Frames), denominati TyA e TyB, che codificano per due proteine diverse, richieste per la trasposizione. In media un ceppo contiene circa 35 elementi Ty. Gli elementi Ty sono simili ai retrovirus – virus con un genoma a RNA a singolo filamento che si replicano attraverso un intermedio a DNA a doppia elica. In altri termini, quando un retrovirus infetta una cellula, il suo genoma a RNA è copiato da una trascrittasi inversa, un enzima che è codificato dal genoma virale. La trascrittasi inversa è una DNA polimerasi dipendente da RNA; ciò significa che l’enzima utilizza l’RNA come stampo per sintetizzare una copia di DNA. L’enzima catalizza poi la sintesi di un filamento complementare di DNA, quindi alla fine produrrà una copia di DNA a doppio filamento a partire da un genoma a RNA. Il DNA si integra nel cromosoma della cellula ospite, dove può essere trascritto per produrre la progenie dei genomi virali a RNA e gli mRNA per le proteine virali. Il virus HIV, responsabile dell’AIDS nell’uomo, è un retrovirus. Data la similarità con i retrovirus, si è ipotizzato che gli elementi Ty non traspongano da DNA a DNA, ma creino una copia di RNA della sequenza integrata nel cromosoma e quindi un nuovo elemento Ty grazie alla trascrittasi inversa. L’elemento Ty neoformato si integrerebbe poi in una nuova posizione cromosomica. Una prova a sostegno dell’ipotesi si è ottenuta con elementi Ty modificati con tecniche di manipolazione del DNA in modo da poter sorvegliare facilmente la loro trasposizione. Una prova decisiva derivò da esperimenti nei quali un introne venne inserito nell’elemento Ty (gli elementi Ty normali non hanno introni), e l’elemento venne seguito dalle prime fasi della trasposizio-

147

L’elemento Ty di lievito 5900 bp Lunga ripetizione terminale (delta)

Lunga ripetizione terminale (delta)

DNA Codifica per due proteine RNA

Figura 7.28 L’elemento trasponibile Ty di lievito.

ne. Nella nuova posizione occupata, l’elemento Ty non aveva più l’introne inserito artificialmente. Questa osservazione concordava con l’ipotesi che la trasposizione comprendesse un intermedio a RNA. Successivamente venne dimostrato che gli elementi Ty codificano per una trascrittasi inversa. Inoltre, sono state identificate nei lieviti particelle Ty simili a virus che contengono la copia a RNA di Ty e hanno attività di trascrittasi inversa. Per la loro somiglianza con i retrovirus sotto questo profilo, gli elementi Ty vengono detti retrotrasposoni e il processo di trasposizione è detto retrotrasposizione. Gli elementi trasponibili di Drosophila In Drosophila sono state individuate numerose classi di elementi trasponibili ed è stato stimato che circa il 15% del suo genoma sia costituito da elementi mobili – una percentuale significativa. L’elemento P è un esempio di una famiglia di elementi trasponibili in Drosophila. Gli elementi P hanno lunghezze variabili tra 500 e 2900 coppie di basi e ripetizioni terminali invertite. Gli elementi P più corti sono elementi non autonomi, mentre i più lunghi sono elementi autonomi che codificano per una trasposasi necessaria per la trasposizione di tutti gli elementi P (Figura 7.29). L’inserzione di un elemento P in un nuovo sito determina una ripetizione diretta del sito bersaglio. Gli elementi P sono importanti vettori per introdurre geni nella linea cellulare germinale di embrioni di Drosophila, consentendo la manipolazione genetica dell’organismo. La Figura 7.30 illustra un esperimento

Elemento P di Drosophila Sequenza centrale di 2900 coppie di basi; trascritta da sinistra a destra 1 Ripetizione invertita di 31 bp

2 Introne 1

3 Introne 2

4 Introne 3

La regione codificante della sequenza centrale include una trasposasi. Dopo la trascrizione e la poliadenilazione, le sequenze codificanti da 1 a 4 processate vengono assortite in diverse combinazioni che producono polipeptidi diversi.

Ripetizione invertita di 31 bp

Figura 7.29 La struttura dell’elemento trasponibile autonomo P scoperto in Drosophila melanogaster.

148

Capitolo 7 Elemento P contenente il gene rosy +

Gene

Nota chiave

rosy +

Vettore plasmidico batterico

Embrione da un mutante rosy

Il plasmide ricombinante viene clonato in E. coli e microiniettato in embrioni di Drosophila Micropipetta

DNA di Drosophila

La trasposizione dell’elemento P introduce il gene rosy + nel genoma di Drosophila

Elemento P

Gene rosy + Duplicazione del sito bersaglio

I discendenti hanno il normale colore dell’occhio

Figura 7.30 Schema che illustra l’uso di elementi P per introdurre geni nel genoma di Drosophila.

condotto da Gerald M. Rubin e Allan C. Spradling, nel quale il gene selvatico rosy+ è stato introdotto nel ceppo omozigote per l’allele mutato rosy (che ha un occhio di colore intermedio tra rosso e marrone). Il gene selvatico rosy+ è stato inserito nel mezzo di un elemento P mediante tecniche di DNA ricombinante e clonato in un vettore plasmidico (vedi Capitolo 8). I plasmidi sono stati quindi microiniettati in embrioni rosy nelle regioni che daranno origine alle cellule della linea germinale. La trasposasi codificata dall’elemento P ha promosso la mobilizzazione di P, insieme al gene rosy+ in esso contenuto, nel genoma di alcune cellule della linea germinale di Drosophila. Quando i moscerini derivati da questi embrioni hanno prodotto gameti, essi contenevano il gene rosy+ e la loro discendenza aveva occhi di colore normale. In linea di principio, qualsiasi gene può essere trasferito nel genoma del moscerino in questo modo.

Gli elementi trasponibili degli eucarioti possono trasporre in un nuovo sito, lasciando nel sito originario una copia di se stessi, oppure possono essere eliminati dal cromosoma. Quando l’escissione è imperfetta, possono aver luogo delezioni; in seguito a vari eventi di ricombinazione possono aver origine altri riarrangiamenti cromosomici, quali inversioni e duplicazioni. Mentre la maggior parte degli elementi trasponibili si muove mediante un meccanismo che prevede il passaggio da DNA a DNA, alcuni elementi trasponibili eucarioti, come gli elementi Ty di lievito, traspongono attraverso un intermedio a RNA (sintetizzato da una trascrittasi inversa codificata dall’elemento trasponibile) e assomigliano quindi ai retrovirus.

I retrotrasposoni umani Nel Capitolo 2 abbiamo discusso delle diverse classi di sequenze ripetute di DNA riscontrate nel genoma. È importante qui citare le sequenze LINE (Long Interspersed Sequences, “lunghe sequenze intersperse”) e le sequenze SINE (Short Interspersed Sequences, “brevi sequenze intersperse”), che si trovano nella classe di sequenze moderatamente ripetute. Le LINE sono sequenze ripetute di circa 1000-5000 coppie di basi che si trovano disperse tra DNA a sequenza unica. Le sequenze SINE hanno una dimensione che varia da circa 100 a 400 coppie di basi e sono disperse fra DNA a sequenza unica. Sia le LINE sia le SINE sono organizzate in famiglie alle quali appartengono elementi con omologie di sequenza. Come gli elementi Ty di lievito, le LINE e le SINE sono retrotrasposoni. Le LINE complete sono elementi autonomi che codificano per gli enzimi necessari per la loro retrotrasposizione e per quella delle LINE con delezioni interne (derivati non autonomi). Tali enzimi sono richiesti anche per la trasposizione delle SINE, che sono elementi non autonomi. Circa il 20% del genoma umano consiste di LINE, di cui un quarto è costituito da sequenze di tipo L1, le più studiate. L’elemento L1 più lungo comprende circa 6500 coppie di basi, ma soltanto circa 3500 elementi nel genoma hanno questa estensione, mentre tutti gli altri hanno delezioni interne di varie dimensioni (in modo simile agli elementi Ds di mais). Gli elementi L1 completi contengono una lunga ORF che ha un’omologia di sequenza con trascrittasi inverse note. Quando il gene della trascrittasi inversa contenuto nell’elemento Ty di lievito è stato sostituito con la sequenza della ipotizzata trascrittasi inversa contenuta in L1, l’elemento Ty modificato è risultato in grado di trasporre. Mutazioni puntiformi introdotte nella sequenza eliminano l’attività enzimatica, in-

Mutazione, riparazione del DNA ed elementi trasponibili

dicando che la sequenza L1 è effettivamente capace di produrre una trascrittasi inversa funzionale. Quindi, come nel caso degli elementi Ac del mais, gli elementi L1 completi (e gli elementi completi di altre famiglie LINE) sono elementi autonomi. L1 e altri elementi LINE non hanno LTR, quindi non sono strettamente imparentati con i retrotrasposoni discussi in precedenza. Infatti, anche se il meccanismo di trasposizione implica un intermedio a RNA, il meccanismo è diverso. È interessante notare che nel 1991 è stato dimostrato che due casi non correlati di emofilia A (OMIM 306700) in bambini dipendevano dall’inserzione di un elemento L1 nel gene per il fattore VIII, che codifica per un prodotto richiesto per la normale coagulazione del sangue (la cui perdita di funzione è responsabile della malattia). L’analisi molecolare dimostrò che l’inserzione non era presente in nessuna delle due coppie di genitori, e che era avvenuta una nuova trasposizione dell’elemento L1. Più in generale, questi risultati mostrano che gli elementi L1 nell’uomo possono trasporre e che possono causare malattie per mutagenesi da inserzione (cioè, inserendosi nei geni). Anche le SINE sono retrotrasposoni, ma nessuna di queste codifica per enzimi coinvolti nella trasposizione. Questi elementi non autonomi dipendono dagli enzimi codificati dalle LINE per la loro trasposizione. Nell’uomo la famiglia Alu è un’ampia famiglia di sequenze SINE. La sequenza ripetuta di questa famiglia è lunga circa 300 coppie di basi ed è ripetuta nel genoma umano circa un milione di volte, rappresentando una componente importante del DNA totale (vedi Capitolo 2). Il nome

149

di questa famiglia deriva dal fatto che questa sequenza contiene un sito di riconoscimento dell’enzima AluI. Indicazioni circa la trasposizione di sequenze Alu sono derivate dallo studio di un giovane paziente con neurofibromatosi (OMIM 162200), una malattia genetica dovuta a una mutazione autosomica dominante. Gli individui con neurofibromatosi sviluppano crescite cellulari simili a tumori (neurofibromi) su tutto il corpo (vedi Capitolo 13). L’analisi del DNA mostrò che una sequenza Alu era presente in un introne del gene della neurofibromatosi del paziente. L’analisi dei trascritti di questo gene rivelò che erano più lunghi di quelli degli individui normali. La presenza della sequenza Alu nell’introne alterava infatti la maturazione del trascritto, causando la perdita di un esone nell’mRNA maturo. Ciò produceva una proteina non funzionale, con circa 800 amminoacidi in meno rispetto a quella normale. Nessuno dei genitori del paziente era affetto da neurofibromatosi né aveva una sequenza Alu nel gene. Dal momento che i singoli membri della famiglia Alu non hanno sequenze identiche, è stato possibile dimostrare la derivazione parentale dell’elemento trasposto. Nel paziente, infatti, la sequenza Alu si era probabilmente inserita nel gene per la neurofibromatosi per retrotrasposizione nella linea germinale del padre, partendo da una differente localizzazione cromosomica. Il tasso di trasposizione nell’uomo è molto basso (ci sono pochi trasposoni attivi nel genoma umano), ma gli esempi sopra riportati dimostrano che la trasposizione avviene e può essere causa di mutazioni.

Sommario l Le mutazioni possono dare origine a variazioni dei caratteri ereditabili. l La mutazione è un processo nel quale viene alterata la sequenza di coppie di basi in una molecola di DNA. Il cambiamento può essere semplice, come una sostituzione, inserzione o delezione di una coppia di basi, o più complesso, come un riarrangiamento, una duplicazione o una delezione di un segmento di cromosoma. Le mutazioni possono avvenire spontaneamente, come nel caso degli errori di replicazione, o possono essere indotte naturalmente o sperimentalmente da agenti mutageni fisici o chimici. l Le mutazioni a livello del cromosoma sono chiamate mutazioni cromosomiche (Capitolo 16). Le mutazioni che alterano una coppia di basi nelle sequenze dei geni e in altre sequenze di DNA vengono chiamate mutazioni puntiformi. l Le conseguenze di una mutazione genica sull’organismo dipendono da diversi fattori, in particolare da quanto risulta modificata l’informazione che codifica per gli amminoacidi di una proteina. l Studiando i mutanti che hanno difetti in determinati processi cellulari, i genetisti hanno realizzato grandi progressi nella comprensione di questi processi. Per identificare i

mutanti dopo la mutagenesi di una cellula o di un organismo sono state sviluppate varie procedure di analisi. l Gli effetti di una mutazione genica possono essere recuperati (revertiti) sia grazie al ritorno della coppia di basi mutata a quella originaria sia per mutazione in un sito diverso da quello della mutazione originale. Quest’ultima viene chiamata mutazione di tipo soppressore. l Un tipo particolare di mutazioni, riscontrate solo nell’uomo, sono le mutazioni dinamiche dovute alla ripetizione di triplette nucleotidiche all’interno di una regione genica (codificante o non codificante). Tali mutazioni, causate da errori della DNA polimerasi durante la replicazione del DNA, sono instabili e possono espandersi nel tempo e tra generazioni. Questo determina un aumento della gravità e un esordio precoce delle patologie a esse associate, in generazioni successive (anticipazione genetica). l Le radiazioni ad alta energia possono causare danni genetici producendo specie chimiche che interagiscono con il DNA o causano legami inusuali fra le basi del DNA. Le mutazioni derivano da un danno genetico non riparato. Le radiazioni ionizzanti possono anche indurre rotture nei cromosomi.

150

Capitolo 7

l Le mutazioni geniche possono anche essere causate dall’esposizione a una varietà di composti chimici, chiamati mutageni chimici, presenti nell’ambiente e in grado di causare malattie genetiche nell’uomo e in altri organismi. l Il test di Ames indica se una sostanza chimica (per esempio, una molecola presente nell’ambiente o commerciale) ha la potenzialità di causare mutazioni nell’uomo. Un gran numero di potenziali cancerogeni umani è stato scoperto in questo modo. l Sia le cellule procariote sia quelle eucariote possiedono un certo numero di enzimi che riparano diversi tipi di danni del DNA. Non tutto il DNA danneggiato viene riparato; quindi, si ha l’insorgenza di mutazioni, anche se con frequenza relativamente bassa. Ad alte dosi di mutageni, i sistemi di riparazione sono incapaci di correggere tutti i danni e le mutazioni si manifestano con frequenza elevata. l Gli elementi trasponibili sono segmenti di DNA che possono inserirsi e spostarsi in uno o più siti del genoma. La loro presenza nella cellula è generalmente individuata a causa dei cambiamenti che essi determinano nell’espressione e nell’attività dei geni nei quali, o nelle vicinanze dei quali, essi si integrano. l Nei batteri due tipi di elementi genetici trasponibili sono le sequenze di inserzione (IS) e i trasposoni (Tn), ciascuno dei quali ha sequenze ripetute invertite alle estremità e co-

difica per proteine, come le trasposasi, responsabili della loro trasposizione. I trasposoni possono anche portare geni che codificano per altre funzioni, quali la resistenza a farmaci. l Molti elementi trasponibili degli eucarioti assomigliano ai trasposoni batterici nella struttura generale e nelle caratteristiche di trasposizione. Un elemento trasponibile eucariote può inserirsi in una nuova posizione lasciando una copia di se stesso nel sito di origine oppure può essere eliminato dal cromosoma. La sua integrazione nel sito bersaglio ha luogo mediante un meccanismo preciso, in modo tale che gli elementi integrati nel punto di inserzione siano fiancheggiati da una breve duplicazione del DNA del sito bersaglio. Alcuni elementi trasponibili sono elementi autonomi che possono dirigere la propria trasposizione, e altri sono elementi non autonomi, che possono trasporre solo se attivati da un elemento autonomo appartenente alla stessa famiglia e presente nello stesso genoma. l Benché la maggior parte dei trasposoni si muova attraverso un meccanismo DNA-DNA, alcuni elementi trasponibili eucarioti si muovono attraverso un intermedio di RNA (utilizzando una trascrittasi inversa codificata dall’elemento trasponibile). Per organizzazione genomica e per altre caratteristiche questi elementi trasponibili assomigliano ai retrovirus e vengono detti retrotrasposoni.

Approccio analitico alla soluzione di problemi di genetica D7.1 Sono stati isolati cinque ceppi di E. coli, contenenti mutazioni per sostituzione di una coppia di basi, che alterano il polipeptide triptofano sintetasi A. La Figura 7.A mostra i cambiamenti prodotti nella proteina nei ceppi mutanti indicati. Inoltre, A23 può essere mutato ulteriormente, inserendo in posizione 210 Ile, Thr, Ser o Gly selvatica. Nelle domande seguenti, supponete che in ogni passaggio avvenga un solo cambiamento di base . a. Usando il codice genetico (Figura 6.7), spiegate come le due mutazioni A23 e A46 possano dare origine a due diversi amminoacidi inseriti in posizione 210. Stabilite la sequenza nucleotidica in questa posizione per il gene selvatico e per i due mutanti. b. I mutanti A23 e A46 possono ricombinare? Perché sì o perché no? Se avviene ricombinazione, quale sarà il risultato?

c. In base a ciò che potete dedurre dalla sequenza nucleotidica del gene selvatico, indicate se, dai codoni che specificano gli amminoacidi 48, 210, 233 e 234, possa essere generato o meno un mutante nonsenso per sostituzione di un singolo nucleotide. R7.1 a. Non esiste un approccio semplice che permetta di rispondere a domande come questa. Quello migliore consiste nel consultare il codice genetico e, usando carta e penna, cercare di definire i cambiamenti nei codoni che sono compatibili con tutti i dati. Basarsi sulla valutazione dei possibili amminoacidi in posizione 210 del polipeptide è di aiuto. L’amminoacido selvatico è Gly e i codoni che codificano per Gly sono GGU, GGC, GGA e GGG. Il mutante A23 ha Arg in posizione 210 e i codoni per l’arginina sono AGA,

Figura 7.A Numero del mutante

A3

A23

A46

A78

A169

Estremità N

Estremità C

Posizione dell’amminoacido nella catena Amminoacido nel selvatico

48 Glu

Cambio di amminoacido nel mutante

Val

210 Gly Arg

Glu

233 Gly

234 Ser

Cys

Leu

Mutazione, riparazione del DNA ed elementi trasponibili AGG, CGU, CGC, CGA e CGG. Ogni codone per Arg può essere generato da una singola sostituzione di base. Quindi è necessario prendere in considerazione gli amminoacidi in posizione 210 generati da altre mutazioni di A23. Nel caso di Ile, i codoni sono AUU, AUC e AUA. L’unico modo per poter passare da Gly ad Arg con un solo cambiamento di base e quindi da Arg a Ile con un successivo singolo cambiamento è GGA (Gly)DAGA (Arg)DAUA (Ile). Questa ipotesi è compatibile con gli altri cambiamenti osservati in A23? Vi sono quattro possibili codoni per Thr – ACU, ACC, ACG e ACA –, quindi una mutazione da AGA (Arg) ad ACA (Thr) corrisponderebbe. Vi sono sei possibili codoni per Ser – UCU, UCC, UCA, UCG, AGU e AGC –, quindi una mutazione da AGA ad AGU o AGC corrisponderebbe. Considerando il mutante A46, i codoni possibili per Glu sono GAA e GAG. Dato che il codone selvatico sia GGA (Gly), l’unica possibile sostituzione di base che può dare Glu è GAA. In conclusione, la risposta è che il codone selvatico in posizione 210 è GGA, la sequenza del mutante A23 è AGA e quella del mutante A46 è GAA. Quindi A23 e A46 sono mutati in basi diverse all’interno dello stesso codone. b. La risposta a questa domanda dipende dalla risposta dedotta al punto a. I mutanti A23 e A46 possono ricombinare, dato che le mutazioni nei due ceppi mutanti si trovano in coppie di basi diverse. I risultati di un singolo evento di ricombinazione (a livello del DNA) tra la prima e la seconda base del codone AGA × GAA saranno un codone selvatico GGA (Gly) e un codone doppio mutante AAA (Lys). La ricombinazione potrebbe anche avvenire tra la seconda e la terza base del codone, ma i prodotti sarebbero AGA e GAA, cioè identici ai parentali. c. L’amminoacido 48 è cambiato da Glu a Val. Questo cambiamento deve aver implicato il passaggio da GAA a GUA oppure da GAG a GUG. In entrambi i casi il codone Glu può mutare con una singola sostituzione di base a codone nonsenso, cioè UAA o UAG, rispettivamente. L’amminoacido 210 nel selvatico ha un codone GGA, come abbiamo descritto prima. Questo gene potrebbe mutare verso il codone nonsenso UGA con una singola sostituzione di basi. L’amminoacido 233 ha subito un cambio da Gly a Cys. Questo cambiamento deve essere dovuto o a GGU che è cambiato in UGU, oppure a GGC che è cambiato in UGC. In entrambi i casi il codone Gly non può mutare in un codone nonsenso con una singola sostituzione di base. L’amminoacido 234 è cambiato da Ser a Leu. Questo cambiamento era o da UCA a UUA oppure da UCG a UUG. Se il codone per Ser era UCA, può cambiare a UGA in un solo passaggio; ma se il codone per Ser era UCG, non può cambiare a codone nonsenso in un solo passaggio. D7.2 Le mutazioni indotte chimicamente, a, b e c, mostrano specifiche reversioni se sottoposte a trattamento con i seguenti mutageni: 2-amminopurina (AP), 5-bromouracile (BU), proflavina (PRO) e idrossilammina (HA). AP è un analogo di base che induce prevalentemente un cambiamento di A-T in G-C, ma anche di G-C in A-T. BU è un analogo di base che induce prevalentemente sostituzioni di G-C in

151

A-T, ma può causare anche sostituzioni di A-T a G-C. PRO è un agente intercalante che causa inserzioni o delezioni non specifiche di singole coppie di basi. HA è un agente che modifica le citosine, causando la transizione da G-C ad A-T. Le reversioni sono indicate nella tabella seguente: Mutageni utilizzati per indurre reversione Mutazioni

AP

BU

PRO

HA

a b c

– + +

– + +

+ + +

– + –

(Nota: + indica che sono state rilevate molte reversioni al selvatico; – indica che sono state verificate poche o nessuna reversione al selvatico.)

Indicate per ciascuna mutazione originale (da a+ ad a, da b+ a b, ecc.) il probabile cambiamento di coppia di basi (da A-T a G-C, delezione di G-C, ecc.) e il mutageno che è stato più probabilmente utilizzato per indurre la mutazione originale. R7.2 Questa domanda serve per verificare la vostra conoscenza dei cambiamenti di coppie di basi che possono essere indotti da vari tipi di mutageni. Il mutageno AP induce soprattutto sostituzioni da A-T a G-C e può causare anche cambiamenti da G-C ad A-T. Quindi le mutazioni indotte da AP possono essere revertite da AP. Il mutageno analogo di base BU induce soprattutto cambiamenti da G-C ad A-T e può causare anche cambiamenti da A-T a G-C, quindi le mutazioni indotte da BU possono essere revertite da BU. La proflavina causa delezioni o inserzioni di singole coppie di basi, quindi i cambiamenti indotti da proflavina possono essere revertiti da un secondo trattamento con proflavina. Il mutageno HA causa transizioni unidirezionali da G-C ad A-T, quindi mutazioni indotte da HA non possono essere revertite da HA. Con queste specificità dei mutageni in mente, possiamo rispondere alla domanda considerando una mutazione alla volta. Mutazione da a+ ad a: la mutazione a viene revertita solo dalla proflavina, e ciò indica che si tratta di una delezione o inserzione (mutazione frameshift). Quindi la mutazione originale è stata indotta da un agente intercalante, come la proflavina, dato che è l’unica classe di mutageni a causare inserzione o delezione. Mutazione da b+ a b: la mutazione b può essere revertita da AP, BU o HA. Un’indicazione ci viene dal fatto che HA causa solo cambiamenti da G-C ad A-T. Perciò b deve essere GC e l’originale b+ doveva essere stato A-T. Quindi il cambio mutazionale da b+ a b deve essere stato causato dal trattamento con AP o BU, dato che questi due mutageni sono i soli della lista in grado di indurre tale cambiamento. Mutazione da c+ a c: la mutazione c può revertire solo con AP e BU. Dato che non può essere revertita da HA, c deve essere A-T e c+ G-C. Il cambiamento mutazionale da c+ a c quindi è una transizione da G-C ad A-T e può essere dovuto a trattamento con BU, HA o AP. D7.3 Supponete di essere genetisti del mais e di essere interessati a un gene chiamato zma, coinvolto nella formazione di

152

Capitolo 7

piccole strutture pelose sulla lamina ventrale della foglia. Possedete anche il clone di cDNA del gene zma. In una linea particolare di mais, che contiene numerose copie di Ac e di Ds, ma che non contiene altri elementi trasponibili, avete osservato la comparsa di una mutazione in zma. Volete sapere se nella comparsa della mutazione è coinvolta l’inserzione di un elemento trasponibile in zma. Come procedereste? Suggerite almeno due approcci, precisando come le attese dell’inserimento di un elemento trasponibile differiscono dalle attese di un evento di mutazione ordinario. R7.3 Un approccio consiste nell’analisi dettagliata della superficie delle foglie delle piante mutate. Se un elemento tra-

sponibile si è inserito in zma, potrebbe anche essere escisso, quindi la mutazione di zma sarebbe instabile. La superficie della foglia mostrerebbe delle chiazze pelose e chiazze prive di peli. Una semplice mutazione puntiforme sarebbe stabile, tutta la foglia sarebbe priva di peli. Un secondo approccio si basa sulla digestione del DNA di piante mutate e di piante normali con una particolare endonucleasi di restrizione, sulla separazione su gel del DNA digerito e sulla preparazione di un Southern blot utilizzando come sonda il cDNA di zma. Se un elemento trasponibile si è inserito nel gene zma nelle piante mutate, la sonda dovrebbe legarsi a frammenti di peso molecolare diverso nel mutante, rispetto al DNA normale. Ciò non avverrebbe nel caso di una semplice mutazione puntiforme.

La genomica: la mappatura e il sequenziamento dei genomi

8

In che cosa consiste il Progetto Genoma Umano?

Come viene determinata la sequenza completa di un genoma o di un cromosoma?

Quali sono le fasi sperimentali della determinazione della sequenza di un genoma?

Come vengono identificati e descritti i geni e altre regioni importanti delle sequenze genomiche?

In che modo è possibile clonare il DNA?

Quali sono le differenze e le somiglianze nell’organizzazione del genoma fra gli eubatteri, gli archeobatteri e gli eucarioti?

Che cosa sono le banche genomiche e cromosomiche?

Quali sono le prospettive future degli studi genomici?

Come viene effettuato il sequenziamento del DNA?

Quali sono le implicazioni etiche, legali e sociali del sequenziamento del genoma umano?

Attività La genomica è la scienza che studia come ottenere e analizzare le sequenze di interi genomi. La genomica è fondata sulla tecnologia del DNA ricombinante, che consente di clonare singoli frammenti di DNA e di effettuare operazioni di manipolazione sul DNA clonato, tra le quali il suo sequenziamento e la sua espressione in una cellula diversa rispetto a quella che lo conteneva in origine. In questo capitolo verrà spiegato come si clonano frammenti di DNA per utilizzarli nel sequenziamento di interi genomi. Successivamente, nella iAttività sarà possibile mettere in pratica quanto appreso, utilizzando le tecniche del DNA ricombinante per creare un lievito di birra geneticamente modificato.

Lo sviluppo di tecniche molecolari per l’analisi dei geni e della loro espressione ha rivoluzionato la biologia sperimentale. Una volta sviluppate le tecniche per il sequenziamento del DNA (che permettono di conoscere base per base la composizione di un frammento di DNA), gli scienziati si resero conto che sarebbe stato possibile, anche se non necessariamente facile, determinare le sequenze di interi genomi. Perché sequenziare un genoma? La risposta risiede nel fatto che a quel punto si avrebbe tra le mani – o, per meglio dire, nel proprio computer – il progetto genetico completo dell’organi-

smo. La sequenza dei nucleotidi del genoma e la loro distribuzione fra i cromosomi sono informazioni che possono essere analizzate per determinare in che modo i geni e le regioni funzionali non geniche del genoma controllino lo sviluppo e la funzione di un organismo. Nel 1981 è stata ottenuta la sequenza completa del primo genoma non virale, il genoma circolare di 16 159 bp del mitocondrio umano. Tuttavia, il genoma nucleare umano è 200 000 volte più grande, e per tale ragione la determinazione della sua sequenza rappresentava un’impresa che incuteva un certo timore. Ciò nonostante, i notevoli progressi nell’automazione del sequenziamento del DNA e lo sviluppo di programmi informatici per l’analisi di grandi quantità di dati di sequenza hanno fatto sì che, a metà degli anni ottanta del secolo scorso, il sequenziamento di genomi di grandi dimensioni diventasse una possibilità concreta. Nacque così la genomica, ossia la scienza che studia come ottenere e analizzare le sequenze di interi genomi. In questo capitolo e nel prossimo verranno descritti i vari aspetti della genomica e le tecniche utilizzate per l’analisi dei genomi. In particolare, nel presente capitolo verrà discusso il settore della genomica che prevede il clonaggio e il sequenziamento di interi genomi e la loro annotazione, ovvero l’identificazione e la descrizione dei geni putativi e di altre sequenze importanti. Lo studio della struttura dei genomi prende il nome di genomica strutturale. Nel Capitolo 9 verranno trattate la genomica funzionale e la

154

Capitolo 8

genomica comparativa. Nella genomica funzionale i biologi cercano di capire come e quando venga usato ogni gene del genoma, mentre nella genomica comparativa i ricercatori confrontano interi genomi al fine di comprendere l’evoluzione e le differenze biologiche fondamentali tra le specie. Gli organismi i cui genomi sono stati sequenziati per primi sono anche quelli che i genetisti conoscono meglio: Escherichia coli (in rappresentanza dei procarioti), il lievito Saccharomyces cerevisiae (come rappresentante degli eucarioti unicellulari), Drosophila melanogaster e Caenorhabditis elegans (animali multicellulari con genomi moderatamente complessi), e Mus musculus (un mammifero). Per ovvie ragioni, anche il genoma umano (Homo sapiens) venne incluso all’interno di questo gruppo iniziale di genomi. Questo capitolo offre una panoramica del sequenziamento dei genomi, e un’introduzione all’informazione ottenuta tramite l’analisi delle sequenze genomiche. Verrà inoltre spiegato come effettuare il clonaggio di un frammento di DNA di interesse in vettori molecolari e la sua amplificazione in cellule ospiti; come è possibile determinare la sequenza di DNA dei cloni, assemblare tali sequenze per ricostruire una sequenza genomica completa, e identificare i geni e le sequenze regolatrici nella sequenza genomica assemblata. Nel corso della lettura di questo capitolo verrà chiarito che il sequenziamento del genoma di un organismo rappresenta una scienza descrittiva, piuttosto che una scienza sostenuta da un’ipotesi: infatti, la raccolta dei dati primari del genoma di un organismo non può essere basata su nessuna ipotesi. Tuttavia, gli esperimenti indotti da un’ipotesi costituiscono una parte fondamentale degli sforzi dei ricercatori per analizzare i dati genomici prodotti, specialmente per quanto riguarda l’individuazione dei geni presenti e dei meccanismi con cui questi dirigono la struttura e le funzioni dell’organismo. (Il sequenziamento del genoma è un approccio di mappatura fisica, come vedremo più avanti nel capitolo.)

Il Progetto Genoma Umano A metà degli anni ottanta del XX secolo, molti scienziati giunsero alla conclusione che il sequenziamento del genoma umano fosse un obiettivo raggiungibile, nonostante l’esistenza di ostacoli significativi, fra i quali i principali erano costituiti dal costo e dalla tecnologia. Quando il progetto ebbe inizio, nel 1990, era stato preventivato un costo pari a 3 miliardi di dollari in 15 anni. Gli scienziati coinvolti nel progetto si riunirono in una massiccia collaborazione internazionale – denominata HUGO, ovvero Human Genome Organization (Organizzazione per il Genoma Umano) – e iniziarono a cercare finanziamenti da varie fonti, inclusi il Dipartimento dell’Energia e i National Institutes of Health negli Stati Uniti e i governi di numerose altre nazioni, comprese la Gran Bretagna, la

Francia e il Giappone. Come parte del Progetto Genoma Umano (HGP, Human Genome Project) vennero sequenziati anche i genomi di numerosi organismi ben studiati (E. coli, il lievito Saccharomyces cerevisiae, il nematode Caenorhabditis elegans, il moscerino della frutta e il topo), in parte come prova, in quanto la maggior parte di questi organismi ha genomi più semplici rispetto al genoma umano, e anche per disporre di genomi da confrontare con il genoma umano. Alla fine, gli scienziati pubblicarono una bozza preliminare del genoma umano nel 2000, e una versione finale nel 2003, in anticipo sui tempi previsti. Nello stesso periodo in cui questo gruppo completava la sua sequenza genomica, anche gli scienziati di una compagnia privata, la Celera Genomics, avevano ottenuto la sequenza del genoma umano.

Nota chiave Il piano, ambizioso e costoso, per il sequenziamento del genoma umano è stato proposto nel 1990. Quando il progetto ebbe inizio, i ricercatori non erano sicuri che fosse realizzabile, anche dal punto di vista economico. Ciò nonostante, il sequenziamento del genoma umano è stato completato in anticipo sui tempi previsti, insieme a quello dei genomi di numerosi altri organismi di interesse genetico.

Trasformare i genomi in cloni e i cloni in genomi I genomi cellulari, anche i più piccoli, risultano troppo grandi e complessi per essere impiegati in forma completa nell’ambito di sperimentazioni scientifiche. Per esempio, il genoma di S. cerevisiae ha una dimensione di oltre 12 milioni di coppie di basi. Per non parlare del genoma umano che ha una lunghezza di circa 3 miliardi di coppie di basi, e in cui cromosoma 1, il più grande, supera i 250 milioni di coppie di basi. Pertanto per poter studiare un genoma sarà necessario in primo luogo suddividerlo in frammenti molto più piccoli, con i quali si possa lavorare in laboratorio. Il primo passo per il sequenziamento completo di un genoma è quindi la costruzione di una banca genomica, cioè una collezione di un gran numero di cloni (da migliaia a milioni) tale da contenere in maniera casuale almeno una copia di ogni sequenza di DNA del genoma in questione, inserita in un vettore di clonaggio; quest’ultimo è una molecola di DNA ricombinante capace di replicarsi in un organismo ospite, come per esempio un batterio o un lievito. Il vettore di clonaggio consente di ottenere moltissime copie di un piccolo frammento di DNA genomico perché, una volta inserito nelle cellule

La genomica: la mappatura e il sequenziamento dei genomi

ospiti, verrà amplificato. Successivamente, il DNA potrà essere recuperato e sequenziato. In questi primi paragrafi verrà illustrato in che modo si costruiscono le banche genomiche e come vengono sequenziati i singoli cloni ottenuti. Successivamente verrà spiegato come vengono usati i dati di sequenza prodotti al fine di ricostruire la sequenza dell’intero genoma, come si individuano i geni nella sequenza e in che modo il confronto di genomi diversi può fornire informazioni su geni, proteine, organismi e rapporti evolutivi.

Il clonaggio del DNA Per capire come può essere costruita una banca genomica, dobbiamo prima conoscere le procedure del clonaggio del DNA. In breve, il DNA di interesse deve essere isolato, opportunamente tagliato alle estremità e legato, a formare una molecola ricombinante, in un vettore di clonaggio, che una volta inserito in cellule ospiti verrà amplificato. Vediamo ora in dettaglio le tappe per il clonaggio del DNA. 1. Isolamento del DNA di un organismo. 2. Taglio del DNA in frammenti mediante una endonucleasi di restrizione – enzima che riconosce una specifica sequenza di DNA a doppio filamento e la taglia – e inserimento (ligazione), mediante l’enzima DNA ligasi, di ciascun frammento in un vettore di clonaggio tagliato con lo stesso enzima di restrizione; tali operazioni creano una molecola di DNA ricombinante, ossia una molecola di DNA costruita in vitro assemblando sequenze di una o più molecole di DNA differenti. 3. Introduzione della molecola di DNA ricombinante (trasformazione; vedi Capitolo 15) in un ospite, quale E. coli. Nella cellula ospite ha luogo la replicazione della molecola di DNA ricombinante che produce molte copie identiche, definite cloni. Nel corso della riproduzione dell’organismo ospite, le molecole di DNA ricombinante vengono trasmesse a tutta la progenie, dando origine a una popolazione (clone) di cellule portatrici delle sequenze clonate. Questo processo prende il nome di clonaggio molecolare. Esistono molte ragioni per clonare il DNA, oltre allo studio dei genomi, come vedremo in altri capitoli. Vedremo anche come, in esperimenti diversi, possono essere utilizzate differenti strategie di clonaggio e varie tipologie di vettori. Enzimi di restrizione Per analizzare il DNA genomico, è necessario in primo luogo tagliarlo in pezzi più piccoli e facilmente manipolabili. Gli strumenti per eseguire tale operazione sono gli enzimi di restrizione. Un enzima di restrizione (o endonucleasi di restrizione) ri-

155

conosce nel DNA una specifica sequenza di coppie di basi, definita sito di restrizione, e taglia (digerisce) lo stesso DNA a livello di tale sequenza, o vicino a essa, idrolizzando l’ossatura zucchero-fosfato. Tutti gli enzimi di restrizione tagliano il DNA tra il carbonio in posizione 3′ e il gruppo fosfato del legame fosfodiesterico; in tal modo, i frammenti prodotti dalla digestione con gli enzimi di restrizione presentano estremità 5′-fosfato e 3′-OH. La maggior parte degli enzimi di restrizione funziona in condizioni ottimali a una temperatura di 37 °C. Nella maggior parte delle applicazioni di laboratorio della digestione con enzimi di restrizione, si cerca di “tagliare completamente” il DNA, ossia di fare in modo che l’enzima tagli tutti i suoi siti di restrizione presenti in una determinata molecola di DNA. Questo tipo di digestione taglierà ogni copia del genoma dello stesso organismo in una serie di frammenti uguali. Come verrà illustrato in seguito, per certe applicazioni (come la costruzione di una banca genomica) è invece preferibile effettuare una “digestione parziale”, nella quale l’enzima non ha tempo sufficiente per completare il suo lavoro; di conseguenza, solo alcuni dei siti di restrizione verranno tagliati, mentre molti verranno lasciati intatti. Dal momento che si stanno tagliando milioni di molecole identiche di DNA, in una digestione parziale ciascuna molecola verrà tagliata in corrispondenza di un sottogruppo unico dei siti di restrizione disponibili. Proprietà generali degli enzimi di restrizione La maggior parte degli enzimi di restrizione si trova naturalmente nei batteri, anche se alcuni sono stati trovati anche negli eucarioti. Nei batteri gli enzimi di restrizione proteggono l’organismo dai virus, tagliando un eventuale DNA virale penetrato nella cellula batterica. Quest’ultima modifica i propri siti di restrizione (attraverso la metilazione), in modo che il suo DNA risulti protetto dall’azione degli enzimi di restrizione. Grazie alla scoperta degli enzimi di restrizione e delle applicazioni di tali molecole nell’ambito della genetica molecolare, Werner Arber, Daniel Nathans e Hamilton O. Smith ricevettero nel 1978 il Premio Nobel per la Fisiologia o Medicina. Sono stati isolati più di 400 enzimi di restrizione differenti, e almeno altri 2000 sono stati caratterizzati parzialmente. Questi enzimi prendono il nome dall’organismo dal quale vengono isolati. Per convenzione, si usa un sistema a tre lettere; nello specifico, la prima lettera indica il genere, mentre la seconda e la terza lettera indicano il nome della specie. Tali lettere sono in corsivo o sottolineate, e sono seguite da numeri romani che indicano uno specifico enzima di restrizione ottenuto da un determinato organismo. Talvolta, prima del numero vengono aggiunte altre lettere per indicare un particolare ceppo batterico dal quale sono stati ottenuti gli enzimi. Per esempio, EcoRI ed EcoRV sono entrambi derivati dal ceppo RY13 di Escherichia coli, ma riconosco-

156

Capitolo 8

no siti di restrizione diversi; HindIII viene ottenuto dal ceppo Rd di Haemophilus influenzae. I numeri romani indicano l’ordine con cui sono stati identificati gli enzimi di restrizione da un determinato ceppo. Quindi, EcoRI ed EcoRV sono, rispettivamente, il primo e il quinto enzima di restrizione identificati dal ceppo RY13 di E. coli. Per quanto riguarda la pronuncia, non si segue una regola precisa. Per esempio, BamHI si pronuncia “bam-acca-uno”, BglII è “bi-gi-elle-due”, EcoRI è “ecoerre-uno”, HindIII è “ind-tre”, HhaI è “acca-acca-auno” e HpaII è “acca-pi-a-due”. Molti siti di restrizione presentano un asse di simmetria localizzato nel punto centrale della sequenza. La Figura 8.1 mostra la simmetria del sito di restrizione di EcoRI: la sequenza di basi da 5′ a 3′ di un’elica di DNA è identica alla sequenza di basi da 5′ a 3′ dell’elica di DNA complementare. Si dice pertanto che le sequenze hanno una doppia simmetria rotazionale, ovvero sono dei palindromi (o sequenze palindromiche). Nella Tabella 8.1 viene riportato un elenco di alcuni siti di restrizione. Gli enzimi di restrizione usati più comunemente riconoscono quattro coppie di basi (come HhaI), oppure sei coppie di basi (per esempio, BamHI ed EcoRI). Alcuni enzimi riconoscono sequenze di otto coppie di basi (come NotI). Altre classi di enzimi non rientrano nel modello descritto, in quanto il sito di restrizione non ha una simmetria assiale. HinfI, per esempio, riconosce una sequenza di cinque coppie di nucleotidi, nella quale le due coppie di nucleotidi a ciascun lato della coppia centrale sono simmetriche, ma quest’ultima è ovviamente asimmetrica all’interno della sequenza. BstXI (“bi-esse-ti-x-uno”) rappresenta invece una classe di enzimi di restrizione la cui sequenza di riconosciLa sequenza è simmetrica rispetto al punto centrale Punto di taglio 5¢

3¢ GA A T T C C T T A AG



5¢ Punto di taglio Digestione con EcoRI 5¢

5¢ G OH 3¢

CTTAAP 5¢

e

3¢ P

AATTC G

OH



Figura 8.1 Siti di restrizione nel DNA, che mostrano una simmetria della sequenza rispetto al punto centrale. La sequenza è la stessa sia che venga letta da sinistra verso destra (da 5’ a 3’) sull’elica superiore (in questo caso, GAATTC), che da destra verso sinistra (da 5’ a 3’) sull’elica inferiore. Il sito di restrizione è quello dell’enzima EcoRI.

mento possiede una regione spaziatrice aspecifica compresa fra due sequenze simmetriche (vedi Tabella 8.1). Frequenza dei siti di restrizione nel DNA Dal momento che ciascun enzima di restrizione taglia il DNA in corrispondenza di una sequenza specifica, il numero di tagli che un enzima può effettuare in una particolare molecola di DNA dipende dal numero di volte che è presente quel sito di restrizione. Quando un certo numero di copie dello stesso genoma subisce un trattamento con un particolare enzima di restrizione, il DNA viene tagliato a livello dei siti di restrizione specifici per quell’enzima, che sono distribuiti lungo tutto il genoma. Sebbene in tal modo si producano milioni di frammenti di dimensioni diverse da una copia genomica, tutte le sequenze identiche dello stesso genoma verranno tagliate a livello dei medesimi siti di restrizione. In base alle leggi della probabilità, la frequenza con la quale una sequenza di basi breve è presente nel genoma sarà teoricamente maggiore della frequenza di una sequenza di basi di lunghezza più elevata. Pertanto, un enzima che riconosce una sequenza di quattro coppie di basi taglierà una molecola di DNA con una frequenza superiore rispetto a un enzima che riconosce una sequenza di sei coppie di basi, e questi enzimi, a loro volta, taglieranno con maggiore frequenza di uno che riconosce una sequenza di otto coppie di basi. Si consideri un DNA composto da un 50% di GC (ovvero nel quale il 50% dei nucleotidi contiene una base G o C) e con una distribuzione casuale delle coppie di nucleotidi. Per questo DNA la probabilità di trovare una C A T delle quattro possibili coppie di nucleotidi G C, G, T e A in qualunque posizione è identica. L’enzima di restri5′-GGCC-3′ . La zione HpaII riconosce la sequenza 3′-CCGG-5′ probabilità di trovare questa sequenza nel DNA può essere calcolata nel modo seguente: 1a coppia di nucleotidi: C , probabilità = 1/4 G 2a coppia di nucleotidi: C , probabilità = 1/4 G 3a coppia di nucleotidi: G , probabilità = 1/4 C 4a coppia di nucleotidi: G C , probabilità = 1/4 La probabilità di trovare una qualsiasi delle coppie di nucleotidi in una particolare posizione è indipendente dalla probabilità di trovare una diversa coppia di nucleotidi in un’altra posizione. Di conseguenza, la probabilità di trovare il sito di restrizione HpaII in un DNA con una distribuzione casuale delle coppie di nucleotidi è pari a 1/4 × 1/4 × 1/4 × 1/4 = 1/256. In breve, nell’ambito di tale segmento di DNA la sequenza di riconoscimento di HpaII si troverà in media una volta ogni 256 bp, e la dimensione media del frammento prodotto dalla digestione con HpaII (un “frammento HpaII”) sarà di 256 bp.

La genomica: la mappatura e il sequenziamento dei genomi

157

Tabella 8.1 Caratteristiche di alcuni enzimi di restrizione Nome dell’enzima

Organismo nel quale l’enzima è stato trovato

Sequenza di riconoscimento e posizione del taglioa ↓

BamHI

bam-acca-uno

Bacillus amyloliquefaciens H

5’-GGATCC-3’ 3’-CCTAGG-5’

BglII

bi-gi-elle-due

Bacillus globigi

5’-AGATCT-3’ 3’-TCTAGA-5’

EcoRI

eco-erre-uno

Escherichia coli RY13 5’-GAATTC-3’ 3’-CTTAAG-5’

HaeII

acca-ae-due

Haemophilus aegypticus

5’-RGCGCY-3’ 3’-YCGCGR-5’

HindIII

ind-tre

Haemophilus influenzae Rd

5’-AAGCTT-3’ 3’-TTCGAA-5’

PstI

pi-esse-ti-uno

Providencia stuartii

5’-CTGCAG-3’ 3’-GACGTC-5’

SalI

sal-uno

Streptomyces albus

5’-GTCGAC-3’ 3’-CAGCTG-5’

SmaI

sma-uno

Serratia marcescens

5’-CCCGGG-3’ 3’-GGGCCC-5’

HaeIII

acca-ae-tre

Haemophilus aegypticus

5’-GGCC-3’ 3’-CCGG-5’

HhaI

acca-acca-a-uno

Haemophilus haemolyticus

5’-GCGC-3’ 3’-CGCG-5

HpaII

acca-pi-a-due

Haemophilus parainfluenzae

5’-CGGC-3’ 3’-GCCG-5’

Sau3A

sau-tre-a

Staphylococcus aureus 3A

5’-GATC-3’ 3’-CTAG-5’

Enzimi con sequenze di riconoscimento di 8 bp

NotI

not-uno

Nocardia otitidis-caviarum

5’-GCGGCCGC-3’ 3’-CGCCGGCG-5’

Enzimi la cui sequenza di riconoscimento contiene una sequenza spaziatrice non specifica

BstXI

bi-esse-ti-x-uno

Bacillus stearothermophilus

5’-CCANNNNNNTGG-3’ 3’-GGTNNNNNNACC-5’







Enzimi con sequenze di riconoscimento di 6 bp

Pronuncia

















































Enzimi con sequenze di riconoscimento di 4 bp

a In questa colonna i siti di taglio sulle due eliche di DNA sono indicati da frecce. Poiché le sequenze di riconoscimento sono palindromiche, le molecole di DNA ottenute dopo il taglio sono simmetriche. R = purina; Y = pirimidina; N = qualunque base.

In generale, la frequenza di un sito di restrizione, in un contesto di coppie nucleotidiche distribuite casualmente con un contenuto in GC del 50%, è data dalla formula (1/4)n, dove n è il numero di coppie di basi nella sequenza di riconoscimento. Questi valori sono riportati nella Tabella 8.2. Nella pratica, tuttavia, i genomi di solito non presentano un contenuto in GC esattamente del 50%, né le coppie di basi sono distribuite in modo casuale. Quindi, allorché il DNA genomico viene tagliato con un enzima di restrizione, si ottengono frammenti caratterizzati da un’ampia gamma di dimensioni, non rispettando le previsioni teoriche.

Siti di restrizione e creazione di molecole di DNA ricombinante Una delle classi principali di enzimi di restrizione riconosce una sequenza specifica di DNA e la taglia al suo interno. Un’altra classe di enzimi di restrizione riconosce una specifica sequenza nucleotidica e taglia le due eliche del DNA all’esterno rispetto a quella sequenza. Quest’ultima classe di enzimi di restrizione non è utile per creare molecole di DNA ricombinante e quindi non verrà presa ulteriormente in considerazione. Gli enzimi di restrizione della prima classe tagliano il DNA in modi diversi. Come indicato nella Tabella 8.1, alcuni enzimi, come SmaI, tagliano entrambe le eliche di DNA fra le stesse coppie di nucleotidi, producendo

158

Capitolo 8 a) Taglio con SmaI

Tabella 8.2 Frequenza di siti per enzimi di restrizione in DNA con coppie di nucleotidi distribuite in maniera casuale Coppie di nucleotidi a livello del sito di restrizione

Probabilità di trovare il sito di restrizione

4

(1/4)4 = 1 ogni 256 bp

5

(1/4)5 = 1 ogni 1024 bp



CCCGGG





GGGC C C



5¢ 5¢ C C C OH 3¢ Estremità 3¢ 3¢ G G G P 5¢ piatte

P

GGG



CCC



HO

b) Taglio con BamHI

6

(1/4)6 = 1 ogni 4096 bp

8

(1/4)8 = 1 ogni 65 536 bp

n

(1/

G G AT C C





C C TA GG



G OH 3¢ C C TA G P 5¢

5¢ 3¢

n 4)



5¢ PG AT C C 3¢ HOG

Estremità sporgenti in 5¢ (coesive)

3¢ 5¢

c) Taglio con PstI

frammenti con estremità piatte (Figura 8.2a). Altri enzimi, come BamHI, operano tagli a zig zag nella sequenza nucleotidica simmetrica, dando origine a frammenti di DNA con estremità coesive o sfalsate, che possono avere un’estremità sporgente in 5′, come nel caso del taglio con BamHI (Figura 8.2b) o EcoRI, o un’estremità sporgente in 3′, come nel caso del taglio con PstI (Figura 8.2c). Gli enzimi di restrizione che producono estremità coesive sono particolarmente utili nel clonaggio del DNA, dal momento che ogni frammento prodotto tagliando il DNA con lo stesso enzima di restrizione presenta la stessa sequenza a singola elica alle due estremità coesive. Se le estremità di due frammenti di DNA prodotti dall’azione dello stesso enzima di restrizione (come EcoRI) – per esempio, un vettore di clonaggio e un frammento di DNA cromosomico – si trovano insieme in soluzione, ha luogo l’appaiamento (annealing) delle basi delle estremità coesive (Figura 8.3). I due DNA possono essere uniti (“ligati”) in modo covalente, utilizzando la DNA ligasi, per produrre una molecola di DNA più lunga con i siti di restrizione ricostruiti a livello della giunzione fra i due frammenti. (Si ricordi dalla



CTGCAG





GACGTC



C T G C A OH 3¢ G P 5¢

5¢ 3¢

Estremità sporgenti 3¢ in 3¢ (coesive)



discussione sulla replicazione del DNA che la DNA ligasi elimina i tagli a singola elica, o “nick”, formando un legame fosfodiesterico fra due nucleotidi che presentino, rispettivamente, un’estremità 5′-fosfato e un’estremità 3′-OH libere; vedi Figura 3.7.) Anche frammenti di DNA con estremità piatte possono essere uniti dalla DNA ligasi, utilizzando una concentrazione elevata di enzima. La ligazione di due frammenti di DNA rappresenta il principio sul quale si basa la formazione di molecole di DNA ricombinante. Nel 1980, Paul Berg ha ricevuto parte del Premio Nobel per la Chimica “per i DNA 2



G A AT TC





G A AT T C



C T T A AG





C T TAAG



GOH 3¢ 5¢ PA AT T C C T TA A P 3¢ 3¢ HOG





Figura 8.2 Esempi delle modalità con cui gli enzimi di restrizione tagliano il DNA. (a) Il taglio con SmaI produce estremità piatte. (b) Il taglio con BamHI produce estremità coesive sporgenti in 5’. (c) Il taglio con PstI produce estremità coesive sporgenti in 3’.

DNA 1

Figura 8.3 Taglio del DNA con l’enzima di restrizione EcoRI. EcoRI effettua sul DNA tagli a zig zag e simmetrici, producendo estremità coesive. Un frammento di DNA con un’estremità coesiva, ottenuto dalla digestione con EcoRI, può unirsi mediante appaiamento fra le basi complementari a qualunque altro frammento di DNA con un’estremità coesiva prodotto dal taglio con lo stesso enzima. I frammenti vengono successivamente uniti dalla DNA ligasi.

5¢ PG ACGTC

HO

3¢ 5¢

Taglio con 5¢ EcoRI, che produce 3¢ estremità coesive



G A AT T C





C T TAAG



5¢ 3¢

G A AT T C 3¢ C T TAAG 5¢ Molecole di DNA ricombinante

GOH 3¢ 5¢ PA A T T C C T TA A P 5¢ 3¢ HOG

3¢ 5¢

3¢ 5¢

La genomica: la mappatura e il sequenziamento dei genomi

suoi studi fondamentali sulla biochimica degli acidi nucleici, con particolare riguardo al DNA ricombinante”.

Nota chiave La genomica è lo studio della sequenza completa del DNA di un organismo o di un virus. Il DNA genomico viene in primo luogo frammentato; in seguito, ogni frammento viene clonato e, quindi, viene determinata la sequenza di ciascun clone. Il DNA viene clonato inserendo i frammenti di DNA di un organismo in un vettore di clonaggio per produrre una molecola di DNA ricombinante; quest’ultima viene successivamente introdotta in una cellula ospite all’interno della quale si verificherà la sua replicazione. Per il clonaggio sono essenziali gli enzimi di restrizione che riconoscono nel DNA sequenze di basi specifiche (siti di restrizione) e tagliano in un punto preciso all’interno della sequenza. Se il DNA da clonare e il vettore vengono tagliati mediante lo stesso enzima di restrizione, le due molecole differenti possono appaiarsi dando origine, in seguito alla ligazione, a una molecola di DNA ricombinante. Può essere clonato anche un frammento con estremità piatte, utilizzando per la ligazione un vettore anch’esso digerito in modo da avere estremità piatte.

Vettori di clonaggio e clonaggio del DNA Come già detto, per determinare la sequenza di un genoma, è necessario suddividerlo in frammenti e clonare ciascun frammento per produrne copie multiple da usare per il sequenziamento del DNA. Numerosi tipi di vettori specifici vengono impiegati per clonare il DNA. Questi ultimi comprendono plasmidi, batteriofagi (per esempio, λ e alcune specie a singolo filamento), cosmidi (vettori che presentano caratteristiche sia dei vettori plasmidici sia dei batteriofagi) e cromosomi artificiali. I vari tipi di vettori differiscono per le loro caratteristiche molecolari e per la quantità massima di DNA che può esservi inserita. Ciascun tipo di vettore è stato costruito in laboratorio. In questo capitolo l’attenzione verrà incentrata su plasmidi e cromosomi artificiali, che hanno avuto largo impiego negli approcci genomici. Vettori di clonaggio plasmidici Come accennato nel Capitolo 2, l’informazione genetica nei batteri può essere presente, oltre che sul cromosoma, in molecole di DNA a doppia elica (spesso circolare) con dimensioni decisamente minori, capaci di replicazione autonoma, chiamate plasmidi ed episomi. Questi elementi differiscono tra loro in quanto i primi sono esclusivamente citoplasmatici ed extracromosomici, mentre i secondi posso-

159

no trovarsi in forma autonoma oppure integrarsi transitoriamente nel DNA batterico. I plasmidi possono conferire al batterio ospite degli impornimazione tanti vantaggi selettivi: in particolare i plasmidi-R contengono Clonaggio geni per proteine in grado di dedel DNA gradare gli antibiotici (geni per in un vettore la resistenza agli antibiotici). La plasmidico capacità dei plasmidi di trasferirsi a batteri diversi (vedi Capitolo 15) può conferire alla cellula ospite resistenza multipla a più antibiotici. Ciò risulta di particolare rilevanza in medicina, quando i batteri che li contengono sono patogeni. Il DNA plasmidico contiene una sequenza di origine (ori) necessaria per la replicazione e geni per le altre funzioni del plasmide. I vettori di clonaggio plasmidici sono derivati da plasmidi circolari trovati in natura, che sono stati “ingegnerizzati” in modo da avere caratteristiche utili per il clonaggio del DNA. In questa sede verranno discusse le caratteristiche dei vettori plasmidici di E. coli. Un vettore plasmidico di E. coli deve avere le seguenti tre caratteristiche. 1. Una sequenza ori (origine della replicazione del DNA), necessaria perché il plasmide si replichi in E. coli. 2. Un marcatore di selezione, cioè un gene che permette di selezionare facilmente le cellule che hanno ricevuto il vettore di clonaggio. Per quanto riguarda i vettori di clonaggio derivati da plasmidi batterici, il tipico marcatore di selezione è rappresentato da un gene che conferisce la resistenza a un antibiotico, come il gene ampR per la resistenza all’ampicillina o il gene tetR per la resistenza alla tetraciclina. Quando plasmidi che portano geni di resistenza agli antibiotici vengono aggiunti a una popolazione di E. coli priva di plasmidi, e quindi sensibile agli antibiotici, le cellule batteriche che assumono il plasmide possono essere selezionate coltivando i batteri in un terreno contenente l’antibiotico appropriato; soltanto i batteri contenenti il plasmide riusciranno a crescere in questo terreno. Se le cellule vengono piastrate su un terreno solido (agar) contenente l’antibiotico, si osserveranno cloni di cellule resistenti (colonie batteriche). 3. Uno o più siti unici di taglio per enzimi di restrizione – siti presenti solo una volta nel vettore – per l’inserimento dei frammenti di DNA da clonare. (La presenza di siti di taglio multipli per l’enzima che si è scelto di utilizzare nel clonaggio determinerebbe la frammentazione del plasmide in seguito alla digestione). Generalmente, un vettore possiede un certo numero di siti, che tendono a essere riuniti in un sito di clonaggio multiplo o polylinker. Un sito di clonaggio multiplo è una regione di DNA che contiene numerosi siti unici di restrizione e a livello della quale un frammen-

MyLab

160

Capitolo 8

SacI

SacII

BstXI

EagI

NotI

SpeI

SmaI EcoRI HindIII SalI

XbaI BamHI PstI EcoRV ClaI

ApaI

XhoI

KpnI

Sito di clonaggio multiplo (polylinker)

lacZ +

pBluescript II (2961 bp)

ori

ampR

ori = origine di replicazione ampR = gene per la resistenza all’ampicillina lacZ + = parte del gene per la β-galattosidasi

Figura 8.4 Il vettore di clonaggio plasmidico pBluescript II. Questo vettore di clonaggio plasmidico ha un’origine di replicazione (ori), un marcatore di selezione ampR e un polylinker situato in una parte del gene per la β-galattosidasi lacZ +.

to di DNA estraneo (ossia che originariamente non faceva parte del vettore) può essere inserito nel vettore. Dal momento che nel sito di clonaggio multiplo è disponibile un certo numero di siti differenti, un ricercatore può utilizzare lo stesso vettore in esperimenti di clonaggio distinti, scegliendo siti di restrizione diversi. Come esempio, nella Figura 8.4 viene riportato lo schema del vettore di clonaggio plasmidico pBluescript II. Tale vettore di 2961 bp ha le seguenti caratteristiche, che lo rendono utile per il clonaggio del DNA in E. coli. 1. È presente nella cellula in un numero elevato di copie, fino a circa 100, poiché ha un’origine di replicazione molto attiva. Di conseguenza, è possibile produrre rapidamente molte copie di un frammento di DNA clonato in un numero ridotto di cellule ospiti. 2. Presenta il marcatore selettivo ampR per la resistenza all’ampicillina. 3. Contiene un sito di clonaggio multiplo contenente 18 siti di restrizione. 4. Il sito di clonaggio multiplo è inserito all’interno della sequenza del gene di E. coli che codifica per la βgalattosidasi (lacZ +; vedi Figura 8.4). Il vettore pBluescript II, come altri plasmidi costruiti in modo simile con un frammento del gene lacZ, viene generalmente inserito in un ceppo di E. coli contenente il gene lacZ mutato (quindi non in grado di produrre

una β-galattosidasi funzionante). Tuttavia, quando nella cellula batterica è presente il plasmide non modificato, grazie a esso viene prodotta una β-galattosidasi funzionante. Allorché però un frammento di DNA viene clonato nel polylinker, la sequenza codificante del gene lacZ sul plasmide viene interrotta e non può essere prodotta una β-galattosidasi funzionante. Quindi, la presenza o l’assenza di attività della β-galattosidasi indica se il plasmide introdotto in E. coli corrisponde al vettore pBluescript II vuoto (nessun frammento di DNA inserito: presenza dell’enzima funzionante), oppure al pBluescript II recante un frammento di DNA inserito (assenza di enzima funzionante). Al mezzo di coltura sul quale vengono piastrate le cellule contenenti i plasmidi viene aggiunto il composto chimico X-gal – un substrato artificiale incolore per la β-galattosidasi – come indicatore dell’attività della β-galattosidasi nelle cellule di una colonia. Il taglio dell’X-gal da parte della β-galattosidasi determina la produzione di una sostanza di colore blu. Quindi, se è presente l’enzima funzionante (vettore senza inserto), la colonia diventerà blu, mentre se viene prodotta una β-galattosidasi non funzionante (vettore con DNA inserito), la colonia sarà bianca. Questo protocollo viene definito saggio bianco-blu. La Figura 8.5 mostra come può essere inserito un frammento di DNA in un vettore di clonaggio plasmidico come pBluescript II. Nel primo passaggio, pBluescript II viene tagliato con un enzima di restrizione che ha un sito nel polylinker. Successivamente, DNA ad alto peso molecolare viene tagliato con lo stesso enzima di restrizione per ottenere il frammento di DNA da clonare. Poiché i siti di restrizione sono distribuiti casualmente nel DNA, vengono prodotti frammenti di varie dimensioni. I frammenti di DNA vengono mescolati con il vettore tagliato in presenza di DNA ligasi; in alcuni casi, un frammento di DNA si inserirà fra le due estremità tagliate del plasmide e la DNA ligasi catalizzerà la formazione di un legame covalente fra le due molecole. Il plasmide ricombinante così ottenuto viene introdotto in cellule ospiti di E. coli mediante la trasformazione. (Per definizione, la trasformazione è un processo nel quale nuova informazione genetica viene introdotta in una cellula sotto forma di frammenti di DNA extracellulare; vedi Capitolo 15.) La trasformazione viene effettuata incubando i plasmidi ricombinanti con cellule di E. coli trattate chimicamente (per esempio, con CaCl2) al fine di aumentare la loro capacità di assumere DNA, oppure mediante elettroporazione, un metodo che prevede di sottoporre le cellule a uno shock elettrico con conseguente disorganizzazione temporanea della parete cellulare, evento che permette il passaggio del DNA. Le cellule trasformate vengono piastrate su terreni di coltura contenenti ampicillina e X-gal. Le cellule capaci di crescere e dividersi su questo mezzo di coltura,

La genomica: la mappatura e il sequenziamento dei genomi 3¢





5¢ 3¢



Plasmide pBluescript II

161

L’inserimento del DNA estraneo interrompe il gene lacZ

Frammenti di DNA

gene lacZ + (parte) ampR

Il plasmide conferisce resistenza all’ampicillina e produce una β-galattosidasi funzionante

ampR

ampR

Taglio di restrizione nel polylinker

Figura 8.5 Inserimento di un frammento di DNA nel vettore di clonaggio plasmidico pBluescript II per produrre una molecola di DNA ricombinante. Il vettore pBluescript II contiene numerosi siti unici per gli enzimi di restrizione, localizzati in un polylinker, che sono utili per la costruzione di molecole di DNA

formando colonie, devono essere state trasformate da un plasmide. Le colonie contenenti i plasmidi con gli inserti possono essere identificate con il saggio bianco-blu. In una reazione di ligazione, il vettore digerito con l’enzima di restrizione può ricircolarizzare, cioè riformare una molecola circolare integra. Tale evento è piuttosto comune, poiché si tratta di una reazione che coinvolge solo una molecola di DNA, ossia il plasmide stesso, ed è quindi più probabile della ligazione di due molecole di DNA, come il vettore e l’inserto. Questa circostanza può rendere più difficoltosa l’individuazione del plasmide ricombinante desiderato fra tutti i plasmidi. Fortunatamente, la ricircolarizzazione del vettore può essere ridotta al minimo trattando il vettore digerito con l’enzima fosfatasi alcalina per rimuovere i gruppi fosfato in 5′, lasciando a entrambe le estremità della molecola di DNA un gruppo 5′-OH. Dal momento che la ligasi può unire solo un gruppo 3′-OH con un gruppo 5′-fosfato, eliminando entrambi i gruppi fosfato in 5′ dal vettore, quest’ultimo non potrà riformare una molecola circolare. Il DNA da inserire nel vettore – l’inserto – non viene trattato con la fosfatasi; in tal modo, tale DNA mantiene i gruppi fosfato alle estremità 5′ e può essere ligato alle estremità 3′ del vettore. Questa reazione di ligazione crea una molecola circolare con due tagli a singola elica laddove lo scheletro fosfodiesterico è rotto, successivamente uniti dalla DNA ligasi. Quindi, se il vettore digerito viene trattato con la fosfatasi alcalina prima della reazione di ligazione, si ottiene una drastica riduzione della percentuale di colonie blu fra i trasformanti. (Perché non si ottiene la scomparsa completa delle colonie blu? Nessuna reazione enzimatica ha un’efficienza del 100% e, pertanto, alcuni vettori non verranno modificati e potranno ancora ricircolarizzare.) In altre parole, il trattamento con la fosfatasi alcalina rende più efficiente l’identificazione dei cloni desiderati.

Il plasmide conferisce resistenza all’ampicillina, ma non può produrre una β-galattosidasi funzionante

ricombinante. L’inserimento di un frammento di DNA nel polylinker interrompe parte del gene per la β-galattosidasi (lacZ +), che non risulta funzionante in E. coli. Per identificare i vettori con o senza gli inserti può essere utilizzato il saggio bianco-blu delle colonie, descritto nel testo.

Nei vettori di clonaggio plasmidici derivati da E. coli possono essere clonati in modo efficiente frammenti di DNA fino a 15 kb. I plasmidi che contengono frammenti di DNA più grandi sono spesso instabili in vivo, e tendono a perdere la maggior parte del DNA inserito. Questo limite nelle dimensioni dell’inserto rende l’uso dei vettori plasmidici nell’analisi genomica limitato, poiché per contenere un genoma singolo di un organismo pluricellulare complesso, come l’uomo, sarebbero necessari milioni di cloni. Per clonare inserti di DNA più grandi vengono utilizzati vettori differenti, come i cosmidi e i cromosomi artificiali (si veda di seguito). Un cosmide può contenere inserti di DNA di 40-45 kb. I cosmidi sono vettori plasmidici in cui sono stati inseriti i siti cos (estremità coesive) del genoma di lambda, che permettono l’impacchettamento del DNA nel virione di questo batteriofago (da cui il nome cosmide: sito cos del fago lambda e plasmide). Le particelle fagiche così ottenute vengono utilizzate per infettare E. coli. (Il ciclo vitale del fago lambda è descritto nel Capitolo 15.) Questi vettori hanno inoltre un’origine di replicazione, un marcatore di resistenza agli antibiotici e un sito di clonaggio multiplo. I cosmidi vengono spesso usati come vettori quando vengono costruite banche genomiche, dal momento che sono capaci di contenere inserti più grandi. Cromosomi artificiali I cromosomi artificiali sono vettori di clonaggio che possono accogliere frammenti di DNA molto grandi, formando molecole di DNA ricombinante simili a piccoli cromosomi. I cromosomi artificiali sono utili per le applicazioni della genomica, perché possono essere impiegati per studiare regioni cromosomiche di grandi dimensioni e possono contenere un genoma intero in un numero ragionevole di cloni. Verranno presi qui in esame due esempi, i cromosomi artificiali batterici e quelli di lievito.

162

Capitolo 8

a) Un vettore BAC (cromosoma artificiale batterico) BamHI

rici giganti. Una delle differenze principali fra i BAC e i plasmidi discussi in precedenza è che, una volta effettuata la trasformazione in E. coli, l’origine di replicazione del fattore F mantiene il numero di copie del BAC a uno per cellula, mentre le origini dei vettori di clonaggio plasmidici classici determinano cicli multipli di replicazione del DNA al fine di generare molte copie del plasmide in ciascuna cellula. A differenza dei cromosomi artificiali di lievito, che verranno descritti qui di seguito, i BAC non subiscono riarrangiamenti nell’ospite. In virtù di tali caratteristiche, i cromosomi artificiali batterici sono diventati i vettori preferiti per ottenere cloni di grandi dimensioni negli studi di mappaggio fisico dei genomi. Tuttavia, nei vettori BAC (e altri in vettori di clonaggio per E. coli) i frammenti di DNA con una percentuale elevata di nucleotidi contenenti A e T non vengono clonati con efficienza. Inoltre, alcune sequenze di DNA eucariotico capaci di influenzare negativamente la replicazione dei vettori in E. coli non possono essere clonate in questo organismo.

SphI Hind III

lacZ +

pBeloBAC11 (7,5 kb) camR

Origine del fattore F

camR = gene per la resistenza al cloramfenicolo lacZ + = parte del gene per la β-galattosidasi b) Un vettore YAC (cromosoma artificiale di lievito) Braccio sinistro

TEL

TRP1

ARS

Braccio destro

CEN

URA3 Siti di restrizione per il clonaggio

TEL

Figura 8.6 Esempi di vettori di clonaggio costituiti da cromosomi artificiali. (a) Un vettore BAC (cromosoma artificiale batterico), come pBeloBAC11, è simile a un vettore plasmidico, dal momento che presenta uno o più marcatori selettivi (in questo caso, camR per la resistenza al cloramfenicolo) e un sito di clonaggio multiplo in parte del gene lacZ+, ma usa un’origine di replicazione derivata dal fattore F, che limita il numero di copie del BAC a uno per cellula di E. coli. (b) Uno YAC (cromosoma artificiale di lievito) contiene un telomero di lievito (TEL) a ciascuna estremità, una sequenza centromerica di lievito (CEN), un marcatore selettivo per il lievito a livello di ciascun braccio (in questo caso, TRP1 e URA3), una sequenza che permette la replicazione autonoma nel lievito (ARS) e siti di restrizione per il clonaggio.

Cromosomi artificiali batterici I cromosomi artificiali batterici (BAC, Bacterial Artificial Chromosomes) sono vettori di clonaggio che contengono l’origine di replicazione di un plasmide naturale di E. coli definito fattore F (vedi Capitolo 15), un sito di clonaggio multiplo, e uno o più marcatori di selezione. Nella Figura 8.6a viene mostrato un vettore BAC, pBeloBAC11. Questo particolare vettore può essere usato, mediante il saggio bianco-blu delle colonie, proprio come un plasmide. Il marcatore di selezione per questo BAC è camR; questo gene codifica per un enzima che degrada l’antibiotico cloramfenicolo, e quindi le cellule che portano questo vettore (con o senza l’inserto) possono crescere in presenza di cloramfenicolo, mentre le cellule che ne sono prive sono incapaci di crescere in tale condizione. I BAC possono contenere inserti fino a 300 kb e offrono il vantaggio di poter essere trattati come plasmidi batte-

Cromosomi artificiali di lievito I cromosomi artificiali di lievito (YAC, Yeast Artificial Chromosomes) sono vettori di clonaggio che permettono la produzione e la replicazione di cromosomi artificiali nelle cellule di lievito. I vettori YAC possono contenere frammenti di DNA della grandezza di alcune centinaia di kilobasi, più lunghi dei frammenti che possono essere clonati in vettori plasmidici, cosmidici, o nei BAC. I vettori YAC sono stati quindi utilizzati per clonare frammenti di DNA molto grandi (fra 0,2 e 2 Mb), per esempio nella creazione di mappe fisiche di genomi di grandi dimensioni, come il genoma umano. Uno YAC (raffigurato nella sua forma lineare nella Figura 8.6b) ha le caratteristiche seguenti. 1. Un telomero di lievito (TEL) a ciascuna estremità. (Si ricordi che i cromosomi eucarioti devono avere un telomero a livello di ciascuna estremità; vedi Capitolo 2.) 2. Una sequenza centromerica di lievito (CEN), che permette una corretta segregazione durante la mitosi; vedi Capitolo 2). 3. Un marcatore di selezione su ciascun braccio, per individuare e mantenere lo YAC nel lievito (per esempio, TRP1 e URA3, che conferiscono indipendenza dal triptofano e dall’uracile quando inseriti, rispettivamente, nei ceppi mutanti di lievito trp1 e ura3). 4. Una sequenza di origine della replicazione – ARS – grazie alla quale il vettore può replicarsi nella cellula di lievito. 5. Un’origine di replicazione (ori), che permette la replicazione del vettore vuoto in forma circolare in E. coli, e un marcatore selettivo, come ampR, che funziona in E. coli.

La genomica: la mappatura e il sequenziamento dei genomi

6. Una regione di clonaggio che contiene uno o più siti di restrizione; gli enzimi di restrizione che tagliano in questa regione non devono avere altri siti nello YAC. Questa regione viene utilizzata per l’inserimento del DNA estraneo. Vi sono due svantaggi associati a questi cloni molto grandi ottenuti tramite l’impiego degli YAC. In primo luogo, durante il processo di clonaggio una parte dei vettori YAC può incorporare due o più inserti, invece di uno, creando uno YAC chimerico. Un secondo problema è che parti del DNA inserito vengono spesso delete o modificate dalla cellula ospite, oppure vanno incontro a ricombinazione con altro DNA presente nella cellula ospite. Gli inserti alterati degli YAC chimerici e riarrangiati possono creare confusione nell’assemblaggio del genoma (nel momento in cui le sequenze vengono confrontate e ordinate per sequenze sovrapposte). Le alterazioni di questi inserti causeranno un’interpretazione errata della loro sovrapposizione con altri cloni, dato che uno YAC chimerico potrà contenere, per esempio, DNA del cromosoma 5 ligato a DNA del cromosoma 18. L’individuazione degli YAC modificati rappresenta spesso un processo molto lento e laborioso, che rende estremamente difficile l’assemblaggio di una sequenza genomica. I vettori YAC vuoti, cioè quelli che ancora non contengono inserti di DNA, vengono propagati come plasmidi circolari in E. coli; in questa forma i due telomeri si trovano affiancati. Questa tappa di propagazione sfrutta l’origine di replicazione batterica e il marcatore di selezione batterico. Si ricordi che le origini di replicazione batteriche ed eucariote non sono simili dal punto di vista funzionale; in altri termini, la sequenza ARS di lievito non funzionerà in una cellula batterica, così come la sequenza batterica ori non funzionerà in una cellula di lievito. Inoltre, anche i promotori batterici ed eucarioti sono diversi e, quindi, l’RNA polimerasi batterica non può trascrivere i geni di lievito TRP1 e URA3, e questi marcatori selettivi funzioneranno solo nel lievito. Allo stesso modo, l’RNA polimerasi II del lievito è incapace di trascrivere il gene ampR. Per gli esperimenti di clonaggio, uno YAC circolare viene tagliato con un enzima di restrizione che taglia in corrispondenza del sito di clonaggio multiplo, e con un altro enzima di restrizione che taglia fra i due TEL; in tal modo, si ottengono i due bracci, destro e sinistro. In seguito, il DNA ad alto peso molecolare, tagliato con lo stesso enzima di restrizione impiegato per tagliare lo YAC nel sito di clonaggio multiplo, viene ligato ai due bracci, e le molecole ricombinanti vengono usate per la trasformazione del lievito. La selezione per TRP1 e URA3 permette di essere sicuri che i trasformanti contengano sia il braccio destro sia il braccio sinistro del vettore.

163

Attività Una birra migliore grazie alla scienza? Nella iAttività Building a Better Beer (Produrre una birra migliore), nel sito web dedicato agli studenti, sarà possibile scoprire come migliorare la qualità della birra con ceppi di lievito geneticamente modificati.

Nota chiave Sono stati sviluppati molti tipi diversi di vettori al fine di costruire e clonare molecole di DNA ricombinante. Tali vettori differiscono per alcune caratteristiche fondamentali e, in particolare, per le dimensioni dell’inserto che possono contenere e per i tipi di cellule ospiti nelle quali il clone può essere propagato. I vettori di clonaggio devono possedere siti di restrizione unici, per inserire frammenti di DNA estraneo, e uno o più marcatori di selezione. La scelta del vettore da utilizzare dipende dalle dimensioni dei frammenti da clonare che, a loro volta, dipendono dalle esigenze sperimentali.

Banche genomiche Compreso in che modo il DNA può essere clonato in vettori specifici, vedremo ora come questo approccio possa essere applicato allo studio di un intero genoma. Il primo passo nello studio di un genoma consiste nella riduzione del DNA in frammenti più piccoli e facilmente manipolabili all’interno di banche genomiche. Una banca genomica, definita anche libreria genomica o genoteca, è una collezione di cloni che, teoricamente, contiene almeno una copia di ogni sequenza di DNA del genoma. (È necessario precisare “teoricamente” perché, sebbene l’obiettivo della ricerca scientifica in ambito genetico sia l’ottenimento di una libreria il più possibile completa, nella pratica alcune sequenze potrebbero risultare instabili nei vettori per il clonaggio scelti e non essere, quindi, rappresentate nella libreria risultante.) Le banche genomiche hanno molte applicazioni sperimentali nella biologia molecolare, oltre a rendere possibile il sequenziamento; per esempio, come verrà illustrato nel Capitolo 10, una banca genomica può essere usata per isolare e studiare un particolare clone relativo a un gene di interesse. In questo capitolo verrà presa in esame la costruzione di banche genomiche di DNA eucariote. Capiremo come vengono costruite e utilizzate nei progetti genomici. Le banche genomiche vengono costruite impiegando le procedure di clonaggio già descritte. Il DNA genomico viene tagliato in modo “parziale” con un enzima di restrizione e viene scelto un vettore che permetta di otte-

MyLab

164

Capitolo 8

nere una rappresentazione dell’intero genoma in un numero ragionevole di cloni. (Si noti che lo scopo della libreria genomica non è quello di clonare geni interi all’interno di un singolo vettore ma di avere una rappresentanza di tutte le sequenze – codificanti e non codificanti – del genoma.) In base a quanto affermato, sarebbe lecito supporre che si tratti semplicemente di digerire completamente il DNA con un enzima di restrizione e clonare i frammenti risultanti in un vettore. Tuttavia, vanno tenute presenti delle limitazioni a tale procedura. Una limitazione è costituita dalle dimensioni dei frammenti ottenuti dalla digestione con gli enzimi di restrizione. Infatti, dal momento che i siti di restrizione per un enzima possono trovarsi a diverse distanze l’uno dall’altro lungo il DNA, si potrebbero produrre dei frammenti troppo grandi per essere clonati nel vettore scelto. Immaginiamo, per esempio, di aver digerito con BamHI un DNA di 10 kb e di aver ottenuto frammenti di 500, 2500 e 7000 bp di lunghezza. Quest’ultimo frammento potrebbe essere inserito con difficoltà in un vettore plasmidico. Se i frammenti più grandi non vengono clonati si avrà una banca genomica mancante di una parte di “informazione”. Estendendo il problema alle migliaia di cloni che costituiscono una banca genomica costruita mediante la digestione completa di DNA genomico, non a)—La digestione parziale del DNA con un enzima di restrizione (per esempio Sau3A) produce una serie di frammenti sovrapposti, ciascuno con estremità coesive identiche 5„ GATC

b)—I frammenti ottenuti possono essere inseriti nel sito BamHI del vettore di clonaggio

TG AC A T T A

Il sito ibrido può essere tagliato da Sau3A, ma non da BamHI

C C G G

Il sito ibrido può essere tagliato sia da Sau3A sia da BamHI

C C T GG A

GG CC A T

Frammento di DNA digerito con Sau3A

Vettore di clonaggio

Figura 8.7 Digestione parziale con un enzima di restrizione per produrre frammenti di DNA sovrapposti di lunghezza appropriata al fine di costruire una banca genomica.

sarebbe possibile riassemblare i frammenti clonati secondo il loro ordine nel genoma. Per ovviare ai suddetti limiti tecnici, è necessario frammentare il DNA genomico in maniera diversa, ossia riducendolo in frammenti che abbiano dimensioni adeguate al vettore di clonaggio utilizzato. Inoltre, per poter ricostruire un ordine di sequenza di tutti i frammenti (una volta sequenziati) occorre che in essi ci siano delle sequenze sovrapponibili. Per ottenere questi frammenti sovrapposti, il DNA genomico può essere sottoposto a una rottura meccanica, oppure può essere eseguito un trattamento con un enzima di restrizione in condizioni tali da consentire una digestione parziale del DNA. (Si ricordi che stiamo tagliando milioni di copie di un particolare genoma; pertanto, ciascuna molecola di DNA verrà tagliata in un modo unico e i frammenti ottenuti da una molecola di DNA non saranno gli stessi ottenuti da un’altra.) La rottura meccanica può essere effettuata facendo passare il DNA attraverso l’ago di una siringa, in modo da ottenere una popolazione di frammenti sovrapposti di grandi dimensioni; tuttavia, in questo caso, si renderanno necessarie ulteriori manipolazioni per aggiungere alle molecole estremità appropriate e permetterne l’inserimento nel sito di restrizione di un vettore di clonaggio. Frammenti di DNA sovrapposti, di dimensioni appropriate per la costruzione di una libreria genomica, possono essere ottenuti più semplicemente mediante la digestione parziale del DNA genomico con enzimi di restrizione in grado di riconoscere sequenze di 6 o 4 bp, che ricorrono frequentemente (Figura 8.7a). Digestione parziale significa che solo una parte dei siti di restrizione disponibili viene tagliata dall’enzima. Questo risultato può essere ottenuto riducendo la quantità di enzima utilizzato e/o il tempo di incubazione con il DNA. I frammenti di DNA prodotti dalla digestione parziale con un enzima di restrizione possono essere clonati direttamente. Per esempio, se il DNA viene digerito dall’enzima Sau3A, che riconosce la sequenza 5′-GATC-3′ , le estremità risulteranno complementari 3′-CTAG-5′ alle estremità prodotte dalla digestione di un vettore di clonaggio operata da BamHI, la cui sequenza di riconoscimento è 5′-GGATCC-3′ 3′-CCTAGG-5′ (Figura 8.7b). Cioè, nella sequenza Œ 5′-GATC-3′ 3′-CTAG-5′ Ø Sau3A taglia a sinistra della G in alto e a destra della G in basso, producendo un’estremità sporgente con la sequenza 5′-GATC…3′, nel modo seguente: 5′3′-CTAG 5′

e

5′ GATC-3′ -5′

165

La genomica: la mappatura e il sequenziamento dei genomi

Œ 5′-GGATCC-3′ 3′-CCTAGG-5′ Ø

BamHI taglia fra i due nucleotidi G, producendo un’estremità sporgente 5′ con la sequenza 5′-GATC…3′, nel modo seguente:

DNA genomico

5′ GATCC-3′ G-5′

Le estremità coesive Sau3A e BamHI possono appaiarsi e formare un sito di riconoscimento ibrido.* Le molecole di DNA ricombinante, prodotte dalla ligazione dei frammenti tagliati con Sau3A e dei vettori tagliati con BamHI, vengono poi inserite in E. coli, dove vengono amplificate (vedi paragrafo precedente). Indipendentemente dalla modalità con cui sono stati ottenuti i frammenti di DNA sovrapposti, questi ultimi presenteranno un’ampia gamma di dimensioni. Si renderà quindi necessario selezionare i frammenti che hanno le dimensioni giuste per il clonaggio nel vettore scelto, eliminando quelli troppo piccoli o troppo grandi. Si consideri una popolazione di frammenti prodotti dalla digestione parziale con un enzima di restrizione (Figura 8.8a). Un sistema comune per selezionare i frammenti delle dimensioni desiderate per il clonaggio è l’elettroforesi su gel di agarosio (vedi Figura 8.8a). Tale metodica prevede l’utilizzo di un campo elettrico in grado di determinare la migrazione dei frammenti di DNA, carichi negativamente, attraverso una matrice costituita da gel di agarosio, dal polo negativo al polo positivo. La matrice, uno strato rettangolare e orizzontale di gel di agarosio immerso in una soluzione tampone, viene preparata facendo bollire una miscela di agarosio e soluzione tampone e versando successivamente tale preparato in uno stampo. Viene quindi aggiunto un “pettine” con denti rettangolari, che forma nel gel dei “pozzetti”. Raffreddandosi, l’agarosio forma un “setaccio” attraverso il quale passa il DNA. I frammenti di DNA (derivati dalla rottura meccanica o dalla digestione con enzimi di restrizione) vengono posti in un pozzetto del gel. Altri pozzetti possono contenere un marcatore di peso mole-

* Poiché questo sito ibrido contiene sempre una sequenza 5′GATC-3′, può essere tagliato da Sau3A. Tuttavia, la possibilità che tale sito possa essere tagliato anche da BamHI dipenderà dalla coppia di basi “interna” al frammento clonato digerito con Sau3A. Se vi è una coppia di nucleotidi C-G, il sito ibrido sarà 5′-GGATCC-3′ 3′-CCTAGG-5′ ovvero il sito di riconoscimento per BamHI. Questo avviene per il sito ibrido a sinistra nella Figura 8.7b. Se vicino al frammento Sau3A si trova qualsiasi altra coppia di nucleotidi, il sito ibrido non sarà un sito di taglio per BamHI (per esempio, il sito ibrido a destra nella Figura 8.7b).

Digestione parziale con un enzima di restrizione

Frammenti di DNA grandi, sovrapposti

Separazione dei frammenti di DNA in base alle dimensioni con l’elettroforesi su gel di agarosio

+

Gel di agarosio Pozzetto



Soluzione tampone Frammenti di DNA grandi

Frammenti di DNA piccoli

b) Analisi con l’elettroforesi su gel di agarosio di DNA genomico dopo digestione parziale con l’enzima di restrizione



4 e 5. DNA genomico parzialmente digerito

e

a) Digestione parziale di DNA genomico

2. DNA genomico non tagliato 3. DNA genomico completamente digerito

5′-G 3′-CCTAG 5′

colare (DNA ladder), ossia una serie di molecole di DNA di dimensioni note. Per esempio, come marcatore di peso molecolare viene spesso usato il DNA del fago

1. Marcatore di peso molecolare

Nella sequenza

kb 23,1 9,4 6,6 4,4 2,3 2,0

+

Corsie

Figura 8.8 Separazione di frammenti di DNA mediante elettroforesi su gel di agarosio. (a) Digestione parziale di DNA genomico con un enzima di restrizione e separazione dei frammenti mediante elettroforesi su gel di agarosio. (b) Analisi con elettroforesi su gel di agarosio di DNA genomico digerito parzialmente con un enzima di restrizione. Corsia 1: marcatore di peso molecolare (lambda ladder). Le dimensioni delle bande di DNA del marcatore sono indicate a sinistra del gel. Corsia 2: DNA genomico non digerito. Corsia 3: DNA genomico digerito completamente con un enzima di restrizione. Corsie 4 e 5: DNA genomico digerito parzialmente con un enzima di restrizione (la digestione del DNA nella corsia 4 è maggiore di quella nella corsia 5, perché sono state usate diverse condizioni di reazione). Notare le diverse dimensioni delle molecole di DNA tra le varie corsie.

166

Capitolo 8

lambda digerito completamente con HindIII; questa digestione dà origine a frammenti di 23,1 kb, 9,4 kb, 6,6 kb, 4,4 kb, 2,3 kb, 2,0 kb e 0,56 kb (lambda ladder). Successivamente, viene applicato al gel un campo elettrico; il DNA, carico negativamente, migra verso il polo positivo. Le molecole più piccole si muoveranno attraverso il gel più rapidamente rispetto alle molecole di dimensioni maggiori (Figura 8.8a). I frammenti di DNA così separati non sono visibili a occhio nudo ma possono essere visualizzati aggiungendo degli agenti intercalanti nella doppia elica del DNA, come il bromuro di etidio o il SYBR® Green, per colorarlo. Entrambi questi composti chimici emettono luce visibile quando sono eccitati dalla luce. In particolare, il bromuro di etidio emette luce visibile dopo essere stato eccitato dalla luce ultravioletta, mentre il SYBR® Green, quando è legato al DNA, emette una luce verde dopo essere stato eccitato dalla luce blu. L’emissione di luce visibile permette di individuare la posizione del DNA nel gel. Dal momento che i pozzetti sono rettangolari, i frammenti di DNA formeranno delle “bande” nel gel. La Figura 8.8b mostra l’analisi mediante elettroforesi su gel di agarosio di una digestione parziale di DNA genomico. Le “corsie” (lanes) verticali del gel mostrano come si sono separati, durante l’elettroforesi, i frammenti di DNA dei campioni caricati nei pozzetti. La corsia 1 contiene il marcatore di peso molecolare che, in questo caso, è il cromosoma del fago lambda tagliato con HindIII; si noti la serie di bande distinte di dimensione nota. Diversamente, nella corsia 2 si può osservare un campione di DNA genomico non digerito con un enzima di restrizione; in tal caso, non si distinguono bande ben definite, bensì è possibile osservare una massa concentrata di DNA in una regione della corsia che corrisponde ai frammenti di maggiori dimensioni del marcatore di peso molecolare, e una striscia (smear) di DNA lungo la corsia a partire da quel punto. La massa di DNA è costituita dai frammenti di DNA genomico di grandi dimensioni estratti dalla cellula. Dal momento che la rottura meccanica del DNA genomico durante l’estrazione dalla cellula è inevitabile, le dimensioni del DNA ad alto peso molecolare sono inferiori a quelle dei cromosomi. Inoltre, la frammentazione meccanica che avviene durante l’estrazione è responsabile delle numerose bande di varie dimensioni visibili, lungo la corsia, come uno smear. La corsia 3 mostra il DNA genomico digerito completamente con un enzima di restrizione. Anche in questo caso, non ci sono bande distinte corrispondenti ai frammenti di DNA, ma si vede una striscia di frammenti, la maggior parte dei quali ha dimensioni inferiori a quelle della più piccola banda visibile (2,0 kb) del marcatore di peso di molecolare. Le corsie 4 e 5 mostrano i risultati della digestione parziale del DNA con lo stesso enzima di restrizione. In entrambi i casi, il DNA è di dimensioni notevolmente maggiori rispetto al campione digerito completamente, come atteso in caso di digestione parzia-

le. Le digestioni parziali sono state effettuate in condizioni diverse per i due campioni e, per tale ragione, il campione nella corsia 4 risulta più digerito di quello nella corsia 5. La differenza nelle condizioni della digestione parziale si riflette nelle dimensioni dei frammenti di DNA sul gel; nella corsia 5 sono infatti visibili frammenti più grandi rispetto alla corsia 4. Anche per la digestione parziale del DNA genomico, come per quella completa, non si osservano bande distinte quando il DNA digerito viene analizzato mediante elettroforesi su gel di agarosio, ma piuttosto si osserva uno smear di frammenti di DNA di dimensioni differenti. Grazie alla presenza del marcatore di peso molecolare, che mostra la posizione raggiunta dai frammenti di una determinata dimensione, i ricercatori sono in grado di isolare i frammenti delle dimensioni desiderate dalle corsie delle digestioni parziali e, successivamente, possono clonarli. L’isolamento viene effettuato semplicemente tagliando un pezzo di gel di agarosio contenente i frammenti di DNA delle dimensioni desiderate ed estraendo il DNA dal gel purificando le molecole dall’agarosio. (L’elettroforesi su gel di agarosio è una tecnica importante che viene usata comunemente in laboratorio per separare e visualizzare frammenti di DNA. È utile per analizzare digestioni parziali di DNA genomico, come appena descritto, ma anche digestioni complete di molecole di DNA diverse, inclusi cloni specifici, genomi virali e genomi degli organuli. Ulteriori esempi dell’uso dell’elettroforesi su gel di agarosio verranno descritti in altri capitoli.) Quanti cloni sono necessari per contenere tutte le sequenze di un genoma? Il numero dei cloni necessari a tal fine dipende dalle dimensioni del genoma stesso e dalle dimensioni medie dei frammenti di DNA inseriti nel vettore. La probabilità di avere in una banca genomica almeno una copia di ogni sequenza di DNA può essere calcolata con la formula N=

ln (1 – P) ln (1 – f)

dove N è il numero di molecole di DNA ricombinante necessarie, P è la probabilità desiderata, f è la proporzione del genoma frazionato in una singola molecola di DNA ricombinante (in altri termini, f rappresenta la dimensione media, in kilobasi, dei frammenti usati per costruire la genoteca, divisa per la dimensione del genoma, sempre in kilobasi), e ln rappresenta il logaritmo naturale. Per esempio, per avere una probabilità del 99% che un dato frammento di DNA di lievito sia presente in una libreria genomica di frammenti di 10 kb, sapendo che le dimensioni del genoma di lievito sono di circa 12 000 kb, saranno necessarie 5524 molecole di DNA ricombinante. Nel caso del genoma umano, che consta di circa 3 000 000 di kb, sarebbero necessari più di 1 380 000 cloni plasmidici, mentre utilizzando come vettori i cro-

La genomica: la mappatura e il sequenziamento dei genomi

mosomi artificiali, con una dimensione media dell’inserto di 250 kb, sarebbero sufficienti solo 56 000 cloni. Tale circostanza permette di comprendere la ragione per cui vengono preferiti i vettori BAC o YAC per costruire banche di genomi di grandi dimensioni. La formula sopraindicata può essere usata anche per calcolare, dopo aver costruito una genoteca, la frazione di genoma presente in essa, dal momento che il numero di cloni, N, la dimensione media degli inserti e le dimensioni del genoma saranno valori noti. In questo caso, quindi, saranno conosciuti i valori di N e f, mentre l’incognita sarà P. È bene sottolineare che, qualunque sia il genoma o il vettore scelto, per essere ragionevolmente sicuri che siano rappresentate tutte le sequenze genomiche si dovrà costruire una genoteca con un numero di cloni diverse volte maggiore rispetto a quello minimo necessario.

167

te diverse, come nel caso dei cromosomi umani. Una procedura di separazione è la citofluorimetria, nella quale i cromosomi di cellule in mitosi, quindi condensati, vengono colorati con un colorante fluorescente e fatti passare attraverso un raggio laser collegato a un rilevatore di luce. Questo sistema separa i diversi cromosomi in base alle loro differenze nella capacità di legare il colorante e nella rifrazione risultante (i cromosomi più grandi legano più colorante ed emettono più fluorescenza di quelli di minore dimensione). Dopo aver raccolto e separato i cromosomi da un certo numero di cellule, è possibile costruire una banca per ciascun cromosoma nel modo descritto in precedenza. Indipendentemente dalla natura della genoteca, che si tratti di una banca cromosomica o di una genomica, alla fine sarà necessario determinare la sequenza del DNA degli inserti.

Banche cromosomiche Come illustrato nel paragrafo precedente, per ottenere una rappresentazione il più possibile completa del genoma, una banca genomica deve contenere un numero di cloni molto elevato. Tale necessità rappresenta un problema in particolare per i genomi di dimensioni elevate, come il genoma umano. Una soluzione a tale problema consiste nella semplificazione della genoteca mediante la costruzione di una serie di banche più piccole, ciascuna corrispondente a un singolo cromosoma. Una genoteca che consiste di una collezione di frammenti di DNA clonati derivati da un cromosoma viene chiamata banca o libreria cromosomica. Nell’uomo ciò implica la costruzione di 24 banche diverse, di cui una per ciascuno dei 22 autosomi, una per il cromosoma X e una per il cromosoma Y. Dal momento che ciascun cromosoma è molto più piccolo del genoma nel suo complesso, anche le genoteche risultanti saranno più piccole. Quando viene assemblata la sequenza di un genoma, l’impiego di queste librerie cromosomiche può anche semplificare le fasi successive, perché tutti i cloni di una data libreria cromosomica derivano, per definizione, dallo stesso cromosoma e quindi dallo stesso frammento di DNA. Queste librerie hanno dimostrato la loro utilità in alcuni aspetti del Progetto Genoma Umano, nel quale diversi gruppi di ricerca coinvolti nel sequenziamento di specifici cromosomi hanno preferito lavorare con queste genoteche più piccole e meno complesse per semplificare le analisi. Sia le banche genomiche sia quelle cromosomiche hanno svariate applicazioni, non solo il sequenziamento del genoma, come verrà spiegato nei capitoli successivi. (Per esempio, qualora sia necessario clonare un gene specifico, ma non si disponga delle sequenze genomiche, le banche saranno strumenti importanti per individuare e clonare quel gene.) I singoli cromosomi possono essere separati se la loro morfologia e le loro dimensioni sono sufficientemen-

Nota chiave Una banca genomica (libreria genomica, o genoteca) è una collezione di cloni che contiene almeno una copia di ogni sequenza di DNA del genoma di un organismo. Come le biblioteche, le librerie genomiche rappresentano fonti essenziali di informazione e, nello specifico, di dati sul genoma. Le dimensioni della genoteca dipendono dalle dimensioni degli inserti e del genoma; pertanto, sono necessari molti cloni per banche che contengono inserti piccoli, specialmente nel caso di genomi di grandi dimensioni. Una banca cromosomica è simile a una banca genomica dal punto di vista concettuale, tranne per il fatto che la collezione di cloni proviene da un solo cromosoma del genoma.

Sequenziamento del DNA e analisi delle sequenze Un clone di una banca genomica, o qualunque altro clone, può essere analizzato per determinare la sequenza nucleotidica dell’inserto di DNA, come pure per determinare la distribuzione e la posizione dei siti di restrizione. La sequenza nucleotidica rappresenta l’informazione più dettagliata che si possa ottenere relativamente a un frammento di DNA ed è la mappa fisica più accurata, permettendo la conoscenza base per base del DNA di interesse. Questa informazione è utile, per esempio, per confrontare sequenze di genomi diversi attraverso l’analisi al computer delle banche dati; in tal modo, è possibile capire quanto sono vicini due organismi da un punto di vista genetico o identificare sequenze geniche e sequenze regolatrici – come promotori, silencer ed enhancer – che controllano l’espressione genica. Inoltre, la sequen-

168

Capitolo 8

za di DNA di un gene che codifica per una proteina può essere “tradotta” dal computer nella corrispondente sequenza amminoacidica, fornendo informazioni sulle proprietà della proteina stessa. Questo tipo di informazione può essere utile a un ricercatore per isolare e studiare il prodotto proteico di un gene di cui sia disponibile il clone corrispondente. Walter Gilbert e Frederick Sanger hanno condiviso nel 1980 il Premio Nobel per la Chimica grazie al loro “contributo alla determinazione delle sequenze di basi degli acidi nucleici.” La sequenza di DNA dei geni che codificano per proteine è utile anche per confrontare le sequenze dei geni omologhi di organismi diversi. Mediante queste analisi si possono confrontare le sequenze di DNA degli organismi, oppure le sequenze proteiche codificate. La genomica comparativa è un settore in continua crescita, grazie al progressivo aumento del numero di sequenze genomiche disponibili.

Sequenziamento mediante didesossinucleotidi Il metodo usato più comunemente per il sequenziamento del DNA, chiamato sequenziamento mediante didesossinucleotidi (sviluppato da Fred Sanger negli anni settanta del secolo scorso), si basa sulla replicazione del DNA. Utilizzando come stampo una sequenza di interesse, una DNA polimerasi opera l’estensione di un breve primer, fino all’arresto di tale allungamento tramite inserimento di un nucleotide modificato (didesossinucleotide). In tal modo, viene prodotta una serie di frammenti più o meno lunghi che può essere interpretata grazie alla elettroforesi su gel, sia in un apparecchio per il sequenziamento automatico del DNA sia in un apparato standard per l’elettroforesi. Il metodo di sequenziamento mediante didesossinucleotidi permette di sequenziare sia il DNA lineare sia quello circolare. Frammenti lineari di DNA possono essere ottenuti, per esempio, tagliando il DNA clonato in un vettore mediante enzimi di restrizione o amplificando uno specifico tratto di DNA mediante la reazione a catena della polimerasi (PCR; vedi Capitolo 9). Per la reazione di sequenziamento sono necessari: il DNA stampo, una miscela di desossinucleotidi (nucleotidi non modificati) e didesossinucleotidi (nucleotidi modificati), la DNA polimerasi e un oligonucleotide primer. Vediamo ora in dettaglio le fasi di questa tecnica. Primer per il sequenziamento Nel sequenziamento mediante didesossinucleotidi, il DNA che funge da stampo viene dapprima denaturato a singola elica mediante trattamento con calore. Successivamente, un breve oligonucleotide a singolo filamento (primer) viene lasciato appaiare a una delle due eliche. L’oligonucleotide funziona da primer (letteralmente, “innesco”) per la sintesi del DNA (si ricordi, dal Capitolo 3, che la DNA polimerasi necessita di un primer per iniziare la sintesi del DNA) e l’orientamento da 5′ a 3′ assicura che il DNA di

nuova sintesi sia una copia complementare alla sequenza di DNA di interesse (Figura 8.9a). Il primer tipico è lungo 10-20 nucleotidi. Per semplificare, i primer illustrati nella figura relativa al sequenziamento del DNA hanno una lunghezza di 3 nucleotidi. Il primer oligonucleotidico viene disegnato in modo che la sua estremità 3′ risulti adiacente alla sequenza di DNA da determinare. Di solito, la sequenza di DNA che un ricercatore vuole determinare è quella dell’inserto in un vettore di clonaggio, come nel caso degli inserti di una banca genomica qualora l’obiettivo sia il sequenziamento completo di un genoma. Si consideri come esempio un frammento di DNA, clonato nel vettore plasmidico pBluescript II (Figura 8.4), caratterizzato da due estremità coesive, KpnI da un lato e SacI dall’altro, e inserito nel vettore tagliato nel sito di clonaggio multiplo in corrispondenza degli stessi siti KpnI e SacI (Figura 8.9b). Per sequenziare l’inserto viene impiegato un primer oligonucleotidico complementare a una sequenza di DNA adiacente al sito di clonaggio multiplo. Infatti, nella maggior parte dei vettori di clonaggio plasmidici le sequenze che fiancheggiano i siti di clonaggio multiplo sono le stesse, in modo che per sequenziare qualunque inserto in questi vettori si possono impiegare due primer universali, quali i primer SP6 e T7 (possono essere usati anche numerosi altri primer). I siti ai quali questi primer si appaiano si trovano ai lati del polylinker di pBluescript II (Figura 8.9b); in definitiva, entrambi i primer universali sono utili per il sequenziamento. Per esempio, dopo che un clone in pBluescript II è stato denaturato con il calore, il primer universale SP6 si appaierà con una delle due eliche, in questo caso alla regione di DNA che si trova a sinistra del sito di clonaggio multiplo (Figura 8.9b). Mediante questo primer sarà possibile sequenziare l’inserto di DNA da questo lato. Utilizzando in una seconda reazione il primer universale T7, complementare a una breve sequenza di DNA dall’altro lato del sito di clonaggio multiplo, sarà possibile sequenziare l’inserto da quella parte. Se l’inserto di DNA presenta dimensioni ridotte, dalle due reazioni di sequenziamento si otterrà in gran parte la stessa sequenza, ma si tratterà della sequenza delle due eliche complementari. La reazione di sequenziamento mediante didesossinucleotidi Il sequenziamento mediante didesossinucleotidi viene generalmente effettuato utilizzando un sequenziatore di DNA automatico, un apparecchio che permette il sequenziamento rapido e l’analisi computerizzata dei risultati. In un esperimento con il sequenziatore automatico, viene allestita una singola reazione di sequenziamento mediante didesossinucleotidi. Ciascuna reazione comprende il DNA stampo da sequenziare e un primer che, come appena spiegato, costituisce il punto a partire dal quale verrà determinata la sequenza. Dopo la denaturazione del DNA stampo mediante il trattamento con il calore, il primer si appaia a una delle due eliche,

La genomica: la mappatura e il sequenziamento dei genomi a)

169

DNA da sequenziare







5¢ Denaturare il DNA a singole eliche e appaiare il primer per il sequenziamento

Primer per il sequenziamento 3¢





Il primer non si appaia a questo filamento, che di conseguenza non prende parte alla reazione di sequenziamento





3¢ L’estensione del primer con la DNA polimerasi produce nuovo DNA; questa è la reazione di sequenziamento b)

Vettore Gene lacZ + Inserto Sito KpnI di DNA pBluescript II (parte) 5¢ 3¢

... ...

Sito di appaiamento per il primer universale T7

... 3¢ ... 5¢ Sito di appaiamento per il primer universale SP6

Sito SacI

Denaturazione a singole eliche

5¢ 3¢ ...

...

Appaiamento del primer universale T7

Appaiamento del primer universale SP6 5¢ 3¢

... 3¢

... 5¢





...

... 5¢ Estensione del primer da parte della DNA polimerasi; questa è la reazione di sequenziamento dell’inserto a partire dall’estremità sinistra

... 3¢

... 3¢



Estensione del primer da parte della DNA polimerasi; questa è la reazione di sequenziamento dell’inserto a partire dall’estremità destra

Figura 8.9 Primer per il sequenziamento del DNA. (a) In una reazione di sequenziamento, il DNA a doppia elica viene denaturato a singola elica e il primer per il sequenziamento si appaia a una regione specifica di uno dei due filamenti. L’estensione del primer da parte della DNA polimerasi produce nuovo DNA, complementare al DNA al quale si è appaiato il primer; in questo consiste la reazione di sequenziamento. L’altra elica del DNA non ha alcun ruolo nella reazione. (b) I vettori utilizzati più comunemente permettono di usare per

il sequenziamento primer universali. Nel caso di pBluescript II, il primer universale T7 si appaia vicino al sito KpnI del sito di clonaggio multiplo e il primer universale SP6 si appaia vicino al sito SacI in corrispondenza dell’altra estremità del sito di clonaggio multiplo. I siti di legame per i primer sono posizionati in modo tale che, quando un primer si appaia, l’estensione del primer stesso da parte della DNA polimerasi produce un’elica di DNA complementare a quella dell’inserto.

come illustrato nella Figura 8.9b. Vengono quindi aggiunti alla reazione la DNA polimerasi, i quattro desossinucleotidi precursori (dNTP, ossia dATP, dTTP, dCTP e dGTP; Figura 8.10a) e una quantità inferiore di nucleotidi modificati, chiamati didesossinucleotidi (ddNTP, ovvero ddATP, ddTTP, ddCTP e ddGTP; Figura 8.10b). La differenza fra un desossinucleotide normale e un didesossinucleotide consiste nel fatto che quest’ultimo ha

un gruppo 3′-H anziché 3′-OH sullo zucchero desossiribosio. Questo impedisce al ddNTP di formare legami fosfodiesterici con un altro desossinucleotide (o didesossinucleotide). Inoltre, a ciascuno dei quattro didesossinucleotidi è legato in modo covalente un colorante fluorescente diverso. Questi coloranti assorbono determinate lunghezze d’onda della luce, ed emettono lunghezze d’onda altamente specifiche. Per esempio, il ddGTP ap-

170

Capitolo 8

a) Desossinucleotide (dNTP) precursore del DNA O –O

P

O O

P

O O

P

O



O–

O–

O–

Base

CH2 O



H

H



H





H

OH H

b) Didesossinucleotide (ddNTP) precursore del DNA

P O–

O

O

O –O

O

P O–

O

P

O



O–

Base

CH2 O



H



H

H





H

H

H

Figura 8.10 Desossinucleotidi (dNTP) e didesossinucleotidi (ddNTP) precursori del DNA.

pare blu-verde perché è legato a un colorante che emette luce con una lunghezza d’onda di 520 nm, mentre il ddATP appare verde, il ddCTP assume una tonalità differente di verde e il ddTTP è giallo-verdastro. Generalmente, i didesossinucleotidi precursori (ddNTP) sono presenti nella miscela di reazione in rapporto di 1 :100 rispetto ai desossinucleotidi normali (dNTP), in modo che nelle reazioni di sequenziamento si verifichi comunque una certa sintesi di DNA. Quando la reazione di sequenziamento ha inizio, la DNA polimerasi aggiunge un nucleotide all’estremità 3′-OH del primer. Nell’esempio mostrato nella Figura 8.11a, nello stampo è presente un nucleotide A e, pertanto, al primer Primer universale per il sequenziamento

a)



5¢ 3¢

verrà aggiunto un nucleotide T. Dal momento che la maggior parte dei precursori nella reazione è rappresentata da dNTP, c’è una probabilità elevata che per questa fase di estensione venga utilizzato il precursore normale dTTP. La catena di DNA avrà quindi un gruppo 3′-OH alla sua estremità e la DNA polimerasi potrà aggiungere un altro nucleotide. Tuttavia, è anche possibile che la DNA polimerasi utilizzi il ddTTP, se pure con probabilità inferiore. In questo caso, la catena di DNA avrà alla sua estremità un gruppo 3′-H e non potrà essere aggiunto un altro nucleotide dalla DNA polimerasi. In altre parole, l’aggiunta di un didesossinucleotide a una catena di DNA durante la sua sintesi provoca l’arresto della sintesi stessa. Quindi, nell’esempio della Figura 8.11a, l’aggiunta del nucleotide T normale porterà alla fase di allungamento successiva, durante la quale sarà ancora possibile la scelta fra i due tipi di nucleotidi precursori, nel caso specifico fra dATP e ddATP. In una reazione di sequenziamento, ci sono milioni di coppie primer/stampo identiche che subiscono la stessa reazione di allungamento. Quindi, statisticamente, alcune reazioni si fermeranno al nucleotide 1 del DNA stampo, dopo aver incorporato un didesossinucleotide T, mentre altre si fermeranno al nucleotide 2, dopo aver incorporato un didesossinucleotide A; altre ancora si fermeranno al nucleotide 3, dopo aver incorporato un didesossinucleotide G, e così via. Nel complesso, verrà prodotta una popolazione di molecole di DNA di nuova sintesi con un numero elevato di nuovi frammenti che terminano in ciascuna posizione (Figura 8.11b). Si ricordi

Sequenza clonata da analizzare

A T GA CC A T GA T T

...

... 5¢

DNA stampo dTTP Il nucleotide T normale aggiunto ha un gruppo 3„-OH che permette l’aggiunta del nucleotide successivo da parte della DNA polimerasi 5¢ 3¢

...

ddTTP

La DNA polimerasi allunga il primer usando il dTTP

3¢ T A T GA CC A T GA T T

... 5¢

Figura 8.11 Sequenziamento mediante didesossinucleotidi. (a) La reazione di sequenziamento comprende il DNA stampo, un primer per il sequenziamento, la DNA polimerasi e una miscela contenente i desossinucleotidi (dNTP) precursori e una piccola quantità di didesossinucleotidi (ddNTP). Quando la DNA polimerasi usa un normale dNTP precursore per allungare la catena di DNA, un gruppo 3’-OH sul nucleotide incorporato permette di aggiungere un altro nucleotide. Quando invece la DNA polimerasi usa un ddNTP precursore per allungare la catena di DNA, un gruppo 3’-H sul nucleotide incorporato impedisce l’aggiunta di un altro nucleotide. (b) In una reazio-

La DNA polimerasi allunga il primer usando il ddTTP 5¢ 3¢

...

Il didesossinucleotide T aggiunto ha un gruppo 3„-H che non permette l’aggiunta del nucleotide successivo da parte della DNA polimerasi; la sintesi del DNA viene interrotta 3¢ T A T GA CC A T GA T T

... 5¢

ne di sequenziamento è presente un gran numero di coppie stampo/primer, che determina la sintesi di frammenti di DNA interrotti in tutte le posizioni possibili lungo il filamento stampo, in seguito all’incorporazione di un didesossinucleotide. (c) Risultato di una reazione di sequenziamento automatizzata. Il sequenziatore automatico produce le curve che si vedono nell’immagine riportata nella pagina a fianco a partire dalle bande fluorescenti su un gel. I colori sono generati dall’apparecchio e indicano le quattro basi: la A è verde, la G è nera, la C è blu e la T è rossa. Dove le bande non possono essere distinte con chiarezza, viene inserita una N.

La genomica: la mappatura e il sequenziamento dei genomi

inoltre che ciascun frammento di nuova sintesi è marcato con un colorante legato al didesossinucleotide che si trova alla sua estremità 3′. Nella reazione, quindi, le catene di diversa lunghezza che terminano con ddT saranno tutFigura 8.11 (segue) 5¢

b) 3¢

... 5¢



... 5¢



... 5¢



... 5¢



... 5¢



... 5¢



... 5¢



3¢ T A C A T GA CC A T GA T T

...

c)

...

... 5¢



... 5¢



... 5¢

3¢ T A C T GG A T GA CC A T GA T T

... 5¢

3¢ T A C T GG T A T GA CC A T GA T T

... 5¢

3¢ T A C T GG T A A T GA CC A T GA T T

... 5¢

3¢ T A C T GG T A C A T GA CC A T GA T T

... 5¢



... 5¢

3¢ T A C T GG T A C T A A T GA CC A T GA T T

... 5¢ 3¢

5¢ 3¢

... 5¢

T A C T GG T A C T A T GA CC A T GA T T

... 5¢



3¢ T A A T GA CC A T GA T T

T A C T G A T GA CC A T GA T T

... 5¢



... 5¢

T A C T A T GA CC A T GA T T

... 5¢



3¢ T A T GA CC A T GA T T

T A C T GG T A C T A A A T GA CC A T GA T T

... 5¢

171

te giallo-verdastre, mentre tutte le catene che terminano con ddG saranno blu-verdi, e così via. In breve, ognuna delle catene di DNA sintetizzate inizia dallo stesso punto e finisce a livello della base determinata dal didesossinucleotide incorporato. Il colorante legato al didesossinucleotide costituisce un codice colore per i frammenti di nuova sintesi, rendendo possibile l’identificazione dell’ultimo nucleotide aggiunto a quel frammento. Le catene di DNA in ciascuna miscela di reazione vengono separate con un tipo speciale di elettroforesi, molto sensibile, all’interno di un capillare molto piccolo; un raggio laser identifica i frammenti colorati quando questi ultimi escono dal suddetto capillare. Anche se i coloranti emettono colori simili, il computer converte queste minime differenze di colore in differenze più nette, assegnando a ciascun colorante “colori falsi”, come il verde per A, il nero per G, il rosso per T, e il blu per C. Il risultato è una serie di picchi colorati corrispondenti ai nucleotidi in ciascuna posizione nella sequenza (Figura 8.11c). La rappresentazione grafica viene convertita dal computer, con la supervisione del ricercatore, in una sequenza di nucleotidi. Il sequenziamento automatico è estremamente utile ai gruppi di ricerca per determinare la sequenza completa di genomi diversi, dal momento che un solo apparecchio può analizzare 100 o più campioni al giorno. La sequenza del filamento di DNA di nuova sintesi viene determinata dal computer associato al laser attraverso la lettura della sequenza dal primo frammento colorato che esce dal capillare (il frammento più corto con un didesossinucleotide marcato con il colorante) fino all’ultimo frammento leggibile (corrispondente al frammento più grande con un didesossinucleotide marcato con il colorante); in tal modo si ottiene la sequenza con orientamento 5′-3′. Generalmente, il laser riesce a leggere varie centinaia di nucleotidi fino a che un “ingorgo” di frammenti rende impossibile determinare l’ordine preciso con cui essi escono dal capillare. Nella Figu-

172

Capitolo 8

ra 8.11b, il frammento di DNA di dimensioni inferiori termina con ddT, il successivo con ddA, e così via. Il risultato della “lettura” della sequenza dal frammento più corto al più lungo è 5′-TACTGGTACTAA-3′; tale sequenza è complementare a quella dello stampo. Per sequenziare più nucleotidi di quanti possano essere letti in una singola reazione, la prima sequenza ottenuta viene utilizzata per disegnare un primer specifico, che si appaierà all’inserto di DNA vicino all’estremità 3′ della sequenza. La reazione di sequenziamento con questo nuovo primer produrrà una sequenza di DNA parzialmente sovrapposta alla prima. In questo modo, un ricercatore può procedere lungo un inserto di grandi dimensioni fino a ottenerne la sequenza completa.

diante didesossinucleotidi, ossia con un DNA stampo a singola elica e un primer, ma non utilizza didesossinucleotidi; infatti, l’apparecchio per il pirosequenziamento individua l’incorporazione dei nucleotidi nell’elica anche se non si verifica l’arresto della sintesi. Questa tecnica viene denominata nel modo sopraindicato perché, quando la DNA polimerasi utilizza un dNTP per allungare la nuova elica di DNA, viene rilasciata una molecola di pirofosfato (due gruppi fosfato uniti mediante un legame covalente). Come verrà illustrato in seguito, l’individuazione enzimatica del pirofosfato rilasciato, effettuata dall’apparecchio per il sequenziamento, fornisce informazioni sulla sequenza stampo. La Figura 8.12 illustra il principio della tecnica di pirosequenziamento. Il DNA da sequenziare viene denaturato per ottenere eliche singole. Il DNA a singola elica Pirosequenziamento viene attaccato a una microscopica sferetta, che viene poIl pirosequenziamento è una nuova tecnica automatiz- sta in un piccolissimo pozzetto nel pirosequenziatore. zata che inizia in modo simile al sequenziamento me- Successivamente, viene aggiunta la miscela di reazione, che contiene un primer, la DNA polimerasi e altri tre enzimi. I quattro dNTP non sono presenti nella miscela inia) Una reazione di pirosequenziamento ziale, ma vengono aggiunti separatamente, uno dopo Desossinucleotidi l’altro, e, in seguito, rimossi, in moprecursori del Il dCTP in eccesso Reazione enzimatica nuovo DNA do che nella reazione di pirosequenche usa l’ATP per viene eliminato CC produrre luce C ziamento si trovi un solo dNTP per C Pirofosfato C Primer per il DNA volta. Questo ciclo di aggiunta e rimosequenziamento polimerasi PP ATP Luce zione di ciascun dNTP viene ripetuto Reazione enzimatica 3¢ 5¢ molte volte. Si consideri una reazione alla in ATP che converte il PP GC A GGC C T C CG T CCGGAGC C T G T A A CG A quale sia stato aggiunto dCTP (Figura ... 5¢ 3¢ 8.12a). Dato che la prima base non appaiata nel DNA stampo Quando dGTP verrà a singola elica Sferetta filamento stampo è una G, il dCTP potrà essere aggiunaggiunto alla reazione, legato alla sferetta microscopica nella catena di nuova sintesi to all’estremità 3′ del primer dalla DNA polimerasi, rilane verranno incorporati due sciando una molecola di pirofosfato (PPi). Un altro enzib) Risultato del pirosequenziamento (pirogramma) ma presente nella miscela di reazione usa questo pirofoi

i

Sequenza nucleotidica del nuovo DNA 5¢ G

C

GG 3¢

C

A GG CC T

Quantità di luce

Un picco di altezza doppia indica che nel nuovo DNA sono stati incorporati due nucleotidi quando è stato aggiunto il precursore. In questo caso è stato incorporato un nucleotide G, circostanza che suggerisce che sullo stampo c’erano due nucleotidi C adiacenti. Un picco di altezza singola indica che nel nuovo DNA è stato incorporato un nucleotide quando è stato aggiunto il precursore. In questo caso è stato incorporato un nucleotide C, circostanza che suggerisce che sullo stampo c’era un nucleotide G.

A

G

C

T

A

G

C

T

A

Nucleotide aggiunto

G

C

T

A

G

L’assenza di picchi quando vengono aggiunti i nucleotidi significa che non sono stati incorporati nel nuovo DNA, circostanza che suggerisce che sullo stampo non c’erano basi complementari.

Figura 8.12 Pirosequenziamento. (a) In una reazione di pirosequenziamento un DNA stampo a singola elica viene legato a una sferetta microscopica. Vengono successivamente aggiunti un primer per il sequenziamento e alcuni enzimi, fra i quali la DNA polimerasi. A questa miscela di reazione vengono addizionati, uno alla volta, i dNTP. In questo esempio, alla reazione è stato appena aggiunto il dCTP. La DNA polimerasi può aggiungere un desossinucleotide C all’estremità 3’ della catena di DNA di nuova sintesi. In questa reazione viene rilasciato pirofosfato (PPi), che viene convertito in ATP da un secondo enzima presente nella miscela di reazione; in seguito, un terzo enzima usa l’ATP per produrre luce. L’apparecchio

per il pirosequenziamento quantifica la luce emessa. Il dCTP in eccesso viene consumato da un quarto enzima presente nella miscela di reazione e, successivamente, viene aggiunto un altro dNTP. Se il dNTP successivo è dTTP o dATP, non si avrà nessuna reazione, poiché nessuno di essi può essere aggiunto alla nuova catena di DNA. L’allungamento della catena potrà realizzarsi solo aggiungendo dGTP. In questo caso la quantità di luce emessa sarà doppia, perché nello stampo ci sono due nucleotidi C adiacenti; quindi, potranno essere aggiunti due desossinucleotidi G. (b) Il pirogramma mostra la quantità di luce emessa e viene usato per determinare la sequenza del filamento di DNA sintetizzato ex novo.

La genomica: la mappatura e il sequenziamento dei genomi

sfato in una reazione che produce ATP, e un terzo enzima sfrutta l’energia dell’ATP per produrre luce. Il pirosequenziatore individua e quantifica la luce, correlandola al dNTP presente nella reazione. Quindi, nell’esempio in esame, dal momento che la luce è stata emessa in presenza di dCTP, si pùo affermare che nella nuova elica è stata incorporata una C. Il dCTP in eccesso viene infine eliminato da un altro enzima presente nella miscela di reazione. A questo punto viene addizionato un altro dNTP, per esempio dTTP; nell’esempio in questione, dato che il dTTP non si appaierà con la C sullo stampo, non si avrà emissione di luce. Il dTTP in eccesso viene degradato da un enzima e il pirosequenziatore aggiunge dATP. Anche in questo caso il nucleotide non può essere aggiunto al filamento di DNA e, quindi, il dATP viene eliminato senza determinare produzione di luce. Successivamente, viene aggiunto il dGTP. Poiché le due basi successive sul filamento di DNA sono entrambe C, la DNA polimerasi aggiungerà due molecole di dGTP al nuovo filamento dopo la C. In tal modo, viene sintetizzato un nuovo filamento di DNA con la sequenza 5′-CGG-3′. È possibile affermare che sono stati incorporati due residui G, dato che l’aggiunta di due residui G al nuovo filamento determina il rilascio di due molecole di pirofosfato, che verranno usate per produrre due molecole di ATP e una quantità doppia di luce rispetto a quando viene aggiunto un nucleotide solo. Il pirosequenziatore misura esattamente la quantità di luce emessa quando viene aggiunto un determinato dNTP e, in base a tale dato, si può determinare sul pirogramma la sequenza esatta del DNA sintetizzato (Figura 8.12b). Il pirosequenziatore continua questo processo ciclico, aggiungendo dCTP, poi dTTP, dATP, dGTP, e così via. Come nel caso del sequenziamento mediante didesossinucleotidi, la sequenza ottenuta è complementare a quella del DNA stampo. Il processo appena descritto corrisponde alla reazione di sequenziamento con una sferetta. Il pirosequenziatore presenta circa 200 000 pozzetti microscopici, in ciascuno dei quali viene effettuata una reazione di sequenziamento differente, con un DNA stampo diverso attaccato a una sferetta. In tal modo, si pùo realizzare il sequenziamento contemporaneo di molte molecole di DNA, circostanza che consente di ottenere circa 20 milioni di nucleotidi di sequenza genomica in 6 ore. La tecnica di pirosequenziamento è ancora nuova e costosa, ma, quando le apparecchiature utilizzate a tal fine saranno perfezionate e più convenienti, questa metodica assumerà notevole importanza.

Analisi delle sequenze di DNA Dal momento che anche la migliore reazione di sequenziamento produce solo poche centinaia di coppie di basi di sequenza, per effettuare il sequenziamento di un frammento di DNA di grandi dimensioni è di solito necessa-

173

rio assemblare i risultati di molte reazioni, ciascuna effettuata con un primer differente. Le sequenze di molti singoli frammenti clonati verranno successivamente assemblate in un cromosoma o in un genoma intero. La comparazione mediante computer di due (o più) sequenze è relativamente semplice; se le sequenze si sovrappongono, una serie di basi sarà presente in entrambe e, se la regione sovrapposta è abbastanza lunga, si potrà assumere che i due frammenti sequenziati si sovrappongano parzialmente. Per esempio, se l’inserto del clone 1 presenta la sequenza 5′-AGCTTACGCCGATATTATGCGTTTA3′, e la sequenza dell’inserto del clone 2 è 5′-ATG CGTTTAGGGCGCAATAATTAGCGCAAT-3′, le sequenze si sovrappongono (la regione sovrapposta è in-

Nota chiave Per determinare la sequenza di un frammento di DNA clonato sono stati sviluppati diversi metodi. Un metodo utilizzato comunemente, il sequenziamento mediante didesossinucleotidi, si basa sulla sintesi enzimatica di una nuova catena di DNA su un filamento di DNA stampo. Mediante tale procedura, la sintesi delle nuove eliche a opera della DNA polimerasi viene bloccata dall’incorporazione di un didesossinucleotide, una forma modificata del desossinucleotide normale, che, non avendo un 3′-OH alla sua estremità, non permette il procedere della reazione. Utilizzando quattro didesossinucleotidi diversi, la sintesi della nuova elica si fermerà in tutte le posizioni possibili, consentendo la determinazione della sequenza completa del DNA. Una nuova tecnica di sequenziamento, il pirosequenziamento, è basata anch’essa sulla sintesi del DNA. In questo caso, il DNA stampo a singola elica viene dapprima attaccato a una sferetta microscopica e, successivamente, viene aggiunta una miscela di reazione contenente il primer, la DNA polimerasi, e altri enzimi. I dNTP vengono aggiunti separatamente, uno per volta e, se un determinato dNTP può essere aggiunto alla nuova catena di DNA, viene rilasciato pirofosfato che, grazie all’azione degli altri enzimi, determina l’emissione di luce. I risultati delle diverse reazioni sono analizzati in successione ed il profilo (“pattern”) di emissione della luce, correlato con il dNTP presente, permette di determinare la sequenza del DNA complementare a quella del DNA stampo. Qualunque sia la tecnica di sequenziamento utilizzata, la sequenza che si può ottenere da una reazione è relativamente corta. Per ottenere la sequenza di frammenti di DNA di grandi dimensioni, è necessario assemblare i risultati di molte reazioni mediante algoritmi, elaborati tramite computer, che identificano regioni di sovrapposizione fra sequenze di DNA adiacenti.

174

Capitolo 8

dicata in grassetto), e la vera sequenza del DNA nel genoma sarà 5′-AGCTTACGCCGATATTATGCGTTTAGGGCGCAATAATTAGCGCAAT-3′. Il progressivo sequenziamento dei cloni permette di individuare ulteriori sovrapposizioni che permettono l’assemblaggio di sequenze lunghe. Questa è una fase critica in quasi tutte le analisi delle sequenze di DNA, non solo nella genomica. Se un gene di interesse viene clonato da una genoteca (vedi Capitolo 10), per studiarlo si renderà necessario sequenziare l’inserto. Si noti che solo pochi geni presentano dimensioni talmente ridotte da poter essere sequenziati completamente in un’unica reazione.

L’assemblaggio delle sequenze di DNA Dopo aver discusso le tecniche per il clonaggio e il sequenziamento del DNA, è necessario inserire tali metodiche nel contesto dell’ottenimento delle sequenze di genomi completi. L’approccio attuale al sequenziamento dei genomi è chiamato sequenziamento casuale diretto. Nei paragrafi seguenti verrà anche descritta la modalità con cui si effettua l’annotazione delle sequenze genomiche, ossia come vengono identificati geni putativi e altre sequenze importanti.

Il sequenziamento del genoma mediante l’approccio del sequenziamento casuale diretto

MyLab

Nel sequenziamento del genoma mediante l’approccio del sequenziamento casuale diretto (whole-genome shotgun), l’intero genoma viene ridotto in frammenti che si sovrappongono parzialmente; successivamente, ciascun frammento nimazione viene clonato e sequenziato, e la sequenza genomica vieL’approccio del ne ricostruita al computer. sequenziamento Que sto approccio è diventacasuale diretto to il più comune, in quanto si del genoma è dimostrato veloce ed efficiente e può essere utilizzato anche se si possiedono poche informazioni sul genoma da sequenziare. La Figura 8.13 delinea l’approccio del sequenziamento casuale diretto. In primo luogo, vengono prodotti tramite un’azione meccanica frammenti genomici casuali, parzialmente sovrapposti, che vengono clonati per produrre una prima genoteca. A differenza delle librerie descritte precedentemente, le dimensioni dell’inserto per ciascun clone sono piccole e, in particolare, pari a circa 2 kb; in tal modo, è possibile utilizzare per il clonaggio vettori plasmidici semplici. Questo vuol dire che è necessaria una banca genomica costituita da migliaia, o milioni, di cloni. Vengono quindi sequenziate poche centinaia di nucleotidi per ciascuna estremità di ciascun clone, e i dati vengono inseriti nel computer. Si ipotizzi che

in ogni reazione vengano sequenziati 500 nucleotidi. A causa della parziale sovrapposizione dei cloni, la sequenza della regione centrale, di circa 1 kb, si potrà ottenere solo sequenziando un clone che le si sovrappone. Per esempio, se un secondo clone si sovrappone al primo per 500 bp, il suo sequenziamento produrrà una sequenza di 500 bp appartenenti alla parte centrale non sequenziata del primo clone. Da queste brevi sequenze, il computer ricostruisce una sequenza genomica, assemblandole in base alle sovrapposizioni. Il risultato del sequenziamento di questa banca genomica è una serie di sequenze contigue (Contig) che coprono la maggior parte del genoma. Ci saranno comunque delle lacune, perché alcune sequenze non sono presenti nella genoteca. La tappa successiva, quindi, è collegare tra loro i Contig, colmando gli “spazi vuoti”. A tal fine viene usata anche una seconda banca genomica, costituita da frammenti di DNA casuali, parzialmente sovrapposti, di circa 10 kb, clonati in vettori plasmidici semplici. Una funzione importante di questa seconda genoteca è quella di sequenziare regioni del genoma contenenti sequenze ripetute. Molte sequenze ripetute hanno infatti dimensioni estese e pari a circa 5 kb; quindi, possono essere contenute, insieme al DNA non ripetuto che le fiancheggia, in un clone di 10 kb, ma non in un clone di 2 kb. (Questo è un limite nell’utilizzo di cloni di 2 kb nello studio del genoma umano). Nell’assemblaggio di una sequenza genomica a partire da cloni di 2 kb, un clone con un inserto costituito da una sequenza unica seguita da parte di una copia di una sequenza ripetuta determina l’arresto dell’assemblaggio della sequenza. La ragione di tale evento è che molti cloni della libreria contengono parti della famiglia di sequenze ripetute che possono provenire da qualsiasi punto del genoma. Gli algoritmi al computer saranno incapaci di individuare la sequenza corretta da sovrapporre al clone in questione, dato che ci saranno diversi possibili cloni, ciascuno dei quali avrà sequenze di DNA fiancheggiante uniche. La genoteca di 10 kb permette di superare tale ostacolo, perché alcuni cloni conterranno una sequenza unica di DNA che fiancheggia una sequenza ripetuta, consentendo di assemblare i cloni più piccoli saltando le regioni ripetute; in altri termini, il clone più grande funziona come un ponte fra due cloni più piccoli. Ciò permette di procedere nell’assemblaggio della sequenza genomica, purché i cloni della libreria di 10 kb contengano solo inserti singoli e non siano contaminati da cloni con inserti multipli, come discusso in precedenza per i cloni YAC. Un altro scopo della seconda libreria genomica è ottenere informazioni di sequenza che forniscano una conferma indipendente della struttura delle sequenze assemblate. L’assemblaggio al computer della sequenza genomica dai dati di sequenziamento è simile a quello descritto in precedenza, ma su scala molto più ampia. La qualità della sequenza assemblata è strettamente corre-

175

La genomica: la mappatura e il sequenziamento dei genomi Cellule dell’organismo di interesse

Frammenti di DNA di varie dimensioni

Estrazione del DNA

Elettroforesi su gel di agarosio 1

2

Purificazione del DNA dal gel Preparazione di una genoteca Frammenti di DNA di 1,6-2,0 kb Corsia 1: DNA cellulare Corsia 2: marcatore di peso molecolare

Ottenimento delle sequenze delle estremità degli inserti di DNA I frammenti corti vengono decodificati Sequenze terminali

Le sequenze vengono inserite nel computer Sovrapposizioni

T A C C A T T C G T A A G C C G A A G C T AC GT Il computer ricostruisce una sequenza continua

ACG

Figura 8.13 L’approccio del sequenziamento casuale diretto (whole genome shotgun) per ottenere la sequenza genomica completa di un organismo.

lata alla copertura del genoma, cioè al numero medio di volte che una data sequenza sarà presente nei risultati del sequenziamento. Una copertura elevata comporterà, ovviamente, una migliore qualità della sequenza assemblata. Per esempio, per avere una copertura di 7 volte di un genoma di 100 Mb, dovranno essere ottenute 700 Mb di sequenza. La qualità della sequenza genomica è strettamente correlata alla copertura, perché i cloni da sequenziare vengono scelti a caso; quindi, più è alta la copertura, minore è la probabilità che una data regione non venga mai selezionata. Un valore di copertura elevato indica che è stata sequenziata una maggiore percentuale del genoma (e che la maggior parte del genoma è stata sequenziata più di una volta con conseguente maggiore qualità della sequenza), mentre un valore di copertura inferiore indica che nella sequenza ci sono più lacune e che buona parte del genoma è stata sequenziata una vol-

ta sola. Molte delle sequenze genomiche di elevata qualità sono state ottenute con coperture da 7 a 8 volte, mentre per altre sequenze con una copertura di 2 o 3 volte i dati sono meno completi. Inizialmente, si riteneva che l’approccio del sequenziamento casuale diretto fosse poco utile al sequenziamento di genomi completi di dimensioni superiori a 100 kb. Le ragioni erano due: (1) l’impossibilità di effettuare il lavoro necessario per ottenere una copertura elevata con sistemi di sequenziamento non automatizzati, e (2) l’aumento progressivo della complessità dell’analisi informatica parallelamente all’incremento del numero delle sequenze. In anni recenti, la disponibilità di procedure robotizzate per la preparazione delle reazioni di sequenziamento, insieme a sequenziatori automatici sempre più potenti e ad algoritmi sofisticati per l’assemblaggio di centinaia, fino a milioni di sequenze di 300-500

176

Capitolo 8

bp, ha permesso di utilizzare questo approccio anche su genomi di grandi dimensioni. La dimostrazione finale che questo approccio avrebbe funzionato su grandi genomi è venuta dalla pubblicazione della sequenza preliminare del genoma umano da parte della Celera Genomics. Questa sequenza aveva una copertura di 5 volte (cioè ogni nucleotide era stato sequenziato, in media, 5 volte) e rappresentava circa il 97% del genoma, ma erano comunque presenti delle lacune. Come mai? Anche con una copertura di 5 volte, alcune regioni non erano state sequenziate, e questo poteva spiegare alcune delle lacune, ma non tutte. Come appreso in precedenza, il genoma umano contiene sequenze ripetute. In molti casi, queste sequenze ripetute sono organizzate in lunghe serie, con un numero elevato di copie di una sequenza di un certo tipo, e l’assemblaggio di queste regioni è molto difficile. Inoltre, a volte il DNA clonato subisce ricombinazione o delezione nell’ospite batterico, e questi processi sono più frequenti per alcuni tipi di sequenze, specialmente per quelle altamente ripetute. Alcune di queste lacune sono state riempite recentemente. Progressi nell’automazione del sequenziamento del DNA si realizzano continuamente e vengono sviluppati sempre nuovi algoritmi computazionali per l’analisi delle sequenze ottenute. Per i progetti di sequenziamento genomico viene ormai utilizzato quasi esclusivamente l’approccio del sequenziamento casuale diretto, anche per genomi di grandi dimensioni.

Assemblaggio e rifinitura delle sequenze genomiche Le sequenze “grezze” ottenute dai progetti di sequenziamento dei genomi devono essere assemblate in sequenze più lunghe; in altri termini, le sequenze dei singoli Contig devono essere unite e le basi devono essere messe insieme nell’ordine in cui si trovano nel genoma. L’assemblaggio di Contig di cloni può servirsi anche di mappe fisiche del genoma. Con il termine mappatura fisica facciamo riferimento all’uso di tecniche di biologia molecolare per “posizionare” sul DNA specifiche sequenze, inclusi i geni. Le mappe fisiche sono basate su distanze molecolari (coppie di basi), a differenza delle mappe genetiche (che verranno discusse nel Capitolo 14), basate sulla frequenza di ricombinazione che non sempre è proporzionale alle distanze molecolari. Come vedremo nel Box 8.1, mappe genetiche e fisiche dei cromosomi permettono agli scienziati di isolare geni di interesse. I frammenti sovrapposti, ottenuti dall’analisi di sequenza, possono essere posizionati “fisicamente” nel genoma prendendo come riferimento una mappa nota. Per esempio, se si conosce la posizione nel genoma in esame di sequenze uniche, come le sequenze STS o siti a sequenza etichettata (Sequence Tagged Site) è possibile far riferimento a queste ultime per posizionare i cloni e

creare delle sequenze continue più grandi. Una sequenza di DNA, per essere catalogata come STS, deve soddisfare alcuni criteri: questi tratti di DNA devono essere lunghi generalmente da 100 a 500 coppie di basi, devono essere noti e facilmente identificabili nel genoma (mediante PCR, per esempio) e, soprattutto, devono essere presenti in esso un’unica volta. L’uso delle STS permette anche di controllare l’assemblaggio: se due diversi Contig contengono la stessa STS in regioni non contigue, allora l’assemblaggio non è corretto. L’insieme di tutti i Contig deve rappresentare l’intera molecola di DNA, per esempio un cromosoma (l’assemblaggio deve essere ripetuto per tutti i cromosomi). Una mappa di cloni contigui può essere anche costituita a partire da un altro tipo di mappa fisica come la mappa di restrizione a lungo raggio (vedi Capitolo 10), in cui i siti di restrizione per enzimi che tagliano sequenze poco rappresentate nel genoma (rare cutters, per esempio NotI) e i frammenti da essi generati sono utilizzati per confermare se due o più regioni sono simili o identiche perché condividono lo stesso profilo di frammenti di digestione (o RFLP, vedi Capitolo 10). Dopo il completamento dell’assemblaggio, vengono generalmente pubblicate le “bozze operative” delle sequenze genomiche. A questo punto il lavoro non è ancora completo, dal momento che nella sequenza saranno rimaste molte lacune da riempire, come pure errori derivati dal sequenziamento. Il passo successivo è la rifinitura (finishing) della sequenza genomica, che produrrà una sequenza molto accurata, con meno di un errore ogni 10 000 basi e il maggior numero possibile di lacune riempite.

Analisi della variazione nelle sequenze genomiche Dopo aver completato il sequenziamento di un intero genoma, gli scienziati possono anche iniziare a studiare le differenze fra gli individui di una specie. Tale studio aiuta a comprendere l’origine della variazione naturale nelle popolazioni e permette di individuare le sequenze responsabili di particolari caratteri in una popolazione.

Nota chiave Per il sequenziamento di un genoma con l’approccio casuale diretto è necessario costruire una banca di frammenti genomici parzialmente sovrapposti e sequenziare ciascun clone. Le sequenze di DNA ottenute vengono poi assemblate al computer in sequenze più lunghe, in base alle sovrapposizioni. Le interruzioni che rimangono a questo punto vengono riempite in una fase successiva chiamata rifinitura.

La genomica: la mappatura e il sequenziamento dei genomi

Box 8.1

177

Il clonaggio posizionale

L’isolamento di geni espressi a livelli molto elevati in specifici tipi cellulari può essere facilmente effettuato a partire dai messaggeri corrispondenti: una volta che gli mRNA sono stati isolati, infatti, essi possono essere retrotrascritti in cDNA (Figura 8.15) e, successivamente, questi ultimi possono essere utilizzati come sonde molecolari per lo screening di banche genomiche. Questa procedura (descritta nel Capitolo 10) non è, però, facilmente applicabile allo studio di geni il cui livello di espressione è minimo. Una valida alternativa è quella di utilizzare un approccio noto come clonaggio posizionale, che consiste nel mappare il gene responsabile di un dato carattere e, successivamente, cercare un suo clone in una libreria genomica con procedure che dipendono dalla sua posizione. Storicamente il clonaggio posizionale ha reso possibile identificare geni responsabili di varie malattie umane ereditarie, come per esempio la fibrosi cistica, la corea di Huntington, il tumore del seno per la mutazione di BRCA1 e la predisposizione all’asma. Oggi, per gli organismi per i quali è disponibile la sequenza dell’intero genoma, la sequenza della regione di interesse, contenente i geni “candidati”, può essere semplicemente ottenuta mediante approcci bioinformatici, senza necessità di effettuare lo screening di una libreria. Innanzitutto è necessaria una mappatura di tipo genetico (vedi Capitolo 14) e, nel caso dell’uomo, l’analisi degli alberi genealogici di famiglie numerose, per studiare l’associazione tra uno o più marcatori polimorfici del DNA (come RFLP, polimorfismi della lunghezza dei frammenti di restrizione, o SNP, polimorfismi a singolo nucleotide; vedi Capitolo 10) e il gene candidato. In pratica, il marcatore o i marcatori noti fanno da punti di riferimento sul genoma (è preferibile utilizzare marcatori sia al 5′ sia al 3′, delimitando così un’area che comprenda il gene di interesse). Per esempio, l’associazione con diversi marcatori molecolari ha permesso la localizzazione del gene della fibrosi cistica sul braccio lungo del cromosoma 7, restringendo la regione di interesse a un tratto che comprendeva, però, numerosi geni candidati. Successivamente, la sequenza del presunto gene può essere localizzata fisicamente su un cromosoma mediante cammini cromosomici o salti cromosomici. Nel caso del cammino cromosomico (chromosome walking), il marcatore molecolare scelto, concatenato (vedi Capitolo 14) al gene di interesse la cui sequenza è ancora sconosciuta, viene utilizzato come sonda per l’ibridazione e la selezione dei cloni di una libreria genomica. I cloni identificati in questa prima analisi sono sovrapposti studiando come vengono tagliati da due diversi enzimi di restrizione (in pratica si fa una mappa dei siti di restrizione, una

procedura di mappatura fisica che permette di sovrapporre e orientare frammenti di DNA non troppo lunghi; vedi Capitolo 10). Successivamente, le estremità dei cloni genomici più lontani dal marcatore iniziale vengono utilizzate come sonda per un secondo screening della libreria genomica. Questa procedura può essere ripetuta più volte fino al gene d’interesse (in genere si procede in entrambe le direzioni a partire dal marcatore iniziale non avendo informazioni sul suo orientamento rispetto al gene di interesse a esso associato). Il cammino cromosomico è, in generale, più facile per genomi più piccoli e con una quantità di DNA ripetuto minore. (Le ripetizioni di sequenza ostacolano, infatti, un cammino corretto: se il frammento utilizzato come sonda contiene una sequenza ripetuta nel genoma, esso si ibriderà non solo ai cloni sovrapposti ma anche ad altri che contengono la ripetizione, creando risultati difficilmente interpretabili con esattezza). Per velocizzare il cammino cromosomico, soprattutto quando è molto lungo, e per saltare zone con sequenze ripetute, ci si può avvalere dei salti cromosomici (chromosome jumping). In maniera analoga al chromosome walking, si parte utilizzando come sonda un marcatore noto; tuttavia sfruttando digestioni parziali del DNA genomico e la capacità dell’enzima DNA ligasi di circolarizzare i frammenti identificati si possono “saltare” regioni ampie di DNA, di 100 kb o più. Una volta identificato un possibile gene candidato si può verificare il suo coinvolgimento esprimendo l’allele selvatico in cellule contenenti l’allele mutato e analizzando la sua capacità di ristabilire il fenotipo selvatico (ciò è possibile solo quando il gene introdotto nelle cellule mutate è realmente la copia funzionale di quello responsabile del carattere in esame). Nel caso del gene per la fibrosi cistica, i geni candidati vennero identificati in base a segnali di inizio e di terminazione. Successivamente le loro sequenze, e quelle dei loro cDNA, vennero confrontate tra individui affetti e individui sani. Una mutazione per delezione di una tripletta codificante per una fenilalanina venne riscontrata in un gene candidato nei pazienti affetti dalla patologia, ma non negli individui sani. Dalla sequenza fu dedotta la struttura funzionale della proteina corrispondente, simile a quella di trasportatori di ioni noti. La conferma finale che questa fosse la sequenza genica giusta fu ottenuta, poi, da saggi funzionali in vitro. Oggi sappiamo che il gene mutato nella fibrosi cistica codifica per la proteina CFTR e che la mutazione più frequente (ΔF508) altera lo splicing dell’RNA messaggero, portando alla produzione di una proteina non funzionale.

178

Capitolo 8

Nonostante i progressi quotidiani della tecnologia per il sequenziamento, per molte specie eucariote risulta ancora proibitivo il sequenziamento dell’intero genoma di molti individui. Una possibile soluzione di tale problema consiste nell’analisi di molte piccole regioni di DNA disseminate in tutto il genoma, al fine di costruire mappe delle differenze genetiche fra individui che possano essere studiate, quali, per esempio, le mappe degli aplotipi. SNP e aplotipi Le mappe più dettagliate utilizzano i polimorfismi di singoli nucleotidi (SNP, Single Nucleotide Polymorphism). Un SNP è un tipo di marcatore di DNA che consiste in una variazione di una singola base, in alcuni individui, a livello di un determinato sito; quel sito è il locus del SNP. Gli SNP sono un esempio di marcatori di DNA, cioè variazioni di sequenza fra individui in corrispondenza di una regione di DNA specifica; tali differenze possono essere individuate attraverso l’analisi molecolare del DNA e impiegate per l’analisi genetica. I loci degli SNP sono abbondanti nel genoma umano e si possono rinvenire, in media, circa una volta ogni 1000 bp (in alcune regioni sono anche più frequenti). Quindi, ogni locus SNP avrà abbastanza vicino altri loci SNP polimorfici. (Si noti che per ogni locus SNP possono esserci due varianti alleliche diverse o uguali, ciascuna su uno dei due cromosomi omologhi.) L’abbondanza dei loci degli SNP ha permesso ai ricercatori di sviluppare mappe genetiche molto dettagliate, che mostrano la localizzazione degli SNP sul cromosoma. Nel caso di loci SNP vicini, è raro che il quadro degli alleli SNP presenti su un dato cromosoma venga riassortito dalla ricombinazione (vedi Capitolo 14). Ciò significa che, per esempio, se è stato ereditato l’allele 1 di SNP-A (SNP-A1) e l’allele 1 di SNP-B (SNP-B1) dal padre, e l’allele 2 di entrambi gli SNP (SNP-A2 e SNP-B2) dalla madre, i figli erediteranno SNP-A1 e SNP-B1, oppure SNP-A2 e SNP-B2 (è molto improbabile che venga trasmesso alla progenie un nuovo assortimento di questi SNP). Se un altro SNP, SNP-C, è lontano sia da SNP-A sia da SNP-B, non si potrà fare una previsione simile per quanto riguarda l’ereditarietà delle diverse versioni di SNP-C rispetto a SNP-A o SNP-B. Un aplotipo è un set di alleli SNP specifici a livello di particolari loci degli SNP che si trovano vicini in una piccola regione di un cromosoma, in modo tale che, in una determinata famiglia, questi aplotipi verranno rimescolati raramente dalla ricombinazione genetica. Nell’esempio precedente, SNP-A1 e SNP-B1 possono costituire un piccolo aplotipo. La ricombinazione genetica tende ad avere luogo con frequenza maggiore in alcune regioni chiamate hot spot (letteralmente, “punti caldi”), mentre è molto più rara in altre definite cold spot (letteralmente, “punti freddi”). In generale, tutti i loci SNP di un aplotipo si troveranno in una regione dove la ricombinazione è più rara, per cui dall’ereditarietà di un allele SNP di un determinato aplo-

tipo è possibile prevedere come verranno ereditati gli altri alleli dello stesso aplotipo. Dato che i cold spot sono regioni piccole di un cromosoma, tutti i loci SNP di un aplotipo si troveranno vicini sullo stesso cromosoma e costituiranno un piccolo gruppo di SNP concatenati geneticamente (come vedremo nel Capitolo 14). Considerando che i diversi SNP che compongono un gruppo tendono a essere ereditati insieme, è possibile analizzare solo un sottogruppo (tag SNP) di questi ultimi. Per definizione, un tag SNP (letteralmente, “SNP etichetta”) corrisponde a uno (o più) locus SNP; in particolare, esso rappresenta un aplotipo intero e viene usato per analizzare quest’ultimo. Infatti, se tutti i componenti di un aplotipo vengono ereditati insieme, sarà sufficiente saggiarne un paio per capire che cosa è successo a quelli che non sono stati analizzati. Si ipotizzi, per esempio, che i loci SNP A, F, L, M, X e Z si trovino nella stessa regione cold spot e formino un aplotipo. Un individuo ha ereditato gli alleli SNP A1, F2, L2, M2, X1 e Z2 da sua madre (questo sarebbe un aplotipo) e gli alleli A2, F1, L2, M1, X2 e Z1 da suo padre (questo sarebbe un altro aplotipo). Per determinare quale aplotipo abbia ereditato il figlio di questo individuo, invece di esaminare ciascun locus SNP (A, F, L, M, X e Z), è possibile analizzare solo l’ereditarietà degli alleli A e Z. Se questo individuo ha trasmesso A1 e Z2, è lecito presumere che il figlio abbia ereditato anche F2, L2, M2 e X1, che appartengono allo stesso aplotipo. Se un altro figlio di tale individuo ha eredita A2 e Z1, è possibile dedurre che quest’ultimo ha ereditato l’altro aplotipo. Inoltre, se i loci SNP A, F, L, M, X e Z vengono ereditati insieme, i cloni di una genoteca contenenti uno o più di questi SNP devono essere vicini fra di loro sulla mappa fisica. Sono stati identificati nell’uomo più di 13 milioni di SNP. Molti di questi si trovano in aplotipi noti con tag SNP definiti; solo questi ultimi possono essere analizzati (esistono circa 500 000 tag SNP) e si può prevedere come verranno ereditati tutti i SNP di ciascun aplotipo in base all’ereditarietà dei tag SNP che definiscono gli aplotipi stessi. L’analisi di mezzo milione di SNP può sembrare un lavoro impossibile, ma i microarray a DNA (vedi anche Capitolo 9) permettono di saggiarne migliaia per volta. I microarray a DNA (chiamati anche chip di DNA) sono vetrini sui quali vengono disposte migliaia di sonde di DNA diverse. (Una sonda di DNA è un singolo filamento di DNA utilizzato in un esperimento per determinare se è presente una molecola bersaglio complementare di DNA o di RNA. L’appaiamento della sonda con la sequenza bersaglio viene individuato mediante la marcatura della sonda stessa.) Un microarray a DNA per l’analisi degli SNP (spesso chiamato SNP chip) è un tipo particolare di microarray, nel quale sul vetrino sono legate sonde a singola elica non marcate e costituite da oligonucleotidi complementari agli alleli tag SNP. (Si noti, comunque, che le sonde di DNA di un

La genomica: la mappatura e il sequenziamento dei genomi

179

DNA bersaglio. Negli esperimenti con i microarray a DNA, invece, le sonde non sono marcate, e ciascuna si trova in una posizione specifica e nota sul vetrino, mentre è marcato il DNA bersaglio. In un SNP chip il DNA bersaglio, costituito da DNA genomico di un singolo individuo marcato con un colorante fluorescente, viene aggiunto al microarray e, se qualche molecola del DNA bersaglio può appaiarsi con una o più sonde presenti sul vetrino, si avrà ibridazione nella posizione corrispondente alla sonda (o alle sonde). Per questo particolare tipo di microarray a DNA vengono stabilite condizioni di ibridazione estremamente rigorose, in modo tale che anche un solo nucleotide non appaiato fra la sonda e il DNA bersaglio impedisca l’appaiamento. Corrispondenza completa fra In altri termini, il DNA bersaglio marcato di un individuo la sonda SNP e il DNA bersaglio Sonda SNP marcato, che quindi si appaiano si appaierà solo alle sonde corrispondenti agli alleli tag (non marcata) 5¢ 3¢ SNP che risultano perfettamente complementari agli GCCA T T AAG T C T T CA T CCC TA alleli SNP presenti nel suo DNA (Figura 8.14a). L’inC G G T A A T T C AG A A G T A GGG A T tensità del segnale fluorescente per ciascuna delle mi3¢ 5¢ DNA bersaglio gliaia di posizioni sul vetrino viene poi quantificata Colorante Tag SNP (marcato) fluorescente mediante un laser, e il profilo risultante viene analizzato al computer per individuare la localizzazione Un singolo malappaiamento delle singole sonde sul vetrino (Figura 8.14b). Il rifra la sonda SNP e il DNA Malappaiamento: le basi bersaglio impedisce l’appaiasultato dell’esperimento consiste nell’identificazione non possono appaiarsi mento fra le due molecole di tutti gli alleli tag SNP specifici nel genoma di quel 5¢ 3¢ C determinato individuo; infine, tale dato indica gli G C C A T T A AG T T T C A T C C C T A aplotipi presenti in quel particolare soggetto. C G G T A A T T C A C A A G T A GGG A T Perché è importante cono3¢ 5¢ scere tutti gli aplotipi di un determinato individuo? Questo Schema di una parte del microarray tipo di analisi può aiutare gli che mostra l’ibridazione con la sonda scienziati a isolare il gene o i geni responsabili di specifiche malattie genetiche umane, daIl DNA genomico marcato di un individuo contenente un allele to che questa tecnica consente SNP si lega alla sonda SNP sul vetrino l’analisi rapida degli alberi gedel microarray solo se la corrispondenza è perfetta nealogici per lo studio dell’ereditarietà della malattia (vedi 20 mm Capitolo 14). Per esempio, è Il DNA genomico marcato possibile osservare che in una di un individuo contenente famiglia l’ereditarietà di cinun allele SNP non si lega alla sonda SNP sul vetrino que serie concatenate di tag del microarray se le due SNP è correlata con l’ereditasequenze non sono perfettamente complementari rietà di una particolare malat-

microarray a DNA possono anche essere rappresentate da DNA di diverso tipo come, per esempio, negli approcci di trascrittomica descritti nel Capitolo 9). Il DNA da analizzare, a singola elica, viene marcato con un colorante fluorescente e depositato sul microarray. Se le sequenze della sonda e del DNA bersaglio sono complementari, si appaieranno in un processo chiamato ibridazione (si forma infatti una doppia elica ibrida fra due frammenti differenti di DNA a singola elica). Per l’ibridazione è sempre necessaria una sonda che possa appaiarsi con il DNA bersaglio e, di solito, le molecole della sonda sono marcate in qualche modo, a differenza del a)

b)

Il microarray a DNA (SNP chip) dopo l’ibridazione

Figura 8.14 Analisi mediante tag SNP (polimorfismo di singoli nucleotidi). (a) Principio della caratterizzazione dei tag SNP mediante ibridazione. Le condizioni di ibridazione sono stabilite in modo tale che un singolo malappaiamento destabilizzi l’ibrido, impedendo quindi l’appaiamento delle due eliche. (b) Analisi di tag SNP con microarray. L’ibridazione fra il DNA bersaglio marcato e le sonde alleliche dei tag SNP non marcate sul microarray può essere individuata grazie alla marcatura con coloranti fluorescenti (in questo caso, con un colorante rosso) del DNA dell’individuo che si vuole analizzare.

180

Capitolo 8

tia genetica, mentre gli individui sani della stessa famiglia non ereditano mai questi tag SNP. Tale osservazione suggerisce che il gene responsabile della malattia sia vicino ai tag SNP su quel cromosoma. Dal momento che la localizzazione fisica di questi tag SNP è nota, queste regioni del genoma possono essere analizzate per verificare la presenza di geni vicini alterati nelle persone affette da quella malattia. La mappa degli aplotipi Esperimenti come gli SNP chip appena descritti possono aiutare a identificare tutti gli aplotipi ereditati da un determinato individuo. Gli scienziati possono quindi cominciare a considerare tutte le combinazioni di aplotipi presenti in molte popolazioni umane e costruire una mappa degli aplotipi (hapmap). La mappa degli aplotipi è una descrizione completa di tutti gli aplotipi conosciuti in tutte le popolazioni umane analizzate e della localizzazione cromosomica di ciascuno di essi. Se due aplotipi si trovano vicini su un cromosoma e sono separati da una regione a bassa ricombinazione, saranno generalmente ereditati insieme. Anche due aplotipi vicini su un cromosoma e separati da una o più regioni in cui il tasso di ricombinazione è elevato tenderanno a essere ereditati insieme; tuttavia, la correlazione non sarà così forte come nel caso dei loci SNP dello stesso aplotipo, dato che gli aplotipi potranno essere separati dalla ricombinazione nella regione hot spot. Aplotipi molto lontani fra di loro verranno trasmessi alle generazioni successive indipendentemente gli uni dagli altri. Una mappa degli aplotipi è quindi una rappresentazione molto fine della struttura fisica e genetica di un cromosoma. È possibile utilizzare le mappe degli aplotipi per studiare l’ereditarietà di caratteri complessi, come le malattie cardiache e l’obesità, che possono essere causate dagli effetti additivi di più geni difficili da identificare attraverso l’analisi genetica classica. Inoltre, queste mappe possono essere utilizzate anche per studiare i rapporti evolutivi (vedi Focus sul genoma).

Nota chiave Gli SNP, o polimorfismi di singoli nucleotidi, sono piccole regioni di DNA che variano fra gli individui. Questi SNP possono essere studiati o singolarmente o come aplotipi, cioè serie di alleli SNP che tendono a essere ereditati come gruppo. Grazie ai microarray a DNA, è possibile determinare il genotipo SNP per migliaia di loci degli SNP in una volta sola. In tal modo, possono essere sviluppate le mappe degli aplotipi. Lo studio delle mappe degli aplotipi fornisce informazioni sulle differenze fra individui e sulla variazione sia nelle regioni che non codificano per proteine, sia in quelle che codificano per proteine funzionali.

Annotazione delle sequenze genomiche La fase successiva all’ottenimento della sequenza completa di un genoma è l’annotazione, che consiste nella localizzazione delle regioni polimorfiche (variabili) e di altre sequenze importanti nel genoma. Con l’annotazione ha inizio il processo di assegnazione della funzione a tutti i geni putativi identificati.

Identificazione e annotazione delle sequenze geniche Le sequenze geniche codificanti sono di particolare interesse per gli scienziati, dato che rappresentano le unità funzionali di un organismo. Di seguito analizzeremo i metodi utilizzati per individuare in modo specifico queste regioni codificanti. È possibile ricercare i geni analizzando i cDNA o cercando regioni probabilmente codificanti nel DNA genomico. Ognuno di questi approcci presenta vantaggi e svantaggi, ma la loro combinazione fornisce risultati affidabili. Identificazione di sequenze geniche mediante l’analisi dei cDNA In teoria, la maniera più semplice per individuare i geni codificanti per proteine consiste nella ricerca degli RNA messaggeri (mRNA), dato che ogni RNA messaggero deriva da un gene. Un problema connesso all’applicazione di questo metodo diretto risiede nella natura della trascrizione stessa. Infatti, una data cellula trascrive solo una piccola parte dei geni del suo DNA, e alcuni geni vengono trascritti con frequenza molto inferiore rispetto ad altri; di conseguenza, in un campione alcuni mRNA saranno molto rari. Un secondo problema è rappresentato dal fatto che gli mRNA non sono stabili dal punto di vista chimico e, in tali condizioni, le tecniche di clonaggio e sequenziamento non possono essere utilizzate. Questo ostacolo può essere superato lavorando con le banche di cDNA. Come ogni libreria di DNA, una banca di cDNA è un’ampia collezione di sequenze clonate. In questo caso, gli inserti sono DNA complementari (cDNA), ossia molecole di DNA a doppia elica costituite da un’elica complementare a un mRNA e dall’elica complementare a quest’ultima molecola di DNA. La sequenza di questa seconda elica è quindi praticamente uguale a quella dell’mRNA, tranne per il fatto che al posto della base U c’è la T. Sintesi dei cDNA Le molecole di cDNA vengono ottenute mediante un processo che prevede due fasi. Nella prima fase, molecole di mRNA vengono usate come stampo per la sintesi di molecole complementari di DNA. In questa fase viene utilizzato l’enzima trascrittasi inversa (RT, Reverse Transcriptase), che sintetizza una molecola di DNA a partire da uno stampo di RNA. L’enzima è così chiamato proprio perché “inverte” il processo di trascrizione descritto nel dogma cen-

La genomica: la mappatura e il sequenziamento dei genomi

181

Focus sul genoma I veri occhi blu Una delle applicazioni delle mappe degli aplotipi è lo studio dell’ereditarietà dei caratteri nell’uomo. Gli occhi blu si trovano in molte popolazioni umane e, anche se in molte regioni le persone con gli occhi blu sono rare, in molte parti dell’Europa esse rappresentano una percentuale elevata della popolazione. Per esempio, in alcune popolazioni della Scandinavia fino al 95% degli individui ha gli occhi blu. Dal momento che persone con gli occhi blu si trovano in molte popolazioni che sono state storicamente isolate, almeno in parte, dai loro vicini per ragioni geografiche, linguistiche, religiose o culturali, si è ritenuto che il gene che controlla il colore degli occhi fosse mutato molte volte, almeno una volta in ogni popolazione nella quale si trovano individui con gli occhi blu. Tale circostanza avrebbe dato origine a piccoli sottogruppi con gli occhi blu non imparentati fra di loro nell’ambito di gruppi etnici differenti e isolati. Questo modello della “mutazione multipla” è stato proposto anche per spiegare l’origine dei capelli rossi. In base a questo modello, i danesi e i turchi con gli occhi blu non avrebbero un antenato con gli occhi blu in comune. Utilizzando le mappe degli aplotipi, gli scienziati hanno analizzato il DNA di più di 800 individui con gli occhi blu. Il risultato è stato sorprendente, in quanto ha dimostrato che tutte le persone con gli occhi blu condividevano lo stesso aplotipo per una regione del cromosoma 15 dove si trovano i geni OCA2 e HERC2. Ciò suggerisce che tutti gli individui con gli occhi blu analizzati abbiano un antenato comune. Questo antenato sarebbe vissuto probabilmente fra 6000 e 10 000 anni fa, presentava lo stesso aplotipo e avrebbe trasmesso quest’ultimo, generazione dopo generazione, ai suoi discendenti. Per quale ragione questo aplotipo è diventato così comune in un periodo di tempo tanto breve? Le spiegazioni possibili sono due. La mutazione che determina il colore blu degli occhi diminuisce anche la pigmentazione della pelle e dei capelli. In Europa, la luce solare è meno intensa rispetto alle regioni tropicali dell’Africa, dove si è evoluta la spe-

trale. Infatti, nella trascrizione classica, il DNA è usato come stampo per la sintesi di RNA, mentre la trascrittasi inversa inverte i ruoli delle molecole, usando l’RNA come stampo per la produzione di DNA. Per produrre il cDNA, si inizia con uno stampo di mRNA. Nella maggior parte dei casi, le banche di cDNA vengono costruite con mRNA eucarioti (che, come descritto in precedenza, differiscono dai geni che li codificano perché sono state rimosse le sequenze degli intro-

cie umana. Quando la luce solare è intensa, i pigmenti cutanei sono di importanza fondamentale per proteggere la pelle dai raggi dannosi del sole. Questi pigmenti però interferiscono con una fase cruciale della sintesi della vitamina D, per la quale è necessaria la luce. In condizioni di luce intensa, la sintesi della vitamina D è facile, nonostante la presenza dei pigmenti protettivi. Diversamente, in Europa e in altre regioni lontane dai tropici, la luce solare è molto meno intensa e, quindi, il ruolo protettivo dei pigmenti risulta meno importante, dato che il danno derivante dalla luce è inferiore; tuttavia, i pigmenti continuano a interferire con la produzione della vitamina D. È quindi possibile che questa mutazione abbia aumentato la disponibilità della vitamina D per gli individui che vivono lontano dai tropici. In questo processo può avere avuto un ruolo anche la selezione sessuale. Quest’ultima si verifica quando un sesso, generalmente quello femminile, predilige nel partner un particolare aspetto. I partner che possiedono quel particolare aspetto avranno più figli e trasmetteranno loro i propri aplotipi. Un esempio classico di selezione sessuale è rappresentato dalla coda del pavone. I maschi traggono un solo vantaggio dalla coda, ovvero la preferenza accordata loro dalle femmine che privilegiano i maschi con code sgargianti; quindi, più grande è la coda, maggiore è il successo nell’accoppiamento. Analogamente, le donne europee potrebbero aver preferito gli uomini con gli occhi blu e la selezione sessuale avrebbe fatto il resto. Potrebbe essersi verificata una combinazione dei due tipi di selezione; in tutte le popolazioni le femmine avrebbero semplicemente scelto i maschi più sani. Questo evento avrebbe determinato la diffusione di individui con gli occhi blu lontano dai tropici, dove un colore più chiaro della pelle permette la produzione della vitamina D; invece nelle regioni tropicali, dove la sintesi della vitamina D è possibile anche se la pelle è più scura, il pigmento supplementare serviva come protezione nei confronti dei danni provocati dalla radiazione solare.

ni). Questo avviene in parte perché gli eucarioti tendono ad avere genomi più grandi, con più regioni non codificanti; quindi, una banca di cDNA, rispetto a una genomica, permette di isolare specificamente le regioni trascritte. Al contrario, la maggioranza dei genomi procarioti contiene solo poco DNA non genico e, pertanto, costruire una banca di cDNA sarebbe un lavoro supplementare di scarsa utilità. In questo caso è generalmente più facile, veloce e meno costoso sequenziare direttamente l’intero

182

Capitolo 8 Coda di poli(A)

mRNA



AAAAAA



Appaiamento del primer oligo(dT) 5¢

AAAAAA TTTTTT

Figura 8.15 La sintesi di DNA complementare a doppio filamento (cDNA) a partire da un mRNA poliadenilato, utilizzando la trascrittasi inversa, la RNasi H, la DNA polimerasi I e la DNA ligasi.

3¢ 5¢

Produzione di cDNA:mRNA mediante trascrittasi inversa e dNTP mRNA 5¢ DNA 3¢

AAAAAA TTTTTT

3¢ 5¢

Degradazione dell’mRNA con la RNasi H 5¢ 3¢

A A 3¢ TTTTTT



DNA polimerasi I 5¢ 3¢

AAAAAA TTTTTT

3¢ 5¢

I frammenti di RNA degradato vengono usati come primer per la sintesi di nuovo DNA

La DNA polimerasi I sintetizza in frammenti la nuova elica di DNA e rimuove i primer di RNA

DNA ligasi 5¢ 3¢

cDNA a doppia elica

5¢ 3¢

AAAAAA TTTTTT

AAAAAA TTTTTT

genoma e identificare i geni esaminando le sequenze ottenute. Le banche di cDNA possono essere costruite facilmente a partire dagli mRNA eucarioti perché, fortunatamente, questi ultimi rappresentano le sole molecole di RNA che hanno una coda di poli(A) (vedi Capitolo 5). Gli altri RNA eucarioti (rRNA, tRNA, snRNA) e tutti gli RNA procarioti ne sono privi. Gli mRNA poli(A)+, ossia le molecole con una coda di poli(A), possono quindi essere purificati da una miscela di RNA cellulari facendo passare le molecole di RNA attraverso una colonna alla quale siano state attaccate corte catene di acido desossitimidilico, chiamate catene oligo(dT). Quando le molecole di RNA passano attraverso tale colonna, le code di poli(A) delle molecole di mRNA formano coppie di basi complementari con le catene oligo(dT). Gli mRNA vengono così trattenuti nella colonna, mentre gli altri RNA possono passare. Gli mRNA vengono poi rilasciati e raccolti, per esempio diminuendo la forza ionica della soluzione tampone che passa attraverso la colonna, in modo da rompere i legami idrogeno. Questo metodo consente di arricchire di mRNA poli(A)+ la popolazione mista di RNA e, nello specifico, fino al 50% rispetto al 3% circa che si trova nella cellula. La Figura 8.15 mostra come può essere sintetizzata una molecola di cDNA dalle molecole di mRNA. Dopo che è stato isolato l’mRNA, la prima fase della sintesi del cDNA è l’appaiamento di un corto primer oligo(dT) alla coda di poli(A). Il primer viene allungato dalla tra-

3¢ 5¢

I frammenti di DNA vengono uniti dalla DNA ligasi

3¢ 5¢

scrittasi inversa per produrre una copia di DNA del filamento di mRNA. Il risultato è una molecola a doppia elica DNA-mRNA. Successivamente, viene sintetizzata la seconda elica di DNA utilizzando la RNasi H (un tipo di ribonucleasi), la DNA polimerasi I, e la DNA ligasi. La RNasi H degrada parzialmente il filamento di RNA della molecola ibrida DNA-mRNA, la DNA polimerasi I sintetizza nuovi frammenti di DNA usando come primer i frammenti di RNA parzialmente degradato sull’elica di DNA e, infine, la DNA ligasi unisce i nuovi frammenti di DNA per formare la catena completa. Si ottiene in tal modo una molecola di cDNA a doppia elica, che rappresenta una copia fedele dell’mRNA di partenza. Costruzione delle banche di cDNA Una volta sintetizzati i cDNA a doppia elica, come appena descritto, è necessario selezionare quelli completi, clonarli in un vettore e, successivamente, inserirli in una cellula ospite. Dal momento che la trascrittasi inversa spesso sintetizza cDNA parziali, che contengono solo l’estremità 3′ del gene, è necessario selezionare le molecole per eliminare quelle incomplete. Questa operazione si può effettuare selezionando le molecole in base alle dimensioni. I cDNA vengono separati mediante elettroforesi su gel, visualizzati, e la parte del gel che contiene i cDNA più grandi (per esempio, quelli con dimensione superiore a 1 kb) viene tagliata. I cDNA vengono poi recuperati estraendoli dal gel.

La genomica: la mappatura e il sequenziamento dei genomi cDNA a doppia elica

3¢ 5¢

5¢ 3¢

DNA ligasi del fago T4

+

5¢ G G A T C C 3¢ 3¢ C C T A G G 5¢ (linker BamHI)

5¢ G G A T C C 3¢ C C T A G G

G G A T C C 3¢ C C T A G G 5¢ Taglio dei linker con BamHI G 3¢ C C T A G 5¢

5¢ G A T C C 3¢ G Inserimento nel vettore tagliato con BamHI

183

mentre i siti interni saranno protetti, lasciando intatto il cDNA e aggiungendo estremità coesive a entrambi i lati della molecola. Un altro sistema per aggirare questo potenziale problema consiste nell’impiego di un adattatore, invece di un linker. Un adattatore possiede già una estremità coesiva adatta al clonaggio e, quindi, non è necessario digerire il cDNA con un enzima di restrizione. L’adattatore non può utilizzare l’estremità coesiva per legarsi al cDNA, poiché quest’ultimo ha le estremità piatte. Si consideri, per esempio, il seguente adattatore, formato dall’appaiamento della sequenza 5′-GATCCAGAC-3′ con la sequenza 5′-GTCTG-3′, 5′-GATCCAGAC-3′ GTCTG-5′

GG A T C C CCTAG G

ATCC GG A C C T GG Vettore

Figura 8.16 L’uso dei linker per il clonaggio del cDNA.

I cDNA sono molto più piccoli del DNA genomico; nella maggior parte dei casi tali molecole hanno dimensioni comprese, in media, fra 1 e 5 kb. Questi frammenti, date le dimensioni limitate, possono essere clonati integri, senza essere prima tagliati con enzimi di restrizione. La Figura 8.16 illustra il clonaggio dei cDNA usando un linker con sito di restrizione (o semplicemente linker), un corto frammento di DNA a doppia elica (oligodesossiribonucleotide) di circa 8-12 bp, che contiene un sito per un enzima di restrizione, in questo caso per BamHI. Sia le molecole di cDNA sia i linker hanno estremità piatte e possono essere uniti usando concentrazioni elevate di DNA ligasi del fago T4. Tagliando le molecole di cDNA così ottenute (con i linker a entrambe le estremità) grazie all’azione di BamHI, sarà possibile ottenere le estremità coesive e inserire il DNA in un vettore di clonaggio, tagliato anch’esso con BamHI. Le molecole ricombinanti verranno poi utilizzate per trasformare cellule ospiti di E. coli. Un problema legato all’uso dei linker per il clonaggio dei cDNA è rappresentato dall’eventuale presenza nel cDNA di un sito di restrizione per l’enzima usato per tagliare i linker. In questo caso, verrebbe tagliato anche il cDNA e verrebbe clonato in diversi frammenti. Questo problema può essere evitato usando, durante la sintesi del cDNA, uno o più nucleotidi metilati al posto di quelli normali. Alcuni enzimi di restrizione non sono capaci di tagliare i siti che contengono basi metilate. Il linker, che non è metilato, potrà quindi essere tagliato,

Quando l’adattatore viene ligato a un cDNA, la sua estremità piatta formerà un legame covalente con l’estremità piatta del cDNA, lasciando un’estremità sporgente 5′-GATC a entrambe le estremità del cDNA. È lecito chiedersi come mai non si abbia la ligazione fra due adattatori, attraverso le loro estremità coesive. Durante la sintesi, viene modificata l’estremità 5′ del filamento più lungo, alla quale non viene aggiunto il gruppo fosfato. Ciò impedisce la ligazione fra questa estremità e una estremità 3′, esattamente come avviene quando si usa la fosfatasi per impedire alcuni tipi di ligazione. L’estremità sporgente si appaierà con un vettore digerito con BamHI (Figura 8.16), che ha i gruppi fosfato alle estremità 5′, e sarà possibile clonare il cDNA intero. Come mai le molecole di cDNA non vengono clonate direttamente nel vettore attraverso le estremità piatte? Dal momento che le molecole di cDNA hanno le estremità piatte, potrebbero infatti essere inserite in un vettore tagliato con un enzima di restrizione, come SmaI (Tabella 8.1), che produce estremità piatte. Questa strategia potrebbe sembrare più semplice, ma in realtà i linker e gli adattatori non sono costosi e sono facili da usare nelle condizioni che favoriscono la ligazione di estremità piatte, mentre i vettori tagliati in modo opportuno sono costosi ed è molto più difficile impiegarli in condizioni che favoriscano la ligazione di estremità piatte. Indipendentemente da come è stata effettuata la ligazione, i cloni della banca di cDNA rappresentano gli mRNA maturi che si trovano nella cellula. I cloni di cDNA possono essere utilizzati per isolare il gene che codifica per un determinato mRNA. Il corrispondente clone genico può fornire più informazioni del clone di cDNA, per esempio per quanto riguarda la presenza e l’organizzazione degli introni e relativamente alle sequenze regolatrici che controllano l’espressione del gene. È però più facile prevedere quale proteina sia codificata a partire dal cDNA, poiché gli introni sono assenti.

184

Capitolo 8

Utilizzo di una banca di cDNA per l’annotazione dei geni Ovviamente, i cloni di una banca di cDNA possono essere sequenziati per identificare i geni espressi nel genoma. Una sola banca di cDNA non sarà però sufficiente a identificare tutti i geni del genoma, dato che il tessuto di partenza (dal quale è stato isolato l’mRNA) trascriverà solo un sottogruppo di geni. La maggior parte di questi cloni non è completa, dato che la conversione dell’estremità 5′ dell’mRNA in cDNA tende a essere molto difficile; tuttavia, essi permettono comunque di individuare le regioni del cromosoma che vengono trascritte. Inoltre, poiché queste banche non contengono né gli introni né le sequenze non trascritte, questo è il modo più affidabile per definire con precisione i confini degli esoni. Per identificare le regioni che vengono trascritte, le sequenze derivate da questi cDNA possono essere confrontate con le sequenze genomiche. Anche se il cDNA non è completo, la regione può essere annotata come contenente un gene e tale informazione può essere elaborata mediante algoritmi computazionali per predire il resto della regione codificante.

Nota chiave I DNA complementari, o cDNA, possono essere ottenuti dalla popolazione di mRNA purificati da una cellula. In primo luogo, vengono utilizzati un primer e l’enzima trascrittasi inversa per sintetizzare una copia di DNA a singola elica dell’mRNA; successivamente, viene ottenuta una copia di DNA a doppia elica, chiamato cDNA, mediante la RNasi H, la DNA polimerasi I e la DNA ligasi. Questo cDNA può essere inserito in vettori di clonaggio e clonato. I cDNA possono essere sequenziati e poi confrontati con il genoma sequenziato dell’organismo, al fine di annotare le sequenze geniche presenti nel genoma.

Identificazione dei geni nelle sequenze genomiche con metodi computazionali Dal punto di vista metodologico, l’annotazione prevede l’uso di algoritmi computazionali al fine di cercare geni su entrambe le eliche del DNA. I geni putativi che codificano per proteine vengono identificati cercando le fasi di lettura aperte (ORF, Open Reading Frames), cioè codoni d’inizio (AUG) in fase (separati da multipli di tre nucleotidi) con un codone di stop (UAG, UAA o UGA). La ricerca delle ORF viene effettuata, in particolare, nelle regioni che hanno più coppie di basi G-C e C-G rispetto al resto del genoma, dato che le regioni non codificanti tendono a essere ricche di AT. Per i genomi procarioti, che non contengono introni, il processo di ricerca è semplice. La presenza degli introni in molti geni eucarioti che codificano per proteine rende invece necessario l’impiego di algoritmi

più sofisticati, che includano fra i criteri di analisi di una ORF anche le giunzioni fra esoni e introni, e di algoritmi in grado di individuare esoni che siano parte esclusivamente della regione codificante di un gene. Per esempio, un gene potrebbe avere tre esoni e due introni, e codificare per un polipeptide contenente 102 amminoacidi. Si ipotizzi che il primo esone contenga la regione non tradotta in 5′, il codone d’inizio e 15 codoni, che il secondo esone contenga i codoni dal 16 al 95 (e nessuna regione non tradotta), e che il terzo esone contenga i codoni dal 96 al 102, il codone di stop e la regione non tradotta in 3′. Un algoritmo semplice non riuscirebbe a individuare questo gene nella sequenza genomica, poiché la ORF dopo il codone d’inizio è piuttosto corta e l’algoritmo verrebbe ingannato da qualunque codone di stop presente nell’introne che si trova dopo il primo esone. Anche il secondo introne, probabilmente privo di un codone d’inizio (AUG) in fase con un codone di stop, verrebbe ignorato da un algoritmo semplice. Tuttavia, se all’algoritmo viene richiesto di ricercare lunghe serie di nucleotidi senza un codone di stop in fase, è probabile che esso trovi questo secondo esone; in tal modo, quella regione può essere esaminata con cura per individuare le giunzioni esone-introne e altri possibili esoni. Mediante un’analisi al computer di questo tipo si possono trovare ORF di tutte le dimensioni; pertanto, è necessario stabilire in modo arbitrario una dimensione di riferimento, al di sotto della quale è improbabile che la ORF codifichi in vivo per una proteina, evitando ulteriori analisi. Per il genoma di lievito, per esempio, il valore limite è stato fissato a 100 codoni. Alcuni geni possono però trovarsi al di sotto di questo limite e, d’altra parte, non è detto che tutte le ORF con più di 100 codoni codifichino per proteine. Per esempio, il gene per il proteolipide della membrana plasmatica PMP1 (Plasma Membrane Proteolipid 1) codifica una proteina di soli 40 amminoacidi. È stato calcolato che il 6-7% delle 6607 ORF nel genoma di lievito non corrisponda a geni veri, che sarebbero invece circa 5700. Per analizzare ulteriormente questi geni candidati, si può effettuare il confronto con altre ORF. Se un altro organismo ha una ORF che codifica una proteina putativa simile, o se la ORF codifica una proteina putativa simile a proteine note presenti nelle banche dati, sarà più probabile che la ORF in questione sia parte di un gene vero, piuttosto che una sequenza che somiglia per caso a un gene. L’analisi del genoma umano aveva identificato inizialmente più di 1000 geni che non mostravano omologia con geni presenti in altri genomi. La ripetizione dell’analisi aveva suggerito che la maggioranza di questi geni (circa 1000) fosse costituita da ORF che probabilmente non corrispondevano a nessun gene. Questa incertezza rende difficile determinare il numero esatto dei geni nel genoma. Il problema dell’identificazione è reso ancora più complesso dalla presenza dei geni che codificano per microRNA e altre

La genomica: la mappatura e il sequenziamento dei genomi

piccole molecole di RNA non tradotte. Questi piccoli RNA sono regolatori fondamentali della trascrizione e della stabilità dell’RNA in molti eucarioti (vedi Capitolo 18). Nel genoma umano sono state identificate centinaia di geni per piccoli RNA, e il loro numero potrebbe essere molto più elevato. I geni che codificano per questi RNA non possono essere identificati mediante la ricerca delle ORF, perché non codificano per proteine (quindi, non presentano ORF). Inoltre, in senso generale, non sarà possibile trovare cDNA corrispondenti a nessuno di questi RNA nelle banche di cDNA, perché non hanno le code di poli(A) e considerato che per il clonaggio vengono selezionati cDNA di dimensioni maggiori. Anche in questo modo, quindi, è difficile identificare questi geni. È chiaro che le stime attuali del numero dei geni verranno riviste, via via che i geni che codificano per questi piccoli RNA e per piccole proteine verranno inclusi nell’annotazione del genoma, e verranno eliminate le ORF che non corrispondono a geni.

Nota chiave L’analisi al computer del DNA genomico permette l’identificazione di possibili geni. Questi programmi al computer cercano le fasi di lettura aperte (ORF) o altri segnali della presenza di geni, come le giunzioni esone-introne. Sono abbastanza accurati con i genomi procarioti, ma non altrettanto con quelli degli eucarioti, i cui genomi tendono a essere più complessi e dove la presenza di introni confonde le analisi di tipo più semplice. Come conseguenza, si ottengono falsi positivi (una regione identificata come genica, ma che probabilmente non funziona come un gene) e falsi negativi (geni veri che il programma non riesce a individuare).

Conoscenze dall’analisi dei genomi: dimensioni dei genomi e densità dei geni Nel Capitolo 2 è stato discusso il paradosso del valore C, che deriva dalla mancanza di una relazione diretta fra il valore C, ossia la quantità di DNA nel genoma aploide, e la complessità di struttura e di organizzazione dell’organismo. Tale principio rappresenta un vecchio concetto basato sulla misurazione della quantità di DNA nei nuclei delle cellule aploidi. La disponibilità delle sequenze di un certo numero di genomi rende possibile confrontare l’organizzazione dei genomi in organismi diversi, in particolare per quanto riguarda l’organizzazione dei geni e delle regioni intergeniche. È stato così possibile evidenziare alcune differenze che sono alla base del paradosso del valore C, fra cui la densità dei geni (ovvero il

185

numero di geni per una data lunghezza di DNA). Nella Tabella 8.3 sono riportati le dimensioni del genoma, il numero stimato di geni e le densità geniche per alcuni Eubacteria (eubatteri), Archaea (archeobatteri) ed Eukarya (eucarioti). In questo paragrafo è inoltre presentata una panoramica dell’organizzazione dei genomi in ciascuno di questi domini.

I genomi degli eubatteri Gli eubatteri hanno genomi di dimensioni molto variabili. Fra i genomi batterici completamente sequenziati, il più piccolo è quello di Carsonella ruddii, un batterio simbionte che vive nell’intestino di alcuni insetti e le cui dimensioni sono di sole 160 000 bp (0,16 Mb), con meno di 200 geni. Si tratta del genoma cellulare più piccolo finora conosciuto. Il genoma batterico più grande è invece quello di Sorangium cellulosum, con una dimensione di 13 Mb (Tabella 8.3), più di 80 volte quello di Carsonella. I genomi batterici hanno densità geniche simili, con un gene ogni 1-2 kb. Per esempio, nel genoma di 0,58 Mb di Mycoplasma genitalium ci sono 523 geni, con una densità di un gene ogni 1,15 kb, e il genoma di 4,6 Mb di E. coli contiene 4397 geni, cioè un gene ogni 1,05 kb. La combinazione di una densità genica elevata e di un numero relativamente basso di geni necessari per la sopravvivenza in laboratorio è alla base di una nuova, affascinante sfida a oggi in parte già realizzata: la possibilità di creare cellule “su misura” in laboratorio, sintetizzando un nuovo genoma. Carsonella ruddii ha 182 geni in 160 000 bp, con una densità di un gene ogni 880 bp. Nei batteri c’è una relazione lineare fra il numero dei geni e le dimensioni del genoma, per cui i batteri con genomi più grandi tendono ad avere più geni, mentre quelli con genomi più piccoli tendono a possederne un numero inferiore. Il genoma di Carsonella ruddii ha obbligato gli scienziati a riconsiderare il numero minimo di geni necessari per la vita, che in precedenza era stato valutato in circa 400. Sembra che questo batterio sia privo di geni considerati necessari per la vita; quindi, è possibile che allo stato attuale questo organismo stia diventando un organulo. Gli spazi fra i geni sono relativamente piccoli (110125 bp per Mycoplasma genitalium); pertanto, i geni sono molto impaccati nel genoma. Negli eubatteri e negli archeobatteri, infatti, circa l’85-90% del genoma consiste di DNA codificante. Il genoma di Carsonella è codificante al 97%, un valore quasi impossibile tenendo conto delle dimensioni dei promotori e dei terminatori. I genomi batterici tendono ad avere molto poco DNA ripetuto e, in generale, nei procarioti gli introni sono quasi completamente assenti. Sia il DNA ripetuto sia gli introni contribuiscono alla quantità di DNA non codificante e, di conseguenza, è chiaro che la densità genica sarà più alta se il contenuto di DNA non codificante è ridotto al minimo.

186

Capitolo 8

Tabella 8.3 Dimensioni del genoma, numero stimato dei geni e densità geniche per alcuni eubatteri, archeobatteri ed eucarioti Dimensioni del genoma (Mb)

Numero di geni che codificano per proteine

Densità genica (kb per gene)

Eubatteri Carsonella ruddii Nanoarcheum equitans Mycoplasma genitalium Escherichia coli K12 Agrobacterium tumefaciens Bradyrhizobium japonicum Sorangium cellulosum

0,16 0,49 0,58 4,6 5,7 9,1 13

182 552 523 4200 5482 8322 9367

0,87 0,88 1,11 1,03 1,04 1,1 1,39

Archeobatteri Thermoplasma acidophilum Methanosarcina acetivorans

1,56 5,75

1509 4662

1,03 1,23

Organismo

Eucarioti Funghi Saccharomyces cerevisiae (lievito) Neurospora crassa (muffa del pane) Protozoi Tetrahymena thermophila Invertebrati Caenorhabditis elegans (nematode) Drosophila melanogaster (moscerino della frutta) Vertebrati Takifugu rubripes (pesce palla) Mus musculus (topo) Rattus norvegicus (ratto) Homo sapiens (uomo) Piante Arabidopsis thaliana Oryza sativa (riso)

12

~6000

40

~10 100

220

>20 000

11

100

20 443

5

180

14 015

13

393 2700 2750 2900

>31 000 ~22 000 ~30 200 ~20 067

13 90 91 107

125 430

25 900 ~56 000

I genomi degli archeobatteri Gli archeobatteri sono un gruppo di procarioti che mostra somiglianze significative sia con gli eubatteri sia con gli eucarioti. Secondo i modelli attuali, infatti, gli eucarioti sarebbero più vicini agli archeobatteri che agli eubatteri. Molti archeobatteri sono estremofili, ossia prosperano in ambienti estremi, caratterizzati per esempio da temperatura o pressione molto elevate, pH estremo, alta concentrazione di ioni metallici e salinità elevata. Dal punto di vista morfologico, gli archeobatteri somigliano agli eubatteri, con forme a sfera, a bastoncino e a spirale. Studi fisiologici e molecolari hanno tuttavia dimostrato che, sotto molti aspetti, essi sono simili agli eucarioti. Per esempio, i geni per la replicazione del DNA, la trascrizione dell’RNA e l’apparato della sintesi proteica sono più simili a quelli degli eucarioti che a quelli degli eubatteri. Nei geni che codificano per proteine non ci sono introni al contrario dei geni eucarioti, bensì si ritrovano nei geni per i tRNA, come negli eucarioti.

2 3,8

4,9 9,6

Considerati nel loro complesso, i genomi degli archeobatteri mostrano un’ampia gamma di dimensioni, da 0,49 Mb in Nanoarchaeum equitans fino a 5,75 Mb in Methanosarcina acetivorans (Tabella 8.3). I geni sono densamente impaccati nel genoma, come negli eubatteri; nei due esempi appena riportati la densità genica è rispettivamente di un gene ogni 880 bp e ogni 1,23 kb. Genomi più grandi tendono a riflettere un aumento del numero dei geni, piuttosto che alterazioni significative della densità genica, come osservato in precedenza per gli eubatteri.

I genomi degli eucarioti Gli eucarioti variano enormemente per forma e complessità, da organismi unicellulari come il lievito a organismi multicellulari come l’uomo. C’è una debole tendenza all’aumento della quantità di DNA genomico parallelamente all’incremento della complessità, anche se, come spiegato in precedenza, non esiste nessuna relazione diretta. Per esempio, i due insetti Drosophila

La genomica: la mappatura e il sequenziamento dei genomi

melanogaster (il moscerino della frutta) e Locusta migratoria (la locusta) hanno una complessità simile, ma la locusta ha un genoma di 5000 Mb, 50 volte più grande di quello del moscerino della frutta e due volte più grande di quello del topo (Tabella 8.3). Negli eucarioti si osservano anche notevoli differenze nella densità genica. Riprendendo l’esempio precedente, nel genoma del moscerino della frutta c’è un gene ogni 13 kb e, assumendo che il numero di geni nel genoma della locusta sia simile (attualmente non è noto), ci sarebbe un gene ogni 365 kb, ossia una differenza sostanziale nella densità genica. In altri gruppi si è osservata una variazione simile, con una variabilità nelle dimensioni del genoma di 50 volte o più nel genere Allium, al quale appartengono le cipolle e le specie affini. Alcuni genomi, come quelli di certi anfibi e di alcune felci, sono circa 200 volte più grandi del genoma umano o di quello del topo. In confronto, altri eucarioti, come il lievito, hanno genomi minuscoli: le dimensioni del genoma del lievito sono pari a solo lo 0,4% (1/250) di quelle del genoma umano. Per i genomi che sono stati annotati, la variazione nel numero dei geni non può spiegare la variazione nelle dimensioni del genoma e si deve nuovamente assumere che queste differenze siano dovute a variazioni nella densità genica. Sembra che la variabilità nella densità genica sia a sua volta determinata da differenze nella quantità di DNA ripetuto nel genoma. In generale, negli eucarioti la densità genica è inferiore rispetto agli eubatteri e agli archeobatteri e mostra una variabilità più elevata (Tabella 8.3). Gli eucarioti mostrano un’ampia gamma di densità geniche, anche se si può riconoscere una tendenza generale secondo la quale la densità genica diminuisce all’aumentare della complessità. La Figura 8.17 mostra le differenze di densità genica nel lievito, nel moscerino della frutta e nell’uomo in confronto a E. coli. Il lievito ha la densità genica più vicina a quella dei procarioti, un gene ogni 2 kb contro un gene ogni 1,03 kb in E. coli. In confronto al lievito, il moscerino della frutta ha una densità genica

187

inferiore di 7 volte, e l’uomo di 56 volte. Si ritiene che organismi con genomi più grandi di quello umano abbiano densità geniche inferiori a quella dell’uomo. È chiaro che i valori di densità genica riportati sono valori medi. In ciascun organismo ci saranno tratti di cromosomi con un numero di geni significativamente superiore alla media – regioni ricche di geni – e tratti con un numero di geni significativamente inferiore alla media – deserti genici. Sembra che i deserti genici siano presenti negli eucarioti, ma poco comuni nei procarioti. Nell’uomo, per esempio, la regione del genoma più ricca di geni ha circa 25 geni per megabase e sono comuni i deserti genici (regioni nelle quali non è stato identificato nessun gene) di dimensione superiore a 1 Mb. Definendo come deserto genico una regione di 1 Mb o più senza geni, nel genoma umano se ne contano circa 80. Ciò significa che più del 25% del genoma umano corrisponde a un deserto genico. In breve, nell’uomo e negli altri organismi complessi una parte minore del genoma è dedicata agli esoni, e il resto è costituito da introni e regioni intergeniche. Almeno nell’uomo, la maggior parte delle sequenze intergeniche consiste di DNA ripetuto (Capitolo 2). Con un genoma nel quale i geni sono così sparsi, è difficile, e a volte addirittura impossibile, trovare i geni di interesse. Un altro vertebrato con una densità genica elevata potrebbe aiutare a risolvere questo probema. Si tratta di Takifugu rubripes, il pesce palla il cui genoma è stato sequenziato recentemente. (Takifugu è un pesce con livrea maculata che, quando viene minacciato, si gonfia come una palla. Questo pesce è considerato una prelibatezza, in particolare in Giappone. Ha un sapore piccante, ma rappresenta un rischio; se non viene preparato nel modo giusto, può causare la paralisi e la morte.) Come si vede nella Tabella 8.3, Takifugu ha un genoma di 393 Mb, circa 8 volte più piccolo di quello umano, ma il numero stimato di geni è superiore a quello dell’uomo. In altre parole, la densità genica in Takifugu è superiore di almeno 8 volte a quella dell’uomo. Questa densità deri-

Figura 8.17 Differenze nella densità genica in regioni dei cromosomi di E. coli, del lievito Saccharomyces cerevisiae, del moscerino della frutta e dell’uomo. Geni

Introni

Sequenze ripetute

Gene della RNA polimerasi

Sequenze intergeniche

Escherichia coli (57 geni)

Saccharomyces cerevisiae (31 geni)

Drosophila melanogaster (9 geni)

Uomo (2 geni)

0

10 000

20 000

30 000 Numero di coppie di basi

40 000

50 000

60 000

188

Capitolo 8

va, in parte, dalla presenza nei geni di introni in numero minore e più piccoli; quindi, i geni omologhi nell’uomo tendono a occupare più spazio sul cromosoma. Inoltre, la densità genica è molto elevata perché c’è molto poco DNA ripetuto e, quindi, è presente poco DNA intergenico. L’elevata densità genica rende il DNA di Takifugu molto più facile da studiare del DNA umano. Fortunatamente, inoltre, molti dei geni di Takifugu sono omologhi a geni umani. Quindi, una volta identificati i geni in Takifugu, potranno essere identificati e studiati i geni omologhi dell’uomo. Gli scienziati sperano che la decodifica delle funzioni dei geni del pesce palla aiuterà a capire la funzione dei geni umani.

Nota chiave Le sequenze dei genomi forniscono informazioni sul numero e l’organizzazione dei geni in organismi differenti. Vi è una tendenza all’aumento della quantità di DNA nel genoma con l’aumentare della complessità dell’organismo, anche se la relazione non è perfetta. Negli eubatteri e negli archeobatteri la maggior parte del genoma è costituita da geni, cioè la densità genica è molto elevata. Negli eucarioti c’è un’ampia variabilità nelle densità geniche, che tendono a diminuire con l’aumentare della complessità.

Alcuni esempi di genomi sequenziati Di seguito vengono descritti alcuni dei genomi che sono stati sequenziati e verrà spiegato il motivo della scelta di tali organismi e il contributo dato da questi ultimi all’aumento della conoscenza in ambito genetico. I genomi vengono sequenziati con velocità sempre maggiore; centinaia di sequenze genomiche si sono rese disponibili all’inizio del 2008. Per avere informazioni sul sequenziamento di un particolare organismo, è possibile visitare i siti Internet del Genome News Network (http://genomenewsnetwork.net), del Genome Online Database (GOLD, http://genomesonline.org), del National Center for Biotechnology Information (http://ncbi.nlm.nih. gov/Genomes/index.html), e dell’Institute for Genomic Research (http://www.tigr.org/db.shtml).

Genomi batterici Haemophilus influenzae Il primo organismo cellulare il cui genoma è stato sequenziato è stato l’eubatterio H. influenzae. Questo organismo è stato scelto perché le dimensioni del suo genoma sono tipiche dei batteri e il suo contenuto in GC è simile a quello del genoma umano. Il sequenziamento è stato completato nel 1995 dall’Institute for Genomic Research. L’uomo è l’unico ospite na-

turale di H. influenzae che, in alcuni casi, può causare infezioni all’orecchio e all’apparato respiratorio. Il genoma di 1,83 Mb (1 830 137 bp) di questo batterio è stato il primo a essere sequenziato con l’approccio del sequenziamento casuale diretto. La Figura 8.18 mostra il genoma annotato di H. influenzae. Attualmente, grazie agli algoritmi computazionali e alla quantità di informazioni disponibili nelle banche dati di sequenze, è possibile annotare un genoma microbico completo per tutte le regioni codificanti e gli altri elementi, come le sequenze ripetute, gli operoni e gli elementi trasponibili. Per H. influenzae, l’analisi del genoma ha previsto 1737 geni che codificano per un prodotto proteico, corrispondenti all’87% del genoma. Di questi geni, 469 non hanno alcuna corrispondenza con proteine presenti nelle banche dati, oppure hanno corrispondenza con proteine definite come ipotetiche. Le rimanenti 1268 ORF corrispondono a geni nelle banche dati con funzione nota. Questo tipo di risultato è caratteristico dei progetti genoma: a molti geni sarà possibile attribuire una funzione, mentre per una parte significativa la funzione rimarrà sconosciuta, e per determinarla saranno necessari studi successivi. Escherichia coli E. coli (Figura 1.1) è un organismo estremamente importante. Si trova nell’intestino degli animali, uomo compreso, e sopravvive bene quando viene introdotto nell’ambiente. In laboratorio, i ceppi non patogeni di E. coli costituiscono un sistema modello molto importante per la biologia molecolare, la genetica e le biotecnologie. Nel 1997 i ricercatori dell’E. coli Genome Center all’Università del Wisconsin-Madison resero nota la sequenza genomica identificata del ceppo di laboratorio E. coli K12. Si trattava della prima sequenza genomica di un organismo cellulare sottoposta a un’analisi genetica molto estesa. Nello stesso periodo, una sequenza non identificata del genoma di E. coli, costituita da frammenti di più ceppi, venne riferita dal giapponese Takashi Horiuchi. In seguito, sono stati sequenziati numerosi altri ceppi di E. coli. Uno dei ceppi sequenziati da Horiuchi era l’O157:H7, responsabile di circa 70 000 casi di intossicazione alimentare e circa 60 morti all’anno negli Stati Uniti. Il genoma circolare del ceppo K12 è stato sequenziato con l’approccio del sequenziamento casuale diretto. È un genoma di 4,64 Mb (4 639 221 bp) che contiene 4288 ORF (87,8% del genoma). Al 38% delle ORF non è stato possibile attribuire una funzione.

Genomi di archeobatteri Il primo genoma di un archeobatterio sequenziato completamente è stato quello di Methanococcus jannaschii.

La genomica: la mappatura e il sequenziamento dei genomi SmaI 1 SmaI 1 800 000 SmaI

189

NotI 100 000 RsrII SmaI

1 700 000

200 000 SmaI SmaI SmaI

1 600 000 SmaI SmaI RsrII

300 000 RsrII

1 500 000

400 000 1 400 000 SmaI

500 000 1 300 000

SmaI

600 000 SmaI

1 200 000

SmaI SmaI 700 000

1 100 000 SmaI SmaI 800 000

SmaI 1 000 000 RsrII 900 000

Figura 8.18 Il genoma identificato di H. influenzae. La figura mostra la posizione di tutte le ORF previste sulla base dell’omologia con sequenze presenti nelle banche dati, e alcune caratteristiche generali del genoma. Cerchio esterno: siti di restrizione principali. Cerchio concentrico più esterno: regioni codificanti con geni identificati. La posizione di ciascuna regione codificante è indicata con un colore diverso, in base alla sua funzione. Secondo cerchio concentrico: regioni con un contenuto elevato di GC, indicate in rosso (>42%) e blu (40%); regioni

M. jannaschii è un metanogeno ipertermofilo che cresce a una temperatura ottimale di 85 °C e a una pressione fino a 200 atmosfere. È un anaerobio obbligato e ricava l’energia dalla riduzione dell’anidride carbonica a metano. Il sequenziamento è stato effettuato con l’approccio del sequenziamento casuale diretto. La sequenza è stata pubblicata nel 1996. Il genoma è costituito da un cromosoma circolare principale di 1 664 976 bp; ci sono inoltre due plasmidi circolari, uno di 58 407 bp e uno più piccolo di 16 550 bp. Il cromosoma principale ha 1682 ORF, il plasmide più grande 44 e quello più piccolo 12. La maggior parte dei geni coinvolti nella produzione di energia, nella divisione cellulare e nel metabolismo è simile ai geni corrispondenti degli eubatteri, mentre molti geni coinvolti nella replicazione del DNA, nella trascrizione e nella traduzione sono simili ai geni che svolgono le stesse funzioni negli eucarioti. È chiaro che questo organismo non è né un eubatterio né un eucariote. La sequenza del suo genoma ha dimostrato chiaramente l’esistenza di un terzo ramo principale della vita sulla Terra.

con un contenuto elevato di AT, indicate in nero (>66%) e verde (>64%). Terzo cerchio concentrico: posizioni dei sei raggruppamenti (cluster) di geni per gli RNA ribosomali (in verde), dei tRNA (in nero) e dei profagi criptici simili a mu (in blu). Quarto cerchio concentrico: ripetizioni semplici in tandem. L’origine di replicazione è indicata dalle due frecce che presentano una direzione opposta (in verde) vicino alla base 603 000. Due possibili sequenze di termine della replicazione sono indicate vicino al punto mediano opposto del cerchio (in rosso).

Genomi di eucarioti Il lievito Saccharomyces cerevisiae Per decenni, il lievito Saccharomyces cerevisiae (Figura 8.19) è stato il modello eucariote per molti tipi di ricerca. Le ragioni dell’utilità di tale organismo consistono nella possibilità di coltivarlo su mezzi di coltura semplici, di impiegarlo agevolmente per l’analisi genetica e di utilizzarlo anche nell’ambito delle tecniche molecolari più sofisticate. Inoltre, dal punto di vista funzionale è simile per molti aspetti ai mammiferi. Era quindi logico che il suo genoma diventasse un obiettivo per i primi progetti di sequenziamento. Infatti, il genoma di S. cerevisiae è stato il primo genoma eucariote sequenziato completamente, nel 1996. Il genoma, costituito da 16 cromosomi, ha una dimensione di 12 067 280 bp. È stato stimato che nella sequenza pubblicata non fossero comprese circa 969 000 bp di sequenze ripetute. Nella sequenza sono state identificate 6607 ORF; solo 233 di queste ultime presentano introni. Secondo le stime migliori, circa 5700 di queste

190

Capitolo 8

Figura 8.19 Fotografia al microscopio elettronico a scansione del lievito Saccharomyces cerevisiae.

ORF codificherebbero realmente per prodotti proteici, mentre le rimanenti non sarebbero veri geni. All’inizio del progetto di sequenziamento genomico del lievito erano stati definiti attraverso l’analisi genetica solo circa 1000 geni. Circa un terzo dei geni che codificano per proteine non ha una funzione nota. Il nematode Caenorhabditis elegans Il genoma del nematode C. elegans (Figura 8.20) è stato il primo genoma di un eucariote multicellulare a essere sequenziato. I nematodi sono vermi lisci non segmentati, con un lungo corpo cilindrico. C. elegans è lungo circa 1 mm; vive nel terreno, dove si nutre di microbi. Esistono due sessi: gli individui ermafroditi XX, che possono autofecondarsi, e i maschi XO. I primi hanno 959 cellule somatiche, mentre i maschi 1031. Il lignaggio di ogni cellula adulta nel corso dello sviluppo è ben conosciuto. Il nematode ha un sistema nervoso semplice, mostra comportamenti semplici e anche una minima capacità di apprendimento. Il primo genetista che ha studiato C. elegans è stato Sydney Brenner* e da allora questo nematode è diventato un organismo modello importante per lo studio degli aspetti genetici e molecolari dell’embriogenesi, della morfogenesi, dello sviluppo, della funzione e dello sviluppo del sistema nervoso, dell’invecchiamento e del comportamento. Il progetto di sequenziamento genomico di C. elegans è stato portato avanti dai laboratori dell’Università di Washington a St. Louis e dal Sanger Center in Inghilterra. Le dimensioni del genoma sono 100,3 Mb, con 20 443 geni, 1270 dei quali non codificano per proteine. Questi dati sono stati il punto di partenza per numerosi progetti importanti, fra cui un progetto knock-out su tutto il genoma, il cui fine è la produzione di mutazioni in * Nel 2002 Sydney Brenner ha condiviso con H. Robert Horvitz e John E. Sulston il Premio Nobel per la Fisiologia o Medicina “per le loro scoperte sulla regolazione genetica dello sviluppo degli organi e della morte cellulare programmata”, effettuate grazie all’impiego di C. elegans come sistema modello (N.d.T.).

Figura 8.20 Il nematode Caenorhabditis elegans.

ciascuno dei geni identificati. Questi progetti verranno discussi ulteriormente nel Capitolo 9. Il moscerino della frutta, Drosophila melanogaster La sequenza genomica di un organismo di particolare importanza nella storia della genetica, il moscerino della frutta D. melanogaster (Figura 1.4b), è stata pubblicata nel marzo del 2000. Il moscerino della frutta è stato oggetto di molte ricerche in genetica, e ha contribuito alla comprensione della genetica molecolare dello sviluppo. Questa sequenza genomica era quindi attesa con impazienza, come quella del lievito. Il genoma di questo organismo è stato sequenziato impiegando l’approccio del sequenziamento casuale diretto. La sequenza della porzione eucromatica del genoma di Drosophila è di 118,4 Mb. Altre 60 Mb circa del genoma sono costituite da DNA altamente ripetuto che non può essere clonato, circostanza che rende impossibile ottenerne la sequenza. Ci sono 14 015 geni, quantitativo inferiore rispetto al nematode C. elegans, con cui si riscontrano somiglianze dal punto di vista della diversità funzionale. È sorprendente che il numero di geni del moscerino della frutta sia appena il doppio di quello del lievito, considerando che il moscerino sembra un organismo molto più complesso. Si potrebbe quindi concludere che per una complessità elevata, come quella raggiunta da organismi quali il moscerino della frutta e l’uomo, non sia necessario un repertorio di prodotti genici altrettanto grande, oppure che attraverso lo splicing alternativo si possa ottenere una complessità maggiore senza aggiungere nuovi geni al genoma. Il valore del moscerino della frutta come sistema modello per lo studio della biologia e delle malattie dell’uomo è stato confermato dall’identificazione nel suo genoma di geni omologhi a più della metà dei geni attualmente noti per il loro ruolo nell’insorgenza di malattie umane, compreso il cancro. La pianta superiore Arabidopsis thaliana Il genoma di A. thaliana (Figura 1.4d) è stato il primo genoma di una pianta superiore a essere sequenziato. Arabidopsis è un organismo modello importante per lo studio degli

La genomica: la mappatura e il sequenziamento dei genomi

aspetti genetici e molecolari dello sviluppo nelle piante. Ha un genoma di 120 Mb, che contiene circa 25 900 geni. Questo numero di geni è quasi il doppio di quello del moscerino della frutta Drosophila melanogaster, ed è superiore alle stime minime del numero di geni del genoma umano. È interessante osservare che circa 100 geni di Arabidopsis sono simili a geni umani che causano malattie, come per esempio i geni per la suscettibilità al cancro della mammella e il gene della fibrosi cistica. Il prossimo passo sarà completare la sequenza ed esplorare in dettaglio la struttura e la funzione del genoma. A questo scopo è stata lanciata un’iniziativa chiamata Progetto Arabidopsis 2010, con una serie di obiettivi ambiziosi, fra i quali definire la funzione di ciascun gene, determinare dove e quando ogni gene viene espresso, mostrare il destino dei prodotti proteici nella pianta e definire tutte le interazioni proteina-proteina. Il riso, Oryza sativa La sequenza del genoma di 389 Mb del riso, una delle numerose piante coltivate per le quali è stato effettuato il sequenziamento genomico, è stata pubblicata nel 2005. Il genoma del riso è molto più piccolo di quello dell’uomo, circa un settimo, ma il numero di geni stimato, attualmente 56 000 (15 000 dei quali derivano da elementi trasponibili), suggerisce che il riso abbia il doppio dei geni rispetto all’uomo. Lo scopo è identificare i geni coinvolti nella resistenza alle malattie, agli insetti e agli erbicidi, e i geni che influenzano la resa e le qualità nutritive. L’uomo, Homo sapiens Come illustrato in precedenza, l’era della genomica ha avuto inizio con il progetto ambizioso di sequenziare i 3 miliardi di coppie di basi (3000 Mb) del genoma di Homo sapiens. Ma di chi è il DNA che è stato sequenziato? I ricercatori avevano raccolto campioni da un gran numero di donatori, ma ne hanno utilizzati solo alcuni per estrarre il DNA da sequenziare. La sequenza del genoma umano che è stata ottenuta è quindi una miscela di sequenze, che non corrisponde in maniera precisa al genoma di nessun individuo della popolazione umana. La bozza della sequenza genomica e la prima interpretazione delle sequenze assemblate sono state pubblicate nel 2001, vari anni prima di quanto previsto in base al programma iniziale. Nei due anni successivi la sequenza del genoma umano è stata terminata ed è stata annunciata pubblicamente nel 2003. Quanti geni ha un essere umano? Le stime attuali calcolano circa 20 067 geni che codificano per proteine, un valore molto inferiore ai 50 000-100 000 previsti prima dell’inizio del sequenziamento. Altri 4800 geni codificano per RNA non tradotti, inclusi rRNA, tRNA, snRNA e microRNA. È interessante notare che questo indica la presenza approssimativamente dello stesso numero di geni che codificano per prodotti proteici di C. elegans. Questo nu-

191

mero di geni così basso sta cambiando radicalmente il modo in cui gli scienziati guardano alla complessità e allo sviluppo degli organismi. Complessivamente, la sequenza del genoma umano si sta dimostrando una grande risorsa, che permette agli scienziati di capire la specie umana. Il data mining, ossia la ricerca di informazioni nelle sequenze genomiche, continuerà ancora per molti anni. Verrà rivolta certamente un’attenzione particolare ai geni che causano malattie, al fine di sviluppare terapie efficaci. Una volta sequenziato il genoma umano e compreso il tipo di sequenze in esso contenute, si è cercato di capire se l’organizzazione del genoma sia in qualche modo casuale, oppure se i geni e le altre sequenze presenti siano organizzati in un modo specifico. Analisi recenti suggeriscono che il genoma sia altamente organizzato, sia a livello cromosomico sia nel modo nel quale è disposto nel nucleo, almeno quando la cellula è in interfase. Quando consideriamo l’organizzazione dei geni e delle sequenze ripetute nel genoma umano, possiamo notare numerosi aspetti interessanti. Molti dei geni trascritti abbondantemente sono riuniti insieme in piccoli gruppi nei quali la densità genica tende a essere elevata e gli introni a essere piccoli. Anche i geni che sono trascritti meno frequentemente tendono a essere raggruppati insieme, ma in queste aree la densità genica è bassa e questi geni tendono ad avere introni più grandi. Inoltre, alcune sequenze ripetute chiamate SINE (vedi Capitolo 2), che comprendono la famiglia Alu (vedi Capitoli 2 e 7), sono più comuni nelle aree con geni trascritti frequentemente. Al contrario, le regioni che contengono geni trascritti con minore frequenza sono più ricche di sequenze chiamate LINE (vedi Capitolo 2). Nel nucleo interfasico, le regioni a bassa densità genica tendono a trovarsi vicino alla membrana nucleare, mentre quelle con densità genica elevata tendono a essere più centrali. Questi studi hanno mostrato che il genoma è più organizzato di quanto si credesse una volta, sia a livello di tipi di sequenze sia relativamente all’organizzazione all’interno del nucleo. Il topo, Mus musculus Un altro dei primi obiettivi dei ricercatori in genomica era il genoma del topo (Figura 1.4e), il mammifero non umano più studiato. Il genoma del topo, con i suoi 2,7 miliardi di coppie di basi (2700 Mb), è leggermente più piccolo di quello dell’uomo, ha più di 22 000 geni che codificano per proteine e quasi 3200 geni che codificano per i diversi tipi di RNA. La maggior parte dei geni del topo si trova anche nell’uomo, e viceversa. Questo risultato non è del tutto inatteso, dal momento che i topi vengono usati come modello per le malattie umane e sono soggetti alle stesse malattie che insorgono nell’uomo. Nei topi sono possibili innumerevoli manipolazioni genetiche che sarebbero irrealizzabili, o inaccettabili dal punto di vista etico, negli

192

Capitolo 8

esseri umani; pertanto, il topo serve da organismo modello per molte delle analisi dei geni identificati in questi processi. Il cane, Canis familiaris Il genoma del cane è un po’ più piccolo di quello umano, circa 2,5 miliardi di coppie di basi (2500 Mb); sembra che contenga meno DNA ripetuto. Gli scienziati che lavorano sul progetto di sequenziamento genomico del cane stimano l’esistenza di almeno 15 000 geni codificanti per proteine e 2500 geni codificanti per RNA. I cani sono stati scelti per una serie di motivi diversi. Come i topi, hanno in gran parte gli stessi geni presenti nella specie umana. Sono inoltre fra i pochi mammiferi ad avere subito un’analisi genetica approfondita in conseguenza della selezione artificiale e dell’inbreeding (inincrocio), realizzati per molte generazioni e attraverso cui hanno avuto origine le razze attualmente conosciute, dai bassotti ai pastori tedeschi. Queste razze sono diverse, dal punto di vista sia comportamentale sia della predisposizione genetica a certe malattie. Per esempio, alcune razze tendono a sviluppare la distrofia muscolare, mentre altre hanno un rischio elevato di manifestare la sindrome di Ehler-Danlos, una malattia che altera la resistenza e l’elasticità della pelle; un ulteriore esempio è rappresentato dai pinscher dobermann che sono soggetti a narcolessia, una grave malattia neurologica caratterizzata da attacchi di sonno improvvisi e incontrollabili. Molte razze di cani costituiscono modelli naturali per almeno 220 malattie umane. Il DNA di razze particolari può essere confrontato con la sequenza genomica, e le regioni che differiscono possono essere studiate al fine di verificare la possibilità di una correlazione con le malattie.

Prospettive future della genomica I progetti attuali dell’Istituto Nazionale per la Ricerca sul Genoma Umano (NHGRI, National Human Genome Research Institute) comprendono il sequenziamento, con alta copertura e qualità elevata, di almeno sette genomi di mammiferi (mucca, cane, scimpanzè, uomo, macaco, topo e ratto), tutti progetti che sono stati completati o quasi. È in corso il sequenziamento di più di 40 genomi di altri mammiferi, fra cui il tammar wallaby (un canguro), il gatto, il cavallo, due specie di pipistrelli, delfini, elefanti e conigli. Il NHGRI finanzia anche il sequenziamento di molte specie batteriche che “popolano” l’organismo umano e di numerosi batteri e funghi patogeni responsabili dell’insorgenza di malattie nell’uomo. Molti altri genomi saranno sequenziati anche da altre organizzazioni. Alcuni organismi sono stati scelti per la loro importanza economica, mentre altri per la loro posizione nell’albero evolutivo della specie umana. Dai dati disponibili possono essere comunque tratte alcune conclusioni: (1) le dimensioni del genoma della maggior

parte dei mammiferi non sono molto diverse da quelle del genoma umano; (2) per quei mammiferi le cui sequenze genomiche sono state completate e i geni sono stati identificati, anche il numero dei geni è simile. È importante sottolineare che sia il topo sia il ratto sono stati organismi modello per gli studi di fisiologia dei mammiferi e per quelli sulle malattie. Il topo, in particolare, è stato un modello per la genetica dei mammiferi grazie alla sua trattabilità genetica, che comprende la possibilità di creare mutazioni specifiche in qualsiasi gene mediante tecniche molecolari (per questo vengono utilizzate cellule di topo coltivate in laboratorio) e di usare successivamente queste cellule modificate per ottenere nuovi topi mutanti (vedi Capitolo 9). L’analisi della sequenza ha rivelato che circa il 99% dei geni del topo e del ratto, inclusi geni associati a malattie, ha una controparte diretta nell’uomo. Gli studi dei genomi del topo e del ratto forniranno quindi informazioni di grande valore per quanto riguarda le malattie umane e altre aree della biologia dell’uomo. Anche molti degli altri organismi potranno fornire informazioni importanti sulle malattie dell’uomo e degli animali, sulle funzioni dei geni e sull’evoluzione. Per esempio, è in corso di sequenziamento il genoma dell’armadillo dalle nove fasce (Dasypus novemcinctus), l’unico animale oltre all’uomo che contrae la lebbra, un’infezione batterica contagiosa e incurabile caratterizzata da un danno neurologico progressivo. Anche i genomi delle specie più vicine all’uomo – scimpanzè, gorilla, orangotango e gibbone – sono in corso di sequenziamento o quest’ultimo è già stato completato. Il confronto fra lo scimpanzè e l’uomo ha già rivelato molto su quali geni si siano evoluti dopo la divergenza dalle scimmie antropomorfe; gli altri genomi completeranno questo quadro. Inoltre, per molti genomi sono stati sequenziati più isolati distinti. Per esempio, è possibile confrontare la sequenza del ceppo di laboratorio E. coli K12 con quella dei ceppi patogeni O157:H7 (che causa alcune intossicazioni alimentari), E. coli uropatogeno (che causa infezioni del sistema urinario) e K1, che provoca la setticemia (una pericolosa infezione del sistema circolatorio definita talvolta “avvelenamento del sangue”) e alcuni tipi di meningite. Differenze rilevanti fra i ceppi patogeni e non patogeni potranno permettere di identificare le regioni coinvolte nell’infettività o nella capacità di causare la malattia. Il sequenziamento genomico è diventato così rapido ed efficiente che sono state determinate le sequenze dei genomi di James Watson e Craig Venter, coloro che per primi lo hanno proposto (il genoma di Watson è stato sequenziato nel 2007, mentre quello di Venter è stato usato dalla Celera negli esperimenti iniziali di sequenziamento). Mentre sono stati necessari 13 anni perché fosse completata la prima sequenza del genoma umano,

La genomica: la mappatura e il sequenziamento dei genomi

con un costo di circa 3 miliardi di dollari, sono stati sufficienti solo 2 mesi per sequenziare il genoma di Watson, con una spesa inferiore a un milione di dollari. Nel 2006 la fondazione X PRIZE ha indetto un concorso per scienziati, offrendo un premio di 10 milioni di dollari al primo gruppo che fosse riuscito a sequenziare il genoma di 100 persone in 10 giorni spendendo meno di 10 000 dollari a genoma. Questo sarebbe stato impossibile solo 20 anni fa, quando una sequenza costava circa un dollaro per ogni coppia di basi, ma nel giro di pochi anni il sequenziamento è diventato sempre più rapido ed economico. Per esempio, oggi è possibile sequenziare 500 kb in un pomeriggio; 20 anni fa ci sarebbero voluti giorni. Negli ultimi anni la tecnologia per il sequenziamento e il software per l’analisi delle sequenze hanno fatto progressi molto rapidi, e continueranno a migliorare. È ragionevole aspettarsi che il costo del sequenziamento di un genoma diminuirà ancora in un futuro non molto lontano. Se i progressi continueranno con la velocità attuale, il sequenziamento genomico diventerà così facile e poco costoso che le persone si faranno sequenziare il genoma per avere terapie mediche su misura in base al proprio genotipo; in altri termini, si potrà adeguare la medicina alle esigenze del genoma. Ulteriori miglioramenti nella velocità e nell’efficienza del sequenziamento consentiranno di determinare la variabilità fra gli individui, di individuare le regioni che cambiano più rapidamente di altre, e di studiare caratteri multigenici complessi alla base delle malattie o sequenziare i genomi delle cellule tumorali per accertare quali cambiamenti si siano verificati nel DNA durante lo sviluppo del tumore.

Nota chiave Molti genomi, sia di virus sia di organismi viventi, sono stati sequenziati; molti altri saranno disponibili nei prossimi anni. L’analisi genetica ha stabilito che vi è stata una divergenza delle sequenze durante l’evoluzione, che ha dato origine alla suddivisione attuale degli organismi viventi in eubatteri, archeobatteri ed eucarioti. Nel corso dell’identificazione di questi genomi sono emerse alcune osservazioni sorprendenti. La più sorprendente è forse che nel genoma umano (e nei genomi di altri mammiferi) ci sono meno geni che nei genomi di altri organismi, come le piante. Il numero dei geni umani è abbastanza vicino a quello del nematode, un organismo che, da adulto, consta solo di un migliaio di cellule. Il costo del sequenziamento continua a diminuire e, quindi, nei prossimi anni verrà sequenziato un numero ancora superiore di genomi.

193

Aspetti etici, legali e sociali del sequenziamento del genoma umano A differenza del sequenziamento di altri genomi, quello del genoma umano ha implicazioni etiche molto serie. Questo aspetto diverrà sempre più rilevante via via che il sequenziamento genomico risulterà meno dispendioso e più comune. Se si raggiungerà un momento in cui le sequenze genomiche personali saranno comuni, sarà necessario affrontare una serie di questioni, specialmente nel settore della privacy. Per esempio, qualora il sequenziamento del genoma di un uomo o di una donna abbia rilevato la presenza di alleli che aumentano il rischio di sviluppare una determinata malattia genetica, chi dovrebbe avere accesso a tali dati? Le persone che si ammaleranno di una certa malattia genetica dovrebbero esserne informate, anche se non esiste una cura? La compagnia di assicurazioni (se ha pagato l’analisi) dovrebbe essere messa a conoscenza del rischio genetico del proprio cliente? Qualora il sequenziamento del genoma riveli un alto rischio di sviluppare una malattia che comporta cure costose, la compagnia potrebbe aumentare il costo della polizza sanitaria o annullarla. Il datore di lavoro dovrebbe essere informato del rischio che il suo dipendente corre di sviluppare una malattia che potrebbe impedirgli in futuro di svolgere il proprio lavoro? Se il datore di lavoro ha pagato la polizza di assicurazione sanitaria, potrebbe essere tentato di licenziare il suo dipendente nel caso in cui le analisi indicassero che a un certo punto quest’ultimo non sarà più in grado di lavorare.* La famiglia del soggetto in questione dovrebbe essere messa al corrente? Il rischio genetico del proprio parente potrebbe indicare relativamente alla costituzione genetica dei membri del nucleo familiare più di quanto questi vogliano conoscere. Prima di entrare nell’era del sequenziamento genomico personale è necessario rispondere a queste e a molte altre domande.

Nota chiave Diversamente dagli altri genomi, il sequenziamento del genoma umano solleva profonde questioni etiche, che dovranno essere risolte al più presto.

* Si ricordi che l’Autore si riferisce al sistema sanitario americano che, attualmente, si basa soprattuto sul settore privato. I cittadini possiedono generalmente un’assicurazione che copre le spese sanitarie e che può essere pagata, in tutto o in parte, dal datore di lavoro (N.d.T.).

194

Capitolo 8

Sommario l Nel 1990 ha avuto inizio un progetto ambizioso e costoso per sequenziare il genoma umano, il Progetto Genoma Umano (HGP, Human Genome Project). Nell’ambito dell’HGP, sono stati sequenziati anche i genomi di numerosi organismi modello della genetica. Nel 2003 è stata pubblicata una versione finale della sequenza del genoma umano. l La genomica è lo studio della sequenza completa del DNA di un organismo. Il processo inizia con il clonaggio del DNA di un organismo in un vettore, che si può scegliere fra più tipi diversi. Successivamente, viene ottenuta la sequenza esatta dei nucleotidi degli inserti clonati. Questi dati di sequenza possono essere utilizzati in numerosi ulteriori tipi di analisi, come quelle volte all’identificazione delle regioni che codificano per geni. l Il clonaggio del DNA è l’inserimento di sequenze di DNA estraneo in un tipo particolare di vettore, una molecola di DNA costruita artificialmente che permette la replicazione del DNA estraneo una volta inserito in una cellula ospite, di solito un batterio o un lievito. Generalmente, è impossibile clonare interi cromosomi e, quindi, il genoma di un organismo viene frammentato in pezzi più piccoli prima di poter essere clonato. Tale frammentazione può essere realizzata mediante gli enzimi di restrizione. l Sono stati sviluppati tipi diversi di vettori di clonaggio; quelli usati più comunemente sono i plasmidi. I vettori di clonaggio sono capaci di replicarsi in uno o più organismi ospiti, hanno siti di restrizione, all’interno dei quali può essere inserito il DNA estraneo, e uno o più marcatori di selezione, impiegati per distinguere le cellule che contengono i vettori. I cromosomi artificiali batterici (BAC) e di lievito (YAC) permettono il clonaggio di frammenti di DNA costituiti da varie centinaia di kilobasi, rispettivamente in E. coli e nel lievito. l Gli enzimi di restrizione tagliano il DNA in posizioni specifiche, chiamate siti di restrizione. Ogni enzima di restrizione riconosce nel DNA una sequenza di basi unica, il sito di restrizione, e taglia entrambe le eliche producendo spesso una breve sequenza sporgente chiamata estremità coesiva. Estremità coesive complementari possono appaiarsi permettendo di unire frammenti di DNA completamente diversi a formare una molecola di DNA ricombinante, purché siano stati tagliati entrambi con lo stesso enzima di restrizione o con enzimi che producono estremità compatibili. Alcuni enzimi di restrizione tagliano il DNA formando estremità piatte. Anche le molecole con estremità piatte possono essere unite per formare una molecola di DNA ricombinante. l Dopo essere stato tagliato con un enzima di restrizione, il DNA può essere clonato in un vettore tagliato con il medesimo enzima. Il DNA genomico e il vettore vengono mescolati, le estremità coesive del DNA genomico e del vettore si appaiano e l’enzima DNA ligasi forma il legame fosfodiesterico fra le due eliche di DNA, unendo i due frammenti mediante un legame covalente. Il vettore e l’inserto possono quindi essere usati per la trasformazione di una cellula ospite.

l I vettori di clonaggio hanno molte caratteristiche comuni: un sito di clonaggio multiplo (polylinker), ossia una serie di siti di restrizione di tipo diverso; un’origine di replicazione appropriata, che renda possibile la replicazione del plasmide nella particolare cellula ospite scelta; un marcatore di selezione, che permette alle rare cellule trasformate di sopravvivere in certe condizioni a diffferenza delle cellule non trasformate. I vettori più comuni comprendono i plasmidi, i cosmidi, gli YAC e i BAC; ciascuno di tali vettori presenta vantaggi e svantaggi. l Per ottenere la sequenza completa di un genoma, quest’ultimo deve essere ridotto in frammenti, ciascuno dei quali deve essere clonato e sequenziato. Si definisce banca genomica o genoteca o libreria genomica una collezione di cloni che contiene almeno una copia di ciascuna sequenza di DNA del genoma di un organismo. Le dimensioni della banca genomica dipendono dalla grandezza degli inserti di DNA nei cloni e da quella del genoma. Nel caso di genomi di dimensioni elevate, una banca può contenere da molte migliaia fino a milioni di cloni. I vettori come BAC e YAC possono contenere frammenti di DNA grandi; pertanto, quando vengono utilizzati questi vettori è necessario un numero di cloni inferiore per costruire una banca genomica completa. Una banca cromosomica è più piccola di una banca genomica, perché contiene il DNA di un solo cromosoma specifico. l Dopo il completamento della banca genomica, il DNA che la costituisce può essere sequenziato. Un metodo molto usato per il sequenziamento del DNA prevede l’uso di didesossinucleotidi per terminare l’allungamento della catena in una versione modificata della replicazione del DNA. I frammenti ottenuti vengono individuati grazie alla presenza di un colorante legato ai singoli ddNTP. Il colorante permette di visualizzare i frammenti e di identificare il ddNTP con il quale termina ciascuno di essi. Una nuova tecnica di sequenziamento, definita pirosequenziamento, permette di identificare direttamente ciascun nucleotide quando viene incorporato nell’elica di DNA di nuova sintesi. l Per il sequenziamento di interi genomi è disponibile un certo numero di approcci. La tecnica che viene usata prevalentemente è il sequenziamento casuale diretto (whole-genome shotgun). Questo approccio prevede che il genoma venga inizialmente ridotto in frammenti casuali e sovrapposti e che, in seguito, ogni frammento venga sequenziato. Le sequenze risultanti vengono assemblate in sequenze più lunghe con l’ausilio di algoritmi computazionali. Le lacune presenti nelle sequenze assemblate vengono riempite successivamente, in un processo definito rifinitura. La maggior parte dei genomi è stata sequenziata con questo metodo. l L’analisi iniziale di un genoma comprende la costruzione di una mappa fisica e il sequenziamento del genoma completo, al fine di identificare regioni importanti come quelle che codificano per proteine e altre sequenze che regolano l’espressione genica. Dopo aver ottenuto la sequenza genomica, si può procedere con l’annotazione, per individuare la localizzazione delle regioni polimorfiche (variabili) e per contrassegnare i geni o le regioni che potrebbero essere geni.

La genomica: la mappatura e il sequenziamento dei genomi l Gli SNP (polimorfismi di singoli nucleotidi) sono le sequenze polimorfiche più comuni nel genoma. Un SNP consiste di un cambiamento di una singola coppia di basi fra individui diversi, mentre una serie di SNP concatenati in un individuo costituisce un aplotipo. Gli SNP e gli aplotipi possono essere usati come marcatori genetici ad alta risoluzione per mappare caratteri nel genoma, per analizzare le differenze genetiche fra gli individui e per aiutare a identificare i geni che causano malattie. l L’annotazione delle sequenze geniche nel genoma si basa sull’informazione che deriva dall’analisi dei cloni. È possibile individuare i geni direttamente analizzando i cloni in una banca di cDNA. Le banche di cDNA vengono costruite sintetizzando dapprima copie di DNA a doppia elica (chiamate appunto cDNA) di tutti gli mRNA espressi, mediante l’enzima trascrittasi inversa, e clonando successivamente i cDNA ottenuti in un vettore. Le banche di cDNA rappresentano tutte le regioni di un genoma che vengono trascritte in mRNA in un determinato tipo cellulare o tessuto. Tuttavia, dal momento che in condizioni differenti o in diversi tipi cellulari non vengono trascritti gli stessi geni, per essere sicuri di ottenere il numero di trascritti più alto possibile dovranno essere costruite più banche di cDNA. l L’annotazione dei genomi è basata anche sull’identificazione dei geni mediante analisi al computer. I computer possono cercare le ORF e le sequenze consenso nelle sequenza genomica, e predire dove potrebbero trovarsi i geni. I programmi al computer possono aiutare a distinguere le sequenze che codificano per proteine dalle regioni non codificanti, ma non sono precisi al 100%. l I genomi di molti virus e organismi viventi sono stati sequenziati completamente. L’analisi dei genomi ha permesso di ottenere molte informazioni nuove, come pure di sup-

195

portare vecchie ipotesi. Per esempio, l’analisi delle sequenze disponibili di vari genomi ha confermato la suddivisione degli organismi viventi in eubatteri, archeobatteri ed eucarioti. I genomi mostrano una tendenza all’aumento del contenuto di DNA con l’incremento della complessità dell’organismo, anche se questa relazione non è perfetta. Negli eubatteri e negli archeobatteri la maggior parte del genoma è costituita da sequenze codificanti o regolatrici; in altri termini, la densità genica è molto elevata. Negli eucarioti, invece, la densità genica è molto variabile, e tende a diminuire con l’aumento della complessità dell’organismo. l Via via che l’utilità delle sequenze genomiche diventa più evidente, aumenta il numero dei genomi che vengono sequenziati. I progressi tecnologici stanno accelerando ulteriormente questo processo e il sequenziamento completo di un intero genoma sta diventando più veloce e meno costoso. È stato spiegato in precedenza che molti organismi hanno lo stesso numero di geni dell’uomo. Se la tendenza attuale continuerà, è lecito attendersi che il sequenziamento genomico diventerà così facile ed economico da consentire ai medici di usare la sequenza genomica di ciascun paziente per stabilire trattamenti terapeutici su misura. l Il sequenziamento del genoma umano solleva una serie di questioni etiche e legali estremamente serie, che riguardano in particolare il diritto di proprietà dell’informazione e dell’interpretazione del genoma di un individuo. La sequenza del genoma può infatti rivelare, fra l’altro, se un individuo ha malattie genetiche, se ha una predisposizione allo sviluppo di malattie genetiche, di tumori o di una condizione psichica che potrebbe influire sulla sua vita e sul suo lavoro. Il continuo progresso della genomica rende quindi necessario che vengano presi in considerazione aspetti fondamentali della privacy.

Approccio analitico alla soluzione di problemi di genetica D8.1 M.K. Halushka e i suoi collaboratori hanno usato microarray a DNA disegnati in modo specifico per la ricerca di SNP in 75 geni che codificano per proteine in 74 individui. Hanno analizzato circa 189 kb di sequenze genomiche trascritte che consistono di 87 kb di sequenze codificanti, 25 kb di introni e 77 kb di regioni non tradotte (ossia UTR in 5′ e in 3′). Hanno identificato in totale 874 possibili SNP, 387 dei quali nelle sequenze che codificano per proteine, chiamati cSNP. 209 di questi cSNP cambierebbero la sequenza amminoacidica in una delle 62 proteine predette. a. Qual è la frequenza degli SNP nel loro campione (numero di coppie di basi per SNP)? b. Gli SNP sono distribuiti uniformemente nelle sequenze che codificano per proteine e in quelle non codificanti? Si tratta di un risultato atteso? Quali sono le sue implicazioni? c. Secondo le stime attuali, i geni che codificano per proteine nell’uomo sarebbero 20 067. Effettuando una estrapolazione dal campione analizzato da M.K. Halushka e collaboratori, rispondete alle seguenti domande. I. All’incirca, quanti SNP ci sono nei geni umani che codificano per proteine?

II. All’incirca, quanti di questi SNP potrebbero avere un effetto sulla struttura delle proteine? III. Se si trova, in media, un SNP ogni 1000 bp, come si può confrontare il numero degli SNP nei geni che codificano per proteine con il numero totale degli SNP nel genoma umano? d. Molti caratteri biologici, comprese alcune malattie, sono complessi, nel senso che sono sotto il controllo di molti alleli di più geni diversi. Sulla base delle risposte alle domande da a a c, perché si ritiene che la ricerca degli SNP con i microarray a DNA aiuterà a identificare i geni associati a questi caratteri complessi? R8.1 Gli SNP sono polimorfismi di singoli nucleotidi, ovvero differenze di un’unica coppia di basi nel DNA di individui diversi. Queste alterazioni della sequenza del DNA non sono necessariamente negative per l’organismo, ma vengono anzi identificate inizialmente come semplici differenze, o polimorfismi, nella sequenza del DNA. Questo problema richiede di analizzarne la frequenza e la distribuzione nell’uomo, e di considerare le implicazioni di tale analisi.

196

Capitolo 8

a. In 189 000 bp di DNA trascritto ci sono 874 SNP; quindi, in media, ci sono 189 000/874 = 216 bp di sequenza di DNA per SNP. Si noti che in questo campione viene valutato il numero di SNP nei geni, e non nelle regioni genomiche fra i geni. b. In totale, 387/874 = 44% degli SNP si trova in sequenze che codificano per proteine, e 487/874 = 56% degli SNP si trova in sequenze che non codificano per proteine. L’osservazione che la percentuale di SNP è inferiore nelle sequenze codificanti suggerisce che in queste sequenze ci sia una minore variabilità. Tale condizione è attesa, perché le sequenze codificanti specificano gli amminoacidi che conferiscono una funzione a una proteina. Un SNP in una sequenza codificante può causare il cambiamento di un amminoacido e modificare la funzione normale della proteina stessa. Questa alterazione può essere svantaggiosa ed essere eliminata dalla selezione naturale. In realtà, solo 209/874 = 24% degli SNP altera la sequenza amminoacidica, e SNP di questo tipo non si trovano in tutti i 75 geni esaminati. Questo indica che, sebbene vincoli sulla sequenza possano essere presenti anche nelle sequenze non codificanti (per esempio, se si tratta di siti di legame per proteine regolatrici), in queste regioni è tollerata una maggiore variabilità della sequenza. c. I. Se ci sono 20 067 geni, sarebbe lecito aspettarsi di trovare circa (874 SNP/75 geni) × 20 067 = 2,34 × 105 SNP nelle regioni trascritte del genoma umano. II. Gli SNP che potrebbero modificare la struttura delle proteine, causando un cambiamento della sequenza amminoacidica, sono 209/874 = 24%, oppure 2,1 × 105. Tuttavia, non tutti questi SNP avranno un effetto significativo sulla struttura delle proteine. Se un SNP provoca la sostituzione di un amminoacido con uno simile (conservato), tale circostanza potrebbe non modificare in maniera significativa la struttura (o la funzione) della proteina. Per esempio, se un SNP determina la sostituzione di aspartato con glutammato, che sono entrambi amminoacidi acidi, la struttura della proteina potrebbe non risultarne alterata in modo significativo. III. Se c’è un SNP all’incirca ogni 1000 bp, nel genoma umano ci sono circa [3 × 109 bp/(1000 bp/SNP)] = 3 × 106 SNP. Solo (2,34 × 105/3 × 106) = 7,8% degli SNP si trova nei geni che codificano per proteine. d. Questi dati suggeriscono che, anche in una popolazione di individui relativamente piccola (n = 74), ci saranno più SNP per ciascun gene. È possibile che, aumentando le dimensioni del campione, si troveranno più SNP. I dati suggeriscono inoltre la possibilità di identificare SNP per la maggior parte dei geni, se non per tutti, e molto più spesso rispetto ad altri tipi di marcatori di DNA. Dal momento che si può usare la tecnologia dei microarray a DNA per saggiare contemporaneamente un gran numero di alleli SNP in un campione di DNA genomico, dovrebbe essere possibile ottenere un’informazione genomica completa. In altri termini, è possibile identificare gli alleli che un individuo presenta in molti geni diversi. Tale circostanza ha due implicazioni nell’identificazione del contributo genetico in caratteri complessi e in malattie e, nello specifico, relativamente alla determinazione degli alleli dei geni che contribuiscono all’espressione di tali caratteri o all’insorgenza di specifiche malattie. In primo luogo, gli SNP possono costituire un set di marcatori molto

densi, che permette di mappare più facilmente i geni in questione. Inoltre, le analisi degli SNP consentono un’identificazione sistematica degli alleli condivisi fra gli individui che presentano i suddetti caratteri o malattie. D8.2 La mappa degli aplotipi (hapmap) rappresenta l’oggetto di un progetto internazionale, il cui scopo è caratterizzare la struttura del genoma umano in termini di aplotipi e produrre una mappa completa degli aplotipi del genoma umano. Le informazioni sulla variazione degli aplotipi nel genoma umano potranno essere applicate al mappaggio e all’identificazione di geni che causano malattie. I ricercatori del suddetto progetto hanno raccolto e analizzato SNP da quattro popolazioni: yoruba a Ibadan, in Nigeria (YRI); giapponesi a Tokio, in Giappone (JPT); cinesi han a Pechino, in Cina (CHB); CEPH, residenti nello Utah con antenati provenienti dall’Europa settentrionale e occidentale (CEU). Nella Tabella 8.A è presentato un riassunto dei dati che sono stati dedotti per gli SNP in un intervallo di 10 kb contenente parte del gene CLOCK, associato a disturbi del sonno. Nella tabella, i dati delle popolazioni JPT e CHB sono riuniti e rappresentati come JPT+CHB. Nella colonna più a sinistra è riportato il nome degli aplotipi trovati nelle popolazioni YRI, CEU o JPT+CHB. Nella seconda colonna da sinistra è riportato il numero degli individui con quel particolare aplotipo. La prima fila delle colonne rimanenti riporta il nome di ciascun SNP nella regione e la seconda fila le sue coordinate di sequenza sul cromosoma 4. I nucleotidi trovati a livello di ciascun SNP vengono riportati nelle file rimanenti e sono di colori diversi per aiutare la visualizzazione degli aplotipi. a. Quali sono gli aplotipi più comuni in ciascuna popolazione? b. Quali aplotipi sono identici in popolazioni diverse? Gli aplotipi identici nelle differenti popolazioni hanno frequenze simili? c. Ci sono aplotipi presenti unicamente in una popolazione? d. Sulla base delle risposte alle domande b e c, perché è importante studiare gli aplotipi in popolazioni differenti? e. Si ipotizzi di voler valutare la correlazione tra i polimorfismi in questa regione e i disturbi del sonno in una popolazione belga. Quale degli aplotipi, se ve ne è uno, può essere identificato da un unico SNP? R8.2 Per risolvere questo problema è necessario aver compreso che cosa sono gli SNP e come si formano gli aplotipi. Gli SNP sono differenze di un singolo nucleotide in un particolare sito del DNA. Nei dati di questo esercizio, ogni SNP ha due alleli. Per esempio, per quanto riguarda l’SNP rs13114841, riportato nella terza colonna da sinistra della Tabella 8.A, gli individui possono avere un allele T oppure C (si considera solo un’elica del DNA, e la descrizione dell’allele SNP fa riferimento alla stessa elica di DNA). Un aplotipo è un set di alleli SNP specifici a livello di particolari loci SNP che si trovano vicini in una piccola regione cromosomica. Gli aplotipi si formano perché la ricombinazione fra loci SNP vicini si verifica raramente; quindi, loci SNP che si trovano vicini fisicamente vengono di solito ereditati insieme. In questo caso, tutti e 8 gli SNP si trovano entro una distanza di 10 000 basi. Dato che si tratta di una regione relativamente piccola, è lecito attendersi che gli SNP che costituiscono questo set vengano ereditati insieme come aplotipo. Gli SNP degli aplotipi verrebbero separati con maggiore frequenza solo se in questa regione ci fosse un hot spot di ricombinazione.

197

La genomica: la mappatura e il sequenziamento dei genomi

Per esempio, l’aplotipo rappresentato da CEU-3, YRI-6 e JBT+CHB-8 è raro nelle popolazioni CEU e JBT+CHB, anche se è il più comune nella popolazione YRI. Anche l’aplotipo rappresentato da CEU-4, YRI-2 e JBT+CHB-1 è il più comune nella popolazione JBT+CHB (104/180 = 57,8%), ma è meno frequente nelle popolazioni YRI (18/120 = 15%) e CEU (38/120 = 31,7%). c. I due aplotipi JBT+CHB-2 e JBT+CHB-6 si trovano solo nella popolazione JBT+CHB, nella quale non sono comuni. d. Le risposte alle domande b e c mostrano che aplotipi diversi non sono presenti con la stessa frequenza in una popolazione e che lo stesso aplotipo può avere frequenze molto diverse in popolazioni distinte. Se in una particolare popolazione viene effettuato uno studio allo scopo di associare un gene a una malattia, alla risposta a una terapia, a una condizione ambientale, è importante sapere quali aplotipi sono presenti in quella popolazione per poter valutare l’associazione di specifici aplotipi alla malattia o alla condizione in esame. È inoltre importante conoscere la frequenza degli aplotipi in popolazioni diverse, perché tale dato può influenzare l’intepretazione degli studi di associazione. Si supponga che un aplotipo raro mostri una forte associazione a una malattia in una popolazione, ma sia molto comune in un’altra popolazione nella quale non risulta associato alla malattia. Questi risultati si possono spiegare ipotizzando che i componenti della popolazione che mostra l’asso-

a. Esaminando i dati nella seconda colonna da sinistra, è possibile vedere quante volte un aplotipo è stato trovato nella popolazione. Tre dei 6 aplotipi identificati nella popolazione CEU, ossia CEU-1, CEU-2 e CEU-4, rappresentano il (41 + 33 + 38)/(41 + 33 + 1 + 38 + 1 + 6) = 112/120 = 93,3% degli aplotipi di questa popolazione. Nella popolazione YRI l’aplotipo più frequente è YRI-6, mentre YRI-2, YRI-4 e YRI-5 sono molto più frequenti di YRI-1 e YRI-3. Gli aplotipi YRI-6, YRI-2, YRI-4 e YRI-5 rappresentano il (18 + 14 + 19 + 67)/(1 + 18 + 1 + 14 + 19 + 19 + 33 + 15) = 118/120 = 98,3% degli aplotipi in questa popolazione. Nelle popolazioni JBT e CHB, l’aplotipo più frequente è JPT+CHB-1, mentre JBT+CHB-5 e JBT+CHB-7 sono molto più frequenti degli altri aplotipi. Questi 3 aplotipi insieme rappresentano il (104 + 39 + 26)/(104 + 4 + 1 + 3 + 39 + 1 + 26 + 2) = 169/180 = 93,9% degli aplotipi in questa popolazione. Quindi, in ciascuna popolazione, alcuni aplotipi sono più comuni di altri. b. Per individuare gli aplotipi identici, si osservino i colori in ciascuna fila della tabella e si controlli se gli aplotipi con lo stesso colore hanno anche alleli SNP identici. Gli aplotipi identici sono i seguenti: CEU-1, YRI-4 e JBT+CHB-5; CEU-2, YRI-5 e JBT+CHB-7; CEU-3, YRI-6 e JBT+CHB-8; CEU-4, YRI-2 e JBT+CHB-1; CEU-5, YRI1 e JBT+CHB-3; e CEU-6, YRI-3 e JBT+CHB-4. Gli aplotipi identici non hanno sempre le stesse frequenze.

Tabella 8.A

Aplotipo

Numero di individui con l’aplotipo

rs13114841 56 046 898

rs7684810 56 047 551

rs939823 56 048 292

rs4864542 56 048 844

rs2070062 56 050 355

rs4864543 56 051 152

rs13146987 56 052 552

rs11939815 56 053 040

SNP a livello del gene CLOCK

CEU-1 CEU-2 CEU-3 CEU-4 CEU-5 CEU-6 YRI-1 YRI-2 YRI-3 YRI-4 YRI-5 YRI-6 JPT+CHB-1 JPT+CHB-2 JPT+CHB-3 JPT+CHB-4 JPT+CHB-5 JPT+CHB-6 JPT+CHB-7 JPT+CHB-8

41 33 1 38 1 6 1 18 1 14 19 67 104 4 1 3 39 1 26 2

T T T C C C C C C T T T C C C C T T T T

C T T T C T C T T C T T T T C T C C T T

C C C T T T T T T C C C T T T T C C C C

C C C G G G G G G C C C G G G G C C C C

A C A A A A A A A A C A A A A A A C C A

C C C T T C T T C C C C T T T C C C C C

A A A G G G G G G A A A G G G G A A A A

T G T G G G G G G T G T G T G G T G G T

198

Capitolo 8

ciazione e quelli della popolazione che non la mostra presentino una differenza genetica vicino all’aplotipo. e. Poiché lo studio viene svolto in una popolazione belga, è necessario identificare il numero minimo di SNP che permette di distinguere fra gli aplotipi trovati nell’analisi della popolazione CEU, che ha avuto origine nell’Europa settentrionale e occidentale. Si inizi questa analisi esaminando a due a due gli SNP per determinare se il genotipo di un SNP permette di prevedere il genotipo di un altro. In tal caso, sarà necessario analizzare il genotipo di uno solo degli SNP. Si impieghino i colori nella tabella per identificare questi SNP, perché avranno colonne con lo stesso pattern di colori (anche se non necessariamente lo stesso colore). Nel caso in esame, l’allele C di rs939823 è sempre associato all’allele C di rs486454, all’allele T di rs13114841 e all’allele A di rs13146987. L’allele T di rs939823 è sempre associato all’allele G di rs486454, all’allele C di rs13114841 e all’allele G di rs13146987. Quindi, è sufficiente analizzare il genotipo di uno solo di questi quattro SNP. Si ipotizzi di scegliere, per esempio, rs13114841. Si determini ora come è possibile utilizzare rs13114841 e gli altri quattro SNP, singolarmente o in combinazione, per identificare un aplotipo in maniera univoca. A questo scopo è utile il codice colore della tabella: esaminando le colonne, si vede che un C è presente in rs2070062 solo nell’aplotipo CEU-2. Per identificare gli aplotipi rimanenti è necessario usare gli SNP in combinazione. CEU-1 e CEU-5 si possono

identificare usando rs13114841 e rs7684810: a differenza degli altri aplotipi, CEU-1 ha un T in rs13114841 e un C in rs7684810, mentre CEU-5 ha un C sia in rs13114841 sia in rs7684810. Allo stesso modo, CEU-3 viene identificato da un T sia in rs7684810 sia in rs11939815, e un C in rs13114841 e rs4864543 permette di individuare CEU-6. Per identificare CEU-4 sono necessari gli alleli di tre SNP, un C in rs13114841, un T in rs7684810 e un T in rs4864543. Anche se rs2070062 consente di identificare CEU-2, lo stesso aplotipo può essere identificato ugualmente da un T in rs13114841 e da un G in rs11939815. Dato che rs13114841 e rs11939815 devono essere usati per identificare altri aplotipi, per distinguere fra i sei aplotipi sono necessari solo quattro SNP: rs13114841, rs7684810, rs4864543 e rs11939815. Per risolvere questo tipo di problema sono possibili anche altri approcci. A seconda della complessità dei dati, approcci diversi possono portare a soluzioni alternative. In un altro approccio possibile, si può iniziare chiedendosi se l’informazione fornita da un determinato SNP sia necessaria per distinguere fra gli aplotipi, e valutando successivamente in maniera sistematica se l’eliminazione di combinazioni diverse di due, tre o più SNP dai dati impedisca di distinguere gli aplotipi. Per esempio, nella serie di dati in esame, è possibile distinguere gli aplotipi fino a che uno tra gli SNP rs939823, rs486454, rs13114841 o rs13146987 è compreso nell’analisi.

Genomica funzionale e comparativa

9

Come può essere attribuito un ruolo funzionale a una sequenza di DNA nota?

Come variano i trascritti e i prodotti proteici di tutti i geni del genoma in tipi cellulari diversi, o in condizioni differenti?

Come comprendere la natura genica di una sequenza di DNA nota?

Come si possono rendere più efficaci le terapie farmacologiche attraverso gli studi di genomica?

Come si possono confrontare geni identificati ex novo con quelli studiati in precedenza?

Come si possono ottenere informazioni sui rapporti evolutivi fra organismi diversi attraverso il confronto delle loro sequenze genomiche?

Come si possono determinare sperimentalmente le funzioni di geni identificati ex novo?

Come può il confronto delle sequenze geniche indicare cambiamenti genici nel cancro e la natura degli agenti infettivi nelle malattie?

I geni e le altre sequenze sono organizzati in un modo particolare nel genoma?

Come possiamo utilizzare la genomica per studiare comunità microbiche complesse in campioni ambientali?

Attività Come la maggior parte delle persone, a un certo punto della vostra vita avrete preso un farmaco. Anche se per sceglierlo il vostro medico avrà preso in considerazione la vostra storia clinica, è molto improbabile che potesse prevedere con esattezza come avreste reagito alla medicina prima di averla presa. In effetti, a causa di variazioni ereditarie nei vostri geni, la vostra capacità di metabolizzare un dato farmaco e gli effetti collaterali ai quali potreste andare incontro sono molto diversi da quelli di altre persone. In un prossimo futuro, tuttavia, i medici potranno prescrivere farmaci, modularne il dosaggio e scegliere i trattamenti basandosi sull’informazione genetica del paziente. Questo è possibile grazie ai microarray a DNA, descritti nel Capitolo 8. In questo capitolo imparerete di più sui microarray a DNA e su altri strumenti e tecniche usati per analizzare interi genomi di organismi. Quindi, nella iAttività, scoprirete come essi possano essere usati per stabilire una terapia farmacologica personalizzata per un paziente malato di cancro.

Il sequenziamento di genomi completi ha aperto nuove strade alla nostra comprensione delle funzioni geniche e cellulari, dell’evoluzione degli organismi, e di molti altri aspetti della biologia. In questo capitolo conoscerete le

applicazioni della genomica, e più specificamente: la genomica funzionale, che consiste nell’analisi completa delle funzioni dei geni e delle sequenze non geniche in genomi interi; e la genomica comparativa, cioè il confronto di interi genomi (o parti di essi) di specie, ceppi o individui diversi, al fine di aumentare la nostra capacità di comprendere le funzioni di ciascun genoma (o di parti di ciascun genoma), compresi i rapporti evolutivi. Approcci di genomica comparativa vengono utilizzati anche per determinare quali organismi o virus siano presenti in un campione. Nei paragrafi dedicati alla genomica funzionale ne apprenderete il metodo, e vedrete come si assegnano funzioni ai geni in un genoma mediante approcci bioinformatici oppure mediante l’analisi di knock-out genici, come si analizza la trascrizione nelle cellule a livello globale, e come possiamo servirci della genomica funzionale per stabilire terapie farmacologiche. Quindi, nei paragrafi sulla genomica comparativa vedrete come si confrontano i genomi e come questi confronti abbiano permesso di comprendere la funzione e l’evoluzione dei geni. Imparerete anche come la genomica comparativa può essere utilizzata in un contesto clinico, per capire come si diffondono le infezioni. La maggior parte degli argomenti trattati in questo capitolo si trova alla frontiera della biologia, un campo dove nuove tecniche e approcci vengono sviluppati quasi quotidianamente.

200

Capitolo 9

Genomica funzionale

Ricerca di similarità fra sequenze per attribuire funzioni geniche Grazie al successo dei vari Progetti Genomici (vedi Capitolo 8), quesiti sperimentali sull’espressione genica, sulla fisiologia, sullo sviluppo e così via possono ora essere formulati tenendo presente dati di sequenza. In altre parole, la capacità di sequenziare i genomi in modo rapido ed efficiente ha cambiato il modo di fare ricerca in biologia, e in particolare in genetica. Naturalmente, la sequenza genomica completa di un organismo non è altro che una lunga fila delle lettere A, T, G e C. La sequenza non deve essere solo conosciuta, ma ne devono essere descritte e interpretate tutte le caratteristiche. Questo è il motivo per cui oggi la genomica comprende, oltre all’approccio strutturale, quello della genomica funzionale, cioè la descrizione delle funzioni di tutti i geni nei genomi, compreso lo studio dell’espressione genica e del suo controllo. La difficoltà nell’assegnare la funzione ai geni sta nel fatto che, procedendo dalla sequenza genica alla funzione, si va nella direzione opposta rispetto a quella dell’analisi genetica classica, nella quale i ricercatori partono da un fenotipo e proseguono con l’identificazione e lo studio dei geni responsabili di quel fenotipo. Molte delle tecniche che verranno descritte in questo capitolo sono state infatti sviluppate per approcci di genetica inversa. Nella genetica inversa, i ricercatori provano a individuare quale fenotipo, se esiste, possa essere associato a un gene. In generale, si tenta di creare mutazioni in geni clonati, e quindi di introdurre queste mutazioni nell’organismo. Oggi, la genomica funzionale si basa su esperimenti di laboratorio effettuati da biologi molecolari e su sofisticate analisi al computer elaborate tramite la bioinformatica, un settore in forte crescita nel quale la biologia si fonde con la matematica e l’informatica. La bioinformatica ha molte applicazioni, che comprendono la ricerca di geni in una sequenza genomica, l’allineamento di sequenze nelle banche dati per determinare quanto siano simili (o il loro grado di similarità), la predizione della struttura e della funzione dei prodotti genici, la descrizione delle interazioni fra geni e prodotti genici a livello globale all’interno della cellula e nel confronto di cellule e di organismi, e la formulazione di ipotesi sulle relazioni filogenetiche fra le sequenze.

Nota chiave Lo scopo della genomica funzionale è la descrizione delle funzioni di tutti i geni in un genoma, compresi la loro espressione genica e il suo controllo. Per la genomica funzionale sono necessarie sia l’analisi molecolare in laboratorio, sia l’analisi delle sequenze al computer (chiamata anche bioinformatica).

Una volta che in un genoma interamente sequenziato siano stati identificati i geni candidati (vedi Capitolo 8), è importante attribuire una funzione probabile ai prodotti codificati da questi geni. La maggior parte degli organismi i cui genomi sono stati sequenziati non è stata sottoposta a un’analisi genetica “classica” esaustiva (impossibile nel caso dell’uomo), quindi generalmente non saranno disponibili banche di ceppi mutanti con fenotipi ben caratterizzati. In questi casi, la nostra conoscenza sarà limitata alla sola sequenza genomica. Non conoscendo quale sia la funzione del prodotto codificato da un gene, non sarà chiaro dove e quando il gene sia espresso. Al contrario, se possiamo attribuire una funzione probabile al prodotto da esso codificato, possiamo iniziare a prevedere come, e perché, il gene venga utilizzato dall’organismo. Per i geni codificanti proteine, la funzione di una ORF, identificata nelle scansioni genomiche, può essere assegnata attraverso ricerche nelle banche dati di un gene a funzione nota e sequenza somigliante alla ORF in studio. (Come è stato descritto nel Capitolo 6, una ORF è un segmento di DNA, potenzialmente codificante per un polipeptide, identificato da un codone d’inizio nella corretta cornice di lettura con un codone di terminazione. Si ritiene che la maggior parte delle ORF di grandi dimensioni sia parte di un gene che viene trascritto in qualche momento.) Nell’analisi del DNA genomico, una ORF viene definita come un segmento di DNA che può codificare un polipeptide di 100 o più amminoacidi. Come si è visto nel Capitolo 8, la ricerca delle ORF negli eucarioti può essere più difficile, perché la presenza degli introni nelle sequenze genomiche fa sì che questa semplice definizione non sia sufficiente. Ne deriva che spesso per identificare questi geni vengono utilizzati cDNA (vedi Capitolo 8). Queste ricerche sono chiamate ricerche di similarità di sequenza e sono basate sul confronto, mediante computer, della sequenza di interesse con tutte le sequenze presenti nelle banche dati. Le ricerche possono essere effettuate via Internet, accedendo ai programmi mediante un browser. Per esempio, il programma BLAST del National Center for Biotechnology Information (http:// blast.ncbi.nlm.nih. gov/blast.cgi) permette all’utente di copiare la sequenza ORF da analizzare in una finestra, in forma sia di sequenza nucleotidica, sia di sequenza amminoacidica. I confronti BLAST basati sulle sequenze delle proteine sono più facili da interpretare, poiché, a causa della degenerazione del codice genetico, molte differenze a livello del DNA non alterano la proteina codificata. Inoltre, le ricerche di similarità di sequenza effettuate con una sequenza amminoacidica sono preferite perché, esistendo 20 amminoacidi ma solo quattro nucleotidi diversi, sarà più difficile che l’identificazione di una somiglianza su una sequenza di 10 o 12 amminoaci-

Genomica funzionale e comparativa

di sia casuale, rispetto a una sequenza di DNA della stessa lunghezza. Il programma BLAST effettua una ricerca di sequenze note nella banca dati e riporta i risultati migliori, indicando il grado di similarità fra la sequenza di interesse e le sequenze presenti nella banca dati. BLAST effettua anche l’allineamento della sequenza inserita con alcune delle sequenze trovate. Il programma non cerca solo la corrispondenza perfetta, dato che una eventualità simile, su migliaia di amminoacidi, in due specie diverse, sarà molto rara; il software cerca anche corrispondenze parziali, e calcola la possibilità che la similarità sia casuale. Le somiglianze possibili vengono poi elencate in ordine, iniziando con quella che ha la minore probabilità di essere casuale (questa è anche il risultato migliore per la nostra ricerca). Ovviamente, se due polipeptidi sono molto simili, è anche probabile che funzionino in modo simile, mentre se la somiglianza è limitata a una regione molto piccola, essi potrebbero non svolgere la stessa funzione nella cellula. La Figura 9.1 mostra una piccola parte di un allineamento ottenuto usando BLAST per confrontare due sequenze proteiche. In questo caso, il programma ha cercato nella banca dati le sequenze proteiche che corrispondono alla sequenza amminoacidica della fibronectina umana, una proteina importante della matrice extracellulare che circonda molte cellule. La sequenza inserita viene chiamata sequenza query. Il programma BLAST ha trovato una somiglianza, e ha dato come risultato (subject o Sbjct) la sequenza della fibronectina bovina. Il programma mostra anche come si allineano le due sequenze. Quando gli amminoacidi nella query e nel subject sono esattamente gli stessi, BLAST li indica in una riga fra le due sequenze (sotto forma di codice a una lettera). Nel caso siano presenti amminoacidi molto simili BLAST inserisce invece un “+” (per esempio, quando una proteina usa la leucina e l’altra isoleucina, che posseggono entrambe catene laterali idrofobiche, moderatamente ingombranti). Se una delle proteine è più lunga dell’altra, BLAST utilizzerà il codice “–” nella query o nel subject, indicando così che, in una breve regione, una determinata sequenza è più corta rispetto all’altra (Figura 9.1). La ricerca di similarità è un modo efficiente di assegnare una funzione a un gene, poiché l’omologia, ovveQuery 2072 Sbjct 1982

201

ro la similarità di sequenza, riflette rapporti evolutivi, cioè sta a indicare la discendenza da un antenato comune. Qualunque differenza fra le sequenze geniche sarà il risultato di cambiamenti mutazionali che si sono verificati durante l’evoluzione. Quindi, se un gene appena sequenziato (per esempio, in un progetto di sequenziamento genomico) è simile a un gene sequenziato in precedenza, ciò vuol dire che i due geni sono imparentati tra loro dal punto di vista evolutivo, e la funzione del nuovo gene sarà probabilmente la stessa, o comunque molto simile, alla funzione del gene che era stato già sequenziato. Data la quantità di informazione attualmente disponibile nelle banche dati, la maggior parte dei nuovi geni è simile, ma non identica, ad almeno un gene putativo di un altro organismo. In molti casi, però, questo gene non ha una funzione nota; pertanto questo approccio non ci aiuta a capire quale potrebbe essere il ruolo del nostro gene candidato nella cellula. Per esempio, nel 2005 è stato analizzato il genoma del nematode C. elegans. I geni precedentemente identificati per C. elegans erano per la maggior parte (56%) simili a geni di altri organismi con funzione nota o predetta. Come abbiamo già detto, la similarità di sequenza suggerisce che questi geni abbiano funzioni simili. Le ricerche di similarità con i rimanenti geni putativi sono state meno informative. I geni putativi erano simili ad altri geni di nematodi privi di funzione nota o definita (23%), oppure non mostravano somiglianza con le sequenze presenti nelle banche dati (21%). Da allora, nelle banche dati sono state aggiunte molte sequenze, quindi la frazione di sequenze prive di somiglianza è diminuita in maniera significativa. Quando una sequenza proteica predetta corrisponde a una regione di sequenza genomica di un altro organismo, ma nessuna di queste proteine putative ha una funzione chiaramente definita, è difficile, se non impossibile, prevedere quale potrebbe esserne la funzione. Una ricerca di similarità di sequenza può indicare delle corrispondenze sia per l’intera sequenza proteica, sia per parti di essa (Figura 9.1). Nella figura, la prima parte della sequenza query non mostra omologia con la sequenza subject, ma la seconda parte della sequenza query risulta simile alla sequenza subject in un’altra regione. In quest’ultimo caso, ciò potrebbe significare che

RPRPY– –PPNVGQEALSQTTISWAPFQDT 2098 + P GQEALSQTTISW PFQ++ KSEPLIGRKKT GQEALSQTTISWTPFQES 2010

Figura 9.1 Il risultato di una ricerca di similarità di sequenza. In questo esempio il programma BLASTp, che confronta sequenze di proteine, è stato utilizzato per confrontare la fibronectina umana (la sequenza query) e la fibronectina bovina (la sequenza subject, o Sbjct). I numeri indicano la posizione degli amminoacidi nella sequenza della proteina. Le lettere nella riga di mezzo indicano che in quella posizione le due sequenze uguali corrispondono perfettamente, mentre il “+” indica

che in quella posizione le proteine hanno amminoacidi chimicamente simili. Se nella riga di mezzo non c’è niente, gli amminoacidi della query e della subject non sono simili. I trattini nella sequenza query o subject indicano che in una di esse (quella con i trattini) mancano uno o più amminoacidi. (Sequenze ottenute dal database NCBI, http://blast.ncbi. nlm.nih.gov/ [scaricate in data 1 giugno 2008]. Per il codice a singola lettera degli amminoacidi, vedi Figura 6.2.)

202

Capitolo 9

un dominio del prodotto genico del gene appena sequenziato corrisponde a un dominio di un prodotto genico identificato in precedenza. Un dominio è una parte di una sequenza polipeptidica che assume una conformazione finale nella proteina tale da poter svolgere una funzione precisa, indipendentemente dal resto del polipeptide. La funzione di molti domini è ben conosciuta. Per esempio, numerosi domini sono coinvolti nel legame al DNA, mentre altri vengono utilizzati per legare il calcio. Questo significa che si può comprendere la funzione di almeno una parte della nuova proteina, purchè l’omologia fra le due proteine includa una regione a funzione nota. Dal punto di vista evolutivo, un risultato di questo tipo vuol dire che i domini hanno un antenato comune, ma che i geni nel loro insieme potrebbero non averlo. La ricerca della similarità di sequenza ha un ruolo importante nell’assegnare una funzione ai geni. Quando il genoma del lievito in gemmazione è stato sequenziato e identificato per la prima volta, circa il 30% dei geni era già noto in base ad analisi genetiche classiche, comprendenti anche saggi funzionali. Era necessario attribuire una funzione al rimanente 70%, se possibile, attraverso le ricerche di similarità di sequenza. Da queste ricerche è emerso che il 30% dei geni del genoma di lievito codifica per una proteina che ha omologia con una proteina a funzione nota presente nelle banche dati. Si assume quindi che la funzione del prodotto del gene del lievito sia simile a quella dell’omologo. Il 10% dei geni di lievito codifica per proteine che hanno omologhi nelle banche dati ma con funzioni sconosciute. Queste ORF di lievito sono chiamate geni FUN (Function UNknown, a funzione sconosciuta), e questi geni e i loro omologhi appartengono alle cosiddette famiglie di geni orfani. Per il restante 30% dei geni di lievito candidati non sono stati trovati omologhi nelle banche dati. Questa classe comprende quel 6-7% di geni candidati per i quali è dubbio se siano o meno veri geni; cioè, alcune di queste ORF probabilmente non vengono trascritte. Le rimanenti ORF a funzione ignota sono probabilmente veri geni, ma attualmente sono stati identificati solo nel lievito. Questi geni sono chiamati geni orfani singoli. Da quando questa analisi è stata effettuata per la prima volta, sono state assegnate funzioni a molte delle famiglie di geni orfani e ai geni orfani singoli, ma c’è ancora un numero elevato di geni di lievito (circa il 14%) che codifica per proteine per le quali non può essere predetta una funzione. Ciò non vuol dire che le proteine codificate da questi geni siano prive di funzione; si tratta piuttosto di proteine non ancora ben caratterizzate. Se consideriamo i geni che codificano per proteine alle quali è stato possibile assegnare una funzione putativa, ci possiamo chiedere quale percentuale dei geni nel genoma di lievito venga utilizzata per una particolare funzione. La Figura 9.2 mostra questo tipo di analisi per i geni nel genoma di lievito. Possiamo chiederci quanti

geni codifichino per proteine coinvolte in particolari funzioni molecolari (Figura 9.2a). Per esempio, circa il 10% dei geni nel genoma di lievito codifica per proteine che legano gli RNA, e circa il 6% per proteine trasportatrici coinvolte nel movimento di piccole molecole attraverso le membrane. Possiamo anche chiederci quanti geni codifichino per proteine coinvolte in particolari processi biologici cellulari (Figura 9.2b). Per esempio, circa il 10% dei geni di lievito codifica proteine che prendono parte alla traduzione, e circa il 5% per proteine coinvolte nella meiosi o nella sporulazione. Il problema dei geni “a funzione ignota” riguarda anche i genomi di altri organismi, procarioti ed eucarioti. Va detto però che, via via che nelle banche dati vengono aggiunti sempre più geni con funzioni definite, la percentuale di ORF che non mostrano omologie con le sequenze nelle banche dati sta diminuendo. Un numero sorprendentemente elevato di geni umani (quasi un migliaio) era collocato nella classe dei geni orfani singoli, e non era stato trovato nei genomi di altri mammiferi via via che se ne rendevano disponibili le sequenze genomiche. Mentre è possibile che un certo numero dei nostri geni non sia presente nel topo o nel cane, almeno alcuni dei candidati come geni orfani singoli si dovrebbero trovare nel nostro parente più stretto, lo scimpanzè (Pan troglodytes), dato che alcuni di questi nuovi potenziali geni dovrebbero essersi evoluti nei milioni di anni trascorsi fra la divergenza degli antenati dei primati dagli altri mammiferi e la divergenza degli esseri umani dagli scimpanzè. Un’estesa analisi di questi geni orfani ha suggerito che per la maggior parte non si tratti di veri geni, ma di regioni sufficientemente simili a un gene da essere identificate come geni candidati dai programmi al computer.

Nota chiave Per assegnare la funzione genica attraverso l’analisi al computer, la sequenza di un gene sconosciuto di un organismo viene confrontata con le sequenze di geni a funzione nota presenti nelle banche dati. Per il gene sconosciuto, la sequenza confrontata può essere la sequenza di DNA o la sequenza amminoacidica del polipeptide da essa codificato. Una ricerca di similarità come questa può dare come risultato una corrispondenza per l’intera sequenza o per parte di essa, indicando in quest’ultimo caso che un dominio del prodotto genico ha una funzione nota.

Attribuire una funzione genica attraverso la sperimentazione Un approccio chiave per attribuire una funzione genica in modo sperimentale consiste nell’eliminare la funzione di un gene e nel determinare i cambiamenti fenotipi-

Genomica funzionale e comparativa a)

203

b)

Degradazione di grosse molecole

Organizzazione e formazione degli organuli

Trasferimento di gruppi funzionali

Trasporto

Legame all’RNA

Traduzione

Legame a proteine

Risposta a stress

Trasporto di piccole molecole

Ciclo cellulare

Molecole strutturali, incluso il citoscheletro

Meiosi e sporulazione

Regolatori della trascrizione

Trascrizione

Legame al DNA

Altro

Altro

Figura 9.2 Le funzioni predette delle proteine codificate nel genoma di lievito. (a) Proteine previste di lievito raggruppate secondo la probabile funzione enzimatica. (b) Proteine previste di lievito raggruppate in base al processo cellulare

nel quale la proteina è coinvolta. (Dati per a e b ottenuti da “Saccharomyces Genome Database Genome Overview”, http://www.yeastgenome.org/ [scaricati in data 1 giugno 2008].)

ci che si verificano. Sono stati intrapresi grandi progetti per inattivare in modo sistematico la funzione di ciascun gene identificato in numerosi organismi, compresi il lievito, il topo, il moscerino della frutta, il Mycoplasma genitalium e il nematode Caenorhabditis elegans. Ci sono molti modi per inattivare le funzioni dei geni che codificano per proteine. Due delle tecniche più comuni sono i knock-out genici e l’interferenza dell’RNA (RNAi). Un knock-out genico si realizza eliminando il gene dal cromosoma. Prenderemo in esame le strategie per eliminare i geni dal cromosoma di lievito, topo e M. genitalium. L’interferenza dell’RNA, chiamata anche silenziamento dell’RNA, è una tecnica nella quale piccoli RNA regolatori vengono usati per silenziare l’espressione genica negli eucarioti (vedi anche Capitolo 18). Questa tecnica non crea un cambiamento nel DNA, quindi non introduce una mutazione a carico del gene di interesse, ma ne impedisce la traduzione del trascritto corrispondente fino a quando il piccolo RNA regolatore è presente nella cellula. Vedremo come viene usata questa tecnica nello studio dei geni del nematode. In entrambi i casi, il fine è vedere cosa succede se non viene prodotta la proteina codificata dal gene in esame.

Knock-out genici nel lievinimazione to Nel lievito è possibile inattivare una precisa funLa reazione zione genica mediante la a catena strategia sperimentale chiadella polimerasi mata knock-out, che per(PCR) mette di ottenere la delezione del gene di interesse sfruttando la ricombinazione tra il DNA cromosomico e un frammento di DNA artificiale, parzialmente omologo a esso, costruito adoperando una metodica chiamata PCR. La reazione a catena della polimerasi, o PCR, è una delle tecniche di biologia molecolare utilizzate più frequentemente. Si tratta di un metodo che permette di amplificare una regione di DNA (generalmente inferiore a 10 kb) – la sequenza di DNA bersaglio – in modo da ottenere un numero di copie praticamente illimitato di quel DNA, senza dover clonare la regione. Una volta prodotte, queste copie potranno essere clonate, separate mediante elettroforesi su gel, o quantificate, a seconda delle esigenze del ricercatore. La PCR è, essenzialmente, una applicazione che sfrutta la reazione di replicazione del DNA, effettuata utilizzando un apparecchio chiamato thermocycler, che sottopone i cam-

MyLab

204

Capitolo 9

pioni a una serie di cambiamenti di temperatura accuratamente controllati per periodi di tempo molto precisi. La sequenza delle fasi della reazione a catena della polimerasi è illustrata nella Figura 9.3. Innanzitutto, è necessario un DNA “stampo” a doppia elica, le cui dimensioni possono essere variabili, che contenga la sequenza che vogliamo amplificare. Per rendere possibile la rea-

zione a catena della polimerasi desiderata, vengono disegnati e sintetizzati due oligonucleotidi a singolo filamento, chiamati inneschi (primer), che devono essere complementari alle due estremità della sequenza bersaglio da amplificare. È molto importante l’orientamento dei primer sulle molecole stampo: i due inneschi vengono disegnati in modo da appaiarsi ai filamenti opposti dello stampo di DNA, alle due estremità della sequenza DNA originario a doppia elica bersaglio. Quindi, l’estremità 3′ di ciascun primer contenente la sequenza deve essere orientata in modo da “puntare” verso bersaglio DNA bersaglio per l’amplificazione l’estremità 3′ dell’altro primer. I primer vengono 5¢ 3¢ aggiunti al DNA stampo insieme ai dNTP precur5¢ 3¢ sori (dATP, dCTP, dGTP e dTTP) in una soluzio1 Denaturazione dei singoli ne salina adeguata, e la miscela di reazione viene filamenti e appaiamento riscaldata a 95 °C. Il calore denatura il DNA in dei primer Primer B Primer A singoli filamenti. La miscela di reazione viene poi raffreddata a una temperatura alla quale si avrà 3¢ 5¢ l’appaiamento (annealing) dei primer allo stampo 5¢ 3¢ 3¢ 5¢ (Figura 9.3, fase 1). Questa temperatura varierà a 5¢ 3¢ seconda dei primer e dello stampo utilizzati (in 2 Estensione dei primer funzione della loro composizione in basi e, quincon la DNA polimerasi Taq di, del numero dei legami idrogeno possibili), ma 3¢ 5¢ sarà generalmente compresa fra 55 e 65 °C. 5¢ 3¢ Nella fase successiva, viene aggiunta una + DNA polimerasi termostabile. Questi enzimi sono 5¢ 3¢ stati isolati da batteri o Archaea che si sono evolu5¢ 3¢ ti per sopravvivere in ambienti molto caldi, quindi 3 Ripetizione della denaturazione i loro enzimi devono funzionare e mantenere una e dell’appaiamento dei primer struttura corretta a temperature elevate. Un esemNuovo primer A pio è la polimerasi Taq, un enzima isolato dal 5¢ 3¢ Thermus aquaticus. Nella PCR, la DNA polime5¢ 3¢ rasi estende ciascuno dei primer a partire dalle 5¢ 3¢ estremità 3′ a 72 °C, che è la temperatura ottimale 4 Estensione dei primer Nuovo primer B con la Taq DNA polimerasi per l’enzima (Figura 9.3, fase 2). Dopo un definiFilamento di lunghezza unitaria to intervallo di tempo per la fase di sintesi del Filamenti 5¢ 3¢ più lunghi DNA (determinato in base alle dimensioni del della 3¢ 5¢ DNA bersaglio da amplificare, tenendo presente 5¢ 3¢ lunghezza unitaria che l’enzima può polimerizzare circa 1000 basi al 5¢ 3¢ Filamento minuto), la fase di denaturazione a 95 °C viene ri5 Ripetizione della denaturazione di lunghezza unitaria e dell’appaiamento dei primer petuta (questo è il motivo per il quale viene utilizzato un enzima termostabile, che si trova ancora 5¢ 3¢ nella miscela di reazione) e la miscela viene raf5¢ freddata per consentire l’appaiamento dei primer 5¢ 5¢ 3¢ (Figura 9.3, fase 3). (Nel resto della figura è stata 6 Estensione dei primer omessa l’ulteriore amplificazione dei filamenti con la DNA polimerasi Taq originali.) Quindi, l’allungamento del primer A ha 5¢ 3¢ DNA a creato un frammento di DNA che si può legare al 3¢ 5¢ doppio primer B, e l’allungamento del primer B ha creato filamento di un frammento di DNA che può legare il primer A. 5¢ lunghezza 3¢ 5¢ 3¢ unitaria A questo punto, nel secondo ciclo di amplificazione, sarà coinvolta una quantità doppia di primer e Ulteriori cicli di amplificazione del DNA di enzima. Come mostrato in Figura 9.3 fase 4, quando l’allungamento dei primer a opera della Figura 9.3 DNA polimerasi è stato effettuato, delle due moLa reazione a catena della polimerasi (PCR) per l’amplificazione lecole a doppia elica prodotte una è di lunghezza selettiva di sequenze di DNA.

Genomica funzionale e comparativa

trale, codificante, viene sostituita con la sequenza di un marcatore di selezione. In questo esempio, il marcatore per la selezione è un frammento di DNA contenente il marcatore kanR (kanamicina), che conferisce resistenza alla molecola inibitrice G418. In sostanza, il marcatore kanR sostituisce la maggior parte della regione centrale codificante per il gene di interesse, che non può quindi codificare per la specifica proteina. Questo DNA lineare viene introdotto all’interno della cellula ospite di lievito. (Questo è un processo di trasformazione; vedi Capitolo 15 relativamente alle cellule batteriche). Vengono quindi selezionate colonie resistenti al G418. Diversamente dai plasmidi descritti precedentemente, questo frammento lineare di DNA non si replicherà nella cellula ospite poiché è privo di un’origine di replicazione. Tuttavia, il plasmide lineare si può integrare nel cromosoma di lievito attraverso un processo chiamato ricombinazione omologa. Si definisce ricombinazione omologa la ricombinazione fra sequenze simili, che si verifica comunemente durante la meiosi (crossing-over; vedi Capitolo 12), e può aver luogo raramente anche in cellule non meiotiche tra sequenze di DNA che mostrano somiglianza (omologia) più o meno elevata. Relativamente al lievito, il tasso di ricombinazione omologa fra plasmidi e cromosomi è alto. In seguito all’evento di ricombinazione, il piccolo costrutto lineare porterà una copia funzionale del gene in esame che avrà preso dal cromosoma, ma sarà privo del marcatore di selezione kanR. Poiché questo costrutto lineare non possiede le sequenze corrette per la replicazione e la segregazione,

unitaria, cioè pari alla lunghezza del DNA fra l’estremità 5′ del primer A e l’estremità 5′ del primer B, cioè la lunghezza del DNA bersaglio; l’altra elica, invece, in entrambe le molecole, è più lunga della lunghezza unitaria.Le fasi di denaturazione e appaiamento dei primer vengono ripetute nuovamente (Figura 9.3, fase 5). (Per semplificare, nel resto della figura l’ulteriore amplificazione delle eliche più lunghe della lunghezza unitaria è stata omessa.) I primer vengono quindi estesi con la DNA polimerasi (Figura 9.3, fase 6). Questa fase di amplificazione produce DNA a doppia elica di lunghezza unitaria. Si noti che, per produrre le due molecole di DNA amplificato di lunghezza unitaria, sono stati necessari tre cicli. Il risultato di cicli ripetuti di denaturazione, annealing ed estensione è l’aumento esponenziale della quantità di DNA di lunghezza unitaria. Di solito, il tipico ciclo di amplificazione in PCR viene ripetuto per 30-35 volte. La PCR è una tecnica molto utile nelle analisi genomiche e nella diagnostica, ed è fondamentale nella quantificazione dell’attività trascrizionale, come si vedrà nel Capitolo 10. (Per la sua invenzione della tecnica di reazione a catena della polimerasi Kary Mullis ha condiviso nel 1993 il Premio Nobel per la Chimica.) La Figura 9.4a mostra come si può realizzare il knock-out di un gene nel lievito con una strategia basata sulla PCR. Usando primer disegnati sulla sequenza genomica nota, si amplifica un modulo di delezione di DNA lineare artificiale. Questo frammento di DNA comprende le regioni al 5′ e al 3′ del gene di cui si vuole ottenere la delezione, mentre la porzione genica cena) Modulo di delezione kan R Inizio della trascrizione

Porzione dell’estremità 5¢ del gene bersaglio

Porzione dell’estremità 3¢ del gene bersaglio

Marcatore di selezione kan R

Gene cromosomico

Delezione di un ampio segmento del gene bersaglio per ricombinazione omologa Inizio della trascrizione

ORF bersaglio sostituita da kan R AUG

kan R

b) Conferma dell’avvenuta delezione 1

Delezione fallita (gene ancora presente) A

C

B 2

D

Delezione riuscita (gene sostituito dal modulo kan R) Inizio della trascrizione A

KanC kan R KanB

205

D

Figura 9.4 Realizzazione e verifica di un knock-out genico nel lievito. (a) Schema di una strategia di delezione genica, che impiega un frammento di DNA costruito mediante PCR, costituito da sequenze dell’estremità 5’ e 3’ del gene bersaglio che fiancheggiano il marcatore di selezione kanR. Il lievito viene trasformato e la ricombinazione omologa sostituisce la ORF del gene bersaglio inserendo la sequenza del marcatore di selezione. (b) Verifica della delezione genica. Saggio basato sulla PCR per confermare (1) una delezione fallita (il gene è ancora presente) e (2) una delezione riuscita (il gene è stato sostituito con il segmento di DNA kanR).

206

Capitolo 9

verrà perduto dalla maggior parte delle cellule generate dalla divisione del lievito ricombinante. L’evento di ricombinazione omologa inattiva completamente – realizza cioè il knock-out – la copia cromosomica del gene di interesse, dato che la maggior parte della regione codificante è stata sostituita dal marcatore selettivo kanR. In termini genetici, quando il gene kanR sostituisce la maggior parte del gene di interesse, viene prodotto un allele nullo (un allele che, in seguito alla delezione della sua sequenza codificante e all’inserzione di DNA esogeno, risulta incapace di codificare per qualunque polipeptide funzionale). Si ricordi che il lievito è generalmente aploide, quindi queste cellule non avranno una seconda copia del gene. Questo significa che, se il gene è necessario per una specifica funzione nella cellula, come risultato della mutazione knock-out la nuova cellula mutante avrà un difetto in quella funzione. (Si noti che, se si tratta di un gene essenziale per la sopravvivenza, la cellula che porta la mutazione morirà e non verranno ottenute colonie resistenti al G418.) Oltre alla ricombinazione omologa, è anche possibile un evento di ricombinazione non omologa, che consiste nel processo di ricombinazione tra sequenze che non sono simili tra loro e che porta, quindi, all’integrazione casuale del DNA esogeno nel genoma dell’ospite. Poiché anche in questo caso vengono prodotti trasformanti resistenti al G418, è necessario effettuare dei saggi molecolari per capire quali cellule abbiano la delezione del gene di interesse. Questo tipo di approccio è preferibile in quegli organismi in cui il tasso di ricombinazione omologa è molto basso. Per l’analisi dei ricombinanti viene utilizzata la PCR, come è illustrato nella Figura 9.4b. Consideriamo per prima la condizione di una delezione non riuscita, nella quale il gene sia ancora presente (Figura 9.4b.1). Per la PCR vengono usati quattro primer diversi, A-D. I primer A e D si trovano, rispettivamente, da 200 a 400 basi a monte o a valle del gene. I primer B e C sono interni al gene stesso. Il DNA viene isolato dai trasformanti, e vengono effettuate PCR separate con i primer A e B e con i primer C e D. Se il gene è ancora presente, queste reazioni produrranno frammenti di DNA delle dimensioni previste. Se il gene è stato deleto, non si otterranno prodotti in PCR. È comunque sempre necessario dimostrare in maniera definitiva che la delezione è stata effettuata, secondo lo schema mostrato nella Figura 9.4b.2. I primer A e D sono gli stessi della Figura 9.4b.1, egli altri due primer utilizzati – KanB e KanC – sono specifici per il frammento di DNA di kanR. Se la delezione è riuscita, il modulo kanR avrà sostituito il gene, e la PCR con i primer A e KanB, e i primer KanC e D, produrrà frammenti delle dimensioni previste. Mediante l’approccio di delezione genica è stato completato un progetto di knock-out nel lievito (YKO, Yeast Knock-Out), nel quale ogni gene del lievito è stato deleto in modo sistematico. Poiché alcuni geni hanno

funzioni essenziali, la loro delezione ha dato un fenotipo letale. Tuttavia, è stato dimostrato che circa 4200 delle circa 6600 ORF non sono essenziali, poiché l’eliminazione di ciascuna di esse individualmente ha dato come risultato un fenotipo vitale. Questa serie di 4200 ceppi della collezione delle delezioni di lievito rappresenta una risorsa genomica per studiare le funzioni di geni non essenziali in questo organismo. Per esempio, per assegnare una funzione ai geni eliminati, i ceppi deleti vengono studiati in varie condizioni ed esaminati per cambiamenti nel loro fenotipo. Il lavoro necessario è notevole, in quanto le funzioni cellulari che devono essere analizzate per individuare un cambiamento nel fenotipo sono molto numerose, e comprendono gli eventi che avvengono durante il ciclo cellulare, la meiosi, la sintesi del DNA, la sintesi e la maturazione dell’RNA, la sintesi proteica, la riparazione del DNA, il metabolismo energetico, e i meccanismi molecolari del trasporto. Da questo lavoro è stato dimostrato che circa la metà dei ceppi deleti non mostra cambiamenti fenotipici significativi per le funzioni analizzate, mentre l’altra metà presenta cambiamenti fenotipici. Come già sottolineato, l’approccio di knock-out genico è efficiente nel lievito, grazie al suo elevato tasso di ricombinazione omologa, ma non lo è altrettanto in altri organismi per i quali devono essere messe a punto strategie di knock-out più complesse. Knock-out genici nel topo I knock-out genici nel topo vengono utilizzati come modelli per studiare le funzioni degli omologhi murini di geni umani sconosciuti (dal momento che non è ammissibile dal punto di vista etico eseguire un knock-out di geni umani), e per cercare di rispondere a domande fondamentali su come funzionano i mammiferi. La Figura 9.5 mostra come si possono effettuare knock-out genici nel topo. La procedura è simile a quella descritta per il lievito, sebbene gli esperimenti siano più complessi. Per prima cosa, bisogna produrre il vettore utilizzato per la mutazione mirata. A tal fine le copie di un gene clonato sono modificate in vitro in modo da sostituirne la regione centrale con un marcatore selettivo. Nel nostro esempio, il marcatore è neoR, un gene che conferisce alle cellule di topo la capacità di crescere in presenza dell’antibiotico neomicina. Al gene modificato viene poi aggiunto un segmento di DNA contenente un secondo marcatore selettivo, in questo caso tk, un gene virale che codifica per l’enzima timidina chinasi. Se a cellule di topo che esprimono il gene tk viene aggiunta in coltura la molecola ganciclovir, la crescita di queste cellule viene inibita. Infatti, la timidina chinasi fosforila il ganciclovir, modificandolo in modo che diventi un inibitore della replicazione del DNA (Figura 9.5a). I costrutti di DNA contenenti il gene difettivo vengono, quindi, iniettati nei nuclei di cellule staminali em-

Genomica funzionale e comparativa

207

brionali (ES) di topo in coltura.* Una cellula ES è una cellula staminale derivata da un embrione molto precoce, che mantiene la capacità di differenziarsi in tipi cellulari caratteristici di qualunque parte dell’organismo. Le cellule ES possono crescere in laboratorio come cellule singole in coltura senza differenziarsi e, aspetto molto importante, possono essere trasferite in un embrione di topo in uno stadio molto precoce, dove potranno costituire qual-

siasi parte dell’embrione e, soprattutto, differenziarsi nelle cellule della linea germinale. Le cellule ES in cui è stato introdotto il costrutto vengono fatte crescere in un mezzo di coltura contenente neomicina, che seleziona le cellule nelle quali si è integrato il vettore. Per produrre trasformanti stabili, ci sono due possibilità. In un caso (Figura 9.5a, parte sinistra), la ricombinazione omologa fra il vettore e il gene bersaglio nel cromosoma determina la sostituzione della copia completa, normale, del gene a) Trasformazione di cellule ES di topo in coltura con un modulo bersaglio con il gene deleto portato dal vettore. Il gene lineare di delezione del DNA contenente un gene bersaglio R cromosomico ora inattivato in seguito al knock-out non è sostituito dal gene neo funzionale, mentre il vettore ricombinante che ha integraR Clone del gene bersaglio interrotto dal gene neo to il gene bersaglio non si replica e viene perso Cellule ES di topo in coltura Estremità del gene bersaglio durante la divisione cellulare. L’altra possibilità è che avvenga una ricombinazione + neoR tk non omologa e si ottenga l’integrazione Marcatori di selezione del vettore nel DNA genomico. Come si Trasformazione delle cellule ES di topo può vedere nella parte destra della e loro coltura in presenza di neomicina Figura 9.5a, l’integrazione casuale in Ricombinazione omologa Integrazione casuale genere determina l’inserimento in un cromosoma della maggior parte del neoR neoR tk tk vettore, comprendente sia il gene bersaglio inattivato sia il gene tk. Delle due possibilità, l’integrazione casuale è di gran lunga la più coneoR tk neoR mune. Tuttavia, le cellule in cui è avvenuta ricombinazione omologa Knock-out del gene Vettore intero bersaglio nel cromosoma integrato nel cromosoma possono essere selezionate, sfruttando i marcatori, facendo crescere Piastra di cellule ES selezionate in terreno contenente neomicina (uccide le cellule le cellule in un terreno di coltura sensibili all’antibiotico neomicina) contenente sia neomicina sia ganciLe colonie che crescono e ganciclovir (uccide le cellule tk+) hanno il gene bersaglio clovir. La ricombinazione omologa inattivato provoca la sostituzione di una copia del gene bersaglio con neoR, ma b) Uso delle cellule con il gene bersaglio inattivato per ottenere una linea di topi knock-out il gene marcatore tk viene perso Cellule ES knock-out Blastocisti da poiché si trova al di fuori della reda un topo agouti un topo nero gione interessata dalla ricombinaIniezione delle cellule ES nella blastocisti zione omologa. I ricombinanti omologhi risultanti saranno quindi capaci di crescere, perché hanno La blastocisti si sviluppa in un topo chimerico, che può avere cellule acquisito il gene bersaglio contegerminali agouti (knock-out) nente il marcatore neoR, ma non il gene tk. Invece, le cellule in cui è avvenuta la ricombinazione non Accoppiamento dei topi omologa non potranno crescere, chimerici con topi neri perché, anche se contengono il ge×

+/ko

+/ko

+/+

+/+

+/+

Analisi della progenie agouti per la presenza del gene knock-out (ko, knock-out del gene bersaglio) e accoppiamento dei fratelli per ottenere una linea knock-out omozigote

ko/ko

Figura 9.5 Realizzazione di un knock-out genico nel topo.

* Nel 2007, Mario Capecchi, Oliver Smithies e Sir Martin Evans hanno ricevuto il Premio Nobel per la Fisiologia o Medicina “per la loro scoperta dei principi dell’introduzione di specifiche modifiche geniche nel topo attraverso l’impiego di cellule staminali embrionali”.

208

Capitolo 9

ne neoR e sono quindi resistenti alla neomicina, contengono anche il gene tk, che ne inibisce la crescita in presenza di ganciclovir. Le cellule che crescono su neomicina e ganciclovir vengono poi analizzate, per essere sicuri che il gene bersaglio sia stato inattivato come atteso (vedi Figura 9.5a). Questo viene di solito effettuato con un approccio basato sulla PCR, concettualmente simile a quello descritto e illustrato per il sistema di knock-out nel lievito. Le cellule ES che portano la mutazione nel gene bersaglio vengono iniettate in blastocisti (uno stadio precoce dello sviluppo embrionale), ottenute da un ceppo di topo con un colore di pelo diverso da quello dal quale sono derivate le cellule ES. Nel nostro esempio, le cellule ES erano derivate da un topo agouti, e le blastocisti da un topo di colore nero. Agouti è il colore grigiastro dei roditori selvatici (vedi Capitolo 13); dal punto di vista genetico agouti è dominante (vedi Capitolo 11) su nero. Le cellule inserite diventano parte dell’embrione in via di sviluppo, e a volte possono produrre alcune delle cellule della linea germinale. L’embrione viene impiantato in una madre adottiva, dove continuerà a svilupparsi. Il topolino risultante sarà una chimera, avrà cioè una miscela di due tipi di tessuto diversi: un tipo sarà derivato dalle cellule ES knock-out, e l’altro dalle cellule della blastocisti. Dal momento che, per marcare l’origine dei due tipi cellulari, sono state usate le differenze di colore del pelo, i topolini chimerici potranno essere facilmente identificati dalla presenza di chiazze di pelo agouti e nero. Quando i topi chimerici si accoppieranno con topi neri normali, trasmetteranno il knock-out genico ad alcuni dei loro discendenti, a patto che una parte della loro linea germinale consista delle cellule trasformate (vedi Figura 9.5b). Questa progenie avrà una copia del gene agouti e una copia del gene nero, ma sarà agouti a causa della dominanza di questo sul nero. Questi topi possono essere analizzati mediante PCR per confermare la presenza del gene neoR nel loro DNA. I portatori di neoR avranno una copia del gene bersaglio inattivata (+/ko nella Figura 9.5b). L’incrocio di questi topi +/ko fra di loro produrrà una progenie della quale il 25% sarà omozigote ko/ko (vedi Capitolo 11), nella quale sono state cioè eliminate entrambe le copie del gene bersaglio (vedi Figura 9.5b). Questa è la linea di topi knock-out desiderata. Dal momento che spesso non sappiamo quale sarà il fenotipo della nostra nuova mutazione, o se ci sarà un fenotipo riconoscibile, spesso viene usata la PCR per determinare quali topi siano omozigoti per il knock-out. Si utilizzano cioè coppie di primer idonee a dimostrare che è presente il costrutto contenente neoR e non sono presenti copie del gene cromosomico. La tecnica del knock-out genico produce un allele con perdita di funzione, o nullo, del gene bersaglio. I topi omozigoti per il knock-out possono essere studiati per determinare che cosa accade quando l’animale è incapace di

produrre la proteina codificata dal gene bersaglio. Ci si può aspettare che animali incapaci di produrre la proteina codificata dal gene di interesse siano incapaci di sopravvivere. Se non si trovano nati vivi omozigoti, sarà necessario analizzare con cura gli embrioni che si formano quando si accoppiano due eterozigoti, e determinare quando e perché questi embrioni muoiono. Questo accade di frequente, e la caratterizzazione di quando e come questi embrioni muoiono ci dà spesso molte informazioni sulla funzione del prodotto genico nello sviluppo normale. Knock-out genici nel batterio Mycoplasma genitalium Uno dei più piccoli genomi caratterizzati, quello di Mycoplasma genitalium, contiene circa 500 geni che codificano per proteine. Gli scienziati hanno impiegato i trasposoni per identificare quali di questi geni fossero necessari al batterio per sopravvivere in laboratorio. Come si è visto nel Capitolo 7, i trasposoni sono elementi mobili di DNA, e l’inserimento di un trasposone in un gene può causare la perdita della funzione di quel gene, eliminandone la corretta cornice di lettura. Sono state prodotte e caratterizzate più di 2000 nuove inserzioni di trasposoni, e i siti di inserzione sono stati mappati sul genoma sequenziato. Ovviamente, se un trasposone si integra nella regione codificante di un gene essenziale, la nuova mutazione risulta letale, quindi nella popolazione possono essere analizzate solo mutazioni vitali. Si sono osservate inserzioni vitali in almeno 100 geni, suggerendo che la maggior parte dei geni che codificano per proteine (le stime vanno da 265 a 340) sia necessaria per la sopravvivenza dell’organismo in laboratorio. In questo caso, lo scopo era identificare il set genico minimo per un progetto di creazione di una cellula artificiale. Questo organismo era stato selezionato perché aveva il genoma più piccolo fra tutti gli organismi capaci di sopravvivere senza un ospite. Knock-out dell’espressione genica mediante interferenza dell’RNA In questo paragrafo vedremo come possono essere effettuati knock-out o knock-down di geni utilizzando l’interferenza dell’RNA (knock-out vuol dire che l’espressione dell’mRNA di un gene viene inibita completamente, mentre knock-down vuol dire che l’espressione genica viene ridotta). L’interferenza dell’RNA (RNAi) è un processo cellulare che avviene fisiologicamente negli eucarioti, nel quale piccole molecole regolatrici di RNA silenziano l’espressione genica. Si tratta di un importante meccanismo di regolazione dell’espressione genica a livello post-trascrizionale e verrà descritto in dettaglio nel Capitolo 18, in particolare nella Figura 18.19. In breve, nella cellula si forma una molecola di RNA a doppio filamento (dsRNA). Specifiche proteine cellulari si legano al dsRNA e lo tagliano in frammenti di circa 21-23 bp. La proteina chiamata Slicer si lega alle corte molecole di dsRNA e i filamenti della doppia elica vengono dissociati. Uno solo dei due fila-

Genomica funzionale e comparativa

209

Il dsRNA dal quale vengono prodotti i piccoli RNA regolatori a singolo filamento nel processo della RNAi può derivare da fonti diverse. Alcune molecole di dsRNA sono codificate da geni. L’espressione di questi geni produce RNA a singola elica, che si ripiegano formando una struttura a forcina per appaiamento di basi complementari appartenenti a differenti regioni della molecola. I segmenti di RNA appaiati nella forcina costituiscono il dsRNA che inizia il processo della RNAi. Il ruolo dei piccoli RNA regolatori prodotti a partire da dsRNA codificati da geni è quello di regolare l’espressione di altri geni, silenziando l’espressione degli mRNA da loro prodotti. Il silenziamento dell’espressione genica mediante RNAi è altamente specifico, perché dipende dall’appaiamento delle basi complementari del piccolo RNA regolaa) tore con l’mRNA bersaglio, ed è utilizzato comunemente 3¢ Molecola 5¢ in laboratorio come approccio sperimentale di regolazio5¢ di dsRNA 3¢ ne dell’espressione genica in cellule di organismi diversi. Alcune proteine cellulari tagliano Proteine il dsRNA in molecole di dsRNA Per inibire o ridurre l’espressione di uno specifico gecellulari più corte, della lunghezza ne bersaglio, bisogna introdurre nella cellula o nell’orgadi 21-23 bp nismo una piccola molecola regolatrice di RNA a singolo filamento, complementare all’mRNA codificato da quel dsRNA corti gene. Nelle cellule può essere introdotta una copia ingeSlicer si lega al dsRNA Slicer gnerizzata di un gene normalmente presente in esse (in e srotola un filamento, generale, un gene introdotto con mezzi artificiali in una che viene eliminato cellula o in un organismo è chiamato transgene. La celPiccolo RNA regolatore lula o l’organismo che hanno integrato nel proprio genoIl piccolo RNA regolatore Appaiamento del piccolo ma il transgene vengono chiamati transgenici o geneticasi appaia a una sequenza RNA regolatore con mente modificati.) La sequenza del transgene, in questo complementare l’RNA bersaglio nell’mRNA bersaglio caso, è disegnata in modo tale che il corrispondente trascritto di RNA si ripieghi su se stesso per formare una mRNA bersaglio struttura a forcina, chiamata RNA corto a forcina (short La traduzione dell’mRNA bersaglio è repressa, oppure Slicer taglia hairpin RNA) o shRNA (Figura 9.6b). Come descritto in l’mRNA bersaglio e i frammenti vengono degradati. L’espressione precedenza, la parte a doppia elica della forcina dà inizio dell’mRNA bersaglio è stata all’RNAi. (In alternativa, è possibile introdurre sperimensoppressa o ridotta talmente nella cellula degli RNA a doppio filamento.) Le cellule che contengono l’RNA interferente sono generalmente incapaci di produrre la b) Gene ingegnerizzato introdotto nell’organismo proteina codificata dal gene bersaglio, anche se il gene in sé non ... 3¢ 5¢ ... DNA è modificato nel genoma. Anche ... ... 3¢ 5¢ se questa tecnica non crea una Trascrizione mutazione cromosomica permaRNA 5¢ 3¢ nente, ci permette di studiare gli effetti della regolazione negativa Sequenze complementari (fino al silenziamento) dell’eAnsa con basi non appaiate spressione del gene di interesse. L’RNA si ripiega formando

menti rimane associato a Slicer e può appaiarsi con qualunque molecola di RNA a singolo filamento presente nella cellula alla quale sia complementare; quella molecola è l’RNA bersaglio per la RNAi. Quando si ha l’appaiamento, viene repressa la traduzione dell’mRNA, o, in alternativa, l’RNA bersaglio viene tagliato da Slicer e successivamente degradato. In entrambi i casi, l’RNA bersaglio, che è di solito una molecola di mRNA, non è più funzionante. La proteina codificata dall’mRNA non può essere più prodotta da quell’mRNA: l’espressione del gene che aveva codificato è stata quindi silenziata (è avvenuta cioè interferenza) a livello della fase di traduzione (Figura 9.6a).

un RNA corto a forcina (shRNA) 5¢ shRNA 3¢ Regione a doppia elica

L’RNA corto a forcina inizia la RNAi

Figura 9.6 Silenziamento dell’espressione genica mediante l’interferenza dell’RNA (RNAi). (a) Schema del meccanismo di silenziamento dell’espressione genica a livello dell’mRNA mediante RNAi. (b) Uso di un gene ingegnerizzato per produrre un trascritto di RNA a forcina con una regione di RNA a doppio filamento che può iniziare il processo di RNAi per silenziare un gene bersaglio specifico.

210

Capitolo 9

Utilizzando questo approccio basato sulla RNAi, sono stati effettuati esperimenti in C. elegans per inattivare sistematicamente, o almeno per ridurre, l’espressione di ognuno dei circa 20 000 geni che codificano per proteine, e per caratterizzare i fenotipi risultanti. Uno studio simile è stato completato usando la RNAi su ogni gene noto di Drosophila. Ovviamente, può essere molto difficile esaminare ognuno dei singoli 20 000 campioni sperimentali e determinare, ove possibile, quali aspetti della vita normale mancano negli animali che hanno perso la funzione di un gene. In numerosi studi, il 10-25% dei geni che avevano subito knock-out o knock-down mediante RNAi determinava un fenotipo individuabile. Saggi più specifici sull’intero genoma, dove la RNAi era stata impiegata su tutti i 20 000 geni ma venivano selezionati fenotipi molto specifici (ricercando, per esempio, geni coinvolti nel metabolismo dei grassi e nella regolazione dell’attività dei trasposoni), hanno consentito di suggerire una funzione per alcuni dei geni per i quali, nelle analisi iniziali sull’intero genoma, non era evidente un chiaro difetto.

Nota chiave La funzione genica può essere assegnata sperimentalmente eliminando un gene o riducendo la sua espressione, e analizzando il fenotipo che ne risulta. Per effettuare il knock-out di un gene si possono utilizzare metodi differenti, comprese la sostituzione della copia cromosomica normale del gene con una copia inattiva (metodo usato in molti organismi) e l’inattivazione del gene inserendo un trasposone al suo interno (metodo usato di solito nei batteri). In ogni caso, il risultato è un gene privo di funzione o con una funzione marcatamente ridotta. I knock-out genici così ottenuti sono cambiamenti permanenti nel DNA cromosomico. In alternativa, in molti eucarioti l’espressione genica può essere silenziata a livello della traduzione con l’interferenza dell’RNA, nella quale un piccolo RNA regolatore specifico induce la degradazione di un mRNA specifico. Questo metodo non causa un cambiamento permanente nel genoma, ma impedisce la traduzione dell’mRNA del gene bersaglio fino a quando è presente la piccola molecola di RNA regolatore.

La descrizione dei profili di espressione genica Nell’analisi genetica classica, la ricerca inizia dall’osservazione del fenotipo per arrivare al gene o ai geni che ne sono responsabili. Una volta che un gene sia stato identificato e isolato, possono essere effettuati esperimenti per studiarne l’espressione in organismi normali e mutanti, al fine di comprendere il ruolo di quel gene nel determi-

nare il fenotipo in esame. Il sequenziamento del genoma completo di un organismo ha aperto nuove ed eccitanti prospettive di ricerca, come l’analisi dell’espressione di tutti i geni in una cellula a livello trascrizionale e traduzionale, e l’analisi di tutte le interazioni proteina-proteina. Misurare i livelli dei trascritti di RNA (di solito focalizzandosi sui trascritti di mRNA), per esempio, ci fornisce informazioni sullo stato globale di espressione genica della cellula. Nel quadro di queste nuove possibilità di ricerca, è stato coniato un nuovo termine che indica il set di trascritti di mRNA in una cellula: il trascrittoma. La scienza che studia il trascrittoma è chiamata trascrittomica. Poiché gli mRNA specificano le proteine responsabili della funzione cellulare, il trascrittoma è l’indicatore principale del fenotipo e della funzione cellulare. Per estensione, il set completo delle proteine di una cellula è chiamato proteoma, e la proteomica è lo studio del proteoma. In questa sezione verranno descritti gli studi del trascrittoma e del proteoma. Il trascrittoma Il trascrittoma non è lo stesso in tutte le cellule di un organismo. Una cellula muscolare e una cellula epatica trascriveranno sottogruppi diversi dei geni del loro genoma comune. Inoltre, il trascrittoma di una particolare cellula potrà cambiare in risposta a stimoli (dall’ambiente esterno o interno) capaci di regolarne l’espressione genica. Per esempio, i geni trascritti cambieranno in una cellula di lievito che modifica le proprie condizioni di crescita, oppure in una cellula staminale umana che si differenzia in una cellula muscolare. La conoscenza esatta dei geni che sono espressi in una cellula, di quando sono espressi, e del loro livello di espressione, permette di cominciare a capire le funzioni cellulari a livello globale. In altre parole, lo studio del trascrittoma permette di comprendere la risposta cellulare a una particolare condizione ambientale (fisiologica o patologica), almeno a livello della trascrizione, nel suo complesso – sapremmo cioè come cambia tutta la trascrizione, non solo come cambia la trascrizione di un gene. Per studiare l’espressione genica a livello globale, gli studi del trascrittoma si basano comunemente sui microarray a DNA, descritti nel Capitolo 8. Un esempio dell’uso della trascrittomica per comprendere i cambiamenti nell’espressione genica è lo studio, effettuato in collaborazione da Pat Brown e Ira Herskowitz, della sporulanimazione zione nel lievito, quel proAnalisi cesso che porta alla formadell’espressione zione per meiosi di spore genica usando aploidi da una cellula diploii microarray de (Figura 9.7a). La sporulaa DNA zione nel lievito comprende quattro fasi principali: la replicazione e la ricombinazione del DNA, la meiosi I, la meiosi II e la maturazione della spora. (La meiosi è de-

MyLab

Genomica funzionale e comparativa

scritta nel Capitolo 12.) Ciascuna di queste fasi è correlata alla trascrizione sequenziale di almeno quattro classi di geni – precoci, intermedi, intermedi-tardivi e tardivi. Quando questi esperimenti con i microarray a DNA hanno avuto inizio, erano stati identificati circa 150 geni espressi differenzialmente durante la sporulazione. Con il nuovo approccio, al fine di analizzare il programma temporale di espressione genica durante la meiosi e la formazione della spora, i ricercatori hanno indotto la sporulazione di cellule di lievito diploidi e hanno prelevato campioni di cellule a sette intervalli di tempo dala)

Divisione meiotica

Formazione della spora

Replicazione Ricombinazione

211

l’induzione della sporulazione. Per analizzare l’espressione genica nel tempo, essi hanno usato microarray a DNA contenenti il 97% dei geni di lievito noti o predetti. Per correlare in maniera precisa i tempi di prelievo alle fasi della sporulazione, sono state utilizzate la microscopia ottica ed elettronica. Per quantificare l’espressione genica, i ricercatori hanno isolato gli mRNA da ciascun campione di cellule e da essi hanno sintetizzato cDNA marcati con una sonda fluorescente mediante trascrizione inversa in presenza di dUTP marcato con Cy5 (Figura 9.7b). (La sintesi di

Classi geniche temporali

b) Campione sperimentale

Campione di controllo

Estrazione dell’mRNA Precoci

mRNA

Sintesi del cDNA per retrotrascrizione (marcatura con coloranti fluorescenti) Cy3 Cy5

Meiosi I

Intermedi

Meiosi II

cDNA

Intermedi-tardivi

Mix e ibridazione al chip

Sonde ORF di lievito prodotte con la PCR Maturazione delle spore

cDNA bersaglio marcato

Tardivi

Vetrino Asco con quattro ascospore

Figura 9.7 Analisi dell’espressione genica globale nella sporulazione di lievito usando un microarray a DNA. (a) Le fasi della sporulazione nel lievito, correlate alla trascrizione sequenziale di almeno quattro classi di geni. (b) Schema dell’esperimento con il microarray a DNA. (c) Esempio dei risultati di un’analisi dell’espressione genica globale nella sporulazione di lievito, ottenuti usando un microarray a DNA. Sul chip a DNA è rappresentato l’intero genoma del lievito, e i segnali colorati rappresentano i livelli di espressione genica, come viene descritto nel testo.

c)

TEP1

Scansione del microarray per individuare le posizioni della fluorescenza di Cy3 e di Cy5 e per quantificarne l’intensità

212

Capitolo 9

cDNA da mRNA mediante trascrizione inversa è descritta nel Capitolo 8.) Il Cy5 è un colorante fluorescente che può essere aggiunto a un nucleotide – in questo caso un precursore per la sintesi dell’RNA – senza che vengano modificate le proprietà di appaiamento delle basi. Esso emette alla lunghezza d’onda specifica per la luce rossa quando viene eccitato dalla luce ultravioletta. Come controllo, i ricercatori hanno isolato gli mRNA dalle cellule immediatamente prima di indurre la sporulazione, e hanno sintetizzato cDNA marcati con una sonda fluorescente, usando questa volta dUTP marcato con Cy3. Anche il Cy3, come il Cy5, è un colorante fluorescente, che però emette luce a una lunghezza d’onda leggermente diversa da quella del Cy5. Per ciascun intervallo di tempo, i ricercatori hanno ibridato i microarray a DNA con una miscela di cDNA isolati dalle cellule stimolate e marcati con Cy5, e di cDNA di controllo marcati con Cy3. I microarray a DNA erano stati preparati amplificando con la PCR ogni ORF (usando primer basati sulla sequenza genomica nota) e fissando i prodotti di PCR denaturati sui microarray. Dopo l’ibridazione, i microarray sono stati analizzati per scansione con un apparecchio dotato di un lettore laser, che localizza e quantifica l’intensità di fluorescenza di Cy5 e Cy3 (Figura 9.7b). Poiché viene emessa solo una piccola quantità di luce, e poiché ogni ORF viene stampata in una microgoccia, i risultati vengono mostrati molto ingranditi sullo schermo di un computer. Il software converte sullo schermo il segnale di Cy5 in colore rosso (lo stesso colore che emette realmente) e quello di Cy3 in colore verde, invece che nel suo colore reale – un rosso diverso da quello di Cy5. L’abbondanza relativa dei trascritti di ciascun gene nelle cellule di lievito sporulanti, rispetto alle non sporulanti, viene stimata come rapporto della fluorescenza rossa sulla fluorescenza verde. Se un mRNA è più abbondante nelle cellule sporulanti che nelle cellule di controllo, come nel caso del gene TEP1 (Figura 9.7c), il risultato sarà un rapporto più alto fra cDNA marcati in rosso rispetto a cDNA marcati in verde preparati dai due tipi di cellule e, quindi, un rapporto ugualmente alto della fluorescenza rossa rispetto alla verde sull’array. In generale, un gene del quale la sporulazione induce l’espressione apparirà come un segnale rosso, e uno represso come un segnale verde. I geni che sono espressi a livelli approssimativamente uguali nelle cellule non sporulanti e durante la sporulazione produrranno segnali di colore giallo. L’emergenza di colore arancio potrebbe indicare che il livello di trascrizione è cambiato durante l’esperimento, e l’assenza di colore indica che il gene rappresentato in quella posizione del microarray non viene trascritto, né nelle cellule sporulanti né in quelle non sporulanti. Utilizzando questo approccio, i ricercatori hanno identificato più di 1000 geni che mostravano cambiamenti significativi nei livelli di mRNA durante la sporu-

lazione. Circa metà di questi geni è repressa durante la sporulazione, mentre l’altra metà è indotta. Si possono notare almeno sette profili temporali distinti di attivazione dell’espressione genica, e questa osservazione fornisce alcune indicazioni sulla funzione di molti geni orfani. L’approccio basato sui microarray a DNA appena descritto può essere utilizzato per analizzare il trascrittoma allo scopo di rispondere a una grande varietà di domande. Per esempio, come varia il trascrittoma in tipi cellulari differenti in un organismo multicellulare? Come differisce il trascrittoma di cellule normali e tumorali, e come cambia in queste ultime durante la progressione tumorale? Come varia il trascrittoma in stadi differenti dello sviluppo, durante il passaggio di un organismo da embrione ad adulto? Come viene modificato il trascrittoma da un’infezione virale?

Attività Nella iAttività Personalized Prescriptions for Cancer Patients (Terapie personalizzate per malati di tumore), sul sito web dedicato agli studenti, sarete un ricercatore della clinica di Russellville che cerca di determinare il profilo di espressione genica di un paziente malato di cancro.

Farmacogenomica Una delle aree di applicazione più promettenti della ricerca sull’espressione genica a livello genomico è la farmacogenomica. Il termine farmacogenomica deriva dall’unione di “farmacologia” e “genomica” e indica lo studio di come il genoma di un individuo e la sua espressione influenzino la risposta delle cellule dell’individuo stesso a farmaci specifici. Infatti, la medicina si basa principalmente sull’assunto che tutti gli esseri umani abbiano gli stessi geni, e su questa base vengono somministrati i farmaci per curare le malattie. Tuttavia, la risposta di una persona alle medicine dipende da vari fattori, in particolare il proprio genoma, con precise forme alleliche dei geni condivisi dagli individui della specie umana, e fattori non genetici quali l’età, lo stato di salute, la dieta e l’ambiente, capaci di influenzare l’espressione genica (vedi Capitolo 18). La promessa della farmacogenomica è che i farmaci potranno essere su misura – cioè adattati al genoma di ciascuno. La ricerca in farmacogenomica è basata sulla biochimica (una componente principale della scienza farmaceutica), integrata con informazioni sui geni, sulle proteine e sui polimorfismi del DNA. L’obiettivo è sviluppare farmaci sulla base delle molecole di RNA e sulle proteine che sono associate ai geni e alle malattie. In caso di successo, i farmaci usati per curare un individuo sarebbero mirati alle differenze di espressione osservate nelle sue cellule malate in modo molto più specifico di quanto non avvenga attualmente. Questo vorrebbe dire rendere massimi gli effetti terapeutici dei farmaci, mentre nel con-

MyLab

Genomica funzionale e comparativa

tempo ne verrebbero minimizzati gli effetti collaterali. Inoltre, il dosaggio del farmaco sarebbe stabilito su misura per la costituzione genetica di un individuo; si terrebbe cioè conto di come e a quale tasso una persona metabolizzi un dato farmaco. (Attualmente, i dosaggi vengono stabiliti principalmente in base al peso e all’età.) La farmacogenomica è un’area di ricerca relativamente giovane, per la quale ci sono molte promesse ma pochi successi dimostrati. Un’area di ricerca avviata riguarda la famiglia di enzimi epatici del citocromo p450 (CYP). Il gene CYP2D6 (OMIM +124030) codifica per un polipeptide chiamato debrisochina idrossilasi, un enzima che è responsabile della rimozione metabolica di un gran numero di farmaci nell’uomo. Farmaci utilizzati per il trattamento di un’ampia varietà di condizioni patologiche, compresi depressione e altri disordini psichiatrici, nausea, vomito, cinetosi e malattie cardiache, vengono degradati da queste proteine, come pure componenti della famiglia degli oppiacei come la morfina e la codeina. Tuttavia, variazioni nei geni che codificano questi enzimi determinano la produzione di enzimi con differenti capacità di metabolizzare particolari farmaci. Esistono infatti più di 70 alleli noti di CYP2D6, e, a seconda del genotipo di un individuo a livello di questo locus, una persona può essere un metabolizzatore scarso (non produrre, cioè, una debrisochina idrossilasi funzionale), intermedio (chi ha un allele nullo e un allele che codifica una versione difettiva della debrisochina idrossilasi), completo (coloro che hanno almeno un allele pienamente funzionale), o anche un metabolizzatore ultrarapido (le persone che hanno un numero di copie del gene superiore al normale, come risultato di eventi di duplicazione genica; vedi Capitolo 16). Il profilo metabolico di un paziente è di importanza cruciale nel determinare il dosaggio appropriato. Infatti, un metabolizzatore scarso presenterà un rischio maggiore di effetti collaterali dannosi o di sovradosaggio, perché l’organismo eliminerà il farmaco in maniera inefficiente, mentre un metabolizzatore ultrarapido avrà probabimente bisogno di una dose maggiore per ottenere un effetto benefico da un farmaco, a causa della sua aumentata capacità di modificarlo e rimuoverlo. Un altro sviluppo suggestivo della farmacogenomica riguarda i farmaci chemioterapici, cioè i farmaci usati per uccidere le cellule tumorali. Uno studio ha coinvolto pazienti affetti da linfoma diffuso a grandi cellule B. Il linfoma diffuso a grandi cellule B è uno dei numerosi tumori del sistema linfatico classificati complessivamente come linfomi non-Hodgkin, una classe comune di linfoma (Figura 9.8). Si tratta di una malattia rapidamente fatale, se non curata. Gli scienziati hanno studiato i trascrittomi dei linfomi diffusi a grandi cellule B in un gruppo di pazienti, e li hanno correlati con l’efficacia del trattamento chemioterapico. In questi pazienti, il tipo di tumore è stato identificato mediante analisi istologica. Prima dell’inizio della chemioterapia, sono stati raccol-

213

Figura 9.8 Un linfoma diffuso a grandi cellule B dell’epididimo (*) e del testicolo (freccia).

ti, congelati e conservati campioni dei tumori. Tutti i pazienti sono stati sottoposti a trattamenti simili con lo stesso farmaco chemioterapico. Alcuni dei pazienti hanno risposto bene alla chemioterapia, e si è avuta la remissione del tumore. Altri pazienti avevano tumori che non hanno risposto altrettanto bene al trattamento chemioterapico iniziale, e la maggior parte di questi pazienti è morta. Quando sono stati studiati i campioni dei tumori che erano stati conservati, si è visto che tutti i tumori che avevano risposto al trattamento avevano un trascrittoma simile. Anche tutti i tumori che non avevano risposto alla cura avevano un trascrittoma simile, ma, aspetto molto importante, i due trascrittomi erano diversi. Questo vuol dire che i tumori che avevano risposto bene al trattamento esprimevano un set di geni diverso rispetto ai tumori che non lo avevano fatto. Quindi, anche se dal punto di vista istologico tutti i tumori avevano lo stesso aspetto, i risultati dei microarray a DNA avevano mostrato che a livello molecolare si trattava di due tipi di tumore molto diversi, e che solo uno dei due rispondeva al trattamento chemioterapico. Il fatto più significativo è che i risultati hanno mostrato come i mi-

214

Capitolo 9

croarray a DNA siano uno strumento diagnostico più sensibile rispetto all’analisi istologica classica. Quindi, se è possibile determinare rapidamente il trascrittoma di un linfoma diffuso a grandi cellule B al momento della diagnosi, può essere seguito un approccio terapeutico appropriato. Ciò vuol dire che, se il trascrittoma è quello dei tumori che rispondono alla chemioterapia, il tumore può essere trattato con i farmaci chemioterapici standard, dato che i tumori di questo tipo tendono a rispondere bene a questo tipo di cura. Se però il trascrittoma è quello dei tumori che non rispondono al trattamento, i pazienti possono essere sottoposti a un altro tipo di cura, più aggressiva. Approcci simili sono presi in considerazione per il trattamento di altri tipi di tumori.

Nota chiave Il trascrittoma è il set completo degli mRNA trascritti in una cellula in un preciso momento e in risposta a precisi segnali dall’ambiente esterno/interno. Lo scopo della trascrittomica, lo studio del trascrittoma, è caratterizzare il trascrittoma in tipi cellulari e organismi diversi, e determinare come esso possa cambiare durante la vita cellulare, al fine di comprendere l’espressione genica a livello globale. Un’applicazione importante della trascrittomica riguarda lo studio dei cambiamenti dell’espressione genica nelle cellule tumorali. La tecnica per l’analisi del trascrittoma è il microarray a DNA.

Il proteoma Il proteoma è la serie completa di proteine espresse in una cellula in un particolare momento. La proteomica consiste nella catalogazione e nell’analisi di queste proteine, mediante approcci principalmente biochimici e molecolari. Gli obiettivi della proteomica sono i seguenti: (1) identificare tutte le proteine del proteoma; (2) determinare la sequenza di ciascuna proteina e inserire i dati nelle banche dati; (3) analizzare il livello complessivo delle proteine in tipi cellulari differenti e in stadi diversi di sviluppo; (4) comprendere le funzioni biochimiche di tutte le proteine nel proteoma. Naturalmente, possiamo utilizzare le informazioni relative al proteoma per l’identificazione dei geni corrispondenti sul genoma (vedi Capitolo 8), e la nostra annotazione del genoma potrà, viceversa, aiutarci a capire il proteoma. Identificare e sequenziare tutte le proteine di una cellula è molto più complesso rispetto alla mappatura e al sequenziamento di un genoma. In concomitanza con la pubblicazione delle sequenze del genoma umano, è stata lanciata l’Organizzazione Proteoma Umano (HUPO, Human Proteome Organisation). La HUPO rappresenta l’analogo post-genomico dell’Organizzazione Genoma Umano (HUGO, Human Genome Organization), con la

missione di far comprendere l’importanza della proteomica a livello scientifico, politico e finanziario, e di aumentare il sostegno alla ricerca in questo campo. La proteomica è un campo molto importante perché si concentra sui prodotti genici funzionali, che hanno un ruolo fondamentale nel determinare il fenotipo di una cellula. Nel caso di patologie umane, proteine e peptidi sono collegati più intimamente al reale processo della malattia di quanto non siano i geni che li codificano; infatti spesso sono i prodotti genici a “funzionare” nel modo sbagliato. Le sfide della proteomica sono però molto più grandi di quelle della genomica. Questo può sembrare un controsenso, dato che il genoma deve essere più grande del proteoma, ma ricordatevi che molti geni codificano mRNA che possono subire splicing alternativo, e che molte proteine possono essere modificate a livello post-traduzionale, cosicché un singolo gene può in teoria codificare molte proteine correlate, ma leggermente diverse. Quindi, anche se la stima dei geni nel genoma umano è di 20 000, ci potrebbero essere circa 500 000 proteine differenti. L’analisi convenzionale del proteoma viene effettuata mediante elettroforesi bidimensionale su gel di acrilammide e spettrometria di massa. Queste procedure non sono adatte ad analizzare un gran numero di proteine contemporaneamente, e non sono sufficientemente sensibili per individuare proteine espresse a bassi livelli. Fortunatamente, c’è un nuovo strumento sensibile per l’analisi di grandi numeri di proteine tutte insieme – gli array di proteine. Gli array di proteine – chiamati anche microarray proteici o chip di proteine – sono concettualmente simili ai microarray a DNA e stanno diventando rapidamente il modo migliore per individuare le proteine, misurarne i livelli nelle cellule e caratterizzarne le funzioni e le interazioni su larga scala. Come tali, sono una tecnologia fondamentale per la proteomica, valida sia per la ricerca di base sia per le applicazioni biotecnologiche. Come per i microarray a DNA, l’uso degli array di proteine sta diventando altamente automatizzato, rendendo così possibile effettuare numerose misure in parallelo. Gli array di proteine sono basati su proteine immobilizzate su substrati solidi, come vetro, membrane o piastre multipozzetto. Al momento, la densità delle proteine negli array è molto inferiore a quella del DNA nei microarray a DNA. Comunque, con il progredire della tecnologia, ci si può attendere che la densità delle proteine negli array aumenterà. Come nel caso dei microarray a DNA, le proteine bersaglio sono marcate in modo fluorescente (per esempio, con Cy5 e Cy3 come per il DNA), e il legame ai punti della matrice nei quali sono presenti le proteine degli array viene misurato con sistemi laser automatizzati. I dati complessi risultanti vengono analizzati al computer. Grazie alle somiglianze con la tecnologia dei microarray a DNA, per analizzare gli array di proteine possono essere usati gli stessi strumenti usati per analizzare i microarray a DNA.

Genomica funzionale e comparativa

Un tipo di array di proteine è l’array di cattura (capture array), nel quale, per rilevare le molecole bersaglio, per esempio in estratti cellulari o tissutali, viene utilizzata (generalmente) una serie di anticorpi legati alla superficie dell’array. Gli anticorpi vengono ottenuti con le procedure convenzionali di immunizzazione, oppure usando la tecnologia del DNA ricombinante per ottenere cloni dai quali vengono ricavati frammenti di anticorpi. Un array di cattura può essere usato come strumento diagnostico, per esempio in screening per la presenza di tumori (per identificare marcatori tumorali specifici in estratti di materiale bioptico). Negli studi di proteomica, gli array di cattura sono usati per ottenere profili di espressione proteica, cioè per definire il proteoma qualitativamente e quantitativamente. Per esempio, si possono quantificare le proteine in tipi cellulari diversi e in tessuti differenti, e confrontare le proteine in condizioni diverse, come durante il differenziamento, con e senza un trattamento farmacologico, e in presenza o in assenza di una malattia.

Nota chiave Il set completo di proteine in una cellula costituisce il proteoma, e lo studio del proteoma è la proteomica. I fini della proteomica sono l’identificazione di tutte le proteine nel proteoma, la comprensione delle funzioni di ogni proteina, lo sviluppo di una banca dati di sequenze proteiche e l’analisi dei proteomi in tipi cellulari diversi e in differenti stadi di sviluppo.

Genomica comparativa La genomica comparativa consiste nel confrontare interi genomi (o parti di genomi) di specie, ceppi o individui differenti, al fine di identificare identità, similarità e/o differenze tra sequenze geniche e non geniche e, quindi, aumentare la nostra capacità potenziale di comprendere le funzioni di ciascun genoma e i relativi rapporti evolutivi. Approcci di genomica comparativa possono anche essere usati per determinare quali organismi o virus siano presenti in un campione, mediante un confronto tra sequenze specie-specifiche. La genomica comparativa si basa sulla convinzione che tutti i genomi attuali si siano evoluti da genomi ancestrali comuni. Pertanto, studiare un gene in un organismo può fornire un’informazione significativa sul gene omologo in un altro organismo. In un senso più ampio, il confronto dell’organizzazione complessiva dei geni e delle sequenze non geniche di organismi diversi ci può dare informazioni sull’evoluzione dei genomi. Poiché la sperimentazione diretta sull’uomo è inaccettabile dal punto di vista etico, la genomica comparativa fornisce un modo valido per determinare le funzio-

215

ni dei geni umani attraverso lo studio dei geni omologhi in organismi non umani. L’identificazione e lo studio degli omologhi di geni responsabili di malattie dell’uomo in un altro organismo sono strumenti validi per capire la funzione biochimica e le aberrazioni del funzionamento dei geni umani. Una domanda ovvia alla quale la genomica comparativa può rispondere riguarda i rapporti evolutivi fra due o più genomi. Per esempio, come discusso in precedenza, l’analisi delle sequenze genomiche complete ha chiarito i rapporti evolutivi fra gli eubatteri, gli Archaea, e gli eucarioti. (L’uso della genomica comparativa per capire i rapporti evolutivi verrà affrontato nel Capitolo 23.)

Esempi di studi di genomica comparativa e delle loro applicazioni Con il completamento del sequenziamento di molti genomi, gli approcci della genomica comparativa sono diventati estremamente potenti. In questo paragrafo vengono discussi alcuni studi recenti che mostrano le potenzialità di questo tipo di approccio. La ricerca dei geni che ci rendono umani Il genoma dello scimpanzè è stato confrontato con i genomi del topo e del ratto, per trovare regioni dove almeno 96 basi su 100 corrispondessero perfettamente. Sono state individuate più di 30 000 regioni di questo tipo. Dal momento che scimpanzè e topi non condividono un antenato comune recente, si può presumere che la conservazione di queste regioni sia dovuta al fatto che la selezione naturale ha agito contro la maggior parte dei cambiamenti. I ricercatori hanno poi confrontato queste regioni con il genoma umano, cercando quelle che erano simili fra il topo, il ratto e lo scimpanzè, ma significativamente diverse nell’uomo. Se una regione di DNA è molto simile fra gli altri mammiferi, si può assumere che abbia una funzione importante, e che la maggior parte dei suoi cambiamenti sia dannosa. Se tuttavia essa è cambiata nell’uomo, presumibilmente questo cambiamento si è verificato nel periodo di 6 milioni di anni trascorsi da quando l’uomo ha condiviso l’ultimo antenato comune con lo scimpanzè, la specie a noi più vicina. I geni contenuti in una regione di questo tipo potrebbero essere alla base dei cambiamenti che si sono verificati nel corso dell’evoluzione dell’uomo moderno. Uno dei geni identificati in questa analisi è stato chiamato HAR-1 (Human-Accelerated Region 1). Il gene HAR-1 dello scimpanzè è quasi identico al gene HAR-1 del pollo, con una corrispondenza esatta di 116 basi su 118. Questo vuol dire che solo due basi sono cambiate nei circa 310 milioni di anni da quando gli scimpanzè e i polli hanno condiviso un antenato comune. Tuttavia, solo 100 basi su 118 corrispondono invece tra i geni HAR-1 dell’uomo e dello scim-

216

Capitolo 9

panzè. È chiaro che questa regione del genoma umano è molto cambiata negli ultimi 6 milioni di anni. Il prodotto del gene HAR-1 è un piccolo RNA noncodificante la cui funzione non è ancora ben chiara. Quando gli scienziati hanno cercato l’RNA codificato da HAR-1 in sezioni di cervello in via di sviluppo, hanno visto che esso viene espresso in una regione che va incontro a un processo di sviluppo unico dell’uomo, diverso dai processi di sviluppo visibili nei cervelli di altri primati. Le stesse cellule che esprimono HAR-1 esprimono anche la proteina relina, che regola il corretto sviluppo della corteccia cerebrale. In altri studi di genomica comparativa sono stati identificati numerosi altri rilevanti geni umani, compresi quelli che codificano per le proteine FOXP2 e ASPM. Sembra che la proteina FOXP2 abbia un ruolo importante nella produzione del linguaggio, mentre la proteina ASPM regola le dimensioni del cervello. Presumibilmente, altri geni sono cambiati durante la nostra evoluzione, e l’identificazione e lo studio di questi geni ci aiuteranno a capire le nostre differenze dalle specie a noi più vicine. Il Focus sul genoma di questo capitolo descrive un esperimento con finalità simili – il sequenziamento del genoma dell’uomo di Neandertal per capire come il suo genoma differisce dal nostro. Cambiamenti recenti nel genoma umano Per individuare regioni del genoma che hanno subìto cambiamenti rapidi con la separazione delle popolazioni umane, è stata effettuata un’analisi utilizzando la mappa degli aplotipi dell’uomo (vedi Capitolo 8). In questo caso, gli scienziati hanno studiato il linkage disequilibrium. Il termine linkage disequilibrium viene usato per definire una condizione nella quale alleli specifici di due o più geni tendono a presentarsi insieme con una frequenza maggiore di quanto atteso in base al caso.* Se in una popolazione si verifica una mutazione che crea un nuovo allele di un dato gene, questo allele sarà fisicamente vicino a un gruppo specifico di aplotipi. Questo set di aplotipi è anche chiamato blocco di aplotipi. Si ricordi che ciascun aplotipo è una serie di alleli per specifici SNP che vengono raramente riarrangiati dalla ricombinazione, quindi un blocco di aplotipi è costituito da una serie di aplotipi vicini (vedi Capitolo 8). La ricombinazione genetica può avvenire all’interno della piccola regione definita da questo blocco di aplotipi ma è un evento raro. Questo perché essa dipende della loro distanza fisica sul cromosoma, in questo caso minima (vedi Capitolo 14). Quando il blocco di aplotipi che porta il nuovo allele viene trasmesso da un genitore al figlio, anche * In questa sede, la discussione sul linkage disequilibrium si concentra sul caso nel quale un suo livello elevato indica concatenazione genetica (vedi Capitolo 14). Nel Capitolo 21 si vedrà che un linkage disequilibrium elevato può avere anche altre cause.

il nuovo allele segregherà insieme con questo. Si avrà quindi un linkage disequilibrium che tenderà a persistere per molte generazioni, fino a quando eventi di ricombinazione molto rari rimescoleranno l’associazione fra gli aplotipi del blocco e il nuovo allele. I ricercatori hanno cercato blocchi di aplotipi di grandi dimensioni che fossero comuni a una o più popolazioni. Un ampio blocco di aplotipi è quasi certamente di origine recente, perché la ricombinazione genetica rimuoverà, anche se molto lentamente, alcuni degli aplotipi dal blocco. Questi voluminosi blocchi di aplotipi corrispondono quasi sempre a regioni che sono state sottoposte a selezione positiva in un recente passato. In altre parole, qualche mutazione nella regione ha conferito un beneficio selettivo, e i portatori di questa mutazione (e del blocco di aplotipi associato) tendevano a produrre una progenie più numerosa, anch’essa portatrice della mutazione e dell’aplotipo associato. In primo luogo, i ricercatori hanno raccolto informazioni sugli aplotipi di individui di differenti popolazioni umane isolate: 89 membri di una popolazione asiatica (una miscela di individui giapponesi e cinesi han), 60 africani (tutti yoruba dalla Nigeria), e 60 individui di discendenza europea settentrionale e centrale. Essi hanno quindi cercato, e trovato, aplotipi specifici che comprendessero una regione di DNA più ampia rispetto alla maggior parte degli altri aplotipi, e che fossero relativamente comuni in almeno una delle popolazioni. L’idea era la seguente: se un aplotipo raro non avesse conferito alcun beneficio, si sarebbe diffuso, qualora l’avesse fatto, molto lentamente in una popolazione e non sarebbe mai diventato comune, oppure lo sarebbe diventato solo dopo un periodo di tempo molto lungo. D’altro canto, se un aplotipo contiene un allele che conferisce un beneficio, sia l’aplotipo sia l’allele tenderanno a diventare più comuni nella popolazione, a causa di una selezione positiva. Una regione che conferisce un vantaggio selettivo può quindi diventare comune molto rapidamente in una popolazione. Il linkage disequilibrium tende a scomparire nel tempo, via via che la ricombinazione elimina gli aplotipi dal blocco, quindi un blocco di aplotipi grande e comune contiene probabilmente al suo interno una mutazione di origine recente, che è sottoposta a selezione positiva nella popolazione. I blocchi di aplotipi grandi e comuni che gli scienziati hanno individuato hanno presumibilmente subìto una selezione positiva recente in una o più delle popolazioni analizzate. I ricercatori hanno quindi cercato di individuare quale gene o quali geni fossero presenti in questa regione di DNA nei blocchi di aplotipi che avevano identificato. Poiché ciascun aplotipo corrisponde a una regione che contiene, in media, circa un milione di coppie di basi, in ciascuno dei blocchi sarà generalmente presente un certo numero di geni che codificano per proteine. I ricercatori hanno tentato di identificare nella regione il gene o i

Genomica funzionale e comparativa

217

Focus sul genoma Il progetto genoma dell’uomo di Neandertal Il nostro parente più stretto era l’uomo di Neandertal, ora estinto da circa 28 000 anni. Evidenze fossili suggeriscono che l’uomo moderno e l’uomo di Neandertal siano coesistiti per un certo periodo di tempo. Circa 50 000 anni fa, i Neandertal hanno compiuto un notevole progresso culturale: i reperti archeologici mostrano che facevano largo uso di simboli, e che la loro cultura in Europa, Africa e Australasia era diventata più complessa. Sarebbe affascinante sapere quanto il loro genoma fosse simile al nostro, e se durante la loro storia i due gruppi si siano mescolati. Questo sta diventando possibile grazie a tecniche genomiche sempre più sensibili. Una piccola parte dei resti dei Neandertal contiene ancora DNA, anche se questo è estremamente degradato. Un campione, rinvenuto nella caverna di Vindija, in Croazia, di circa 38 000 anni fa, conteneva ancora abbastanza DNA da permettere agli scienziati di sequenziare più di 1 milione di coppie di basi del DNA dell’uomo di Neandertal. Data la sensibilità delle tecniche utilizzate, i ricercatori hanno dovuto esaminare i loro dati con la massima attenzione, per rimuovere il DNA umano contaminante derivato dagli archeologi e dagli stessi ricercatori, e per tener conto della degradazione del DNA. Infatti, come appreso nel Capitolo 7, il DNA tende a subire reazioni di deamminazione. Nelle cellule viventi queste vengono per la maggior parte riparate, perché queste reazioni creano basi non rappresentate nel DNA. Una volta che la cellula è morta, la deamminazione della citosina, che produce uracile, non è più riparabile, e causerà errori nella reazione di sequenziamento, nella quale la C deaminata verrà interpretata come una T.

geni che potrebbero essere stati il bersaglio della selezione positiva. In alcuni casi, questo è stato relativamente semplice. Per esempio, nella popolazione europea, una delle regioni candidate conteneva il gene per l’enzima lattasi. Questo enzima scinde gli zuccheri del latte nell’intestino e, normalmente, nei mammiferi adulti non viene trascritto né tradotto. Numerose popolazioni umane, compresa la maggior parte delle popolazioni europee, hanno utilizzato nell’alimentazione il latte di bestiame addomesticato, e consumano latticini fino all’età adulta. Una persona priva di lattasi attiva è intollerante al lattosio, e si sentirà male dopo aver ingerito latte o i suoi derivati. In una popolazione nella quale non vi è consumo di latticini, non c’è nessun vantaggio associato a una mutazione che permette alla lattasi di essere espressa durante tutta la vita, mentre in una cultura dove è presente bestiame addomesticato, questa mutazione permetterà al

Nonostante la maggior parte dei frammenti isolati fosse molto corta, con una lunghezza media di sole 60-200 coppie di basi, gli scienziati sono stati in grado di confrontare le sequenze del Neandertal con quelle dell’uomo e dello scimpanzè. (Come il genoma umano, il genoma dello scimpanzè è stato interamente sequenziato, e gli scimpanzè sono la specie vivente più vicina a quella umana.) Il confronto dei tre genomi ha permesso di stimare quanto tempo fa sia avvenuta la divergenza fra di noi e i nostri parenti Neandertal. La maggior parte dei modelli ha suggerito che la divergenza fosse avvenuta circa 0,5 milioni di anni fa, con i Neandertal molto più simili a noi di quanto l’uomo e il Neandertal siano entrambi vicini agli scimpanzè. Un altro gruppo è riuscito a clonare e studiare il gene FOXP2, che ha un ruolo nella capacità di parlare. Gli scimpanzè e l’uomo differiscono solo per due amminoacidi nelle proteine FOXP2, ma questa è una differenza importante – difetti in questo gene provocano profonde difficoltà di parola e nel linguaggio. Un gruppo di scienziati ha sequenziato il gene FOXP2 dal DNA di Neandertal e ha trovato che esso era identico al nostro e diverso da quello dello scimpanzè, quindi è possibile che i Neandertal siano stati in grado di parlare un linguaggio più complesso di quanto immaginiamo. Altri scienziati hanno analizzato sia il DNA umano sia quello di Neandertal per stimare quanto sia “pulita” la divisione fra le due specie, ma i risultati non sono chiari. Alcuni studi suggeriscono che ci sia stato un mescolamento minimo, mentre altri hanno suggerito che vi sia stata una certa introgressione (trasferimento di geni attraverso le barriere delle specie).

portatore di avere accesso a una nuova fonte di cibo. Quindi, questa regione ha probabilmente subìto una selezione recente, associata ai cambiamenti di espressione del gene per la lattasi. Sono stati identificati numerosi altri blocchi di aplotipi soggetti a selezione, e molti contenevano geni con un possibile ruolo nell’olfatto, nella spermatogenesi, nello sviluppo dei gameti e nella fecondazione. Altri studi, che hanno confrontato i genomi dell’uomo e dello scimpanzè, hanno dimostrato che tutte queste classi di geni sono bersagli della selezione. Lo studio ha anche identificato altri grandi blocchi di aplotipi comuni negli europei e contenenti geni che hanno un ruolo nella regolazione del colore della pelle e degli occhi. Uno dei blocchi di aplotipi così individuati è associato all’allele per gli occhi blu discusso nel Focus sul genoma del Capitolo 8. Questo è presumibilmente correlato alla perdita selettiva della

218

Capitolo 9

pigmentazione normale via via che l’uomo si diffondeva in Europa. È stato anche scoperto che un blocco di aplotipi contenente un gene per il metabolismo dello zucchero mannosio ha subìto una selezione recente nelle popolazioni yoruba, mentre altri blocchi di aplotipi sottoposti a selezione positiva nelle popolazioni asiatiche contengono geni che codificano per proteine implicate nel metabolismo del saccarosio. Anche aplotipi contenenti geni dei citocromi, che codificano per proteine coinvolte nella detossificazione di varie sostanze chimiche, hanno subìto una selezione recente in particolari popolazioni. Si può presumere che questi cambiamenti riflettano pressioni selettive, imposte probabilmente da differenze nella dieta, nei diversi gruppi. Questa analisi e altre simili ci aiuteranno a identificare i cambiamenti genetici che sono stati fondamentali nell’adattamento dell’uomo (o di qualunque altro organismo per il quale sia disponibile una mappa degli aplotipi). Potremo cercare mutazioni che hanno conferito nel passato resistenza a malattie epidemiche, come la peste o la febbre tifoidea. Potremo anche cercare le mutazioni che ci hanno permesso l’addomesticazione e la modifica di animali e piante coltivate. Per esempio, potremo usare la mappa degli aplotipi bovini (mucche) per individuare le mutazioni che hanno aumentato la produzione di latte, o le mappe degli aplotipi del riso o del grano per identificare le mutazioni che hanno aumentato la produttività durante l’addomesticazione di queste piante. Caratterizzazione di amplificazioni e delezioni geniche nel cancro con l’uso di microarray a DNA Nelle cellule tumorali il genoma tende a divenire instabile e accumula numerose mutazioni. Queste mutazioni possono avvenire a livello di una singola coppia di basi, creando una mutazione puntiforme, o possono cambiare il numero di copie di un gene, una parte di un gene, o un frammento più grande del cromosoma. Fra i cambiamenti del numero di copie sono comuni le delezioni e le duplicazioni, sia in regioni casuali del genoma, sia in aree contenenti geni (vedi Capitolo 16). La crescita e la divisione cellulare sono regolate da geni particolari, e un’alterazione del numero di copie di questi geni può stimolare una cellula ad andare incontro a un processo incontrollato di crescita e divisione, una caratteristica del cancro (vedi Capitolo 20). Per esempio, se un gene codifica per un polipeptide con la funzione di rallentare la divisione cellulare, la delezione di questo gene può conferire a una cellula tumorale un vantaggio in termini di crescita. Al contrario, se un gene codifica per un polipeptide che promuove la divisione cellulare, la duplicazione o la maggiore amplificazione di quel gene, con l’aumento corrispondente nella quantità di proteina da esso prodotta, potrebbero permettere alla cellula tumorale di crescere più rapidamente delle cellule vicine.

Michael Wigler e Robert Lucito hanno sviluppato un metodo per identificare la variazione del numero di copie geniche. Il metodo, chiamato Representational Oligonucleotide Microarray Analysis o ROMA (letteralmente, analisi microarray con oligonucleotidi rappresentativi), è un approccio di genomica comparativa nel quale vengono confrontati interi genomi (ed è simile al test CNV che verrà descritto nel Capitolo 11). La Figura 9.9 mostra l’uso della tecnica ROMA per identificare geni con numero di copie alterato in cellule tumorali. DNA genomico isolato da biopsie di tessuto tumorale viene digerito con un enzima di restrizione, come BglII, che lascia estremità sporgenti a singolo filamento (Capitolo 8). A ciascuna estremità di tutti i frammenti di restrizione viene ligato un adattatore a singolo filamento (si veda il riquadro della Figura 9.9), disegnato in modo che una sequenza a un’estremità dell’adattatore sia complementare alla sequenza a singolo filamento sporgente dai frammenti di restrizione. Il resto dell’adattatore è una sequenza complementare a un primer disegnato per amplificare il frammento di restrizione mediante PCR. Quindi, aggiungendo la stessa sequenza dell’adattatore alle due estremità di ciascun frammento di restrizione, è possibile amplificare tutti i frammenti di restrizione nella miscela di reazione usando lo stesso primer. Durante la fase di amplificazione della PCR, i frammenti di restrizione vengono marcati con il Cy5 (rosso), per ottenere il DNA bersaglio marcato per l’analisi con i microarray. Come controllo, dallo stesso individuo viene prelevato un campione di tessuto normale (non-tumorale) che viene trattato nello stesso modo, tranne per il fatto che in questo caso i frammenti di restrizione amplificati vengono marcati con il Cy3 (verde). I due DNA marcati vengono poi mescolati e utilizzati per l’ibridazione di un microarray a DNA contenente sonde oligonucleotidiche (della lunghezza di circa 70 nucleotidi) che rappresentano migliaia di geni umani singoli (Figura 9.9). Come descritto prima per l’analisi dei microarray a DNA, i DNA marcati si appaiano alle sonde oligonucleotidiche non marcate alle quali sono complementari. I microarray a DNA vengono quindi analizzati con un laser, e la marcatura con Cy5 e Cy3 viene quantificata. I risultati indicano se si sono verificati cambiamenti nel numero di copie geniche nel tumore (Figura 9.9). Se, cioè, una posizione del microarray è gialla, i DNA marcati con Cy5 e Cy3 si sono legati in uguale misura, e ciò significa che il numero di copie di quel particolare gene, rappresentato dalla sonda oligonucleotidica, non è cambiato nel tumore. Una posizione rossa indica che in quella sede si è legato più DNA marcato con Cy5 (tumore) che con Cy3 (controllo), quindi il numero di copie del gene rappresentato dalla sonda è aumentato nel tumore. Se infine la posizione è verde, si sarà legato più DNA marcato con Cy3 (controllo) che con

219

Genomica funzionale e comparativa Biopsia

Amplificazione di un frammento di restrizione mediante PCR Estremità sporgente 5¢

3¢ 3¢

5¢ Aggiunta dell’adattatore

Cellule tumorali

Cellule normali

Estrazione del DNA genomico

Estremità sporgente Adattatore



3¢ 5¢

3¢ Sequenza complementare al primer per la PCR

Appaiamento con l’estremità sporgente del frammento di restrizione

Denaturazione del DNA e appaiamento del primer

Adattatore

Digestione con BglII



5¢ Estensione in PCR PCR primer Amplificazione in PCR e marcatura dei frammenti di restrizione (vedi riquadro)









PCR primer Estensione in PCR





Amplificazione mediante PCR del frammento di restrizione Frammenti di restrizione delle cellule tumorali marcati con Cy5 (rosso)

Frammenti di restrizione delle cellule normali marcati con Cy3 (verde)

I DNA marcati vengono mescolati e usati per ibridare microarray a DNA contenenti sonde per migliaia di geni

Ingrandimento di una parte del microarray a DNA

Gene deleto nelle cellule tumorali Gene con lo stesso numero di copie nelle cellule tumorali e di controllo Gene amplificato nelle cellule tumorali

Figura 9.9 Caratterizzazione dei geni amplificati e deleti in cellule tumorali mediante la tecnica ROMA (Representational Oligonucleotide Microarray Analysis).

Cy5 (tumore), indicando che nel tumore il numero di copie del gene rappresentato dalla sonda è diminuito. Per riassumere, la tecnica ROMA può mostrare se particolari geni siano duplicati e/o amplificati in un numero di copie più alto del normale in un determinato tipo di tumore. I geni così identificati possono quindi essere studiati in maggiore dettaglio, per capire meglio i meccanismi molecolari alla base del cancro. Inoltre, i geni con un numero di copie alterato così identificati sono bersagli potenziali per lo sviluppo di nuove procedure diagnostiche e di terapie specifiche.

Identificazione di un virus in un’infezione virale con l’uso di microarray a DNA Un’ampia varietà di virus è causa di infezioni nell’uomo e negli animali. In alcuni casi, è facile individuare il tipo di virus che causa l’infezione in base ai sintomi, ma per molti virus tale identificazione è complicata. Recentemente, Joseph DeRisi ha sviluppato un approccio di genomica comparativa basato sui microarray a DNA per rendere semplice ed efficiente l’identificazione dei virus. La chiave per il processo di identificazione dei virus è un microarray a DNA chiamato Virochip, che contiene sonde oligonucleotidiche per circa 20 000 geni che

220

Capitolo 9

rappresentano i numerosi virus dei quali sono stati sequenziati i genomi. Questi comprendono virus che conosciamo bene, come quelli che causano l’herpes, la varicella, il vaiolo, le verruche, e molti, molti altri. Quando un paziente ha una malattia virale che non può essere diagnosticata facilmente, viene raccolto dal tessuto infetto il muco, o un altro fluido corporeo nel quale si possono trovare cellule contenenti il virus. Dal campione viene isolato l’RNA messaggero, e si usa la trascrittasi inversa per sintetizzare copie di cDNA dell’mRNA. Alcuni degli RNA saranno di origine virale, e alcuni saranno derivati dalla cellula ospite. Utilizzando nella trascrizione inversa un dNTP precursore marcato con Cy5 o con Cy3, si otterranno cDNA fluorescenti. Questi DNA bersaglio marcati verranno quindi utilizzati per l’ibridazione con il Virochip. Se il virus che ha causato l’infezione è noto, il DNA bersaglio si appaierà con una o più sonde sul Virochip; l’ibridazione verrà rilevata con l’analisi laser, come descritto in precedenza per l’analisi dei microarray a DNA. La sede del segnale, o dei segnali, fluorescenti indica quale o quali virus sono coinvolti nell’infezione. Subito dopo il suo sviluppo, il Virochip è stato usato per caratterizzare una nuova infezione. Nel 2003 l’Organizzazione Mondiale della Sanità dichiarò lo stato di allarme per una nuova malattia, la SARS (Sudden Acute Respiratory Syndrome, o sindrome respiratoria acuta grave), un’infezione umana potenzialmente fatale. Dopo soli 7 giorni, campioni provenienti da pazienti infettati vennero analizzati usando il Virochip, e il giorno successivo i ricercatori determinarono che i pazienti con la SARS erano infettati da un nuovo coronavirus. Le sequenze diagnostiche per questo particolare virus non erano presenti sul Virochip, ma il DNA bersaglio marcato preparato dalle cellule infettate ibridava sonde di coronavirus noti presenti sul Virochip. Quando gli scienziati confrontarono le sequenze alle quali ibridavano le sequenze SARS, riuscirono a ricostruire una parte della sequenza del virus determinando le somiglianze con le sequenze oligonucleotidiche sul Virochip. Questo dimostra lo straordinario potere diagnostico del Virochip: è possibile identificare in maniera rapida e accurata un’infezio-

Nota chiave La genomica comparativa consiste nel confronto di interi genomi di specie diverse, con lo scopo di aumentare la nostra capacità di comprensione delle sequenze geniche e non geniche di ciascun genoma e i loro rapporti evolutivi. L’analisi genomica comparativa può definire geni che evolvono rapidamente o geni che hanno subìto cambiamenti nel corso di una malattia.

ne causata da un virus noto, o determinare l’identità di un nuovo virus (a patto che sia correlato a virus noti). Analisi metagenomica La metagenomica (chiamata anche genomica ambientale) è un settore della genomica comparativa che prevede l’analisi dei genomi in intere comunità microbiche isolate dall’ambiente. Si tratta essenzialmente di un’estensione dell’analisi genomica dell’individuo a popolazioni miste di microbi, evitando di dover isolare e coltivare individualmente le diverse specie per analizzarle. In verità, noi non conosciamo le condizioni di crescita in laboratorio per molte specie microbiche e, quindi, l’analisi metagenomica permette l’identificazione e la caratterizzazione di nuove specie. Nell’analisi metagenomica basata sulla sequenza, viene raccolto un campione ambientale e il DNA viene isolato direttamente dal campione stesso. Questo DNA sarà derivato da tutti i microrganismi presenti nel campione, compresi batteri, virus, protisti e funghi. Il DNA viene poi clonato e sottoposto a sequenziamento casuale diretto (vedi Capitolo 8). Le sequenze vengono assemblate (vedi Capitolo 8) e, dopo il sequenziamento e l’allineamento, ciascun organismo microbico o virus dovrebbe essere rappresentato da una o più sequenze riassemblate. Come è possibile ottenere questo risultato partendo da una popolazione mista? Si ricordi che la tecnica di sequenziamento casuale diretto, descritta nel Capitolo 8, impiega algoritmi informatici complessi per ricostruire sequenze cromosomiche da piccoli frammenti di sequenza di un singolo genoma. Questi stessi algoritmi sono in grado di distinguere i diversi genomi, dato che è improbabile che il DNA dell’organismo A abbia una lunga serie di basi che corrisponde perfettamente alle basi del DNA dell’organismo B. Ci potranno essere brevi regioni di corrispondenza quasi perfetta, ma si può fare in modo che l’algoritmo richieda regioni di allineamento perfetto più lunghe di quanto si trovi normalmente fra specie diverse. Ognuna delle sequenze assemblate può quindi essere confrontata con le sequenze di DNA nelle banche dati. In questo caso, lo scopo è trovare l’omologia migliore (o le omologie migliori) nella banca dati, il che ci può aiutare a identificare gli organismi presenti nel nostro campione, o le specie più vicine a essi. Un altro tipo di analisi metagenomica è basato sulla funzione. In questo caso, i ricercatori analizzano il DNA estratto dal campione ambientale alla ricerca di geni con funzioni biologiche specifiche, come la produzione di antibiotici. Utilizzando l’analisi metagenomica basata sulla funzione sono stati già scoperti nuovi antibiotici. Un’altra area dell’analisi metagenomica è focalizzata sul microbioma dell’intestino umano. Un microbioma è la comunità di microrganismi che si trova in un particolare ambiente. In questo caso, l’ambiente è l’intestino umano. È stato recentemente istituito un “progetto

Genomica funzionale e comparativa

microbioma umano”, con lo scopo di caratterizzare il microbioma umano, di comprendere come cambia con lo stato di salute dell’ospite umano e di determinare quanta variazione esiste fra individui e popolazioni umane. In uno studio che si è occupato di batteri, è stato raccolto DNA dai microbiomi intestinali di due volontari sani. Il DNA è stato raccolto dal materiale fecale, poiché la maggior parte dei batteri che si trovano nell’intestino crasso sarà presente anche nelle feci. L’analisi dei batteri non prevedeva di coltivarli in laboratorio, dal momento che sappiamo che molti dei batteri del nostro intestino non sopravviverebbero nelle condizioni di laboratorio. Il DNA è stato invece sequenziato direttamente. (La tecnica di sequenziamento scelta di solito per questo tipo di studi è il pirosequenziamento [vedi Capitolo 8], perché non richiede la coltura dei batteri come gli altri metodi.) Utilizzando come stampo il DNA del microbioma intestinale, sono state ottenute più di 100 milioni di basi di sequenza di DNA, che sono state analizzate usando gli algoritmi sviluppati per il sequenziamento casuale diretto. Le sequenze assemblate (si trattava generalmente solo di parti dei genomi, non di genomi interi) venivano infine confrontate con le banche dati. I ricercatori hanno potuto dedurre che circa i due terzi delle sequenze assemblate contenevano DNA da membri del dominio batterico, mentre circa il 3% delle sequenze assemblate contenevano DNA dal dominio degli Archaea, e il rimanente non poteva essere identificato con chiarezza. Nei campioni erano abbondanti due abitanti ben caratterizzati dell’intestino umano, il batterio Bifidobacterium longum e l’archeobatterio Methanobrevibacter smithii. Per capire come i microbi dell’intestino siano correlati ad altri organismi noti, sono stati amplificati dal DNA dell’intestino, mediante PCR, i geni che codificano per l’rRNA 16S (l’RNA ribosomale che si trova nella subunità minore del ribosoma; vedi Capitolo 6), e i frammenti di DNA ottenuti sono stati sequenziati. I geni che codificano per gli rRNA vengono utilizzati spesso per studiare i rapporti evolutivi, poiché i ribosomi vengono prodotti da tutti gli organismi e alcune regioni degli rRNA subiscono un cambiamento genetico nel tempo (il che ci permette di confrontarle), mentre altre regioni sono essenzialmente identiche in tutti gli organismi. Quest’ultima caratteristica rende facile amplificare i geni con la PCR. Se confrontiamo le sequenze dell’rRNA 16S di due specie, e queste due sequenze sono molto simili, è probabile che gli organismi abbiano un antenato comune recente. Al contrario, se le due regioni mostrano differenze interne significative, ciò vuol dire che si sono separate l’una dall’altra molto tempo fa, e il loro antenato comune è più lontano nel passato. L’analisi dei geni per l’rRNA 16S, effettuata sul DNA genomico dei campioni intestinali, ha permesso di identificare 72 tipi distinti di sequenze batteriche e un unico tipo di sequenza di Archaea. La sequenza di Archaea corrispondeva alla sequenza dell’rRNA 16S di

221

Methanobrevibacter smithii e quindi, presumibilmente, era derivata da questa specie o da una specie vicina. Solo 12 delle 72 sequenze batteriche corrispondevano a organismi che erano stati coltivati in laboratorio, mentre 16 erano uniche e rappresentavano probabilmente specie non caratterizzate in precedenza. L’analisi in PCR aveva identificato altri 79 tipi di sequenze. L’analisi statistica suggeriva che nei campioni di feci fosse presente un minimo di 300 specie di batteri. L’analisi dei due campioni non era stata sufficientemente completa da permettere di determinare esattamente quanto fossero simili i due microbiomi intestinali, ma era stata comunque notata una sovrapposizione significativa fra le sequenze. Le sequenze di DNA ottenute dai microbiomi intestinali sono state sottoposte a ulteriori analisi per identificare ORF, cioè potenziali geni che codificano per proteine. Si ricordi dal Capitolo 8 che il genoma umano ha meno geni di quanto la maggior parte degli scienziati avesse previsto. Una spiegazione parziale di questo risultato è che molti batteri dell’intestino umano sono ospiti benefici, piuttosto che dannosi, e sintetizzano alcune sostanze chimiche che noi assorbiamo e utilizziamo, comprese alcune vitamine. Le interazioni fra noi e i nostri partner batterici sono più complesse di quanto possiamo attualmente capire. Sappiamo che persone prive dei microbi intestinali normali hanno alcuni difetti per quanto riguarda la funzione del sistema immunitario e la guarigione delle ferite, anche se le cause precise di questo fenomeno non sono ancora pienamente comprese. Tuttavia, sulla base di altre interazioni fra di noi e i nostri microbiomi intestinali, la spiegazione più plausibile sembra comunque che in queste persone manchino alcune molecole normalmente fornite dai batteri dell’intestino. Quando le ORF ottenute dalle sequenze del microbioma sono state confrontate con geni a funzione nota, gli scienziati hanno trovato che il microbioma intestinale era arricchito in modo significativo in geni codificanti per enzimi coinvolti nel trasporto e nel metabolismo di carboidrati, amminoacidi, nucleotidi e coenzimi, in confronto all’abbondanza di questi geni nelle banche dati. Inoltre, il microbioma intestinale era arricchito in geni codificanti per

Nota chiave La metagenomica, un settore della genomica comparativa, è l’analisi dei genomi di intere comunità. Al centro della metagenomica si trova il sequenziamento casuale diretto. La metagenomica può essere utilizzata per comprendere i complessi rapporti fra organismi nell’ambiente, come catalogare i microbi e i virus in un posto particolare, o identificare un agente patogeno.

222

Capitolo 9

questi enzimi anche rispetto al genoma umano. Presumibilmente, il nostro microbioma è arricchito in queste attività enzimatiche perché i batteri dotati di queste capacità sono benefici per i loro ospiti, ed è inoltre pro-

babile che abbiamo perso alcuni geni che codificano per queste attività enzimatiche via via che siamo diventati sempre più dipendenti dal nostro microbioma per alcuni compiti enzimatici che questo completa al posto nostro.

Sommario l Lo scopo della genomica funzionale è descrivere una (o più) funzioni per ogni gene trovato nel genoma di un organismo, incluso il profilo di espressione di ciascun gene e la sua regolazione. La genomica funzionale prevede analisi molecolari in laboratorio e analisi al computer (chiamate anche bioinformatica). l Per assegnare una funzione a un gene mediante l’analisi bioinformatica, la sequenza di un gene sconosciuto di un organismo viene confrontata con le sequenze di geni già caratterizzati, identificati in un’ampia varietà di organismi ben studiati, per individuare una somiglianza fra il gene ignoto e uno con funzione nota. l Un approccio chiave per assegnare sperimentalmente una funzione genica è di eliminare (knock-out) o ridurre (knockdown) la funzione di un gene, e poi determinare quali cambiamenti fenotipici ne risultano. I knock-out genici sono cambiamenti permanenti nelle copie cromosomiche del gene bersaglio, ottenute di solito attraverso la sostituzione del gene normale con una copia non funzionante (tecnica utilizzata in molti organismi), oppure inserendo nel gene un trasposone (tecnica utilizzata di solito nei batteri). I knockdown genici non prevedono un cambiamento permanente del gene bersaglio. Piuttosto, viene invece utilizzata l’interferenza dell’RNA per ridurre il livello dell’mRNA codificato dal gene bersaglio. l Il trascrittoma è il set completo di trascritti di mRNA in una cellula, e lo studio del trascrittoma è la trascrittomica. Il trascrittoma cambia a seconda dello stato della cellula, quindi attraverso la determinazione quantitativa del trascrittoma si può ottenere una comprensione della funzione cellulare a livello globale. Il trascrittoma viene di solito studiato con i microarray a DNA. Questa tecnica permette ai ricercatori di analizzare in una volta sola il profilo di espressione di migliaia di geni. l Il proteoma è il set completo di proteine in una cellula, e lo studio del proteoma è la proteomica. La proteomica cerca non solo di identificare e catalogare tutte le proteine del pro-

teoma, ma anche di capire la funzione di ciascuna proteina, e di caratterizzare come varia il proteoma in tipi cellulari diversi e in differenti stadi di sviluppo. Poiché le proteine determinano il fenotipo di una cellula, lo studio del proteoma fornisce molte più informazioni sulla funzione cellulare a livello globale rispetto allo studio del trascrittoma. l La genomica comparativa prevede il confronto di interi genomi (o parti di genomi) di individui o specie diversi. Il fine della genomica comparativa è di aumentare la nostra capacità di comprendere tutte le parti del genoma, comprese le varie funzioni delle sequenze non codificanti e delle regioni del genoma che codificano per RNA o proteine, informazioni che possono essere utilizzate in molti modi. In tutti i casi, due o più genomi vengono confrontati per individuare differenze sottili o più esplicite. La genomica comparativa può anche aiutare i ricercatori a capire meglio i rapporti evolutivi, poiché tutti i genomi attuali si sono evoluti da genomi ancestrali comuni. Questo tipo di confronto può essere usato per individuare geni peculiari di una specie, per individuare geni che sono cambiati da quando due popolazioni si sono separate, per determinare i cambiamenti nel trascrittoma di cellule mutate, o per individuare mutazioni in geni specifici, e anche per identificare un agente infettivo quando la diagnostica normalmente disponibile non è sufficiente. La genomica comparativa è importante per gli studi del genoma umano, dal momento che la sperimentazione diretta sull’uomo non è accettabile dal punto di vista etico, quindi ottenere informazioni su un gene in organismi strettamente correlati può dare ai ricercatori indicazioni sulla funzione del gene equivalente nell’uomo. l L’analisi metagenomica è un ramo della genomica comparativa che non confronta fra di loro unicamente due organismi, ma analizza invece intere comunità di microbi o virus. In questo approccio, tutti i diversi tipi di microbi e virus in una particolare comunità vengono identificati dalla presenza di particolari sequenze geniche in un campione di DNA isolato dalla stessa comunità.

Approccio analitico alla soluzione di problemi di genetica 10D9.1 Una mutazione da A a G a livello di un sito precedentemente non polimorfico (x) produce due alleli SNP, xA e xG. La Figura 9.A rappresenta il blocco di aplotipi nel quale è comparsa la mutazione xG. Nella Figura, la dimensione degli

aG bT

cA

d C eA f G

gT hC i A x G j A

kT

aplotipi nella popolazione è rappresentata da segmenti bianchi e neri, gli SNP sono rappresentati da lettere, e gli esponenti degli SNP indicano i nucleotidi presenti nel blocco di aplotipi nel quale si è verificata la mutazione xG.

l G mC n G

oT

pG

qG

rA

Figura 9.A

Genomica funzionale e comparativa a. Spiegate se vi attendete di trovare un aplotipo hC iA xA jA kT nella popolazione in un momento vicino a quello nel quale si è verificata la mutazione xG. Se sì, è atteso che sia sempre associato all’aplotipo dC eA f G gT? b. Il primo individuo con un allele xG lo trasmette a quattro dei suoi figli. Se in nessuna delle sue meiosi si è realizzata una ricombinazione entro il blocco di aplotipi mostrato nella Figura, quale aplotipo riceveranno da lui questi figli? c. Assumete che, nel tempo, il tasso di ricombinazione vicino a x sia basso e costante. Dopo un piccolo numero di generazioni (diciamo da 10 a 20), una serie di eventi casuali determina un aumento della frequenza dell’allele xG, che si trova adesso nel 2% della popolazione. Quali SNP vi attendete che mostrino il livello maggiore di linkage disequilibrium con xG? d. Spiegate come cambieranno le dimensioni della regione che mostra linkage disequilibrium con xG in ciascuna delle situazioni seguenti. I. In molte generazioni, la frequenza di xG aumenta al 40% per effetto del caso. II. In un numero di generazioni relativamente piccolo, la frequenza di xG aumenta al 40% per effetto della selezione positiva. R9.1 Questo problema permette di verificare se avete capito come vengono identificati cambiamenti recenti nel genoma umano. Esso vi chiede di capire la differenza fra un aplotipo – un set di alleli SNP specifici a livello di particolari loci SNP che si trovano vicini in una piccola regione di un cromosoma – e un blocco di aplotipi – un set di aplotipi vicini presenti in un individuo. Gli aplotipi sono dovuti al fatto che, entro una piccola regione cromosomica, la ricombinazione è rara. In una popolazione non sono presenti tutte le combinazioni possibili di alleli differenti posizionati in loci vicini, quindi due (o più) individui possono avere un segmento di cromosoma con lo stesso set di alleli SNP. In quel segmento, questi due individui condividono un aplotipo. Si consideri ora il set di alleli SNP presenti in un segmento adiacente in ciascun individuo. Se questi differiscono, i due individui hanno aplotipi diversi nei segmenti vicini – quindi hanno blocchi di aplotipi diversi. Tuttavia, ciascuno dei due aplotipi nel segmento vicino può comunque essere identificato in altri individui della popolazione. Il problema richiede di riflettere su quello che avviene quando, in un blocco di aplotipi esistente, si verifica una nuova mutazione. Poiché il tasso di ricombinazione entro un blocco di aplotipi è basso, la nuova mutazione tenderà a essere trasmessa insieme al blocco di aplotipi nel quale ha avuto origine, cioè la ricombinazione la separerà dal blocco di aplotipi solo con bassa frequenza. A livello di popolazione, questo determinerà linkage disequilibrium – la condizione nella quale alleli specifici di due o più geni tendono a trovarsi insieme con una frequenza maggiore di quanto atteso in base al caso. Il linkage disequilibrium sarà più forte nella regione più vicina alla nuova mutazione, e si manterrà per molte generazioni. Nel corso del tempo, comunque, il linkage disequilibrium diminuirà, via via che la ricombinazione separerà gradualmente l’allele mutante da alleli specifici in loci vicini. a. Il problema indica che il polimorfismo a livello del sito x è il risultato del cambiamento da A a G introdotto dalla mu-

223

tazione. Possiamo quindi dedurre che, prima che si verificasse la mutazione, nella popolazione fosse presente solo l’allele xA. La figura mostra che gli alleli hC, iA, jA, e kT appartengono a un aplotipo presente nella popolazione; quindi, prima che la mutazione introducesse un polimorfismo nel sito x, l’allele xA deve aver fatto parte di quell’aplotipo. Quindi, l’aplotipo hC iA xA jA kT fa parte del blocco di aplotipi nel quale si è verificata la mutazione xG, e si troverà nella popolazione. La figura indica che il blocco di aplotipi in questa regione cromosomica consiste in una serie di quattro aplotipi vicini. Possiamo quindi dedurre che, quando sono stati determinati gli alleli dei loci di questo blocco di aplotipi in una popolazione di individui, un set di specifici alleli dei loci di un aplotipo fossero associati gli uni agli altri, ma quel set di alleli non era sempre associato a un set specifico di alleli dei loci di aplotipi adiacenti. Quindi, anche se gli alleli hC iA xA jA kT e dC eA fG gT erano associati in un individuo, gli alleli hC iA xA jA kT potevano essere associati con un set differente di alleli ai loci d, e, f, e g in un individuo diverso. b. La figura indica che l’uomo con la mutazione xG originaria ha l’aplotipo aG bT cA dC eA fG gT hC iA xG jA kT lG mC nG oT pG qG rA. Poiché non si ha ricombinazione nella regione del blocco di aplotipi, i quattro figli che ricevono l’allele xG hanno anche ricevuto questo aplotipo. c. Durante un periodo di tempo corrispondente a un numero di generazioni relativamente basso, solo raramente la ricombinazione separerà xG dagli alleli dei loci vicini. Di conseguenza, più un locus è vicino a xG, maggiore sarà il livello di linkage disequilibrium fra uno specifico allele di quel locus e xG. Gli alleli hC, iA, jA e kT dovrebbero quindi mostrare i livelli maggiori di linkage disequilibrium con xG. Anche se ci si aspetta che il linkage disequilibrium diminuisca con l’aumentare della distanza di un locus da xG, esso può essere presente in un blocco di aplotipi se non è passato un tempo sufficiente perché la ricombinazione separi xG dai loci adiacenti. Questa è la ragione per la quale un blocco di aplotipi grande è quasi certamente di origine recente. d. I. Via via che, nel corso di molte generazioni, la frequenza di xG aumenta nella popolazione, il cromosoma che contiene xG avrà molte opportunità di ricombinare con altri cromosomi aventi aplotipi diversi. Mentre la ricombinazione separa xG dagli alleli dei loci più vicini, si avrà una diminuzione delle dimensioni della regione che ha un linkage disequilibrium significativo con xG. Solo gli alleli dei loci più vicini a xG mostreranno linkage disequilibrium, che potrà non essere elevato. II. Se xG conferisce un vantaggio che determina una selezione positiva per l’allele stesso nella popolazione, la sua frequenza potrà aumentare più rapidamente di quanto la ricombinazione locale possa ridurre il range di linkage disequilibrium fra xG e alleli specifici di loci vicini. In questo caso, un blocco di aplotipi grande rimarrà associato alla nuova mutazione. Questo è il motivo per il quale la ricerca di blocchi di aplotipi di grandi dimensioni può permettere di identificare regioni che hanno subìto selezione positiva in un recente passato.

10

La tecnologia del DNA ricombinante

Quali tipi di vettori sono disponibili per la manipolazione del DNA clonato?

Come possiamo identificare proteine che interagiscono tra loro?

Come si possono mappare siti di restrizione in un frammento di DNA clonato?

Quali tipi di polimorfismi del DNA sono presenti nel genoma?

Come si possono esprimere l’mRNA o la proteina codificata da un gene clonato in una cellula ospite?

Come si possono utilizzare i polimorfismi del DNA nell’analisi genetica e nella diagnosi di malattie?

Come possiamo trovare uno specifico gene in una libreria di DNA?

Che cosa è il fingerprinting del DNA (tipizzazione del DNA) e come viene utilizzato?

Come possiamo confrontare sequenze di DNA genomico?

Come agisce la terapia genica?

Come possiamo determinare se un gene è, o non è, trascritto in un particolare campione?

Come vengono applicate commercialmente nell’industria biotecnologica le tecniche per clonare, amplificare e manipolare il DNA?

Come possiamo determinare l’abbondanza di un particolare RNA in un campione?

Come è possibile ingegnerizzare geneticamente le piante?

Come possiamo utilizzare tecniche molecolari per indurre una mutazione specifica in un gene clonato?

Attività Praticamente ogni giorno è possibile sentir parlare, o leggere un nuovo articolo, riguardo una nuova applicazione della tecnologia del DNA ricombinante. Nella società odierna, infatti, approcci di questo tipo sono ormai largamente diffusi. Gli esempi più frequenti fanno riferimento ad applicazioni nel campo medico o in agricoltura; tuttavia la biotecnologia ha rivoluzionato diversi settori, quali l’antropologia, la tutela ambientale, l’industria e la medicina legale. In questo capitolo conoscerete alcuni utilizzi specifici della tecnologia del DNA ricombinante. Dopo aver letto e studiato questo capitolo potrete applicare ciò che avete appreso nella iAttività, cercando di risolvere un caso di omicidio attraverso lo studio del DNA.

Il campo della genetica è cambiato radicalmente negli anni settanta del secolo scorso, quando sono state sviluppate tecniche che hanno reso possibile ai ricercatori la costruzione di molecole di DNA ricombinante e la loro

amplificazione mediante il clonaggio (vedi Capitolo 8). Questo approccio permette di ottenere grandi quantità del DNA di interesse che può essere purificato e manipolato mediante svariate procedure quali, per esempio, la mappatura, il sequenziamento, la mutagenesi e la trasformazione cellulare. Nei Capitoli 8 e 9 avete appreso come la tecnologia del DNA ricombinante viene utilizzata per lo studio dei genomi. L’impiego della tecnologia del DNA ricombinante per manipolare i geni a scopo di analisi genetica, per la produzione di molecole di interesse medico o industriale o per altre applicazioni viene chiamato ingegneria genetica, e rappresenta il tema di questo capitolo.

Vettori versatili per andare oltre il semplice clonaggio Nel Capitolo 8 abbiamo discusso di clonaggio e di vettori di clonaggio. I vettori considerati in quella sede rappresentano però soltanto una piccola frazione di quelli disponibili, vale a dire quelli specializzati per contenere

226

Capitolo 10

ampi frammenti di DNA evitando il riarrangiamento dell’inserto; inoltre la maggior parte dei vettori utilizzati nei progetti genomici è progettata per replicarsi in un unico ospite, E. coli. Qui considereremo vettori utilizzati in funzioni più complesse: in particolare vettori per mantenere una sequenza clonata in più specie ospiti e vettori per esprimere la proteina codificata da un gene clonato. La maggior parte degli esempi di vettori che descriveremo si basa sui vettori di clonaggio plasmidici ma ne esistono molti altri tipi, tra i quali quelli derivati dai fagi lamba o da altri virus. Vettori di clonaggio plasmidici sono stati sviluppati per un’ampia varietà di organismi procarioti ed eucarioti. Le loro caratteristiche generali sono quelle descritte nel Capitolo 8, sebbene in alcuni casi le sequenze richieste per la replicazione nell’organismo di interesse siano sconosciute e pertanto non si riesca a far replicare i plasmidi nella cellula ospite. Può succedere inoltre che questi vettori si integrino all’interno del genoma ospite, oppure che il gene (o i geni) che essi contengono siano espressi in maniera transiente fino a quando il plasmide viene degradato dagli enzimi cellulari.

Vettori navetta Nel Capitolo 8 abbiamo discusso dei vettori YAC nel lievito. Si ricordi che questi vettori contenevano sequenze necessarie per crescere in E. coli, tra le quali un marcatore batterico per la selezione come ampR e l’origine di replicazione batterica. Tuttavia questi vettori avevano anche sequenze adatte all’utilizzo nel lievito, come le sequenze centromeriche (CEN) per la segregazione durante la mitosi, una sequenza di origine di replicazione (ARS) per la replicazione e uno o più marcatori per la selezione. Un vettore YAC è un esempio di vettore navetta. Un vettore navetta è un vettore che può essere introdotto in due o più organismi ospiti ed essere mantenuto in entrambi gli organismi. Nella maggior parte dei casi uno degli organismi ospiti è E. coli, dal momento che è facile coltivare e manipolare questo batterio in laboratorio. In questo modo un vettore navetta permette ai ricercatori di lavorare con frammenti di DNA ricombinante (per esempio alterando alcune parti del gene) nelle condizioni più semplici possibili (cioè quando E. coli è l’ospite), e successivamente di introdurre il DNA ricombinante in un organismo adatto al lavoro di sperimentazione solo quando le modificazioni al DNA siano state completate e sia stato prodotto un quantitativo abbondante di plasmide ricombinante. Esistono diversi tipi di vettori navetta lievito-E. coli, alcuni dei quali sono in grado di replicarsi nel nucleo fino a un elevato numero di copie; alcuni si replicano liberamente come copie singole nel nucleo, mentre altri si integrano in un cromosoma del lievito e si replicano durante la sua replicazione. Tuttavia, i vettori navetta sono stati ingegnerizzati per essere introdotti in cellule di vari orga-

nismi, incluse quelle di funghi, di mammifero (così come altre cellule animali) e di piante.

Vettori di espressione Un vettore di espressione è un vettore di clonaggio contenente le sequenze regolatrici necessarie per permettere la trascrizione e la traduzione di uno o più geni clonati. I vettori di espressione sono utilizzati per produrre la proteina codificata dal gene clonato all’interno dell’ospite. Per esempio, l’industria biotecnologica produce proteine attive dal punto di vista farmaceutico mediante l’uso di vettori di espressione e di ospiti opportuni. Caratteristiche dei vettori di espressione I vettori di espressione sono derivati dei vettori di clonaggio plasmidici usati nello stesso ospite. La Figura 10.1 mostra un esempio di un vettore di espressione utile per esprimere un gene eucariote in E. coli. In questo caso le caratteristiche aggiuntive rispetto a quelle di vettore di clonaggio per E. coli sono: (1) un promotore a monte del sito di clonaggio multiplo; (2) un terminatore di trascrizione a valle del sito di clonaggio multiplo; (3) una sequenza di DNA codificante la sequenza di Shine-Dalgarno per l’inizio della traduzione (Capitolo 6) collocata fra il promotore e il sito di clonaggio multiplo. Il promotore e il terminatore sono specifici per l’apparato di trascrizione di E. coli. Per produrre una proteina eucariote in E. coli usando tale vettore di espressione, un cDNA derivato dall’mRNA del gene che codifica la proteina viene inserito all’interno del vettore di espressione. Si utilizza un cDNA perché il gene corrispondente avrà probabilmente degli introni che in E. coli non possono essere rimossi dal trascritto. Il cDNA viene prodotto a partire dagli mRNA trascritti dal gene, come descritto nel Capitolo 8. Una strategia per inserire il cDNA all’interno di un vettore per il clonaggio è aggiungere dei linker dotati di siti di restrizione a entrambe le estremità (Capitolo 8 e Figura 8.16). Nel nostro esempio, vengono aggiunti i linker con il sito BamHI, che consentono al cDNA di essere inserito all’interno del sito di restrizione BamHI nel sito di clonaggio multiplo (Figura 10.1). Dopo che il plasmide ricombinante viene trasformato in E. coli, il cDNA viene espresso sotto il controllo del promotore presente sul vettore di espressione. La sequenza di Shine-Dalgarno è aggiunta all’estremità 5′ dell’mRNA e il trascritto risultante può venire tradotto in E. coli. Si ricordi che negli mRNA eucarioti manca la sequenza di Shine-Dalgarno e, senza la sua aggiunta, non può esserci traduzione. La traduzione dà origine al polipeptide codificato dal cDNA clonato. Aspetti pratici per la costruzione di cloni utilizzando i vettori di espressione A prescindere dall’ospite, il punto chiave per esprimere un gene è inserire il gene all’in-

La tecnologia del DNA ricombinante

227

presente nel sito di clonaggio multiplo. In pratica il cDNA digerito BamHI può venire inserito nel vettore con due possibili orientamenti. In quello mostrato nella Figura 10.1 il cDNA è nell’orientamento corretto e di conseguenza la trascrizione produce un mRNA che codifica il polipeptide desiderato. Tuttavia, se il cDNA digerito BamHI si inserisce nel vettore nell’orientamento opposto, l’mRNA trascritto a partire dal promotore sarà complementare all’mRNA corretto. Tale mRNA non coDNA che codifica BamHI per una sequenza KpnI Sal I dificherà più per il polipeptide desiderato. di Shine-Dalgarno Terminatore Come si riesce a distinguere il clone corretto dal clodi trascrizione Promotore ne non corretto? Un metodo consiste nel sequenziare il DNA. Normalmente, i vettori di espressione hanno siti di Sito di clonaggio multiplo legame per primer universali utilizzati per il sequenzia(MCS) mento, fiancheggianti il sito di clonaggio multiplo. Questo consente ai ricercatori di sequenziare l’inserto di DNA del clone riuscendo pertanto a determinarne l’oVettore ori di espressione rientamento. Un approccio alternativo è nimazione l’uso della mappatura Mappatura per restrizione, proper restrizione cedura con la ampR quale si determinano il numero e la posicDNA del gene zione dei siti per uno o più enzimi di reBamHI BamHI di interesse strizione in un frammento di DNA o in un Inserzione del DNA al sito BamHI clone. Il risultato di una mappatura per restrizione è una mappa di restrizione che mostra le collocazioni e le posizioni dei siti di restrizione mappati. La mappatura per BamHI BamHI Promotore restrizione utilizza gli strumenti descritti nel Terminatore Capitolo 8. Vale a dire che il DNA viene digerito da enzimi di restrizione, i frammenti sono sepaInizio della trascrizione rati con un’elettroforesi su gel di agarosio e i profili di migrazione ottenuti e le dimensioni dei frammenti vengono utilizzati per costruire la mappa. Clone di espressione La Figura 10.2 illustra in modo teorico l’utilizzo della mappatura per restrizione per distinguere fra cloni corretti e cloni non corretti. L’esempio è basato sulla Figura ori 10.1. Immaginiamo che il cDNA con i linker BamHI sia lungo 2000 bp, e di sapere da esperimenti di sequenziamento della presenza di un sito di restrizione per AatII a 1800 bp dall’inizio del cDNA. Supponiamo di clonare ampR questo cDNA al sito BamHI nel MCS di un vettore di espressione di 3500 bp che abbia un sito AatII situato a Trasformazione in E. coli 500 bp dal sito BamHI, in senso antiorario. Se il cDNA si Trascrizione del cDNA inserito inserisce con un orientamento corretto cosicché il polipeptide codificato possa essere espresso, avremo il clone Sequenza di Shine-Dalgarno di 5500 bp rappresentato nella parte in basso a sinistra della Figura 10.2. Il clone con l’orientamento opposto non 3¢ mRNA 5¢ corretto è raffigurato nella parte in basso a destra della FiAUG Codone di stop gura 10.2. La digestione mediante AatII dei cloni prodotti La traduzione produce il polipeptide codificato ci permetterebbe di selezionare i cloni per determinare

terno del vettore di espressione cosicché la trascrizione del gene produca la sequenza di mRNA per la proteina desiderata. Nella strategia mostrata nella Figura 10.1 il cDNA è stato inserito all’interno di un vettore di espressione mediante taglio dei siti di restrizione a entrambe le estremità del cDNA con BamHI e inserimento del cDNA digerito all’interno del vettore tagliato nel sito BamHI

dal DNA clonato

Polipeptide

Figura 10.1 Clonaggio in un vettore di espressione.

MyLab

228

Capitolo 10

quali siano quelli corretti per l’espressione del polipeptide. In altre parole, per un clone corretto la digestione di AatII produce due frammenti da 3200 e 2300 bp, mentre per un clone non corretto la digestione con AatII produce due frammenti da 4800 e 700 bp (vedi Figura 10.2). I due risultati alternativi sono chiaramente distinguibili mediante elettroforesi su gel di agarosio. Esistono delle strategie sperimentali per ovviare al problema dell’inserimento del DNA nel vettore in un orientamento sbagliato. Come abbiamo appena visto, se per preparare l’inserto e il vettore viene utilizzato un singolo enzima di restrizione, allora ciascun clone può avere l’inserto in ciascuna delle possibili direzioni. Tuttavia se usiamo due enzimi di restrizione, riusciamo a inserire un frammento di DNA all’interno di un vettore in modo direzionale; vale a dire che con l’approccio basato su due enzimi non può essere prodotto un clone con l’orientamento opposto, non corretto. Ritorniamo a vedere il vettore di espressione mostrato nella Figura 10.1. Vi sono un sito KpnI vicino all’estremità del promotore del sito di clonaggio multiplo e un sito SalI vicino all’estremità del terminatore. Pertanto, se abbiamo creato un cDNA con un sito KpnI aggiunBamHI

Promotore

Figura 10.2 Esempio teorico di una mappatura per restrizione per confermare che è stato costruito un clone plasmidico corretto.

to all’estremità del codone di inizio e un sito SalI all’estremità del codone di stop, quel cDNA può essere inserito all’interno del vettore digerito con KpnI e SalI soltanto in un orientamento corretto per l’espressione del polipeptide. Vale a dire che le due estremità coesive di KpnI possono appaiarsi fra di loro, come quelle di SalI, ma un’estremità coesiva di KpnI non può appaiarsi a una di SalI. Questo approccio di clonaggio viene spesso chiamato clonaggio forzato in quanto “costringiamo” i frammenti a unirsi in un’unica direzione. Esso viene anche definito clonaggio direzionale. Come possiamo sintetizzare tale molecola di cDNA? Si ricordi che, quando usiamo una PCR (Capitolo 9 e Figura 9.3), definiamo le estremità della regione da amplificare quando disegniamo i primer. Pertanto, i siti di restrizione possono essere aggiunti alle estremità del cDNA durante l’amplificazione del DNA (Figura 10.3). Clonando il cDNA come descritto nel Capitolo 8, è possibile determinarne la sequenza. La sequenza stessa può successivamente essere utilizzata per disegnare i due primer per la PCR. Il primer a sinistra è disegnato in modo da avere due regioni. La regione di circa venti nucleotidi all’estremità 3′ può appaiarsi con l’estremità sinistra del

Terminatore

Aat II

cDNA

MCS

BamHI

Aat II BamHI

+

Vettore di espressione da 3500 bp

1800 bp

cDNA clonato nel vettore nell’orientamento corretto

cDNA clonato nel vettore nell’orientamento sbagliato

1800 bp

1800 bp

Aat II BamHI 500 bp Aat II

200 bp

2000 bp

200 bp

200 bp

Aat II

BamHI

BamHI 500 bp

Clone espresso correttamente 5500 bp

Aat II

BamHI Clone espresso erroneamente 5500 bp

3000 bp

3000 bp Tagliato con Aat II 3200 bp (3000 + 200) 2300 bp (1800 + 500)

4800 bp (3000 + 1800) 700 bp (500 + 200)

La tecnologia del DNA ricombinante

cDNA (identica ai primer della PCR discussi nel Capitolo 9), mentre l’estremità 5′ del primer contiene la sequenza del sito di restrizione KpnI, che non può appaiarsi con lo stampo di cDNA (Figura 10.3). Analogamente, il primer destro ha due regioni. I venti nucleotidi all’estremità 3′ possono appaiarsi con l’estremità destra del cDNA, mentre l’estremità 5′ contiene la sequenza del sito di restrizione SalI, che non può appaiarsi con lo stampo di cDNA (Figura10.3). Quando questi primer si associano allo stampo (Figura 10.3) l’enzima sarà in grado di estenderli utilizzando la loro estremità 3′. Tuttavia, quando il frammento prodotto da questa estensione viene utilizzato di volta in volta come stampo per un ciclo successivo di PCR, l’estensione darà origine a una sequenza complementare a tutta la lunghezza del primer, comprendente anche le porzioni che all’inizio non si appaiavano allo stampo. I prodotti amplificati mediante PCR possono essere tagliati con KpnI e SalI, dando origine a un lungo frammento (il cDNA) con due differenti estremità coesive e due frammenti molto corti. Il frammento più lungo viene purificato e inserito all’interno del vettore di espressione tagliato con KpnI e SalI. Anche questa digestione produce un frammento più lungo e uno più corto (la par-

te del sito di clonaggio multiplo fra i siti di restrizione KpnI e SalI). Il frammento più lungo del vettore è purificato e poi ligato al frammento di cDNA amplificato per produrre il clone corretto per l’espressione del polipeptide in E. coli.

Vettori di clonaggio da PCR Clonare un frammento prodotto mediante una reazione di PCR può sembrare semplice in quanto si dovrebbe supporre che questi frammenti abbiano estremità piatte. In realtà, la maggior parte delle polimerasi comunemente utilizzate aggiunge all’estremità 3′ del DNA prodotto della PCR un nucleotide A che non è specificato dallo stampo di DNA e, quindi, rimane non appaiato. In sostanza, i frammenti della PCR generati con questi enzimi hanno ciò che può essere considerato una piccolissima estremità coesiva. Purtroppo nessun enzima di restrizione noto produce un’estremità coesiva che funzioni con questa singola A sporgente. Alcuni vettori in commercio sono disegnati per funzionare con queste estremità coesive. Questi vettori sono forniti in forma lineare con la sporgenza di un singolo nucleotide T a ognuna delle estremi-

DNA clonato 5¢...

... 3¢

3¢...

... 5¢ Denaturazione del DNA e appaiamento dei primer

Primer della PCR

... 3¢

5¢... 3¢ 5¢ GG

C

AG

Sito KpnI

T

A

C

TG

Sito Sal I

C

C





3¢...

... 5¢ Amplificazione con PCR cDNA con i siti KpnI e Sal I aggiunti 5¢ 3¢

3¢ GG T A C C CC A T GG

GT CGA C CAGC T G



Digestione con KpnI e Sal I cDNA con estremità coesive per il clonaggio in un vettore tagliato con KpnI e Sal I C CA T GG

3¢ G CAGC T

Estremità coesiva KpnI

Estremità coesiva Sal I





229

Figura 10.3 Utilizzo nella reazione a catena della polimerasi (PCR) di primer progettati appositamente per produrre siti di restrizione alle estremità di un cDNA che deve essere clonato in un vettore di espressione.



230

Capitolo 10

tà 5′. I vettori non possono richiudersi in una reazione di ligazione ma un frammento di PCR con la sporgenza di un singolo nucleotide A può essere inserito nel vettore per produrre un plasmide di DNA circolare ricombinante.

ne digerito con un enzima di restrizione a un sito in quel che rimane del sito di clonaggio multiplo a valle del gene (Figura 10.4). Questo viene fatto in quanto l’RNA polimerasi fagica funziona in maniera più efficiente in vitro se il plasmide non è superavvolto, come nel caso di un plasmide non digerito. RNA polimerasi di T7 ed NTP Vettori trascrivibili vengono miscelati in un tampone e la reazione viene inUn vettore trascrivibile è un vettore plasmidico che ha cubata a 37 °C. Gli mRNA trascritti vengono sintetizzaun promotore per un’RNA polimerasi immediatamente a ti iniziando dal nucleotide subito a valle del promotore e monte del sito di clonaggio multiplo (Figura 10.4) e ge- finendo all’estremità del plasmide linearizzato, vale a dineralmente anche le altre caratteristiche dei vettori di re subito a valle della fine del gene clonato. clonaggio plasmidici (mostrate nella Figura 8.4). I vettoLe molecole di mRNA sintetizzate in questo modo ri trascrivibili sono progettati per la trascrizione dell’in- vengono utilizzate per scopi differenti. Un impiego preserto in vitro e, per alcuni sistemi, anche in vivo. Al con- vede che siano aggiunte a un sistema di traduzione, in vitrario, i vettori di espressione sono progettati soltanto per tro, allo scopo di sintetizzare il polipeptide codificato dal l’espressione in vivo del gene clonato. I promotori dei gene o dal cDNA clonato. Un sistema di traduzione in vivettori trascrivibili vengono pertanto scelti per una tra- tro (acellulare) è una miscela purificata di amminoacidi, scrizione efficiente del gene clonato in vitro. General- proteine, tRNA e ribosomi, necessaria per la traduzione mente il promotore proviene da uno dei tre batteriofagi ma priva di mRNA. L’aggiunta di mRNA mette in funT7, T3 o SP6. Il promotore illustrato nella Figura 10.4 è zione il sistema di traduzione. In un altro impiego l’RNA per un’RNA polimerasi di T7. Perché utilizzare un’RNA sintetizzato è utilizzato come una sonda – detta sonda a polimerasi di batteriofago? La risposta risiede nel fatto RNA – in varie tecniche analitiche (alcune di queste tecche questi enzimi possono sintetizzare una quantità ele- niche saranno descritte più avanti in questo capitolo). In vata di RNA in un periodo di tempo relativamente breve. questo caso, l’RNA trascritto dal vettore deve essere Per trascrivere un gene clonato da un vettore trascri- marcato, radioattivamente o non radioattivamente. Ciò si vibile in vitro, un campione purificato del plasmide vie- ottiene inserendo nella reazione di trascrizione NPT radioattivi o modificati per aggiungere il marcatore. Per esempio, per avere un segnale radioattivo, si Gene di interesse usano comunemente i 32P-NTP. Porzione di MCS Il gene o il cDNA clonati in un vettore di Porzione di MCS Promotore T7 trascrizione possono essere espressi in vivo se il clone è trasformato in una cellula che espriGene di interesse clonato me l’RNA polimerasi specifica per il promoin vettore trascrivibile tore presente nel vettore (Figura 10.4). Per esempio, mediante la trasformazione del cloori ne all’interno di una cellula di E. coli che R amp contiene, in aggiunta, un vettore Per la trascrizione in vitro, tagliare nel MCS a valle del gene per linearizzarlo

Per la trascrizione in vivo, trasformare all’interno di una cellula di E. coli che esprime l’RNA polimerasi di T7

Gene dell’RNA polimerasi T7 RNA polimerasi di T7 NTP Trascrizione

mRNA 5¢



Figura 10.4 Un vettore trascrivibile contenente un inserto di cDNA. Il vettore di trascrizione illustrato ha un promotore T7 immediatamente adiacente al sito di clonaggio multiplo (MCS). I vettori di trascrizione possono essere utilizzati in vitro mediante la loro linearizzazione, con aggiunta

Gene di interesse Promotore T7

RNA polimerasi dell’ospite Trascrizione, traduzione

Trascrizione, traduzione Proteina codificata RNA polimerasi dal Gene di interesse di T7

E. coli

dell’opportuna RNA polimerasi (in questo caso RNA polimerasi T7) e di NTP, oppure in vivo mediante la loro trasformazione all’interno di una cellula ospite (in questo caso E. coli) che esprime l’RNA polimerasi appropriata.

La tecnologia del DNA ricombinante

di espressione con il gene per l’RNA polimerasi di T7, il gene nel vettore di trascrizione può essere trascritto in modo appropriato. In altre parole, il promotore T7 è specifico per l’RNA polimerasi di T7 e questo rende la trascrizione del gene clonato dipendente dalla sintesi dell’RNA polimerasi di T7. In questo caso la trascrizione avviene a partire dal plasmide circolare superavvolto. Come menzionato precedentemente, l’elevata attività dell’RNA polimerasi di T7 porta ad alti livelli di trascritti. Inoltre, poiché soltanto i vettori trascrivibili trasformati all’interno della cellula possiedono il promotore T7, vi è una elevata specificità per la trascrizione dal momento che tutte le RNA polimerasi di T7 prodotte trascriveranno il gene clonato. Gli mRNA trascritti in questo modo vengono successivamente tradotti dall’apparato di traduzione cellulare per produrre un’abbondante quantità del polipeptide codificato. In questo modo la trascrizione in vivo di un gene è possibile in qualsiasi tipo di cellula nella quale possa essere introdotta ed espressa l’RNA polimerasi di T7.

Vettori non plasmidici Molti altri vettori sono disponibili per scopi specifici. Per esempio, numerosi vettori di espressione sono basati sul fago lambda piuttosto che sui plasmidi. I vettori fagici mancano di siti di clonaggio multipli estesi; inoltre, nel clonaggio con i fagi non vengono utilizzate la selezione per il colore bianco-blu o la resistenza all’ampicillina. I cloni fagici vengono propagati in maniera differente rispetto ai cloni plasmidici. I batteri contenenti plasmidi formano colonie quando crescono su piastre di agar. Le regioni di un vettore fagico contengono tutti i geni necessari per lisare, quindi provocare la morte della cellula ospite (vedi Capitoli 2 e 15). Questo significa che una cellula che contiene un clone fagico sarà uccisa dal fago e rilascerà circa 300 copie del clone, che successivamente andranno a infettare le cellule vicine. Perché progettare un vettore capace di lisare le cellule ospiti? Ai fini dell’esperimento si utilizza un tappeto di cellule batteriche. (Il termine tappeto è usato per descrivere l’aspetto di una piastra con cellule batteriche che ricoprono l’intera superficie disponibile.) A differenza delle piastre delle quali abbiamo parlato in precedenza, le cellule nel tappeto sono miscelate con un terreno di agar fuso e caldo, quindi questa miscela viene versata su una piastra di agar. Il risultato è che le cellule batteriche sono inglobate nello strato superiore di pochi millimetri di agar, anziché essere appoggiate sulla sua superficie. Una frazione molto piccola di queste cellule inglobate viene infettata dai fagi. Le cellule infettate con un clone fagico subiscono la lisi e questa lisi rilascia fagi che infettano e uccidono le cellule vicine nel tappeto. La ripetizione di questo processo porta alla morte di tutte le cellule in una piccola regione e lascia un’area chiara e translucida sul

231

tappeto opaco detta placca: una regione nel tappeto su una piastra dove non ci sono cellule vive. L’area chiara contiene molti fagi rilasciati che possono essere raccolti per continuare a lavorare con il DNA clonato che essi contengono (la Figura 15.11 mostra una fotografia di una piastra con le placche). I vettori fagici sono vantaggiosi per due motivi principali. Il primo risiede nella loro capacità di accogliere inserti più lunghi rispetto ai plasmidi. Il secondo motivo consiste nel fatto che una piastra può ospitare più placche che colonie, permettendo di lavorare con un corredo più grande di cloni rispetto a quando si utilizza un vettore plasmidico. Alcuni degli altri vettori già analizzati in questo volume hanno utilizzi differenti. Per esempio, data la loro capacità di accogliere estesi inserti di DNA, i BAC (Capitolo 8) costituiscono le basi dei vettori per lo studio dalla regolazione genica in vertebrati come il topo e lo zebrafish. Infatti, è noto che il promotore e le sequenze di regolazione dei geni di molti vertebrati spesso occupano un lungo tratto di DNA. Pertanto un gene e un lungo segmento di DNA a monte possono essere clonati in un BAC e il clone può essere introdotto nell’organismo per studiarne il gene corrispondente.

Nota chiave Sono state sviluppate molte tipologie di vettore per la manipolazione di sequenze di DNA clonate. I vettori navetta possono essere trasferiti da una specie ospite a un’altra. I vettori di espressione portano sequenze che permettono alla proteina codificata dall’inserto di essere espressa dalla cellula ospite. I vettori di clonaggio basati sulla PCR hanno estremità specializzate per facilitare il clonaggio del DNA amplificato in PCR nel quale la DNA polimerasi aggiunge a ogni filamento un’estremità coesiva formata da un singolo nucleotide. I vettori di trascrizione permettono la trascrizione in vitro e sia la trascrizione sia la traduzione in vivo. I vettori fagici offrono alcuni vantaggi, in particolare inserti più lunghi e la possibilità di amplificare nei batteri un gran numero di cloni senza eccessivo sforzo. Molti vettori plasmidici si replicano all’interno del loro organismo ospite. I vettori fagici lisano i batteri che li ospitano dopo essersi replicati al loro interno. La scelta del vettore da utilizzare dipende dall’obiettivo dell’esperimento e dagli organismi coinvolti.

Clonaggio di un gene specifico Spesso i ricercatori intendono studiare un particolare gene o un frammento di DNA. Molti di essi lavorano con

232

Capitolo 10

un organismo del quale è stato sequenziato il genoma. In questo caso clonare un gene di interesse è generalmente semplice, e consiste nel cercare le sequenze genomiche in un database, progettare i primer che permetteranno di amplificare in PCR il gene di interesse, e successivamente utilizzare DNA genomico o cDNA come templato per la reazione a catena della polimerasi. Il frammento ottenuto con la PCR può essere clonato direttamente o, se nei primer sono stati disegnati dei siti di restrizione (Figura 10.3), il prodotto della PCR può essere tagliato e clonato come descritto precedentemente. Se il genoma è sequenziato, i geni associati a una specifica malattia possono essere identificati anche senza avere alcuna informazione sul fenotipo. Un esempio del genere viene descritto nel Focus sul genoma di questo capitolo. Che cosa succede se un ricercatore vuole clonare un gene da un organismo che possiede un genoma non ancora sequenziato? Senza informazioni sulla sequenza, il gene non può essere clonato mediante i semplici protocolli di PCR che abbiamo discusso. Esistono molti approcci che possono essere utilizzati, e molti modi diversi per individuare il nostro gene di interesse in un insieme di cDNA (Capitolo 8). Ogni metodo per individuare il

cDNA richiede strumenti molecolari molto specifici e la disponibilità di questi strumenti è importante per decidere quale strategia avrà successo. Inoltre, la strategia utilizzata può influenzare la natura del clone che verrà ottenuto, e questo aspetto dovrà essere tenuto in considerazione al momento di compiere la scelta.

Identificazione di cloni specifici usando una libreria di DNA Se abbiamo a disposizione, o costruiamo, una libreria di cDNA (Capitolo 8) a partire dal nostro organismo, possiamo cercare in questa libreria il cDNA corrispondente al gene di interesse. Le librerie di cloni non hanno un catalogo, pertanto, per trovare un clone di interesse, devono essere analizzate estensivamente. Per fortuna, per fare questo sono state sviluppate numerose tecniche, alcune delle quali saranno discusse in questo paragrafo. Assumeremo di avere anticorpi che possano legarsi, riconoscendola, a una proteina di interesse, oltre a una libreria di cDNA (in un vettore di espressione) e a una libreria genomica. Il nostro obiettivo è trovare un clone di cDNA e un clone genomico contenenti l’intero gene.

Focus sul genoma Trovare un nuovo gene legato al diabete di tipo 1 Il genoma umano e la mappa degli aplotipi possono essere utilizzati per trovare nuovi geni associati a malattie note (vedi Capitoli 8 e 14). In uno studio alcuni ricercatori si sono prefissi di scoprire ulteriori geni associati al diabete di tipo 1. Il diabete di tipo 1, chiamato anche diabete giovanile, è caratterizzato da un attacco alle cellule β del pancreas da parte del sistema immunitario. È noto che molti geni coinvolti in determinati aspetti della funzione del sistema immunitario sono implicati nello sviluppo di questa patologia. I ricercatori si sono domandati se ci fossero altri geni coinvolti nello sviluppo della malattia. Le cellule β producono insulina e la rilasciano quando il livello di zucchero nel sangue è elevato (generalmente dopo il pasto). L’insulina stimola il fegato e i muscoli ad aumentare il loro tasso di assorbimento del glucosio e questo, in sostanza, fa aumentare il tasso di produzione di glicogeno in entrambi i tessuti in quanto il glucosio è convertito in glicogeno, un polimero del glucosio più facilmente immagazzinabile. Il glicogeno del fegato verrà degradato quando la concentrazione dello zucchero nel sangue diminuisce. Quindi, l’insulina svolge un ruolo essenziale nella regolazione della glicemia, rappresentando il segnale per la sua diminuzione ed essendo anche responsabile della produzione del

glicogeno immagazzinato, che sarà utilizzato per aumentare il livello di zucchero nel sangue quando questo diminuisce. Nel diabete di tipo 1, la morte delle cellule β impedisce il normale rilascio di insulina e la risposta all’ormone, determinando l’innalzamento della glicemia dopo i pasti e una limitata produzione di glicogeno. Poiché viene prodotta una quantità di glicogeno molto bassa, una persona affetta da diabete di tipo 1 non è in grado di utilizzare il glicogeno immagazzinato per aumentare il livello di zucchero nel sangue nel caso abbia saltato un pasto. Le persone con questo disturbo sono generalmente trattate con insulina, che può venire isolata da animali o prodotta in laboratorio. I ricercatori hanno trovato una regione, estesa circa 230 kb sul cromosoma 16, che è stata associata in maniera significativa all’aumento del rischio di sviluppare il diabete di tipo 1. In questa regione è presente solamente un singolo gene (chiamato KIAA0350) che codifica per uno specifico tipo di proteina che lega lo zucchero, chiamata lectina. Le proteine di questo tipo sono spesso implicate nella funzione del sistema immunitario e sembra che le mutazioni nella lectina che predispongono al diabete di tipo 1 possano agire con maggiore probabilità mediante un attacco inopportuno alle cellule β.

La tecnologia del DNA ricombinante

1

Figura 10.5 Identificazione di specifici cDNA plasmidici in una libreria di cDNA utilizzando una sonda anticorpale.

DNA plasmidico ricombinante

3 Vettore di espressione

Promotore

Segnale di inizio della traduzione

233

Piastrare su terreno di crescita selettivo; si sviluppano colonie.

Sequenza di terminazione della trascrizione Sequenza clonata di cDNA

2

Trasformare E. coli con cloni di cDNA (in vettori di espressione).

Vagliare una libreria di cDNA Esistono diversi modi per saggiare una libreria di cDNA al fine di identificare il clone di cDNA al quale siamo interessati. Il nostro primo screening della libreria di espressione di cDNA sarà una ricerca di un clone di cDNA che codifica una specifica proteina (Figura 10.5). Questo approccio comporta l’utilizzo di anticorpi che possano legarsi alla proteina codificata dal gene di interesse. Si ricordi che i cDNA sono stati clonati in un vettore di espressione (Figura 10.5, passaggio 1). Questo significa che il cDNA è inserito tra un promotore e un segnale di termine della trascrizione, che sono entrambi componenti del vettore. Nella cellula batterica ospite verrà trascritto un mRNA corrispondente al cDNA e la traduzione dell’mRNA produrrà la proteina codificata. Per il saggio, dapprima si trasforma E. coli con la collezione di cloni di cDNA, preparata utilizzando un vettore di espressione (Figura 10.5, passaggio 2); in seguito le cellule vengono seminate in piastra, in modo che ogni batterio dia luogo a una colonia (Figura 10.5, passaggio 3). Questi cloni vengono conservati, per esempio, prelevando ogni colonia dalla piastra e mettendola in terreno di coltura nel pozzetto di una piastra per microtitolazione (Figura 10.5, passaggio 4; in questo esempio sono mostrati 16 pozzetti). Repliche di questi cloni vengono poste (stampate) su un filtro appoggiato su una piastra di terreno selettivo appropriato per le molecole ricombinanti, per esempio ampicillina per plasmidi che contengono il gene per la resistenza all’ampicillina (Figura 10.5, passaggio 5). Le colonie cresceranno sul filtro nello stesso ordine in cui i cloni sono presenti nella piastra per microtitolazione. Il filtro viene tolto dalla piastra e trattato per lisare le cellule in situ (Figura 10.5, passaggio 6). Le proteine all’interno delle cellule, incluse quelle espresse dai cloni di cDNA, si attaccano al filtro. Il filtro viene quindi incubato con un anticorpo specifico per la proteina di interesse (Figura 10.5, passaggio 7). Se l’anticorpo è marcato con un isotopo radioattivo, qualsiasi clone che esprima la proteina di interesse potrà essere identificato mettendo il filtro asciutto a contatto con una lastra sensibile alle particelle emesse dal radio-

4

Trasferire singole colonie in una piastra per microtitolazione e farle crescere; conservare.

5

Posizionare le colonie su filtro e lasciar crescere in terreno; la proteina codificata dal cDNA viene espressa.

6

Rimuovere il filtro e lisare le cellule in situ; il prodotto proteico del cDNA è legato al filtro.

7

Far reagire la proteina sul filtro con anticorpo radioattivo. Lavare via l’anticorpo non legato.

8

Realizzare un’autoradiografia per identificare il clone.

Anticorpo radioattivo

isotopo e lasciandolo al buio per un certo tempo (da una a dodici ore) per produrre quello che si chiama un autoradiogramma (Figura 10.5, passaggio 8). Il processo viene detto autoradiografia. Quando la lastra viene sviluppata, si vedranno macchie scure in tutti i punti in cui la sonda radioattiva si è legata al filtro nella reazione immune. (Le macchie scure sono il risultato del decadimento degli atomi radioattivi, che determinano la precipitazione dei grani di argento della lastra.) Queste macchie corrispondono ai cloni del cDNA che esprimono la proteina di interesse. Si noti che questi cloni non neces-

234

Capitolo 10 Filtro premuto sulla piastra. I fagi delle placche si attaccano al filtro.

DNA 1

Infettare E. coli con una libreria genomica (qui costruita in un vettore fagico).

2

Piastrare su terreno di coltura; si formano placche.

Figura 10.6 Utilizzo di una sonda a DNA per analizzare una libreria genomica fagica per la ricerca di specifiche sequenze di DNA.

3

Rimuovere il filtro dalla piastra, denaturare e legare il DNA al filtro, lavare via le proteine.

4

sariamente contengono il cDNA completo; infatti sono selezionati mediante un anticorpo che, come tale, riconosce un epitopo della molecola bersaglio. (Un epitopo è la breve regione specifica di una proteina – o di un’altra molecola riconosciuta da un anticorpo – alla quale un anticorpo si lega in maniera specifica.) Gli epitopi sono spesso costituiti da meno di dieci amminoacidi, quindi il nostro clone selezionato contiene sicuramente la parte di DNA che codifica per l’epitopo, ma può contenere o meno l’intero cDNA. Dopo che un clone di cDNA è stato identificato (assumiamo che il nostro clone selezionato contenga l’intero cDNA codificante per la proteina di interesse), lo si può usare per altre applicazioni, per esempio per analizzare il genoma dello stesso o di altri organismi alla ricerca di sequenze omologhe, per isolare il gene nucleare per l’mRNA da una libreria genomica o per quantificare la produzione dell’mRNA sintetizzato a partire dal gene. Analisi di una libreria genomica Data l’esistenza di una sonda, come cDNA clonato, è ora possibile identificare il DNA genomico, comprendente la regione del promotore e degli introni, che corrisponde al gene di interesse utilizzando la sonda per l’analisi di una libreria genomica. Una volta che sia stato identificato il clone genomico corretto, possiamo isolare l’inserto di DNA nel clone e domandarci quale funzione svolga il gene. Per esempio, potremmo paragonare la sequenza genomica con quella del cDNA per studiare come è avvenuto il processo di splicing dell’mRNA, o potremmo studiare il promotore e le sequenze di regolazione per vedere come è controllata la trascrizione del gene di interesse. Qui discuteremo il saggio delle librerie genomiche prodotte in un vettore di clonaggio fagico. L’analisi di una libreria genomica ottenuta in un vettore di clonaggio derivato dal fago lambda è simile a quella appena descritta di una libreria di cDNA. In primo luogo cellule di E. coli vengono infettate con la libreria genomica (Figura 10.6, passaggio 1), poi le cellule sono piastrate in un tappeto, dove daranno origine a

La sonda a DNA viene ibridata al DNA sul filtro

Incubare la soluzione con la sonda marcata insieme al filtro in una busta di plastica sigillabile con il calore.

5 Rimuovere dal filtro la sonda non ibridata. Evidenziare l’ibridazione mediante autoradiografia per le sonde marcate con radioattivo, o rilevamento della chemioluminescenza per le sonde non radioattive. Le macchie scure indicano i cloni individuati dalla sonda.

placche (Figura 10.6, passaggio 2). Successivamente sulla piastra viene posizionato un filtro. Le particelle fagiche presenti sulle placche aderiscono al filtro. Il filtro viene quindi trattato in modo da lisare le cellule batteriche, rimuovere le proteine che proteggono il DNA del fago, denaturare il DNA in singoli filamenti e infine legarlo in modo covalente sul filtro (Figura 10.6, passaggio 3). Nel passaggio successivo il filtro viene messo in un sacchetto di plastica sigillabile con il calore e incubato con la sonda di cDNA (Figura 10.6, passaggio 4), che è stata marcata in modo radioattivo o non radioattivo. Il Box 10.1 descrive un metodo per produrre una sonda di DNA radioattiva. Possono essere usate come sonde radioattive anche sonde costituite da RNA (ribosonde). Poiché esse sono prodotte mediante trascrizione in vitro, le si può marcare in maniera molto semplice: bisogna solo aggiungere NTP radioattivi alla reazione di trascrizione in vitro per produrre una ribosonda radioattiva. Le sonde non radioattive si avvalgono dei sistemi di rilevamento basati sull’impiego di enzimi: la sonda marcata reagisce con un substrato chimico per produrre alternativamente luce o un precipitato colorato. Un tipo di marcatura non radioattiva di una sonda e il relativo sistema di rilevamento vengono descritti nel Box 10.1. Per preparare il DNA marcato da usare come sonda, il

235

La tecnologia del DNA ricombinante

DNA viene denaturato per bollitura e poi raffreddato rapidamente in ghiaccio per ottenere molecole a singolo filamento. Queste molecole marcate vengono aggiunte ai filtri ai quali è stato legato il DNA denaturato (a singolo filamento) derivato da ogni colonia. Le molecole marcate diffondono sul filtro e, dopo un tempo sufficiente, troveranno legato al filtro quel DNA con il quale possono ibridarsi per complementarità di appaiamento tra le basi. Per mezzo di questo legame idrogeno si for-

Box 10.1

mano ibridi tra la sonda e il DNA bersaglio. Per esempio, se la sonda di cDNA è derivata dall’mRNA per la β-globina, essa si ibriderà con quel DNA legato al filtro che codifica per l’mRNA della β-globina, ossia col gene per la β-globina. Dopo il passaggio di ibridazione, i filtri vengono lavati per rimuovere la sonda non legata o legata aspecificamente e sottoposti alla procedura appropriata per il rilevamento della sonda radioattiva o non radioattiva: vale a dire un’autoradiografia, se la

Marcare il DNA

Il DNA può essere marcato con metodi radioattivi o non radioattivi. Sebbene storicamente la ricerca abbia fatto largamente uso soprattutto di metodi che sfruttano isotopi radioattivi, al giorno d’oggi è possibile evidenziare quantità di DNA fino a 0,1 picogrammi (0,1 × 10–12 g) con sonde sia radioattive sia non radioattive. Marcatura radioattiva del DNA La marcatura radioattiva di una sonda di DNA può essere realizzata con il metodo dei primer random (Figura box 10.1). In questo approccio il DNA viene denaturato in singoli filamenti mediante bollitura e rapido raffreddamento in ghiaccio. Primer di DNA da sei nucleotidi (primer esanucleotidici random), sintetizzati per incorporazione casuale di nucleotidi, vengono fatti ibridare al DNA. Ciò avverrà in molti punti della molecola, perché nella miscela di reazione sono presenti tutti i possibili esanucleotidi. I primer vengono allungati dal frammento Klenow della DNA polimerasi I, che usa precursori (dNTP) marcati radioattivamente. (Il frammento Klenow, così chiamato dal nome del suo scopritore, manca dell’attività esonucleasica da 5’ a 3’, che altrimenti distruggerebbe i primer, ma possiede ancora l’attività esonucleasica da 3’ a 5’ per la correzione degli errori.) Di solito la marcatura è dovuta all’utilizzo di un isotopo radioattivo; in particolare al 32P del gruppo fosfato legato al carbonio in 5’ dello zucchero desossiribosio. Questo gruppo fosfato viene chiamato fosfato α, perché è il primo della catena di tre; il fosfato α è usato per formare il legame fosfodiesterico dell’ossatura zucchero-fosfato. La rilevazione del DNA legato alla sonda dipenderà dal tipo di isotopo utilizzato e dalla capacità di rilevarne le particelle emesse. Per esempio, se una sonda marcata con 32P si è ibridata a una sequenza di DNA bersaglio su un filtro, il filtro viene messo a contatto con una lastra sensibile alle particelle emesse e il tutto viene posto al buio. Ogni punto del filtro dove si trova 32P viene rilevato come una zona nera sulla lastra (una macchia, una banda ecc.) dopo lo sviluppo. Questa procedura è chiamata autoradiografia e la fotografia risultante dal segnale radioattivo è chiamata autoradiogramma.

Marcatura non radioattiva del DNA La marcatura dei primer random può essere utilizzata anche per preparare sonde marcate non radioattivamente. La differenza rispetto alla preparazione di sonde radioattive è che si usano particolari molecole precursori del DNA invece di precursori marcati con 32P. Per esempio, in uno dei molti sistemi di marcatura, si aggiunge digossigenina-dUTP (DIG-dUTP) alla miscela di dNTP precursori. La digossigenina è uno steroide ed è legata alla dUTP (desossiuridina5’-trifosfato). Durante la sintesi del DNA, la DIGdUTP può venire incorporata di fronte ai nucleotidi A sul filamento del DNA stampo. Il DNA marcato in modo non radioattivo può essere usato negli esperimenti nello stesso modo del DNA marcato con radioattivo. Tuttavia il rilevamento è DNA

5¢ 3¢

3¢ 5¢ Denaturare a singoli filamenti



3¢ Filamenti denaturati



5¢ Appaiamento di primer esanucleotidici random

5¢ 3¢ Primer 3¢ 5¢ 3¢



5¢ 3¢

3¢ 5¢





3¢ 5¢

3¢ 5¢

Allungamento dei primer con il frammento Klenow della DNA polimerasi I in presenza di precursori radioattivi ( ) 5¢ 3¢ Nuovo DNA 5¢ 3¢

DNA polimerasi I 3¢ 5¢ 3¢ 5¢

Denaturare a singoli filamenti da usare come sonda

Figura box 10.1 Metodo dei primer random per la marcatura radioattiva del DNA.

236

Capitolo 10

diverso. Dopo che la sonda marcata con DIG-dUTP si è legata al DNA bersaglio, per esempio su un filtro, si aggiunge del coniugato anti-DIG-AP. La parte anti-DIG del coniugato è un anticorpo che reagirà specificamente con DIG, mentre la parte AP del coniugato è l’enzima fosfatasi alcalina. Dovunque il DNA marcato con DIG sia ibridato con il DNA bersaglio sul filtro, il coniugato anti-DIG-AP si legherà a formare un complesso DNA-DIG-anti-DIG-AP. La posizione dell’ibrido sonda-bersaglio viene poi resa visibile da substrati che reagiscono con la fosfatasi alcalina. Per

sonda è marcata con un isotopo radioattivo, o il rilevamento della chemioluminescenza o della colorazione, se la sonda è marcata con procedure non radioattive (Figura 10.6, passaggio 5). Dalla posizione delle macchie sulla lastra o sul filtro si potrà determinare la posizione della placca fagica, o delle placche, sulla piastra originale, e i cloni di interesse potranno essere isolati per un’ulteriore caratterizzazione. Paragone tra cDNA e cloni genomici Dopo aver recuperato un clone di cDNA e un clone genomico possiamo sequenziarli entrambi (Capitolo 8) e paragonare le loro sequenze. Ovviamente sia i cloni di cDNA sia i cloni genomici conterranno le sequenze degli esoni, ma soltanto la sequenza genomica comprenderà gli introni e le sequenze di regolazione a monte. Da questo confronto possiamo identificare le sequenze candidate dei promotori, e capire come gli esoni e gli introni sono distribuiti nel genoma.

Identificazione di geni in librerie per complementazione di mutazioni Nel caso di microrganismi nei quali sono stati ben messi a punto sistemi di analisi genetica e nei quali vi sono ben definite mutazioni, è possibile clonare geni per complementazione di quelle mutazioni. In breve, questo approccio si basa sull’espressione di una copia del gene selvatico, introdotto nella cellula o nell’organismo mutati per esso, in modo da riparare il difetto dovuto alla presenza nel genoma della sua forma non funzionale. (La complementazione sarà discussa in maggior dettaglio nel Capitolo 13.) Questo si può fare, per esempio, nel lievito Saccharomyces cerevisiae, facile da manipolare geneticamente e per il quale sono disponibili efficienti sistemi di trasformazione integrativa e replicativa utilizzando vettori navetta E. coli-lievito. Per prima cosa si costruisce una libreria genomica di frammenti di DNA del ceppo selvatico in un vettore navetta E. coli-lievito. La libreria viene poi usata per trasformare un ceppo di lievito ospite che porti due mutazioni: una che permette la selezione dei trasformanti (per

ottenere una sensibilità simile a quella delle sonde radioattive, si usa un substrato chemioluminescente. Questo substrato produce luce in una reazione catalizzata dalla fosfatasi alcalina e il rilevamento prevede l’esposizione a una lastra sensibile alla luce emessa, come per un autoradiogramma. Se non è necessaria un grande sensibilità, vengono utilizzati substrati colorimetrici per l’enzima. In questo caso, quando la reazione enzimatica procede, macchie o bande che appaiono come regioni viola o blu si sviluppano direttamente sul filtro.

esempio, ura3 che determina la necessità di uracile per la crescita) e una nel gene del quale si vuole clonare l’allele selvatico. Consideriamo il clonaggio del gene ARG1, il gene selvatico per un enzima necessario per la biosintesi dell’arginina (Figura 10.7), per complementazione di una mutazione recessiva arg1. Un ceppo che porta la mutazione arg1 possiede un enzima per la biosintesi dell’arginina inattivo e quindi richiede arginina per crescere. Una libreria genomica viene costruita con DNA del ceppo di lievito selvatico (ARG1) (Figura 10.7, passaggi 1 e 2). Quando una popolazione di cellule di lievito ura3 arg1 viene trasformata con la libreria genomica preparata nel vettore navetta (Figura 10.7, passaggio 3), alcune cellule riceveranno plasmidi contenenti il gene normale (ARG1) per l’enzima della biosintesi dell’arginina. Il gene ARG1 del plasmide sarà espresso consentendo alla cellula di crescere su terreno minimo – cioè in assenza di arginina – nonostante la presenza di un allele arg1 difettivo nel genoma cellulare (Figura 10.7, passaggio 4). Si dice che il gene ARG1 sopperisce al difetto funzionale della mutazione arg1 per complementazione di quella mutazione (Figura 10.7, passaggi 5 e 6). Il plasmide viene quindi isolato dalle cellule di lievito e il gene clonato viene caratterizzato.

Identificazione di specifiche sequenze di DNA in librerie mediante l’uso di sonde eterologhe Le sonde di cDNA possono essere usate per identificare e isolare geni specifici, e in questo modo sono stati clonati moltissimi geni sia dai procarioti sia dagli eucarioti. È anche possibile identificare geni specifici all’interno di una libreria genomica utilizzando come sonde i cloni di geni equivalenti da altri organismi. Per esempio, una libreria genomica umana potrebbe essere saggiata mediante una sonda di topo. Queste sonde sono chiamate sonde eterologhe e la loro efficacia dipende da un buon grado di omologia fra la sonda e il gene. Per questa ragione, i maggiori successi con questo tipo di approccio sono stati ottenuti per geni altamente conservati o con sonde di specie molto vicine all’organismo dal quale deve essere isolato un certo gene.

La tecnologia del DNA ricombinante 1

DNA genomico da ceppi di lievito selvatici (ARG1).

2

Costruire una libreria genomica dei frammenti in un vettore navetta E. coli-lievito.

DNA di lievito 3

Trasformare un ceppo di lievito ura3 arg1.

4

Piastrare su terreno minimo. Solo cellule contenenti il gene ARG1 possono crescere.

Marcatore selettivo URA3

Gene ARG1

ché il codice genetico è universale, si possono progettare oligonucleotidi di circa 20 nucleotidi, che, se tradotti, darebbero la sequenza di amminoacidi nota. A causa della degenerazione del codice – fino a sei diversi codoni possono specificare un determinato amminoacido – devono essere preparati molti diversi oligonucleotidi, tutti in grado di codificare la sequenza di amminoacidi in questione. Queste sonde sono conosciute come indovinameri. Questi oligonucleotidi misti vengono marcati e usati per analizzare le librerie con la speranza che almeno uno di essi troverà il gene o il cDNA di interesse. Se la sonda è marcata con un metodo radioattivo, il rilevamento verrà realizzato mediante autoradiografia, mentre, se la marcatura della sonda è non radioattiva, il rilevamento avverrà per colorimetria o chemioluminescenza (Box 10.1). Benché non sempre abbia successo, il saggio di librerie basato su oligonucleotidi è stato estremamente fruttuoso e ha permesso di clonare molti geni per i quali non era disponibile in precedenza alcuna informazione molecolare.

Nota chiave

Colonie di lievito contenenti molecole di DNA ricombinante con il gene ARG1 5

237

arg1 del cromosoma di lievito produce un enzima difettoso.

Sequenze specifiche possono venire identificate in librerie di cDNA e genomiche usando diversi metodi, inclusi l’uso di anticorpi specifici, sonde di cDNA, complementazione di mutazioni, sonde eterologhe e sonde di oligonucleotidi.

Analisi molecolari del DNA clonato Le sequenze di DNA clonate rappresentano una risorsa per esperimenti progettati per rispondere a molte tipologie di quesiti in ambito biologico. Qui ne daremo due esempi: il Southern blotting e il northern blotting.

6

Si ha complementazione perché ARG1 nel vettore produce un enzima funzionante.

Figura 10.7 Esempio di clonaggio di un gene per complementazione di una mutazione: clonaggio del gene di lievito ARG1.

Identificazione di geni o di cDNA in librerie mediante l’uso di sonde oligonucleotidiche Molti geni sono stati isolati da librerie usando come sonde oligonucleotidi sintetici. In questo metodo deve essere nota almeno la sequenza di alcuni amminoacidi della proteina codificata dal gene. In tal caso, può essere possibile determinare una sequenza consenso (quella sequenza formata dal nucleotide più frequente in ciascuna posizione) da versioni del gene precedentemente clonate e disponibili in GenBank (http://www.ncbi.nlm.nih.gov/ Genbank/index.html), un archivio elettronico nel quale vengono depositate sequenze che vengono messe a disposizione dei ricercatori di tutto il mondo. Quindi, poi-

Analisi mediante Southern blot di sequenze nel genoma Una tecnica fondamentale della biologia molecolare è stata messa a punto da E.M. Southern e, per questo, chiamata Southern blot o Southern blotting (Figura 10.8). Questa metodica prevede (1) la separazione di miscele complesse di frammenti di DNA in base alle loro dimensioni mediante elettroforesi su gel; quindi (2) il trasferimento delle molecole su una membrana e (3) l’identificazione tra esse di un DNA di interesse mediante l’utilizzo di una sonda complementare a esso. Immaginiamo per esempio di aver selezionato un clone di interesse da una libreria di cDNA. Potremmo voler determinare i siti di restrizione nella copia genomica di questo cDNA. Oppure potremmo voler sapere se ci sono differenze per questi siti tra popolazioni diverse. Ancora, mediante l’utilizzo di sonde appropriate, potremmo voler determinare la presenza o assenza di se-

238

Capitolo 10

quenze di DNA mutate. Queste sono solo alcune delle domande per rispondere alle quali possiamo utilizzare una tecnica come il Southern blotting. La metodica procede come segue:

1 DNA cellulare

Digestione con enzima di restrizione 2 La lunghezza dei frammenti di restrizione è determinata dai siti di taglio per l’enzima utilizzato Gel di agarosio

+

3 Elettroforesi su gel che permette la separazione – dei frammenti di DNA in base alle dimensioni Dopo l’intercalazione del bromuro di etidio, i frammenti di DNA sono visibili ai raggi UV Peso 4 Trasferimento su filtro Fazzoletti mediante la tecnica di carta del Southern blot Filtro Gel Carta assorbente Vassoio contenente il tampone

5 I frammenti di DNA si trasferiscono esattamente come sono ordinati nel gel di agarosio

Ibridazione con sonda marcata

6 I frammenti di DNA complementari alla sonda sono visibili dopo autoradiografia o chemioluminescenza

Figura 10.8 Tecnica del Southern blot per l’analisi di DNA cellulare alla ricerca di sequenze complementari a una sonda marcata, come una molecola di cDNA realizzata a partire da una molecola di mRNA isolata. Le ibridazioni tra sonda e DNA complementare a essa (in questo caso tre diversi frammenti) vengono visualizzate mediante autoradiografia o chemioluminescenza (in questo esempio sono osservabili tre bande).

1. Campioni di DNA genomico vengono tagliati con diversi enzimi di restrizione (Figura 10.8, passaggi 1 e 2), ciascuno dei quali produrrà frammenti di DNA di diversa lunghezza a seconda della localizzazione dei siti di restrizione. 2. I frammenti di restrizione vengono separati in base alle dimensioni mediante elettroforesi su gel di agarosio (Figura 10.8, passaggio 3). Dopo l’elettroforesi, il DNA viene trattato con l’agente intercalante bromuro di etidio in modo da essere visibile sotto luce ultravioletta. Quando il DNA genomico viene digerito con un enzima di restrizione, il risultato è in genere una strisciata continua di fluorescenza per tutta la lunghezza del gel, dovuta al fatto che vengono prodotti frammenti di ogni dimensione, non visibili quindi come bande discrete. 3. I frammenti di DNA vengono poi trasferiti su di un filtro (Figura 10.8, passaggio 4). In breve, il gel viene immerso in una soluzione alcalina per denaturare in singoli filamenti il DNA a doppia elica. Il gel viene quindi neutralizzato e posto sopra un pezzo di carta assorbente che copre una lastra di vetro. Le estremità della carta sono immerse in un contenitore di soluzione tampone. Un filtro viene appoggiato sul gel in modo da coprirlo. Sopra la membrana vengono poggiati degli altri fogli di carta assorbente (non imbevuti nel tampone) e un peso. La soluzione tampone nel vassoio sottostante viene assorbita dalla carta assorbente, passa attraverso il gel e il filtro e infine nel pacco di carta assorbente posto sopra al filtro. Durante questo processo, i frammenti di DNA vengono trasportati dal flusso di tampone e trasferiti dal gel alla membrana, alla quale si legano a causa delle sue proprietà chimiche. I frammenti sul filtro avranno esattamente le stesse posizioni che avevano nel gel (Figura 10.8, passaggio 5). 4. A questo punto il filtro viene immerso in un tampone contenente una sonda marcata, che si ibriderà a qualsiasi frammento, o frammenti, di DNA complementare (Figura 10.8, passaggio 6). La presenza della sonda viene determinata nel modo appropriato per il tipo di marcatura della sonda, radioattiva o non radioattiva, per determinare la posizione delle molecole ibride (Figura 10.8, passaggio 6). Se un campione di marcatori di peso molecolare è stato caricato in una diversa corsia dello stesso gel durante l’elettroforesi, le dimensioni dei frammenti che si ibridano con la sonda possono essere calcolate. Dalle dimensioni dei frammenti così ottenute, si può generare una mappa di restrizione che mostra le posizioni relative

La tecnologia del DNA ricombinante

dei siti di restrizione. Si immagini, per esempio, che usando solo BamHI si ottenga un frammento di DNA di 3 kb, che si ibrida con la sonda marcata. Se poi si usa una combinazione di BamHI e PstI e vengono prodotti due frammenti di DNA, uno di 1 kb e l’altro di 2 kb, si dedurrà che il frammento BamHI di 3 kb contiene un sito di restrizione PstI a 1 kb da un’estremità e a 2 kb dall’altra estremità. Ulteriori analisi con altri enzimi di restrizione, da soli o combinati, rendono possibile al ricercatore la costruzione di una mappa di restrizione delle posizioni relative di tutti i siti di restrizione. Altre applicazioni della tecnica di Southern blot saranno descritte più avanti nel capitolo.

Analisi di RNA mediante northern blot Una tecnica simile a quella del Southern blot chiamata northern blot o northern blotting è stata sviluppata per analizzare l’RNA invece del DNA. (In questo caso il nome non deriva da una persona ma indica la relazione con il Southern blot). Nel northern blot, l’RNA estratto da cellule o da tessuto viene separato in base alle dimensioni mediante elettroforesi su gel (in questo caso si utilizza una soluzione denaturante, per risolvere l’eventuale struttura secondaria dell’RNA, ovvero le zone che hanno formato regioni a doppio filamento). Successivamente le molecole di RNA vengono trasferite e legate a un filtro con una procedura essenzialmente identica a quella utilizzata nel Southern blot. Dopo ibridazione con una son-

Nota chiave Geni clonati e altre sequenze di DNA vengono spesso analizzati per determinare la disposizione e la localizzazione specifica di siti di restrizione. Il processo analitico prevede il taglio del DNA con enzimi di restrizione, seguito dalla separazione dei frammenti risultanti per mezzo di elettroforesi su gel di agarosio. Le dimensioni dei frammenti di DNA vengono calcolate, permettendo la costruzione di mappe di restrizione. I frammenti di DNA prodotti dal taglio di DNA genomico mostrano una vasta gamma di dimensioni, dando luogo a una strisciata continua di frammenti di DNA nel gel. In questo caso, specifici frammenti di un gene si possono evidenziare solo trasferendo i frammenti su una membrana mediante la tecnica del Southern blot, ibridando i frammenti di DNA con una specifica sonda marcata ed evidenziando le molecole ibride. Una procedura simile – il northern blotting – serve per analizzare le dimensioni e la quantità relativa (anche l’assenza/presenza) degli RNA isolati da una cellula.

239

da marcata e l’uso della tecnica di rilevazione appropriata, le bande indicano la localizzazione delle molecole di RNA complementari alla sonda. Se in una corsia dello stesso gel erano presenti appropriati marcatori di dimensioni di RNA, si può determinare la dimensione delle molecole di RNA identificate dalla sonda. Il northern blot è utile per rivelare la dimensione, o le dimensioni, dell’mRNA codificato da un gene. In alcuni casi mediante questa tecnica sono state identificate diverse specie di mRNA codificate dallo stesso gene, suggerendo che vengano usati promotori o terminatori diversi, o che un trascritto possa maturare in maniere alternative. Il northen blot può essere anche utilizzato per verificare se una certa specie di mRNA sia presente in un tipo di cellula o di tessuto e in quale quantità. Questo tipo di esperimenti è utile per determinare il livello di attività genica, per esempio durante lo sviluppo, in diversi tipi cellulari di un organismo, in cellule tumorali rispetto a cellule non tumorali, o ancora prima e dopo che una cellula sia sottoposta a specifici stimoli fisiologici.

Altri impieghi della PCR nella genetica molecolare La PCR (metodica presentata nel Capitolo 9 e illustrata nella Figura 9.3) è una delle tecniche più comunemente utilizzate nei moderni laboratori di genetica, se non addirittura la più comune. Questo è dovuto al fatto che la PCR consente di produrre un numero teoricamente illimitato di copie di un frammento di DNA di interesse anche se se ne conosce solo in minima parte la sequenza (rendendo possibile il disegno dei primer) o non si ha molto materiale di partenza. La PCR è anche una procedura rapida nella quale la maggior parte delle reazioni si svolge in poche ore. Vedremo ora alcune sue applicazioni nella genetica molecolare, in particolare l’approccio che permette la quantificazione di uno specifico RNA in un campione.

Vantaggi e limitazioni della PCR La PCR rappresenta una potente tecnica di amplificazione di segmenti di DNA assai più sensibile e veloce rispetto alle tecniche di clonaggio: in particolare, essa può produrre in poche ore milioni di copie di un frammento di DNA partendo da una sola molecola. Al contrario, il clonaggio richiede quantità rilevanti del DNA di partenza per la digestione con enzimi di restrizione e qualche giorno per tutti i passaggi richiesti. Anche la PCR tuttavia presenta un paio di limitazioni. Per prima cosa la PCR richiede primer specifici, che a loro volta richiedono che la sequenza del DNA che si vuole amplificare sia nota in modo da poterli progettare. In secondo luogo, la lunghezza del DNA che può essere amplificata per PCR è limitata dalle condizioni sperimentali al massimo fino

240

Capitolo 10

a circa 40 kb. Di fatto, l’amplificazione di frammenti di queste dimensioni è tecnicamente impegnativa e, se possibile, i ricercatori utilizzano la PCR per amplificare frammenti molto più piccoli. Un ulteriore problema è che la Taq polimerasi, utilizzata da molti ricercatori, non possiede attività di correzione di bozze. Gli errori di appaiamento delle coppie di basi che possono verificarsi durante l’amplificazione in vitro non verranno corretti, pertanto qualsiasi clone prodotto con la Taq polimerasi in PCR deve essere analizzato attentamente per verificare che l’enzima non abbia introdotto mutazioni. Esistono forme alternative di DNA polimerasi termostabile disponibili per la PCR che possiedono attività di correzione, e questi enzimi riducono in modo significativo la frequenza di errore. Uno di questi è la Vent polimerasi, che è stata estratta in origine da un Archaea che cresce nelle vicinanze delle fumarole all’alta temperatura delle fosse oceaniche. Infine, la grande sensibilità della PCR può rappresentare uno svantaggio in alcune applicazioni. Dato che la PCR produce moltissime copie da una singola molecola di DNA, bisogna controllare con la massima cura che vengano amplificate le molecole giuste. In ambito forense, per esempio, è cruciale che il DNA utilizzato come prova non sia stato inquinato dal DNA degli investigatori o dei ricercatori che lo hanno maneggiato.

Applicazioni della PCR Esistono molte applicazioni della PCR, non solo l’amplificazione del DNA per clonare o subclonare (inserire una parte di una sequenza già clonata in un nuovo vettore) in un vettore, ma anche la diagnosi di malattie, la determinazione del sesso degli embrioni, le analisi forensi, e gli studi di evoluzione molecolare. Nella diagnosi di malattie, per esempio, la PCR può essere impiegata per mettere in evidenza agenti patogeni batterici o virali, come i virus dell’epatite B o HIV (Human Immunodeficiency Virus, l’agente che causa l’AIDS). Inoltre la PCR può essere usata per la diagnosi di malattie genetiche, un argomento che sarà trattato successivamente in questo capitolo. Per esempio, la PCR è utile per subclonare un frammento di un DNA clonato. Riprendiamo il discorso del clonaggio per complementazione di un gene di lievito che abbiamo affrontato in precedenza in questo capitolo (Figura 10.7): abbiamo visto che una libreria genomica di lievito può essere usata per identificare un dato gene mediante complementazione di una mutazione. Un clone della libreria viene identificato sperimentalmente in quanto conferisce il fenotipo selvatico alla cellula mutante che trasforma. Nell’esempio specifico era stato identificato in questo modo il gene selvatico ARG1 di lievito. Ora raffiniamo l’analisi. Il clone plasmidico che complementa il mutante arg1 deve contenere il gene ARG1. Il plasmide viene estratto dal lievito, e la sequen-

za del frammento clonato viene determinata. Se nel frammento esiste un solo gene, questo deve essere ovviamente il gene ARG1. Tuttavia, se nella sequenza è presente più di un gene, per identificare il gene ARG1 sono richiesti altri passaggi. Dal momento che abbiamo determinato la sequenza del frammento clonato, possiamo progettare dei primer adeguati e amplificare mediante PCR ciascuno dei geni separatamente. I geni amplificati possono ora essere clonati ciascuno dentro un vettore, proprio come nel caso della costruzione di una libreria genomica descritto nella Figura 10.3. Ciascuno dei geni può essere ora saggiato individualmente per la capacità o meno di complementare il gene mutante arg1 e in questo modo si identifica il gene ARG1. In ambito forense, per esempio, la PCR trova utilizzo nell’amplificazione di tracce di DNA provenienti da campioni rinvenuti sulla scena di un crimine, come capelli, sangue o sperma. Il DNA amplificato può quindi essere analizzato e confrontato con quello della vittima e di un sospetto, e i risultati usati per incriminare o scagionare il sospettato del crimine. Questa analisi, detta tipizzazione del DNA (DNA typing, DNA fingerprinting, DNA profiling), sarà discussa in dettaglio più avanti in questo capitolo.

L’RT-PCR e la quantificazione dell’mRNA La PCR viene anche utilizzata in esperimenti nei quali il materiale di partenza è RNA. In questo caso, è necessario prima retrotrascrivere l’RNA in cDNA e, successivamente, amplificare quest’ultimo mediante PCR. Reverse transcription PCR La reverse transcriptionPCR (RT-PCR) è una tecnica altamente sensibile per identificare e quantificare l’RNA, spesso mRNA. Questa metodica prevede tre passaggi. Nel primo il cDNA viene sintetizzato partendo dall’RNA mediante l’enzima trascrittasi inversa (RT) e un primer adeguato, per esempio un oligo(dT) per l’RNA messaggero. (La sintesi del cDNA partendo dall’RNA è descritta nel Capitolo 8 e nella Figura 8.15.) Nel passaggio successivo lo specifico cDNA prodotto viene amplificato mediante una PCR (Figura 9.3) utilizzando primer complementari alle due estremità della molecola. I prodotti della PCR vengono a questo punto analizzati con l’elettroforesi su gel. La tecnica dell’RT-PCR, come la normale PCR, è una tecnica altamente sensibile in grado di rilevare la presenza di RNA di interesse anche se questo costituisce solo una minima frazione degli RNA totali presenti nel campione iniziale. L’RT-PCR viene usata per saggiare la presenza di un particolare RNA, o per quantificare in modo grezzo la concentrazione di un RNA. Per esempio, alcuni virus possiedono un genoma a RNA e, in teoria, l’RT-PCR potrebbe essere impiegata per stabilire se una persona è sta-

La tecnologia del DNA ricombinante

ta infettata dal virus. Un test del genere è stato sviluppato per i virus dell’HIV, del morbillo e della parotite. Se vogliamo determinare la quantità dell’mRNA del gene che ci interessa possiamo ottenere una stima della quantità relativa, vale a dire se l’mRNA del nostro gene è comune, raro o molto raro. La limitazione principale sta nel fatto che è difficile calcolare in maniera precisa la quantità di stampo iniziale mediante l’esame di una banda nel gel ottenuta con numerosi cicli di amplificazione. Resta 3¢

mRNA 5¢

1

Sintesi di cDNA mediante trascrizione inversa

Trascrittasi inversa, primer, dNTP









cDNA

2

Denaturazione 3¢



3¢ 3

5¢ Primer della PCR

Appaiamento dei primer



5¢ 3¢ 5¢ 3¢ 4



Estensione dei primer mediante Taq polimerasi in presenza di SYBR® Green

Taq polimerasi dNTP, SYBR® Green

SYBR® Green (non fluorescente) 3¢

5¢ 3¢ 5¢





5¢ Il SYBR® Green si lega al doppio filamento di DNA 3¢ e diventa fluorescente





















I cicli ripetuti di PCR amplificano il DNA. L’incremento del DNA a doppio filamento viene quantificato misurando la fluorescenza del SYBR® Green

Figura 10.9 Utilizzo della real-time PCR (e del SYBR® Green) per determinare la quantità di mRNA di un gene di interesse.

241

pertanto impossibile determinare la quantità esatta di mRNA per un gene di interesse. Real-time PCR La real-time PCR (detta anche real-time quantitative PCR o quantitative PCR, qPCR) è un metodo di PCR con il quale si misura l’aumento nella quantità di DNA mentre viene amplificato (il che dà alla tecnica il nome di “real-time”). La real-time PCR prevede, come una normale PCR, la denaturazione del DNA (Figura 10.9, passaggio 2), l’appaiamento dei primer (Figura 10.9, passaggio 3), e la loro estensione a opera di una DNA polimerasi termostabile come la Taq polimerasi (Figura 10.9, passaggio 4). Tuttavia, la real-time PCR differisce dalla PCR durante la fase di estensione dei primer (allungamento). Nella versione mostrata nella figura 10.9 (ne esistono molte altre versioni), la miscela di reazione per la sintesi del DNA contiene il SYBR® Green, un intercalante del DNA a elevatissima sensibilità. Il SYBR® Green è intensamente fluorescente quando è legato al DNA, mentre emette una fluorescenza debole quando non è legato al DNA. Durante la PCR, quando il DNA è un singolo filamento, praticamente non c’è fluorescenza rilevabile, ma quando i primer vengono estesi e viene prodotto DNA a doppio filamento il colorante SYBR® Green si lega alle regioni a doppio filamento (Figura 10.9, passaggio 4). Mano a mano che l’estensione procede, un numero sempre maggiore di molecole di SYBR® Green si lega alle molecole di DNA, provocando un incremento della fluorescenza. Quantificando la fluorescenza, il ricercatore può misurare in tempo reale, durante la sintesi di nuovo DNA, la quantità di DNA a doppio filamento nella reazione. Questa misura richiede l’uso di uno speciale termociclatore che utilizza un sistema laser per rilevare la fluorescenza prodotta dopo ogni ciclo di PCR. Il prodotto di reazione (il DNA amplificato e marcato con SYBR® Green) può essere confrontato con controlli che contengono quantità note di DNA di riferimento. Questo permette di stabilire la quantità di templato presente nel campione da analizzare. La real time PCR permette di amplificare quantificando in tempo reale un templato di DNA ma questa tecnica è utilizzata soprattutto per la quantificazione precisa del livello di RNA presente in un campione (Figura 10.9). Così come l’RT-PCR, questa applicazione della real-time PCR, chiamata reverse transcriptionquantitative-PCR implica la sintesi di cDNA catalizzata dalla trascrittasi inversa (Figura 10.9, passaggio 1) a partire dallo stampo a RNA e successivamente l’utilizzo di questo cDNA come stampo per la PCR. La real-time PCR viene utilizzata estensivamente per la quantificazione dei livelli di RNA relativi a molti geni in un ampio spettro di cellule e tessuti di numerosi organismi. Per esempio la real-time PCR è utile nella diagnosi dell’HIV e del virus dell’epatite C (che colpisce il fegato provocando infiammazioni e lesioni tali da costituire la principale causa di trapianto di fegato).

242

Capitolo 10

Nota chiave La reazione a catena della polimerasi (PCR) usa specifici primer oligonucleotidici per amplificare molte migliaia di volte uno specifico segmento di DNA con una procedura automatizzata. La PCR ha molte applicazioni sia nella ricerca sia in campo commerciale, comprese la produzione di specifici segmenti di DNA per il clonaggio o il sequenziamento, l’amplificazione del DNA per diagnosticare specifici difetti genetici e l’amplificazione del DNA per la tipizzazione durante indagini condotte sulla scena di un crimine. Se il cDNA viene utilizzato come stampo per la PCR (RTPCR) è possibile individuare l’mRNA e determinarne la concentrazione.

Applicazione di tecniche molecolari In questo paragrafo discuteremo alcune applicazioni di base della tecnologia del DNA ricombinante, andando dalla manipolazione e dall’analisi del DNA all’espressione genica, e quindi all’analisi delle proteine e ad applica1M 3¢





2

5¢ 3¢

5¢ 3¢



3¢ 1



3¢ 2M

PCR con i primer 1 e 1M 5¢ A 3¢

3¢ 5¢



PCR con i primer 2 e 2M

5¢ 3¢

3¢ B 5¢ Rimuovere i primer. Combinare A + B, denaturare e riappaiare. In alcuni casi A si appaierà con B



3¢ 3¢

5¢ 3¢



3¢ 5¢ Allungamento delle estremità in 3¢ mediante DNA polimerasi

5¢ 3¢

3¢ 5¢ PCR con i primer 1 + 2

5¢ 3¢

Figura 10.10 Un esempio di mutagenesi sito-specifica mediante l’uso della PCR.

3¢ 5¢

zioni più specializzate come la terapia genica. Queste applicazioni sono così ampie che in questa sede si può soltanto considerarle superficialmente. Gli esempi riportati sono stati scelti per descrivere alcune applicazioni come modello di studio, in modo che sia possibile avere un’idea più generale dei tipi di problematiche e di ipotesi che possono essere affrontati con queste metodologie.

Mutagenesi sito-specifica del DNA Lo studio dei mutanti è uno dei pilastri della ricerca genetica. Nel Capitolo 7 abbiamo appreso che si possono indurre mutazioni in organismi sperimentali trattandoli con mutageni. Ottenendo le mutazioni in questo modo, l’intero genoma è bersaglio del mutageno. Così, ogni individuo che sopravvive al trattamento mutageno ha probabilmente molte mutazioni e la sfida diventa quella di trovare i mutanti di interesse attraverso un saggio o una selezione appropriati. Inoltre, sebbene le mutazioni di un particolare gene possano in effetti produrre un fenotipo alterato che può essere usato in un saggio o in una selezione, la mutazione del gene non è guidata, in quanto il trattamento mutageno è casuale. Tuttavia, se per esempio un ricercatore sta studiando la funzione di un particolare gene, e quel gene è stato clonato, allora si possono ottenere in vitro delle mutazioni che abbiano come bersaglio una qualsivoglia parte del gene. Questo approccio è chiamato mutagenesi sito-specifica. Esistono numerosi procedimenti per realizzare la mutagenesi sito-specifica, molti dei quali utilizzano la PCR. La Figura 10.10 illustra un modo in cui una mutazione puntiforme o una piccola inserzione o delezione possono essere ottenute in un DNA clonato (come un gene clonato) con un approccio di mutagenesi basato sulla PCR. Si usano quattro primer: il primer 1 è all’estremità di sinistra della sequenza che deve essere amplificata, il primer 2 è alla sua estremità di destra. Gli altri due primer, 1M e 2M, ibridano all’interno della sequenza di DNA bersaglio, tranne nel punto in cui si desidera introdurre la mutazione (M); 1M e 2M sono complementari tra loro. La mutazione è simbolizzata nella figura come una piccola protrusione nei primer. Per prima cosa si realizza una PCR con i primer 1 e 1M e quindi una seconda PCR con i primer 2 e 2M. Quindi i primer vengono eliminati e i due prodotti di amplificazione A e B vengono mescolati, e i DNA vengono denaturati e poi lasciati appaiare. In alcuni casi questo comporta l’appaiamento di una molecola a singolo filamento A a una molecola a singolo filamento B. La DNA polimerasi può quindi allungare le estremità 3′ dei due filamenti della regione centrale appaiata, producendo un DNA completo a doppia elica. Questa molecola completa con la mutazione introdotta nella regione centrale viene quindi amplificata usando i primer 1 e 2, e il prodotto della PCR viene usato per trasformare una cellula sostituendone la sequenza selvatica.

La tecnologia del DNA ricombinante

Un’applicazione della mutagenesi sito-specifica è la produzione di topi mutanti. Poiché non si possono effettuare studi di mutagenesi con gli esseri umani, i ricercatori provano spesso a mimare l’effetto di mutazioni umane nei topi. Tali modelli murini delle mutazioni umane sono preziosi per accrescere la nostra comprensione del gene coinvolto e, nel caso di geni malattia, si può procedere verso la diagnosi e la cura. Come potremmo studiare la funzione di un gene umano in un topo? Immaginiamo di avere clonato un gene umano e di voler studiare la funzione di un gene analogo in un topo. Possiamo facilmente clonare o localizzare sul genoma sequenziato il gene equivalente di topo, poiché è probabile che i due geni abbiano un livello elevato di similarità. Il gene clonato di topo può quindi subire un knock-out come descritto precedentemente (Capitolo 9). Possiamo caratterizzare i difetti del fenotipo evidenti in questi topi knock-out, mentre, se vogliamo studiare geni umani omologhi in un organismo modello (frequentemente nel topo), possiamo sostituire il gene di topo con una copia transgenica del gene umano. Questo processo è detto umanizzazione ed è attuato modificando il gene di topo (viene impiegato l’approccio di mutagenesi sito-specifica per rendere la copia clonata più simile al gene umano e successivamente vengono utilizzate tecniche di knock-out per sostituire la copia genomica con la versione mutata) oppure realizzando inizialmente il knock-out del gene del topo e successivamente aggiungendo un transgene che esprime il gene umano. Questi topi transgenici possono essere utilizzati, per esempio, per saggiare come la proteina umana reagirebbe a un farmaco sperimentale, senza esporre direttamente individui umani.

Nota chiave Quando un gene è stato clonato, in quel gene si possono realizzare mutazioni specifiche in vitro e il gene mutato può essere quindi studiato in vivo. Le mutazioni possono essere modifiche sito-specifiche nella regione che codifica per il prodotto proteico, tali da influenzare la funzione della proteina. Per studiare i geni umani e per sviluppare e sperimentare trattamenti terapeutici per le malattie genetiche, si possono usare anche tecniche mediante le quali si altera un gene nel genoma di un organismo modello, rendendo questo gene simile al gene umano di interesse.

Analisi dell’espressione di singoli geni Vengono presentati qui due esempi che descrivono l’uso delle tecniche del DNA ricombinante e della PCR per studiare l’espressione genica.

243

Regolazione della trascrizione: repressione da glucosio del gene GAL1 di lievito Nel Capitolo 18 tratteremo in dettaglio la regolazione dell’espressione genica negli eucarioti. L’esempio qui riportato descrive come la tecnologia del DNA ricombinante possa essere usata per studiare la trascrizione genica. Nel lievito Saccharomyces cerevisiae, l’espressione dei geni GAL (galattosio) è indotta dalla presenza nel terreno di crescita dello zucchero galattosio come fonte di carbonio. I prodotti dei geni GAL sono enzimi che controllano il catabolismo del galattosio. Quando però il lievito viene fatto crescere in presenza della sua fonte di carbonio preferita, il glucosio, i geni GAL non sono trascritti (vedi Capitolo 18). Che cosa succede se si aggiunge glucosio a una coltura di lievito che sta già crescendo in un terreno che contiene galattosio? I geni GAL vengono spenti, e non solo viene interrotta la loro trascrizione, ma anche gli mRNA dei geni GAL presenti nella cellula sono degradati velocemente. Quest’ultimo fenomeno fu dimostrato nell’esperimento descritto di seguito e illustrato nella Figura 10.11. Cellule di lievito furono fatte crescere in modo che i loro geni GAL fossero attivati. Quindi, al tempo zero, fu aggiunto glucosio, e furono prelevati campioni cellulari in tempi successivi. Dai campioni fu estratto l’RNA, che fu separato mediante elettroforesi su gel di agarosio. Dopo l’elettroforesi furono condotti esperimenti di northern blot, nei quali fu usato come sonda il gene GAL1, marcato radioattivamente come è stato descritto in precedenza. Nella Figura 10.11 si può vedere facilmente che l’intensità del segnale di ibridazione diminuiva rapidamente durante i 45 minuti nei quali si è protratto l’esperimento. Dopo aver quantificato e riportato in grafico questi risultati, fu evidente che si aveva una perdita veloce di mRNA nei primi 10 minuti, mentre successivamente la quantità di mRNA si riduceva più gradualmente. Splicing alternativo del pre-mRNA: la trasposizione dell’elemento P in Drosophila Nel Capitolo 18 sarà discusso il processo dello splicing alternativo, vale a dire la rimozione di diversi introni da un pre-mRNA in seguito all’uso di siti di splicing diversi, processo che rappresenta uno dei livelli della regolazione dell’espressione genica negli eucarioti. Lo splicing alternativo determina la produzione di molecole di mRNA diverse che Minuti dopo l’aggiunta di glucosio

Figura 10.11 La regolazione della trascrizione del gene di lievito GAL1 da parte del glucosio. Il glucosio è stato aggiunto al tempo zero, e la quantità di trascritto di GAL1 è stata analizzata a vari intervalli di tempo, secondo il metodo descritto nel testo.

244

Capitolo 10

codificano proteine con funzioni diverse. Qui discuteremo dell’espressione di un gene che va incontro a splicing alternativo. Il gene codifica per un enzima responsabile della trasposizione degli elementi P (un tipo di elementi trasponibili) in Drosophila melanogaster (Capitolo 7 e Figura 7.28). Gli elementi P rappresentano un tipo di elemento trasponibile comune in molti ceppi di Drosophila melanogaster. Gli elementi P sono generalmente stabili in Drosophila, nella maggior parte dei casi il loro tasso di trasposizione è molto basso, e non sono quasi mai in grado di trasporre nei tessuti somatici; ma in un moscerino che ha avuto un padre portatore di elementi P (che ha passato alla sua progenie) e una madre che non ne è portatrice, gli elementi P sono in grado di attuare la trasposizione soltanto nei tessuti germinali (riproduttivi). Questa attivazione degli elementi P è detta disgenesi degli ibridi. Lo stesso elemento P porta un singolo gene e questo gene codifica per la trasposasi P, l’enzima richiesto per la trasposizione degli elementi P. Il gene che codifica la trasposasi è stato clonato; è un gene abbastanza piccolo, con dimensioni inferiori a 3 kb, e contiene 4 esoni e 3 introni (Figura 10.12). Mediante northern blot di poli(A)+ RNA isolati da moscerini che hanno subito la disgenesi degli ibridi, utilizzando come sonda l’elemento P clonato, sono stati identificati due trascritti. La lunghezza del trascritto più piccolo è di circa 200 basi inferiore a quella del trascritto più lungo. I moscerini normali hanno soltanto il trascritto più lungo. L’analisi della sequenza dei cDNA preparati usando la trascrittasi inversa a partire dagli mRNA (Capitolo 8 e Figura 8.15) indica che i trascritti sono prodotti mediante splicing alternativo. In particolare nei corpi di tutti i moscerini il terzo introne è

ignorato dal meccanismo di splicing e mantenuto nell’mRNA finale (Figura 10.12, lato sinistro). Questo comporta la sintesi di un mRNA più lungo, che tuttavia codifica per una proteina più corta in quanto nell’introne conservato è presente un codone di stop nel normale quadro di lettura. Questa proteina non riesce ad agire come trasposasi. Nella linea germinale di un moscerino che subisce la disgenesi degli ibridi tutti gli introni subiscono lo splicing e l’mRNA risultante codifica una trasposasi dell’elemento P attiva (Figura 10.12, lato destro).

Analisi delle interazioni proteina-proteina Si studiano i geni e i loro prodotti per capire la struttura e la funzione delle cellule e degli organismi. Da quanto abbiamo già appreso sulle proteine e sul loro ruolo, abbiamo scoperto che molte funzioni cellulari sono svolte da proteine capaci di interagire. Alcuni esempi sono già stati analizzati, come quello dei polipeptidi α-globina e β-globina dell’emoglobina, e quello dei fattori trascrizionali che interagiscono tra di loro e con l’RNA polimerasi a formare il complesso che inizia la trascrizione (vedi Capitolo 5). Un procedimento sperimentale che consente di isolare geni che codificano per proteine che interagiscono con proteine note è il sistema del nimazione doppio ibrido di lievito, chiamato anche saggio della trapIl sistema del pola di interazione, sviluppato doppio ibrido da Stanley Fields e collaboratori di lievito (Figura 10.13). Ecco come funziona. Affinché sia trascritto il gene di lievito GAL1 il cui prodotto metabolizza il galattosio, è necessario che la

Introne 1 Introne 2 Introne 3 Esone 1 Esone 2 Esone 3 Esone 4 DNA Cappuccio pre-mRNA

Coda di poli (A)



AAAAAAA...3¢ Splicing nei tessuti somatici

Splicing nella linea germinale (tessuti riproduttivi)

Introne 3 Esone 1 Esone 2 Esone 3 Esone 4 mRNA 5¢

Esone 1 Esone 2 Esone 3 Esone 4 AAAAAAA...3¢

AUG

Codone di stop

Codone di stop

Proteina trasposasi non funzionale

Figura 10.12 Splicing alternativo specifico rispetto ai vari tessuti nel gene della trasposasi P di Drosophila melanogaster. Nel corpo, il terzo introne non ha subito splicing; di conseguenza il tra-

mRNA 5¢

AAAAAAA...3¢ AUG

Codone di stop

Proteina trasposasi funzionale

scritto non codifica una trasposasi funzionale, mentre nella linea germinale tutti gli introni hanno subito lo splicing e l’mRNA codifica per l’enzima trasposasi funzionale.

MyLab

245

La tecnologia del DNA ricombinante Promotore Promotore AD BD Y3 Y1 Marcatore selettivo 2

X Marcatore selettivo 1

Y2

Libreria di espressione nel lievito di cDNA fusi al dominio di attivazione di Gal4p

Vettore di espressione nel lievito con la sequenza per il dominio di legame al DNA (BD) di Gal4p fusa alla sequenza di una proteina nota

Co-trasformazione nel lievito dove vengono prodotte proteine di fusione

AD AD Y2 Y2 AD AD AD AD Y3 Y3 Y1 Y1

X X BD BD Proteina di fusione BD–X

Se una proteina di fusione Y–AD si lega alla proteina di fusione BD–X il gene reporter viene espresso

AD

Y1 AD Y1

X

RNA polimerasi

X BD BD Gene reporter lacZ UASG

Proteine di fusione Y1–AD, Y2–AD, Y3–AD ecc.

Trascrizione

proteina regolatrice Gal4p (codificata dal gene GAL4) si leghi a un elemento del promotore di GAL1 chiamato sequenza G di attivazione a monte (UASG, Upstream Activation Sequence) (Figura 10.13). Gal4p ha due domini: un dominio di legame al DNA (BD), che si lega a UASG, e un dominio di attivazione (AD), che facilita il legame dell’RNA polimerasi al promotore e l’inizio della trascrizione. Nel sistema del doppio ibrido di lievito vengono usati due plasmidi di espressione nel lievito. Un tipo di plasmide contiene la sequenza del dominio BD di Gal4p fusa alla sequenza della proteina (X) nota. L’altro tipo di plasmide contiene la sequenza del dominio di attivazione AD di Gal4p fusa a sequenze codificanti (Y) di una libreria di cDNA. Un ceppo di lievito viene co-trasformato con un plasmide BD e con la libreria di plasmidi AD in modo che ogni trasformante abbia il plasmide BD e uno dei plasmidi dalla libreria AD. Nel cromosoma del ceppo di lievito che è co-trasformato c’è un gene reporter, cioè un gene che codifica un prodotto facilmente analizzabile, a valle di una UASG. Nella Figura 10.13 il gene reporter è il gene lacZ di E. coli che codifica la β-galattosidasi. Le

Figura 10.13 Individuazione di interazioni proteina-proteina con il sistema del doppio ibrido di lievito.

colonie di lievito che esprimono questo gene diventano azzurre in presenza del substrato incolore X-gal (vedi Capitolo 8). Il gene reporter è espresso soltanto quando la proteina ignota Y della proteina di fusione con AD interagisce con la proteina nota X della proteina di fusione con BD. L’interazione tra la proteina X e la proteina Y avvicina i domini BD e AD di Gal4p, che in questo modo sono in grado di attivare la trascrizione del gene reporter. Se X e Y non interagiscono tra loro, i domini BD e AD di Gal4p sono separati e il gene reporter non viene attivato. In altre parole, la proteina di fusione con BD funge da esca per la proteina, o le proteine, che interagiscono con X. Quando si ottiene un’interazione, evidenziata dall’espressione del gene reporter, si può isolare dal lievito il plasmide AD e la sequenza di cDNA corrispondente può essere usata per isolare il gene genomico. Un esempio dell’utilizzo del sistema del doppio ibrido di lievito è nello studio delle interazioni tra le proteine umane perossine, codificate dai geni PEX, che sono necessarie per la biogenesi dei perossisomi. (I perossisomi sono organelli a membrana unica presenti in quasi tutte le cellule eucariote; uno dei processi metabolici più

246

Capitolo 10

importanti dei perossisomi è quello della β-ossidazione dagli acidi grassi a catena lunga.) Il sistema del doppio ibrido di lievito ha dimostrato che le proteine PEX1 e PEX6 interagiscono negli individui normali e che la perdita dell’interazione tra queste due proteine è una delle cause più frequenti della malattia neurologica nota come sindrome di Zellweger (OMIM 214100). Gli individui con la sindrome di Zellweger hanno perso la funzione di molti enzimi dei perossisomi, hanno anomalie neurologiche, epatiche e renali gravi, manifestano ritardo mentale e muoiono nella prima infanzia.

Nota chiave Le tecniche del DNA ricombinante e della PCR sono ampiamente usate nello studio di processi biologici di base. Per esempio, il DNA può essere analizzato in dettaglio (come avviene mediante la costruzione di mappe di restrizione), si può determinare la dimensione e la quantità degli RNA trascritti, si possono analizzare gli eventi di maturazione dell’RNA e si possono studiare le interazioni proteina-proteina.

Impieghi dei polimorfismi del DNA nell’analisi genetica Fino a questo punto della trattazione abbiamo focalizzato la nostra attenzione sui geni come marcatori per l’analisi genetica. I geni hanno alleli diversi che producono fenotipi diversi la cui ereditarietà può essere seguita nelle generazioni. Ogni gene ha una precisa localizzazione – locus – su un preciso cromosoma (la determinazione della localizzazione di un gene nel genoma richiede approcci di mappatura genetica, trattati nel Capitolo 14, e approcci di mappatura fisica, trattati nel Capitolo 8). Un polimorfismo del DNA consiste in una delle due o più forme alternative (alleli) potenzialmente presenti in un locus cromosomico, che differiscono per la sequenza nucleotidica (un esempio sono gli SNP, dei quali abbiamo parlato nel Capitolo 8) oppure hanno un numero variabile di unità nucleotidiche ripetute in tandem o indel. (Indel è un acronimo creato dalle parole “inserzione” e “delezione” e riguarda brevi inserzioni o delezioni nel genoma.) Questa definizione introduce il concetto che un allele non è solo la forma alternativa di un gene, poiché un polimorfismo del DNA può essere ovunque nel genoma, non necessariamente in un gene. Quindi ogni posizione cromosomica può essere considerata un locus e, nella popolazione, possono esserci una o più differenze nella sequenza corrispondente a essa (ricordiamo però che in un individuo diploide le forme alleliche per un singolo locus saranno sempre al massimo due). Molti polimorfismi del DNA sono utili negli studi di mappatura genetica (e in altri settori della ricerca) e sono chiama-

ti marcatori del DNA. Poiché non ci sono prodotti che interagiscano a dare un fenotipo, gli alleli dei marcatori del DNA sono codominanti, vale a dire che essi non mostrano dominanza o recessività, come si vede per gli alleli di molti geni. I marcatori del DNA sono rilevati con strumenti molecolari (generalmente l’ibridazione in Southern blot o microarray a DNA, o la PCR) che si focalizzano sul DNA stesso, piuttosto che sul prodotto genico o sul fenotipo associato. Con i geni e con i marcatori del DNA si possono calcolare le distanze di mappa tra i geni, tra i marcatori del DNA, e tra un gene e un marcatore del DNA (vedi Capitolo 14). Come vedremo in seguito in questo capitolo, i polimorfismi del DNA hanno molte altre applicazioni oltre alla mappatura.

Classi di polimorfismi del DNA Prenderemo in considerazione tre classi principali di polimorfismi del DNA: i polimorfismi di un singolo nucleotide (SNP), le corte ripetizioni in tandem (STR), e il numero variabile di ripetizioni in tandem (VNTR), e descriveremo i modi con i quali esse possono essere analizzate. Ci concentreremo sul genoma umano, ma questi polimorfismi si trovano anche nei genomi di altri organismi. I polimorfismi di singoli nucleotidi (SNP, “Snip”) Come è stato descritto nel Capitolo 8, gli SNP possono essere utilizzati per la caratterizzazione e la mappatura dei genomi. Qui discuteremo più in dettaglio l’utilizzo di singoli SNP. Rilevamento di SNP che modificano i siti di restrizione Una piccola frazione di SNP influenza i siti di restrizione, creandoli o eliminandoli. Tali SNP possono essere rilevati usando l’enzima di restrizione per il sito di interesse oppure il Southern blot o, secondo il metodo più attuale, la PCR. I diversi profili dei siti di restrizione nei diversi genomi determinano i polimorfismi della lunghezza dei frammenti di restrizione (RFLP, Restriction Fragment Length Polymorphism), che sono i frammenti di lunghezza diversa prodotti dagli enzimi di restrizione. L’utilità degli RFLP sarà chiarita negli esempi che seguono. La Figura 10.14 descrive l’approccio in Southern blot per studiare SNP che influenzano i siti di restrizione. Essa mostra un segmento teorico di 7 kb in un genoma con una coppia di alleli SNP, uno dei quali (allele SNP 1) ha una coppia di basi T-A in un sito di restrizione BamHI, e l’altro (allele SNP 2) una coppia di basi C-G che elimina quel sito. Il sito in questione è fiancheggiato da altri due siti BamHI, uno 2 kb a sinistra e l’altro 5 kb a destra. Per determinare quali alleli SNP siano presenti è necessario seguire i passaggi del Southern blot illustrati nella Figura 10.8. In pratica, il DNA genomico viene isolato e digerito con BamHI e i frammenti prodotti dal taglio sono separati per elettroforesi su gel di agarosio. Dopo essere stati tra-

La tecnologia del DNA ricombinante

sferiti su un filtro, i frammenti di DNA di interesse vengono visualizzati mediante ibridazione con una sonda marcata (che nell’esempio mostrato in Figura 10.14 si estende per una gran parte del DNA), quindi segue un’autoradiografia. I risultati per i possibili genotipi sono visibili nella parte bassa della figura. Quando un Southern blot viene ibridato, la sonda si appaia a ogni frammento in cui siano presenti sequenze complementari e così la sonda può legarsi a più di una banda, come si vede nella Figura 10.14. Nel caso di marcatori del DNA, il genotipo corrispondente sarà indicato da due numeri, che corrispondono ai diversi alleli. Un omozigote per l’allele SNP 1 (1,1), che ha il sito BamHI intatto, mostrerà due bande, una da 5 kb e l’altra da 2 kb. Un omozigote per l’allele SNP 2 (2,2), che ha perso il sito BamHI, mostrerà una sola banda da 7 kb. Un eterozigote per i due alleli SNP (1,2) mostrerà tre bande, da 7 kb (dall’omologo con l’allele 2), da 5 kb e da 2 kb (queste ultime dall’omologo con l’allele 1). La Figura 10.15 mostra il metodo di analisi RFLPPCR. Consideriamo un frammento di 2000 bp del genoma con una coppia di alleli SNP simili alla coppia dell’eSito BamHI

Allele SNP 1

GG A T C C C C T A GG

GG A T C C C C T A GG

Sito BamHI

sempio precedente che influenzano un sito BamHI a 500 bp dall’estremità di sinistra del frammento. Sono disponibili primer di PCR che riconoscono il DNA alle estremità di sinistra e di destra. L’analisi in PCR degli alleli SNP che influenzano i siti di restrizione prevede l’isolamento del DNA genomico, l’amplificazione del segmento di DNA di interesse usando i primer di sinistra e di destra, la digestione del frammento amplificato con l’enzima di restrizione (qui BamHI) e l’uso dell’elettroforesi su gel di agarosio per esaminare le dimensioni dei frammenti prodotti. Nel nostro esempio, i risultati dei possibili genotipi sono illustrati nella parte bassa della figura. Un omozigote per l’allele SNP 1 (1,1) darà un frammento amplificato di DNA che può essere digerito con BamHI per produrre frammenti di 1500 e di 500 bp. Un omozigote per l’allele SNP 2 (2,2) darà un frammento di 2000 bp, e un eterozigote per i due alleli (1,2) darà i frammenti di 2000, 1500 e 500 bp. Rilevamento di tutti gli SNP Poiché la maggior parte degli SNP non influenza siti di restrizione, per analizzaPrimer di sinistra della PCR

GG A T C C C C T A GG

Sito BamHI

2 kb

Allele SNP 1

Sito BamHI

GG A T C C C C T A GG

5 kb 500 bp

Allele SNP 2 GG A T C C C C T A GG

1500 bp Primer Allele Assenza del sito BamHI di destra per la PCR SNP 2

Assenza del sito BamHI

GG A C C C C C T GGG

247

GG A T C C C C T A GG

GG A C C C C C T GGG

7 kb 2000 bp Sonda Isolamento del DNA genomico, amplificazione della PCR e quindi digestione con BamHI

Digestione con BamHI, Southern blot

Genotipi dell’allele SNP

Genotipi dell’allele SNP (1,1)

Dimensioni 7 del DNA (kb) 5

(2,2)

(1,1)

(1,2)

Autoradiogramma

2

Figura 10.14 Il metodo del Southern blot per studiare gli SNP che influenzano i siti di restrizione. Un frammento di 7 kb del cromosoma ha un sito BamHI a ogni estremità. L’allele SNP 1 (in alto) ha un sito BamHI a 2 kb dall’estremità di sinistra, mentre l’allele SNP 2 (in basso) ha una coppia di basi G-C al posto della coppia T-A, cosicché il sito BamHI è andato perduto. La digestione con BamHI dei campioni di DNA derivati da individui che hanno genotipi SNP diversi, seguita dal Southern blot, produce la distribuzione delle bande illustrata nella parte inferiore della figura.

Dimensioni 2000 del DNA 1500 (coppie di basi)

(2,2)

(1,2)

Risultato dell’elettroforesi su gel di agarosio

500

Figura 10.15 Il metodo della PCR per studiare gli SNP che influenzano i siti di restrizione Un frammento di 2000 bp del cromosoma ha alleli SNP a 500 bp dall’estremità di sinistra. Il variare della coppia T-A dell’allele SNP 1 (in alto) in G-C nell’allele SNP 2 (in basso) modifica un sito BamHI in una sequenza che non viene riconosciuta dall’enzima di restrizione. La PCR dei campioni di DNA derivati da individui che hanno genotipi SNP diversi, usando i primer di sinistra e di destra mostrati, seguita da digestione con BamHI produce il profilo di bandeggio illustrato nella parte inferiore.

248

Capitolo 10

re gli SNP in generale sono necessari altri metodi. Si può ben immaginare che analizzare un particolare locus SNP nell’uomo sia una sfida, poiché questo rappresenta una coppia di basi polimorfica nei tre miliardi di coppie di basi nel genoma. È possibile analizzare singoli SNP mediante l’analisi di ibridazione di oligonucleotidi allele-specifici (ASO, Allele-Specific Oligonucleotide) (Figura 10.16). In questo procedimento vengono sintetizzati corti oligonucleotidi che sono complementari a ogni allele SNP, e ogni nucleotide è deposto (e poi legato chimicamente) su un filtro. Si può quindi utilizzare come stampo per la PCR il DNA dell’individuo del quale vogliamo determinare il genotipo. I primer per questa PCR sono progettati per amplificare la regione che contiene l’SNP. Alcuni dei nucleotidi utilizzati per la PCR sono marcati, radioattivamente o chimicamente, e forniscono così un prodotto di PCR marcato (il DNA bersaglio). Le molecole di DNA bersaglio sono poi denaturate e aggiunte al filtro con le sonde dell’allele SNP non marcato. Un filamento di DNA bersaglio si può ibridare a una sonda SNP se le loro sequenze sono complementari. L’ibridazione viene condotta in condizioni di alta stringenza, il che significa che tali condizioni favoriscono soltanto l’appaiamento perfetto tra la sonda e il DNA bersaglio. Se l’ibridazione avviene, l’allele del DNA bersaglio è perfettamente complementare alla sonda SNP depositata sul filtro. Questa ibridazione è visualizzata mediante il rilevamento della presenza di marcatura sul DNA bersaglio in un particolare sito corrispondente a uno specifico allele SNP depositato sul filtro. In queste condizioni di elevata stringenza, una sonda dell’allele SNP non si ibriderà al DNA bersaglio anche in caso di una sola coppia di basi non complementare. Vale a dire che una sonda dell’allele SNP non si ibriderà a un DNA bersaglio contenente un qualsiasi altro allele SNP per quel locus.

L’ibrido con le basi perfettamente appaiate è stabile; viene rilevata la marcatura sul filtro

5¢ 3¢

Corte ripetizioni in tandem (STR) Le corte ripetizioni in tandem (STR, Short Tandem Repeats), chiamate anche microsatelliti o ripetizioni di sequenze semplici (SSR), sono sequenze di DNA di 2-6 coppie di basi ripetute in tandem. In ogni locus STR, una sequenza STR può essere ripetuta in qualunque punto da poche volte, fino a circa 100 volte. Esempi sono le ripetizioni di dinucleotidi, (GT)n, e le ripetizioni di trinucleotidi, (CAG)n. È stato stimato che nel genoma umano vi siano circa 128 000 STR dinucleotidici, 8740 trinucleotidici, 23 680 tetranucleotidici, 4300 pentanucleotidici e 230 esanucleotidici. Gli esanucleotidi includono le sequenze ripetute che si trovano in corrispondenza dei telomeri. Molte STR sono polimorfiche in una popolazione, pertanto esse sono diventate preziose in molti studi di mappatura genetica e medicina legale. Poiché la lunghezza complessiva di una STR è piuttosto breve, il metodo preferito per analizzare i loci polimorfici STR è la PCR (Figura 10.17). Nella figura sono illustrati due alleli di un locus di STR, uno con 6 copie della ripetizione GATA e l’altro con 10 copie. In una popolazione saranno presenti molti alleli di dimensioni diverse a un locus STR. Per esempio, in un particolare locus STR umano con la ripetizione GATA, vi sono alleli che hanno da 6 a 15 copie della ripetizione. Per condurre l’analisi si utilizzano primer progettati sulle sequenze che fiancheggiano il locus. La PCR produrrà frammenti di DNA di dimensioni diverse che comprendono la regione di estensione dell’STR e il DNA compreso tra i primer utilizzati nella PCR e gli STR. Per questi due alleli, i frammenti di DNA si differenzieranno di 16 bp, a causa della differenza di quattro ripetizioni. Analizzando il DNA genomico derivato da individui diversi, questo approccio di PCR può distinguere gli individui omozigoti da quelli eterozigoti e può definire il numero reale di copie di ogni ripetizione. Entrambi i risultati sono definiti dalle lunghezze dei frammenti di DNA amplificati.

Sonda oligonucleotidica (non marcata) dell’allele SNP attaccata al filtro 3¢

GC C A T T A A G T C T T C A T C C C TA CGG T A A T T C AG A AG T AGGG AT

Locus SNP



DNA bersaglio amplificato con PCR (marcato)

Differenza di una singola base: l’ibrido non si può formare; nessuna marcatura viene rilevata sul filtro Basi non complementari; l’appaiamento tra le basi non può aver luogo 5¢



3¢ GC C A T T A A G T C T T C A T C C C TA CGG T A A T T C A C A AG T AGGG AT



Figura 10.16 Genotipizzazione di uno SNP mediante analisi di ibridazione con oligonucleotidi allele-specifici (ASO). Le sonde oligonucleotidiche dell’allele SNP sono legate a un filtro. Per amplificare la regione di DNA bersaglio che contiene il locus SNP viene utilizzata la PRC. Durante l’amplificazione, il DNA viene marcato radioattivamente o chimicamente. Il DNA bersaglio marcato è ibridato alle sonde SNP non marcate presenti sul filtro in condizioni nelle quali l’appaiamento può avvenire solo se le sequenze sono perfettamente complementari (parte della figura in alto). L’ibridazione viene visualizzata mediante rilevamento della marcatura del DNA bersaglio ora legato alla sonda sul filtro. In tali condizioni di ibridazione, la presenza anche di una sola coppia di basi non complementari – un polimorfismo SNP – è sufficiente per impedire l’ibridazione tra il DNA bersaglio e la sonda (parte della figura in basso). In questo caso non si rileva alcun segnale di marcatura.

La tecnologia del DNA ricombinante Alleli contenenti corte ripetizioni in tandem (STR) Primer di sinistra della PCR

Allele STR 1 (6 ripetizioni)

Primer di destra della PCR GATA

Allele STR 2 (10 ripetizioni) PCR, elettroforesi su gel

Genotipo STR (6,6)

(10,10)

(6,10)

249

locus VNTR. I metodi classici per studiare i loci VNTR sono quindi la digestione con enzimi di restrizione e il Southern blot. Il DNA genomico viene isolato e digerito con un enzima di restrizione che taglia esternamente al locus VNTR. I frammenti di restrizione vengono separati mediante elettroforesi su gel e trasferiti quindi su un filtro mediante Southern blot. La lunghezza dell’allele VNTR è determinata usando come sonda la sequenza della particolare ripetizione del locus VNTR. Come per l’analisi delle STR, i risultati indicano l’allele, o gli alleli, presente nel genoma studiato. Per esempio, un individuo potrebbe essere omozigote o eterozigote per gli alleli di un locus. In uno studio di popolazione si può determinare l’intervallo degli alleli per un certo locus. Vi sono due tipi di loci VNTR: i loci unici e i loci multipli. In altre parole, vi può essere una sola copia di un locus VNTR nel genoma di un organismo (con la sua unica sequenza di ripetizione), oppure vi possono essere molte copie disperse nel genoma. Se una sonda rileva soltanto un locus VNTR, essa è chiamata sonda monolocus, oppure sonda a locus singolo. Le sonde che rilevano loci VNTR in molte posizioni del genoma sono note come sonde multiloci.

Nota chiave Figura 10.17 Uso della PCR per determinare quali alleli STR (microsatelliti) siano presenti. Si isola DNA genomico e i primer di PCR che fiancheggiano un locus STR vengono usati per amplificare la porzione di DNA che contiene le ripetizioni. Le dimensioni dei frammenti di DNA prodotti sono determinate mediante elettroforesi su gel di agarosio. Nella figura l’allele STR 1 ha 6 ripetizioni GATA mentre l’allele STR 2 ne ha 10. Il gel mostra i tre genotipi possibili per questi due alleli: (6,6) (cioè entrambi gli omologhi hanno l’allele con 6 ripetizioni), (10,10) e (6,10). In realtà è tipico che in un locus STR esista un’ampia variazione nel numero delle ripetizioni.

Numero variabile di ripetizioni in tandem (VNTR) Le ripetizioni in tandem in numero variabile (VNTR, Variable Number Tandem Repeats), chiamate anche minisatelliti, sono simili alle STR, ma l’unità ripetuta è più lunga di quella delle STR, e va da 7 ad alcune decine di basi di lunghezza. Le VNTR sono state scoperte da Alec J. Jeffrey nel 1985. La scoperta ha costituito la prima dimostrazione di polimorfismo di sequenza del DNA nel genoma umano. Nel genoma umano vi sono molte meno VNTR che STR. I loci VNTR mostrano anch’essi dei polimorfismi. La lunghezza delle ripetizioni VNTR è maggiore di quella delle STR, e quindi la PCR di norma non è un metodo conveniente per analizzarle, proprio per la lunghezza complessiva del DNA da amplificare per analizzare un

Un polimorfismo del DNA è una delle due o più forme alternative di un locus che differiscono nella sequenza nucleotidica oppure hanno un numero variabile di sequenze ripetute in tandem. I loci polimorfici sono marcatori del DNA che, come i geni, possono essere utilizzati in esperimenti di mappatura e in altre applicazioni. I fenotipi dei loci polimorfici sono le variazioni di DNA che vengono analizzate a livello molecolare. Esempi di polimorfismi del DNA sono i polimorfismi di un singolo nucleotide (SNP), le corte ripetizioni in tandem (STR) e il numero variabile di ripetizioni in tandem (VNTR).

Test molecolari del DNA per le mutazioni associate a malattie genetiche umane Tutti i tipi di polimorfismi del DNA possono essere utilizzati per la diagnosi di malattie umane. Essi sono numerosi e facili da analizzare grazie alle metodiche odierne. I marcatori del DNA possono trovarsi vicino a un gene che causa una specifica patologia (quindi essere associati a esso; vedi Capitolo 14); in questo caso possiamo analizzarne l’ereditarietà e tentare di prevedere se un individuo erediterà o non erediterà l’allele che causa la malattia. Ovviamente questo è più facile quando addirittura il polimorfismo è parte del gene stesso, piuttosto che situato vicino al gene. Per un numero sempre maggiore di malat-

250

Capitolo 10

tie genetiche, come la malattia di Huntington, l’emofilia, la fibrosi cistica, la malattia di Tay-Sachs e l’anemia falciforme, si possono effettuare test molecolari sul DNA per determinare la presenza di mutazioni correlate alla malattia. Le mutazioni considerate ricadono nelle classi dei polimorfismi del DNA che abbiamo appena discusso, quindi potremo vedere alcune applicazioni pratiche dei metodi che utilizzano questi polimorfismi. I concetti alla base del test molecolare del DNA Un test genetico consente di determinare se un individuo sintomatico, oppure ad alto rischio di sviluppare una malattia genetica per la sua storia familiare, porta effettivamente una particolare mutazione genica. Un test molecolare del DNA è un tipo particolare di saggio genetico che si focalizza sulla natura molecolare delle mutazioni associate a una malattia. La scelta dei saggi molecolari del DNA, quindi, dipende dalle conoscenze circa le mutazioni geniche che causano la malattia di interesse. Queste conoscenze si ottengono sequenziando il gene coinvolto (una volta che è stato identificato). Una complicazione del test genetico consiste nel fatto che in un gene molte mutazioni diverse possono causare la perdita di funzione e condurre pertanto allo sviluppo della malattia. Spesso un singolo test molecolare non è in grado di individuare tutte le mutazioni possibili che coinvolgono il gene in questione. Per esempio, i due geni BRCA1 (OMIM 113705) e BRCA2 (OMIM 600185) sono implicati nello sviluppo di cancro al seno e alle ovaie. Quando funzionano normalmente, i prodotti di BRCA1 e BRCA2 hanno un ruolo nel controllo della crescita cellulare nei tessuti del seno e delle ovaie. Tuttavia, mutazioni che causano la perdita o il funzionamento aberrante dei prodotti di questi due geni possono portare allo sviluppo di cancro (nel Capitolo 20 è presente una discussione più dettagliata sul ruolo dei geni BRCA nel cancro). Nei geni BRCA1 e BRCA2 sono state individuate centinaia di mutazioni, ma il rischio di sviluppare cancro al seno varia molto tra le pazienti in funzione della mutazione della quale sono portatrici. Ovviamente una situazione del genere rende impossibile lo sviluppo di un singolo test molecolare del DNA per le mutazioni nei geni BRCA per una sua applicazione diagnostica. Più oltre nel capitolo discuteremo un saggio basato su microarray per valutare le mutazioni di BRCA. È importante rilevare che un test genetico permette al ricercatore di scoprire principalmente se un individuo ha una mutazione nota per essere coinvolta nell’insorgenza di una malattia genetica. Tuttavia, un test genetico è diverso dalla ricerca di una malattia. Quest’ultima è generalmente condotta su individui che non presentano i sintomi della malattia oppure che non hanno una storia familiare di ricorrenza della malattia, mentre il test genetico viene effettuato su una popolazione scelta di individui che hanno i sintomi della malattia o una storia familiare di ricorrenza signifi-

cativa di questa. Le mammografie, per esempio, sono test clinici che individuano lesioni al seno che potrebbero portare al cancro, prima che vi siano sintomi clinici. I test genetici per il cancro alla mammella, invece, rilevano la presenza o l’assenza di mutazioni potenzialmente associate allo sviluppo di cancro, anche se non sono in grado di prevedere se il cancro alla mammella si svilupperà o meno. Secondo lo stesso criterio, i test genetici sono diversi dai test che diagnosticano una malattia. I test diagnostici rivelano se vi è la malattia e quanto la malattia è estesa. La biopsia di una cisti al seno, per esempio, è un test diagnostico che determina se la lesione è benigna o cancerosa. Lo scopo dei test genetici nell’uomo I test genetici sono effettuati principalmente per tre scopi: la diagnosi prenatale, la valutazione dei neonati e l’identificazione dei portatori sani (eterozigoti) di un allele mutato. La diagnosi prenatale ha lo scopo di verificare se un feto è a rischio per una malattia genetica. I campioni di amniocentesi o i prelievi di villi corionici possono essere analizzati per la presenza di mutazioni specifiche o per anomalie biochimiche o cromosomiche (vedi Capitolo 4). Se, per esempio, entrambi i genitori sono portatori sani (eterozigoti) del gene per una malattia genetica, vi è 1/4 di possibilità che il feto sia omozigote per l’allele mutato (vedi Capitolo 11) e il rischio di sviluppare la malattia è molto alto. Più di recente sono state sviluppate tecniche per indagare la presenza di difetti genetici negli embrioni prodotti mediante fecondazione in vitro, prima che siano impiantati nelle madri. Così gli embrioni con geni mutati che potrebbero portare allo sviluppo di malattie genetiche gravi possono essere rimossi prima dell’impianto. Il test per verificare se un individuo è portatore sano (eterozigote) di una mutazione genica recessiva è effettuato per identificare quegli individui che potrebbero trasmettere il gene dannoso alla progenie. Sono disponibili test per individuare i portatori sani di molte malattie, come la malattia di Huntington, la distrofia muscolare di Duchenne e la fibrosi cistica. Anche i neonati possono essere sottoposti a un test per verificare la presenza di mutazioni specifiche. Per esempio, nel Capitolo 4 si è rilevato che negli Stati Uniti tutti i neonati sono sottoposti a test per la fenilchetonuria mediante il test di Guthrie sul sangue del neonato. Sono disponibili anche test per gruppi ad alto rischio per determinate malattie genetiche, quali l’anemia falciforme per gli afroamericani, e la malattia di Tay-Sachs per gli ebrei aschenaziti. Questi test genetici, insieme a quelli molecolari sul DNA descritti di seguito, vengono effettuati su campioni di sangue o su tamponi orali. Esempi di test molecolari del DNA Per i test molecolari del DNA generalmente i campioni vengono analiz-

La tecnologia del DNA ricombinante

zati per digestione con enzimi di restrizione e Southern blot, mediante procedure basate sulla PCR, o mediante analisi basata su microarray a DNA. Qui esamineremo alcuni esempi.

MyLab

Test basati sull’analisi dei RFLP Una mutazione associata a una malattia genetica può causare la perdita o l’acquisizione di un sito di restrinimazione zione nel gene o in una regione che lo fiancheggia. Come Test molecolare abbiamo appreso in precedel DNA per denza, il sito cromosomico in individuare cui avviene la mutazione è un mutazioni genilocus SNP e i diversi profili che responsabili dei siti di restrizione determidi malattia nano i polimorfismi della nell’uomo lunghezza dei frammenti di restrizione (RFLP). Si ricordi che i marcatori molecolari del DNA sono codominanti, cosicché possiamo determinare il genotipo esatto di un individuo analizzato, anche quando la malattia si manifesta solo in individui omozigoti per un allele recessivo. Nel caso dell’anemia falciforme, per esempio, la variazione di una singola coppia di basi nel gene per il polipeptide β-globina dell’emoglobina dà luogo a una forma anomala di emoglobina, Hb-S, anziché alla forma normale Hb-A (vedi Capitolo 4). Le molecole Hb-S si associano in modo anormale, il che porta all’aspetto falciforme dei globuli rossi, al danneggiamento del tessuto ed eventualmente a morte. La mutazione nella cellula falciforme modifica una coppia di basi A-T in una coppia di basi T-A (il sesto codone della β-globina è mutato da GAG in GUG). A causa di questo allele SNP, si ha

251

l’inserimento nel polipeptide di una valina al posto di un acido glutammico (Figura 10.18). La mutazione produce anche un RFLP per l’enzima di restrizione DdeI. Il sito di DdeI è 5′-CTNAG-3′ 3′-GANTC-5′ nel quale la base centrale (N) può essere una delle quattro basi possibili. La mutazione da A-T a T-A cambia la quarta coppia di basi nel sito di restrizione. Quindi, nel gene normale βA della β-globina, vi sono tre siti DdeI, uno a monte dell’inizio del gene e gli altri due all’interno della sequenza codificante (Figura 10.19a). Nel gene mutante per l’anemia falciforme βS, la mutazione ha eliminato il sito DdeI centrale (Figura 10.18), lasciando soltanto due siti DdeI (Figura 10.19a). Quando il DNA di individui normali viene digerito con DdeI e i frammenti risolti mediante elettroforesi su gel vengono trasferiti su un filtro attraverso Southern blot, e quindi saggiati con a) Siti di restrizione DdeI bS (allele mutante dell’anemia falciforme) Gene per la b-globina DNA 376 bp DdeI

DdeI Sonda bA (allele

normale) 175 bp DdeI

201 bp

DdeI

DdeI

Sonda b-globina b) Frammenti di DdeI visualizzabili in Southern blot ibridato con un frammento contenente l’inizio del gene per la b-globina

DdeI

Hb-A DNA

5¢ 3¢

G T G C A C C T G A C T C C T G AG G AG C A G G T G GA C T G A G G A C T C C T C

3¢ 5¢

mRNA



1 2 3 4 5 6 7 G U G C A C C U G A C U C C U G A G GAG



Anemia falciforme (omozigote)

Normale (omozigote)

Eterozigote

bp Polipeptide

Val

His

Leu Thr

Pro Glu Glu ... 376 Migrazione

Hb-S DNA

5¢ 3¢

G T G C A C C T G A C T C C T G T G G AG C A G G T G G A C T G AG GA C AC C T C

3¢ 5¢

mRNA



1 2 3 4 5 6 7 G U G C A C C U G A C U C C U GUG GAG



Polipeptide

Val

His

Leu Thr

Pro Val

Glu ...

Figura 10.18 Frammento iniziale del gene, dell’mRNA e del polipeptide della b-globina, con le sequenze dell’allele normale Hb-A e dell’allele mutato Hb-S. Le differenze di sequenza tra HB-A e Hb-S sono visibili in rosso. La mutazione altera un sito di restrizione DdeI (evidenziato nel DNA di Hb-A).

201 175

Figura 10.19 Individuazione del gene per l’anemia falciforme per mezzo del polimorfismo della lunghezza dei frammenti di restrizione mediante DdeI. (a) Segmenti di DNA che mostrano i siti di restrizione DdeI. (b) I risultati dell’analisi del DNA tagliato con DdeI, sottoposto a elettroforesi, trasferito su membrana e ibridato con una sonda per la β-globina.

252

Capitolo 10

l’estremità 5′ di un gene della β-globina clonato, si vedono due frammenti da 175 e 201 bp (Figura 10.19b). Il DNA di individui falcemici analizzato allo stesso modo dà un frammento da 376 bp, a causa della perdita del sito DdeI. Gli individui eterozigoti possono essere individuati per la presenza di tre bande da 376, 201 e 175 bp. In questo caso, quindi, come raramente succede, il polimorfismo riguarda sequenze dentro il gene responsabile della patologia, non vicine a esso. Non tutti gli RFLP, infatti, derivano da cambiamenti in siti di restrizione che rappresentano essi stessi il sito in cui avviene nel gene la mutazione responsabile del suo funzionamento anomalo. Molti derivano da cambiamenti nel DNA che fiancheggia il gene, qualche volta a rilevante distanza da esso. Questo è il caso di un RFLP associato alla malattia genetica fenilchetonuria (PKU; Capitolo 4). Dopo la digestione del DNA genomico con HpaI, il Southern blot e l’ibridazione con una sonda di cDNA derivata dall’mRNA del gene per la fenilalanina idrossilasi, si ottengono frammenti di restrizione con dimensioni diverse da DNA isolato da individui con PKU e da individui omozigoti normali. L’RFLP in questione deriva da una differenza esterna alla regione codificante del gene, in questo caso in 3′ rispetto al gene. L’RFLP può essere usato per la diagnosi di PKU nei feti dopo amniocentesi o campionamento dai villi coriali. In questi casi, l’individuazione della malattia genetica si basa sull’associazione dell’RFLP fiancheggiante, che segrega insieme alla mutazione genica nella maggior parte dei casi (vedi Capitolo 14, “Studi di associazione nell’uomo” e Box 14.1). Raramente può aver luogo ricombinazione tra l’RFLP e il gene in esame e ciò può causare qualche difficoltà nell’interpretazione dei risultati. Test genetici che utilizzano approcci basati sulla PCR Possono essere effettuati test molecolari del DNA basati sulla PCR soltanto se sono disponibili informazioni sulla sequenza tali da permettere di disegnare gli oligonucleotidi utilizzati nella reazione di amplificazione. Un test molto utilizzato che si basa sulla PCR è l’ibridazione con un oligonucleotide allele-specifico (ASO) (Figura 10.16). Il suo principio viene illustrato nell’esempio riferito al test per mutazioni nel gene GLC1A (OMIM 137750), uno dei molti geni che, quando mutato, causa il glaucoma ad angolo aperto (Figura 10.20). (Il glaucoma in genere è causato da un aumento della pressione nell’occhio, e il glaucoma ad angolo aperto è di gran lunga la forma di glaucoma più diffusa. Negli stadi iniziali la condizione non presenta sintomi, tuttavia, al crescere della pressione oculare, si perde la capacità visiva periferica e, in assenza di diagnosi e trattamento, può verificarsi cecità completa.) Il gene GLC1A è stato sequenziato e sono state scoperte numerose mutazioni responsabili dell’insorgenza del glaucoma. Una di queste determina il cambiamento

di una coppia di basi nel DNA da C-G a T-A e quindi la sostituzione di un codone CCG (Pro) in CUG (Leu). (Questi due alleli definiscono un locus SNP.) Per mostrare la mutazione, la Figura 10.20a riporta la sequenza di parte del gene GLC1A. Poiché è stato sequenziato il DNA di un individuo eterozigote, nel punto della mutazione si vedono sia l’allele normale con la C, sia quello mutato con la T. Sulla base della sequenza del gene GLC1A sono stati disegnati primer per amplificare mediante PCR la regione del gene che contiene la mutazione. I prodotti di PCR sono stati trasferiti su filtro, in condizioni denaturanti. Sono quindi stati prodotti due ASO, uno specifico per l’allele normale, l’altro per l’allele mutato (Figura

a)

GATC



G T T C T T A T G C/T C C T T G A C A G

Ser

372

Tyr

371

Pro

/

Leu

370

Phe

369

le

368

5¢ b) ASO Allele selvatico 370Pro



G A C A G T T C C C G TAT T C T T G



Allele mutante 5¢ 370Leu

G A C A G T T C C T G TAT T C T T G



c) Risultati della sonda ASO

Omozigote normale

Omozigote mutante

Eterozigote

Selvatico 370Pro Mutante 370Leu

Figura 10.20 Saggio molecolare del DNA per individuare la presenza di mutazioni nel gene del glaucoma ad angolo aperto GLC1A mediante PCR e ibridazione con oligonucleotidi allele-specifici (ASO). (a) Sequenza di un frammento del gene GLC1A di un eterozigote che mostra una mutazione da C a T che causa la sostituzione di Pro con Leu a livello dell’aminoacido 370 della catena polipeptidica. (b) Sequenze dei due oligonucleotidi allele-specifici (ASO), uno per l’allele selvatico e l’altro per l’allele mutato. (c) Risultati (teorici) dell’ibridazione con copie radioattive del gene GLC1A ottenute in PCR e usate come sonde sui campioni contenenti l’ASO selvatico o mutante nel caso di individui omozigoti normali, omozigoti per l’allele mutato o eterozigoti.

La tecnologia del DNA ricombinante

10.20b). In questo caso ogni ASO era lungo 19 nucleotidi, con la mutazione in posizione quasi centrale. Contrariamente a quanto illustrato precedentemente nella Figura 10.16, in questo caso sono state marcate con isotopi radioattivi le due sonde ASO piuttosto che i prodotti di amplificazione del DNA. Ogni ASO marcato è stato successivamente ibridato al DNA di GLC1A non marcato, immobilizzato su filtro. I risultati degli autoradiogrammi hanno indicato se il DNA saggiato è stato ottenuto da un omozigote per l’allele normale, da un eterozigote oppure da un omozigote per l’allele mutato. Come è visibile nella Figura 10.20c, nel caso del DNA di un individuo omozigote per l’allele normale si ha un segnale di ibridazione soltanto con l’ASO normale, nel caso di un eterozigote si ha segnale per entrambi gli ASO, mentre nel caso di un individuo omozigote per l’allele mutato si ha segnale di ibridazione soltanto con l’ASO specifico per la mutazione. Questo metodo è stato usato per analizzare i membri affetti da glaucoma in famiglie nelle quali la malattia era ricorrente, al fine di verificare la presenza di particolari mutazioni. Come è stato qui illustrato, l’ibridazione con ASO utilizza soltanto un ASO marcato radioattivamente come sonda da ibridare a un prodotto di PCR immobilizzato su un filtro. Questo approccio consente di saggiare ciascun filtro con un ASO ed è quindi utilizzato per analizzare gli individui relativamente alla presenza della stessa particolare mutazione. Un metodo simile, chiamato ibridazione ASO inversa, marca radioattivamente il prodotto di PCR come sonda per saggiare molti ASO diversi fissati al filtro (questo corrisponde sperimentalmente all’approccio della Figura 10.16), ed è utile per saggiare contemporaneamente numerosi campioni di DNA per la presenza di una o più mutazioni. Nel gene della fibrosi cistica, per esempio, vi sono centinaia di mutazioni. Mediante PCR multiplex si possono amplificare molte regioni del gene da campioni di DNA dei pazienti. I prodotti di PCR risultanti vengono marcati con radionuclidi e ibridati agli oligonucleotidi corrispondenti agli alleli normali o mutati, precedentemente fissati ai filtri. Sulle lastre degli autoradiogrammi il segnale di ibridazione derivato dal prodotto di ibridazione legato indica quale allele è posseduto dall’individuo. Questo metodo rivela se un individuo ha un qualsiasi allele mutato utilizzato nel test e, in caso positivo, se è eterozigote oppure omozigote. Il metodo tuttavia non può escludere che un individuo abbia una mutazione che non è coperta dalla serie di ASO utilizzata. Microarray a DNA nella diagnosi di malattie Oltre alle applicazioni descritte nei Capitoli 8 e 9, i microarray a DNA sono utili per lo screening delle malattie genetiche, compreso il cancro. Di particolare interesse sono le malattie genetiche caratterizzate da un elevato numero di mutazioni possibili, il che rende inefficaci i comuni metodi di tipizzazione del DNA. Per esempio, le mutazioni

253

nei geni BRCA1 (OMIM 113705) e BRCA2 (OMIM 600185) sono responsabili del 60% circa dei casi di cancro al seno e alle ovaie di tipo ereditario. Tuttavia, come accennato in precedenza, in BRCA1 sono state scoperte almeno 500 mutazioni diverse che possono portare allo sviluppo del cancro. Uno dei campi di applicazione della tecnologia dei microarray a DNA è proprio quello della verifica di molteplici mutazioni. I microarray vengono pertanto utilizzati per verificare se donne con una storia familiare nella quale ricorre il cancro al seno hanno una mutazione nel gene in questione. Esami simili si stanno sviluppando per alleli associati ad altre malattie, comprese la leucemia linfoblastica pediatrica acuta (un cancro dei globuli bianchi dell’età infantile), l’Alzheimer e la fibrosi cistica. Nel test di BRCA si confronta il genoma del paziente con quello di un individuo normale seguendo i principi generali dell’analisi mediante microarray, discussi precedentemente nel Capitolo 8. In questo impiego della tecnica, il sangue viene prelevato dal paziente e il DNA corrispondente ai geni BRCA1 e BRCA2 viene amplificato e marcato con il colorante verde Cy3 mediante PCR e poi mescolato a DNA ottenuto da un individuo normale e marcato con il colorante rosso Cy5. In questo caso il microarray a DNA consiste in un determinato numero di piccole sonde oligonucleotidiche che collettivamente rappresentano la totalità dei geni BRCA1 e BRCA2. Nelle condizioni di ibridazione utilizzate, se il paziente ha una mutazione in uno o nell’altro gene, il DNA rosso (normale) si ibriderà in corrispondenza del DNA sul microarray, ma il DNA verde (del paziente) non si ibriderà in corrispondenza degli oligonucleotidi complementari alla regione in cui si trova la mutazione. La ragione è che la mutazione impedisce l’appaiamento completo delle basi fra il DNA saggiato e la sonda oligonucleotidica sul microarray. Un’ibridazione paragonabile, quando entrambi i campioni sono complementari all’oligonucleotide, appare come uno spot giallo (rosso/verde); una mutazione è invece visibile come uno spot rosso. Dal momento che la posizione di ogni punto della matrice è nota, e lo è anche l’oligonucleotide presente in ogni punto, i risultati localizzano la mutazione all’interno di una regione molto ristretta del gene BRCA1 o del gene BRCA2; questa regione potrà essere analizzata in modo più dettagliato. Disponibilità di test molecolari del DNA Non esistono test genetici per tutte le malattie. Vi sono varie ragioni per questo, fra le quali quelle che seguono. 1. Il gene responsabile della malattia potrebbe non essere stato ancora identificato oppure potrebbe essere stato clonato ma non sequenziato: in entrambi i casi non è possibile sviluppare strumenti molecolari per il saggio. Per ovvi motivi le malattie genetiche più

254

Capitolo 10

comuni sono quelle per le quali i geni sono stati clonati per primi e sono stati quindi sviluppati i test molecolari. 2. Il gene è stato clonato e sequenziato, ma è soggetto a molte mutazioni diverse, il che rende impossibile sviluppare il test. In questo caso si possono sviluppare test per un sottogruppo di mutazioni note, cosicché un risultato positivo confermi la presenza di una mutazione nel gene che causa la malattia, ma un risultato negativo non escluda la possibilità di altre mutazioni nello stesso gene. Si è appena considerato un test delle mutazioni nei geni BRCA1 e BRCA2 progettato per giungere a dei risultati malgrado queste condizioni. Tuttavia molti geni implicati nelle malattie umane hanno molte mutazioni note e non sono stati sviluppati dei test per tutti questi geni. 3. In molte patologie la mutazione del gene non causa sempre lo sviluppo della malattia. Un esempio classico è rappresentato dalle mutazioni in geni che determinano la predisposizione di un individuo a sviluppare il cancro (l’argomento è discusso in dettaglio nel Capitolo 20). In questi casi il test potrebbe essere limitato alle famiglie ad alto rischio. 4. Molte malattie sono causate da interazioni geniche multiple.

Nota chiave Le tecniche del DNA ricombinante e di PCR, e gli approcci mediante microarray sono usati nei test molecolari del DNA per indagare la presenza di mutazioni associate a malattie genetiche nell’uomo. Questi test si sono resi disponibili con l’aumento delle conoscenze sulla natura molecolare di molte malattie genetiche umane. In generale i test genetici nell’uomo riguardano le diagnosi prenatali, l’analisi dei neonati e i test per l’individuazione di portatori sani. Molti test molecolari del DNA si basano su polimorfismi della lunghezza dei frammenti di restrizione (RFLP) oppure sull’amplificazione mediante PCR seguita da ibridazione con oligonucleotidi allele-specifici (ASO).

La tipizzazione del DNA Non vi sono due individui che abbiano esattamente lo stesso genoma, coppia di basi per coppia di basi (nemmeno i gemelli identici – il cui genoma mostra piccole variazioni di sequenza, introdotte per errori durante la replicazione cellulare; vedi Focus sul genoma nel Capitolo 11 – sebbene il metodo che apprenderete più oltre probabilmente non permetterebbe di rilevare queste sottili differenze), e questo dato di fatto ha portato allo sviluppo delle tecniche di tipizzazione del DNA (detta anche

DNA fingerprinting o DNA profiling), che sono in uso in medicina legale, nei test di paternità e di maternità e in altri casi ancora. La tipizzazione del DNA si basa sull’analisi dei polimorfismi del DNA descritti in precedenza nel capitolo. Tipizzazione del DNA in un caso di attribuzione di paternità Consideriamo ora un esempio relativo alla tipizzazione del DNA in un caso di attribuzione di paternità. In questo scenario immaginario supponiamo che la madre di un bambino appena nato abbia indicato un certo uomo come padre del bambino, e che l’uomo invece neghi. In tribunale i giudici decideranno di basare il proprio giudizio sulle prove derivate dalla tipizzazione del DNA, che procede nel modo seguente (Figura 10.21). Si preleva un campione di DNA dalle tre persone coinvolte (Figura 10.21, parte 1). Nei casi di attribuzione di paternità la fonte consueta di DNA è un campione di sangue o un tampone orale. Il DNA viene tagliato con un enzima di restrizione e i frammenti risultanti vengono separati mediante elettroforesi (Figura 10.21 parte 2), trasferiti su un filtro mediante Southern blot (Figura 10.21, parte 3), e saggiati con una sonda STR o VNTR a singolo locus marcata (Figura 10.21, parti 4 e 5). Il profilo delle bande del DNA, visibili dopo autoradiografia o rilevamento per chemioluminescenza, viene analizzato per confrontare i campioni (Figura 10.21, parte 6). I dati possono essere così interpretati: dalla madre si sono ottenuti due frammenti di DNA, pertanto la donna è eterozigote per una coppia di alleli al locus STR o VNTR che si sta studiando. Allo stesso modo, il bambino presenta due frammenti di DNA, e pertanto è eterozigote. Uno dei frammenti del bambino ha le stesse dimensioni del più grande dei frammenti della madre, mentre l’altro frammento del bambino è molto più grande, e ciò indica che si tratta di un allele con molte più ripetizioni. Il bambino riceve un allele dalla madre e l’altro dal padre, quindi un allele presente nel bambino (ma assente nella madre) deve essere stato trasmesso dal padre. Si tenga presente che sia la madre sia il padre avranno alleli che non vengono trasmessi al figlio. Nel nostro esempio, l’analisi dell’autoradiogramma porta a concludere che l’allele che deve essere stato trasmesso dal padre si trova anche nel padre presunto. I dati indicano che l’uomo condivide un allele con il bambino, ma non dimostrano che ne sia il padre. Egli potrebbe aver contribuito al genoma del bambino con quell’allele, ma anche molti altri uomini portano questo allele ed è possibile che il padre sia uno di questi altri uomini. Se l’uomo non avesse avuto alleli in comune con il bambino, la tipizzazione avrebbe provato che l’uomo non era il padre del bambino: in questo caso avremmo avuto una prova di esclusione. Stabilire un’identità in positivo, la prova di inclusione, mediante la tipizzazione del DNA è molto più difficile. È infatti necessario calcolare

La tecnologia del DNA ricombinante

1

Il DNA è prelevato dalla madre, dal bambino e dal presunto padre. In analisi separate, il DNA viene tagliato in frammenti Bambino Padre con un enzima Madre presunto di restrizione. Standard Standard –

2

Elettroforesi su gel del DNA di ciascun campione e degli standard di peso molecolare. +

3

Southern blot preparato dal gel

Soluzione contenente la sonda

4

Il filtro viene incubato con una sonda di DNA radioattivo, che si lega a specifiche sequenze del DNA sul filtro.

5

L’eccesso di sonda viene lavato via, lasciando la sonda radioattiva ibridata al filtro.

6

Viene preparata un’autoradiografia. La distribuzione delle bande per ciascun campione è un DNA fingerprint.

Filtro con DNA legato

Standard Madre

Bambino

Standard Padre presunto

Figura 10.21 Tipizzazione del DNA per attribuire la paternità.

le probabilità relative che l’allele sia stato fornito dall’individuo in esame piuttosto che da un’altra persona. Il calcolo dipende dalle conoscenze delle frequenze alleliche dei loci STR o VNTR individuati dalla sonda nel gruppo

255

etnico al quale appartiene l’uomo in esame. La maggior parte delle diatribe legali ruota intorno a questo aspetto del problema, in quanto si hanno buone stime alleliche di loci STR o VNTR soltanto per un numero limitato di gruppi etnici, e quindi in molti casi il calcolo delle probabilità di effettiva paternità dà un’accuratezza dubbia. Per minimizzare l’inaccuratezza gli investigatori utilizzano più sonde diverse (di solito cinque o più), in modo che le probabilità combinate per l’insieme di STR o VNTR risultino abbastanza elevate da convincere i giudici che l’imputato è effettivamente il genitore (o il colpevole in un procedimento penale), anche tenendo conto del fatto che le frequenze alleliche delle STR o VNTR possono non essere stimate in maniera perfetta nella popolazione in esame. Proprio l’aspetto legato alle probabilità combinate è quello del quale si sente parlare più spesso dai mezzi di comunicazione quanto all’uso della tipizzazione del DNA nei processi (si veda oltre). Di solito nei tribunali la base scientifica del metodo non è messa in dubbio; piuttosto la prova del DNA è perlopiù rifiutata per ragioni legate ai possibili errori commessi durante la raccolta o la lavorazione delle prove, oppure per il fatto che le basi statistiche non sono sufficientemente solide. Nel nostro esempio, saremmo probabilmente molto più propensi a essere convinti che l’uomo sia il vero padre del bambino se i dati ottenuti da tutte le cinque sonde a singolo locus fossero concordi nell’indicare che l’uomo avrebbe potuto contribuire con un dato allele al patrimonio genetico del bambino. Il test per la tipizzazione del DNA può essere svolto molto più agevolmente mediante l’utilizzo di PCR. Indagine sulla scena di un crimine: il DNA in medicina legale I polimorfismi del DNA che sono a disposizione in un grande numero di loci rendono il nostro genoma pressoché unico. Sulla base di questo principio è possibile confrontare due campioni di DNA e determinare la probabilità che essi derivino dallo stesso individuo. Nelle indagini su crimini commessi ai nostri giorni, è ormai una prassi abituale cercare e analizzare campioni di DNA come strumenti per costruire un impianto accusatorio contro un certo sospettato, o per esonerarlo. Se i campioni di DNA concordano, si calcolano le probabilità della significatività del dato, come già descritto nel paragrafo precedente. Naturalmente nei casi in giudizio la prova del DNA è soltanto una delle prove considerate. I metodi per lo studio del DNA utilizzati in medicina legale sono già stati discussi. L’utilità della tipizzazione del DNA in medicina legale è illustrata dai casi di studio selezionati che seguono. Gli esempi includono casi nei quali la prova del DNA ha stabilito la colpevolezza di un sospettato e casi nei quali è stato provato che un sospetto o una persona già condannata era innocente.

256

Capitolo 10

Attività MyLab

Siete l’esperto forense che usa l’analisi delle STR per risolvere un caso di omicidio nell’iAttività Combining Through “Fur”ensic Evidence (Un caso forense risolto... per un “pelo”) nel sito web degli studenti.

I delitti di Narborough: la prima assoluzione e la prima condanna sulla base del DNA Nel 1983 e nel 1986 nella piccola città di Narborough nel Leicestershire, in Inghilterra, furono assassinate due bambine. Entrambe le bambine avevano subito violenza sessuale e i campioni di sperma rinvenuti dai corpi indicavano che l’assassino o gli assassini avevano lo stesso gruppo sanguigno. Il principale sospettato del secondo assassinio aveva quel gruppo sanguigno e alla fine confessò l’uccisione, ma negò il coinvolgimento nel primo omicidio. La polizia era convinta che avesse commesso entrambi gli omicidi, e per questo motivo contattò Alec Jeffrey (Figura 10.22) presso la vicina Università di Leicester per condurre la tipizzazione del DNA sui campioni prelevati. Come già citato, Alec Jeffrey aveva scoperto i VNTR. Egli aveva anche appena dimostrato che si poteva estrarre il DNA da campioni recuperati sulla scena del crimine e che tale DNA poteva essere tipizzato per particolari loci VNTR. Usando il Southern blot con sonde multiloci, il Dott. Jeffrey dimostrò che il DNA derivato dai campioni di sperma rinvenuti nei due omicidi non corrispondeva a quello del sospettato della polizia, e per questo l’individuo venne rilasciato. Egli fu la prima persona al mondo a essere riconosciuta innocente di omicidio mediante la tipizzazione del DNA. In mancanza della prova del DNA era quasi certo che un tribunale l’avrebbe condannato. Chi era allora il vero assassino? Il Sovrintendente della Polizia che si occupava del caso decise di affrontare il primo saggio di DNA al mondo effettuato in massa su una popolazione. Cinquemila maschi adulti dei paesi cir-

Figura 10.22 Sir Alec Jeffrey, lo scopritore dei VNTR. Nella foto egli mostra esempi di DNA fingeprinting.

costanti furono invitati a fornire campioni di sangue o di saliva per l’analisi forense. Circa il 10% dei campioni mostrò di avere lo stesso gruppo sanguigno dell’assassino e su questi campioni venne fatta la tipizzazione del DNA. Nessun profilo del DNA corrispondeva a quello sulle scene del crimine, un risultato frustrante per la polizia. Per uno strano scherzo del destino, però, una donna aveva sentito un collega di lavoro che diceva di aver dato il proprio campione al posto di un amico, un certo Colin Pitchfork. La polizia arrestò Colin Pitchfork e il profilo del suo DNA corrispondeva al profilo dei campioni di sperma. Nel 1988 egli fu condannato all’ergastolo per gli omicidi. Gli omicidi di Green River: condanna L’8 luglio del 1982 Wendy Lee Coffield, di 16 anni, scomparve da Tacoma, nello stato di Washington. Il suo corpo fu trovato nel Green River, nella contea di King, nello Stato di Washington il 15 luglio del 1982: era stata strangolata. Negli anni successivi molte altre giovani donne, generalmente prostitute, scomparvero e furono trovate strangolate, molte nel Green River. Un serial killer era libero e all’opera. L’intervista di numerose prostitute dell’area di Seattle mise in luce che alcune erano state violentate o erano state minacciate di morte da un uomo che guidava un camion blu e bianco. Questa scoperta rese sospetto un certo Gary Ridgway. Quando gli sceriffi della contea di King perquisirono la sua abitazione nel 1987 trovarono che stava masticando un pezzo di garza. A quel tempo l’uso del DNA per scopi forensi era agli albori, ma un numero crescente di investigatori raccoglieva campioni in previsione di future applicazioni del fingerprinting del DNA in medicina legale. Fortunatamente i campioni erano stati maneggiati e preservati con cura, e il DNA non si era degradato. Ridgway era il principale sospettato, tuttavia le prove materiali non erano sufficienti per farlo arrestare. Nel settembre del 2001, sulla prova raccolta fu utilizzata un’analisi in PCR delle STR, con il risultato che il profilo del DNA di Ridgway concordava con quello derivato dai campioni di sperma prelevati da Carol Christensen, una delle vittime del Green River. Nel novembre 2003 Ridgway ammise di aver ucciso 48 donne e si dichiarò colpevole di 48 omicidi di primo grado. Sembrava “odiare le prostitute” e disse che “strangolare giovani donne era la sua professione”. Il caso della donna che correva a Central Park: assoluzione Nell’aprile 1989 una donna di 28 anni, che lavorava nel settore degli investimenti bancari, fu violentata e picchiata violentemente mentre faceva jogging nel Central Park di New York City. La donna fu lasciata legata, sanguinante e svenuta con gravi ferite, poi riacquistò i sensi e lentamente guarì. L’opinione pubblica rimase sconvolta dalla ferocia del crimine. Gli investigatori della polizia scoprirono che, al tempo del crimine, un gruppo di adolescenti maschi compiva attacchi casuali alle

La tecnologia del DNA ricombinante

persone. Cinque sospettati furono arrestati in relazione alla violenza sessuale e al pestaggio della donna. Quattro di essi confessarono, e nel 1990 tutti i cinque furono condannati e imprigionati. Tuttavia, coloro che sostenevano le ragioni dei giovani dissero che essi erano stati costretti a confessare e che, inoltre, non vi era alcuna prova fisica che li collegasse al crimine. Poi, nel 2002 Matìas Reyes, un carcerato che stava scontando una pena per un altro caso di violenza sessuale e omicidio, confessò di essere l’autore della violenza sessuale sulla donna che faceva jogging a Central Park. Fu dimostrato che il suo DNA, e non quello di alcuno dei cinque condannati, concordava con quello del campione di sperma prelevato dalla vittima. Sulla base della confessione di Reyes, la condanna dei cinque giovani fu cancellata. La tipizzazione del DNA quindi è chiaramente uno strumento potente nelle inchieste su casi criminali. Se usata in modo appropriato, essa può portare alla condanna o all’assoluzione di un individuo per un crimine, oppure alla liberazione di una persona condannata ingiustamente. Altre applicazioni della tipizzazione del DNA Attualmente vi sono molti settori nei quali trova impiego la tipizzazione del DNA. Qui di seguito si riporta un elenco di esempi esplicativi dell’utilità dei test di tipizzazione del DNA nell’uomo e in altri organismi. 1. Studi di genetica di popolazione per stimare la variabilità genetica delle popolazioni o dei gruppi etnici. 2. Certificazione del pedigree di alcune razze di cavalli, ai fini della registrazione. 3. Studi di tutela di specie in pericolo di estinzione, per determinare il livello di variabilità genetica. 4. Analisi forensi nei reati di bracconaggio. Alcuni animali selvatici vengono uccisi illegalmente e la tipizzazione del DNA è sempre più utilizzata per individuare i colpevoli dei reati. Per esempio, una serie di sei STR è stata utilizzata per risolvere un’inchiesta di caccia di frodo dell’antilocapra americana nel Wyoming. Sei carcasse senza testa di antilocapra americana furono scoperte e il fatto venne riferito alle autorità competenti. Dopo l’inchiesta fu trovato un sospettato che aveva un cranio di antilocapra con le corna. Campioni di DNA furono prelevati dai campioni delle carcasse e dal cranio e i dati concordarono. Durante il processo il sospettato fu condannato per uccisione senza motivo di sei grossi esemplari di selvaggina. L’uomo trascorse 30 giorni in carcere, fu multato per 1300 dollari, gli furono comminate un’ammenda di 12 000 dollari e la sospensione della licenza di caccia per 36 anni. 5. Individuazione della presenza di ceppi patogeni di E. coli negli alimenti, per esempio nella carne per hamburger, attraverso l’uso di oligonucleotidi ceppo-specifici da utilizzare in saggi di PCR.

257

6. Individuazione di organismi modificati geneticamente (OGM). Gli OGM hanno un grande impiego nell’agricoltura negli Stati Uniti. Le piante coltivate modificate geneticamente hanno in genere geni che sono stati introdotti durante lo sviluppo della nuova varietà da coltivare. Spesso questi geni sono espressi sotto il controllo di un promotore particolare e posseggono anche dei segnali di terminazione particolari, e ciò rende possibile disegnare degli oligonucleotidi specifici per queste sequenze, da utilizzare per verificare la presenza dei geni introdotti. Questi test possono essere condotti sia sulle piante, sia sugli alimenti che sono stati derivati dalle piante. Un risultato di PCR positivo indica che la pianta è stata modificata geneticamente o che l’alimento contiene uno o più OGM. Un risultato negativo tuttavia non è una garanzia assoluta di non essere in presenza di un OGM. La pianta potrebbe essere stata modificata con geni provvisti di un promotore diverso, oppure il DNA potrebbe essere andato completamente distrutto durante il processo di preparazione dell’alimento. È stato stimato che negli Stati Uniti dal 50 al 75 per cento degli alimenti venduti nei supermercati potrebbe derivare da piante geneticamente modificate. La tipizzazione del DNA trova altre applicazioni molto interessanti per l’analisi di campioni di DNA antico. 1. L’analisi di DNA estratto da organismi antichi, come un insetto intrappolato nell’ambra 40 milioni di anni fa, una foglia fossile di 17 milioni di anni fa, un vecchio mammut di 40 000 anni fa, ha permesso il confronto a livello molecolare con i loro discendenti attuali. 2. La tipizzazione del DNA ha consentito di risolvere controversie e misteri storici. Per esempio, nel 1795 nella torre della Prigione del Tempio in Francia morì di tubercolosi un bambino di dieci anni. Il grande mistero riguardava l’identità del bambino, e cioè se fosse il delfino del re di Francia, il solo figlio sopravvissuto del re Luigi XVI e di Maria Antonietta, che furono ghigliottinati dai repubblicani, oppure se fosse un bambino scomparso, mentre il vero erede al trono era scappato. Dopo l’autopsia il cuore del bambino fu messo da parte e, nonostante le cattive condizioni nelle quali venne tenuto fin dalla sua morte, nel dicembre del 1999 ne furono presi due piccoli campioni di tessuto dai quali sorprendentemente fu possibile estrarre il DNA. Il DNA fu tipizzato e messo a confronto col DNA estratto da una ciocca di capelli del delfino conservata da Maria Antonietta, e con il DNA di due sorelle di Maria Antonietta e di alcuni discendenti attuali. I risultati dimostrarono che il bambino morto era effettivamente il delfino del re di Francia.

258

Capitolo 10

Nota chiave La tipizzazione del DNA, o DNA fingerprinting, è condotta per distinguere individui sulla base dell’assunzione che mai due individui di una specie hanno la stessa sequenza genomica. Le differenze nella sequenza del genoma sono messe in evidenza come variazioni nella lunghezza di sequenze ripetute in tandem. La tipizzazione del DNA ha numerose applicazioni, quali studi di biologia di base, applicazioni in medicina legale, individuazione di batteri patogeni e analisi di DNA antico.

La terapia genica È possibile modificare il genoma per trattare le malattie genetiche? Teoricamente sono possibili due tipi di terapia genica: la terapia delle cellule somatiche, nella quale per prevenire un difetto genetico vengono modificate geneticamente le cellule somatiche dell’individuo trattato; e la terapia della linea cellulare germinale, nella quale per correggere un difetto genetico vengono modificate le cellule della linea germinale. La terapia delle cellule somatiche consiste nel trattamento di una malattia genetica nell’individuo, ma la progenie può ancora ereditare il gene mutato. La terapia delle cellule della linea germinale, invece, sarebbe preventiva, perché il gene mutante sarebbe rimpiazzato dal gene normale che verrebbe ereditato dalla progenie. La terapia somatica e quella delle cellule germinali sono state impiegate con successo in organismi diversi dall’uomo, come il topo; nell’uomo, a causa dei problemi etici sollevati dalla terapia delle linee cellulari germinali, è stata tentata soltanto la terapia delle cellule somatiche. Le malattie più idonee da considerare per la terapia delle cellule somatiche sono quelle che derivano da un difetto in un solo gene e per le quali il gene normale clonato è disponibile. La terapia genica che coinvolge le cellule somatiche prevede le seguenti tappe: viene prelevato un campione di cellule mutate dal paziente affetto, quindi copie selvatiche del gene mutato vengono introdotte nelle cellule e queste vengono reintrodotte nel paziente, nel quale si spera che le cellule produrranno il prodotto genico normale e gli effetti della malattia genetica saranno totalmente o parzialmente aboliti. La fonte di cellule varia con la malattia genetica. Per esempio, malattie del sangue, come la talassemia o l’anemia falciforme, richiedono la modificazione di linee cellulari isolate dal midollo osseo, che produrranno le cellule del sangue. Per malattie genetiche che alterano proteine circolanti, un approccio promettente è la terapia genica di fibroblasti della pelle, costituenti del derma (lo strato più profondo della pelle). I fibroblasti modificati

possono facilmente essere reimpiantati nel derma, dove i vasi sanguigni sono abbondanti e permettono la distribuzione dei prodotti genici. Una cellula nella quale è stato introdotto con mezzi artificiali un gene è chiamata cellula transgenica e il gene coinvolto è chiamato transgene. L’introduzione di geni normali in una cellula mutata pone diversi problemi. Innanzitutto, i procedimenti per introdurre DNA nelle cellule (trasformazione per i microrganismi e transfezione per le cellule eucariote) sono in generale inefficienti; forse solo una su 1000 o 100 000 cellule riceverà il gene di interesse. Pertanto, per poter tentare la terapia genica, è necessario avere una numerosa popolazione cellulare. Per inserire il transgene i procedimenti attuali utilizzano vettori speciali derivati da virus. In secondo luogo, non si può prevedere il destino del DNA estraneo (esogeno) nelle cellule che ricevono il gene clonato. In alcuni casi il gene mutato viene rimpiazzato dal gene normale, mentre in altri il gene normale si integra da qualche altra parte nel genoma. Nel primo caso la terapia genica avrà successo, se il gene verrà espresso. Nel secondo caso si ha un trattamento efficace della malattia se il transgene è espresso e il gene mutato originario, ancora presente nel genoma, è recessivo e non interferisce con il gene normale introdotto. Il successo della terapia delle cellule somatiche è stato dimostrato ripetutamente negli animali da esperimento come topi, ratti e conigli. Nell’uomo invece gli insuccessi sono stati più numerosi dei successi. Inoltre, una preoccupazione recente deriva dallo sviluppo di leucemie in pazienti che hanno subito la terapia genica, in seguito all’uso di vettori virali per introdurre il transgene. Un esempio di successo del trattamento con terapia genica delle cellule somatiche negli esseri umani è stato ottenuto nel 1990 in una bambina di 4 anni sofferente di una grave immunodeficienza combinata (SCID, OMIM 102700), causata da una deficienza nell’adenosina deaminasi (ADA), un enzima necessario per il normale funzionamento del sistema immunitario. In questo caso, le cellule T (cellule del sistema immunitario) furono isolate dalla bambina, fatte crescere in laboratorio e dotate del gene ADA normale introdotto usando un vettore virale. Le cellule “ingegnerizzate” furono poi reintrodotte nella paziente. Poiché, nel corpo, le cellule T hanno un arco di vita definito, furono necessarie continue infusioni di cellule ingegnerizzate. Il gene ADA introdotto viene espresso probabilmente durante tutta la vita della cellula T. Come risultato, il sistema immunitario della paziente funziona più normalmente e ora la paziente non è soggetta a un numero di infezioni maggiore della norma. Essenzialmente, la terapia genica le ha dato la possibilità di vivere una vita più normale. Ci si attende che con il tempo molte altre malattie possano essere trattate mediante la terapia genica delle cellule somatiche, comprese talassamie, fenilchetonuria,

La tecnologia del DNA ricombinante

cancro, distrofia muscolare di Duchenne e fibrosi cistica. Il livello dei successi dovrebbe aumentare a mano a mano che si escogiteranno nuovi metodi per introdurre i transgeni in modo tale da sostituire i geni mutati corrispondenti, e da regolare l’espressione dei geni inseriti. Tuttavia, prima che la terapia genica sia applicata regolarmente, si devono affrontare ancora numerosi problemi di natura scientifica, etica e legale.

Nota chiave La terapia genica è la cura di malattie genetiche attraverso l’introduzione negli individui della forma normale del gene, in modo da sostituire il gene mutato o annullarne gli effetti. Per motivi etici nell’uomo è ammessa soltanto la terapia genica delle cellule somatiche. Esistono alcuni esempi coronati da successo dell’impiego della terapia genica delle cellule somatiche per la cura di malattie genetiche negli esseri umani, ma c’è una grande aspettativa di poter trattare in questo modo molte altre malattie genetiche nel prossimo futuro.

Biotecnologia: prodotti commerciali Lo sviluppo delle tecniche di clonaggio e di manipolazione del DNA ha determinato l’affermazione di un gran numero di imprese biotecnologiche, che utilizzano metodiche basate sulla tecnologia del DNA ricombinante per produrre un gran numero di prodotti commerciali. Per esempio, è possibile clonare un gene o il suo cDNA in un organismo che lo trascriverà e tradurrà l’mRNA corrispondente. Il gene o il suo cDNA sono inseriti in vettori d’espressione appropriati per l’organismo ospite. Vengono usati numerosi organismi diversi, che vanno da E. coli ai mammiferi, e quindi i vettori di espressione cambiano per quanto concerne i promotori usati per la trascrizione del transgene, i segnali di inizio della traduzione e i marcatori selettivi. Se è facile ottenere una specifica proteina purificandola da un microrganismo, come E. coli, ciò diventa molto più complesso nei mammiferi. Per le pecore o le capre, per esempio, il modo più semplice per isolare il prodotto biotecnologico è quello di farlo secernere nel latte, che si può raccogliere facilmente e dal quale si possono estrarre facilmente le proteine. La produzione di una proteina ricombinante in mammiferi (in questo caso una pecora) è illustrata nella Figura 10.23. In questo caso il gene di interesse è stato modificato in modo tale da essere fiancheggiato da un promotore attivo soltanto nel tessuto mammario, come per esempio il promotore della β-lattoglobulina. Le molecole di DNA ricombinante vengono microiniettate nelle cellule uovo della pecora e ogni uovo è impiantato in una madre adottiva. La progenie transgenica viene ricono-

259

Gene di interesse Promotore della b-lattoglobulina

Cellula uovo di pecora Microiniezione del DNA nel pronucleo Micromanipolatore

Impianto in una madre adottiva

Riconoscimento della progenie transgenica mediante PCR

Il gene di interesse viene espresso solo nel tessuto mammario; la proteina corrispondente è secreta nel latte

Raccolta del latte

Il latte contiene la proteina di interesse

Frazionamento delle proteine del latte

Proteina di interesse

Figura 10.23 La produzione di una proteina ricombinante (codificata dal gene di interesse) in un mammifero transgenico, in questo caso una pecora.

sciuta mediante PCR specifica per sequenze del DNA ricombinante. Quando questi animali transgenici raggiungono la maturità, il promotore della β-lattoglobulina dirige l’espressione del gene a esso associato nel tessuto mammario e la proteina ricombinante di interesse viene ottenuta dal latte raccolto con tecniche biochimiche di separazione.

260

Capitolo 10

Qui di seguito proponiamo alcuni esempi di prodotti biotecnologici. 1. L’attivatore del plasminogeno tissutale (TPA), usato per prevenire o far recedere la coagulazione del sangue, e quindi per prevenire colpi apoplettici, attacchi di cuore o embolie polmonari. 2. L’ormone umano della crescita, usato per curare il nanismo pituitario. 3. Il fattore di crescita tissutale β (TGF-β), che stimola la produzione di nuovi vasi sanguigni e la crescita epidermica ed è quindi potenzialmente utile per far rimarginare le ferite e le bruciature. 4. Il fattore VIII per la coagulazione del sangue, usato per il trattamento dell’emofilia. 5. L’insulina umana, usata per il trattamento del diabete insulino-dipendente. 6. La DNasi, per il trattamento della fibrosi cistica. 7. Vaccini ricombinanti, usati per il trattamento di malattie virali umane e animali (per esempio l’epatite B nell’uomo). 8. L’ormone bovino della crescita, usato per aumentare la resa nelle razze bovine. 9. Il fattore di crescita derivato dalle piastrine (PDGF), per il trattamento delle ulcerazioni croniche della pelle nei pazienti con diabete. 10. Batteri e altri microrganismi geneticamente modificati per aumentare la produzione, per esempio, di enzimi industriali (come l’amilasi, che scinde l’amido in glucosio), acido citrico (come additivo alimentare) ed etanolo. 11. Batteri geneticamente modificati per poter accelerare la degradazione di oli contaminanti o di certi prodotti chimici (come la diossina) presenti in rifiuti tossici.

Nota chiave Le società biotecnologiche e farmaceutiche sviluppano prodotti commerciali utilizzando le stesse tecniche del DNA ricombinante e di PCR impiegate nella ricerca di base, nei saggi di analisi del DNA, nel clonaggio di geni, nella tipizzazione del DNA e nella terapia genica. Molti di questi prodotti sono già disponibili. Tra essi sono da menzionare i farmaci, i vaccini per l’uomo e per gli animali, organismi geneticamente modificati creati per migliorare la produzione di importanti composti alimentari, oppure da impiegare per la degradazione di composti chimici tossici.

MyLab

nimazione L’ingegneria genetica nelle piante

L’ingegneria genetica delle piante Per molti secoli la genetica tradizionale delle piante si è basata

sull’adozione di incroci e di selezione: le piante con le caratteristiche desiderate venivano usate per produrre una progenie con le stesse caratteristiche. Come risultato, l’uomo ha prodotto un’enorme varietà di piante (come il mais, il frumento e l’avena) e ha avuto successo nell’ottenere varietà con caratteristiche ritenute migliori. (Esperimenti simili sono stati realizzati anche in animali come cani, bovini e cavalli per produrre le razze desiderate.) Attualmente con la tecnologia del DNA ricombinante sono stati sviluppati vettori che possono essere usati per la trasformazione delle cellule vegetali di specie coltivate, rendendo possibile ottenere piante ingegnerizzate geneticamente da usare in agricoltura.

La trasformazione delle cellule vegetali Introdurre geni nelle cellule vegetali è molto più difficile che introdurre geni nei batteri, nel lievito o nelle cellule animali, e ciò ha causato un ritardo nello sviluppo dell’ingegneria genetica nei vegetali. I metodi generalmente usati per produrre piante transgeniche sfruttano le caratteristiche di un batterio del terreno, Agrobacterium tumefaciens, che infetta molte specie vegetali. Nello specifico, questi approcci sfruttano un meccanismo naturale con il quale il batterio trasferisce un definito segmento di DNA nel cromosoma della pianta. L’Agrobacterium tumefaciens provoca una malattia nota come galla del colletto, caratterizzata dall’insorgenza di un tumore (la galla) nei siti dove vi è una lesione. La maggior parte delle piante dicotiledoni è sensibile a questa malattia, mentre le piante monocotiledoni non lo sono. L’Agrobacterium tumefaciens trasforma le cellule delle piante a livello di una lesione, causando crescita e divisione cellulare autonome e quindi l’insorgenza di un tumore. La trasformazione delle cellule vegetali è mediata da un plasmide dell’Agrobacterium chiamato plasmide Ti (Ti sta per “induttore di tumore”; Figura 10.24). I plasmidi Ti sono plasmidi di DNA circolare di grandi dimensioni (circa 200 kb rispetto alle 2,69 kb di pBluescript II). L’interazione tra il batterio infettante e la cellula vegetale dell’ospite stimola il batterio all’escissione dal plasmide Ti di una regione di 30 kb, detta T-DNA (chiamata così perché è DNA trasformante). Il T-DNA è fiancheggiato da due sequenze ripetute di 25 bp, dette confini, che sono coinvolte nell’escissione. Questa inizia con un taglio nel filamento singolo che porta la sequenza fiancheggiante destra. Un secondo taglio nella sequenza fiancheggiante sinistra rilascia una molecola di T-DNA a singolo filamento, che è quindi trasferita dal batterio al nucleo della cellula vegetale mediante un processo analogo a quello della coniugazione batterica. Una volta entrato nel nucleo della cellula vegetale, il T-DNA si integra nel genoma nucleare. Il risultato è che la cellula vegetale acquista i geni che si trovano nel T-DNA, inclusi quelli per la trasformazione delle cellule vegetali. Tutta-

La tecnologia del DNA ricombinante

261

DNA cromosomico Agrobacterium T-DNA

Cromosoma

Il T-DNA si integra nel DNA dell’ospite

Plasmide Ti Cellula vegetale trasformata

Figura 10.24 La formazione di un tumore (galla del colletto) nelle piante, a causa dell’infezione con alcune specie di Agrobacterium. I tumori sono indotti dal plasmide Ti, che è portato dal

via, i geni necessari per l’escissione, il trasferimento e l’integrazione del T-DNA nella pianta ospite non sono parte del T-DNA. Sono invece altrove nel plasmide Ti, ovvero nella regione vir (per “virulenza”). Usando gli approcci tipici del DNA ricombinante, i ricercatori hanno scoperto che l’escissione, il trasferimento e l’integrazione del T-DNA richiedono solo le ripetizioni terminali di 25 bp del T-DNA. Come risultato, il plasmide Ti, con il T-DNA che contiene, è un vettore utile per introdurre nuove sequenze di DNA nel genoma nucleare delle cellule somatiche di specie di piante sensibili. Poiché ogni gene posto tra le estremità di 25 bp si integrerà nel genoma dell’ospite, dal plasmide Ti e dal T-DNA sono stati derivati numerosi vettori di trasformazione. Benché il sistema di trasformazione basato sul TDNA sia molto efficiente per le piante dicotiledoni, non lo è altrettanto per le monocotiledoni, che non fanno parte dello spettro d’ospite tipico dell’Agrobacterium tumefaciens. Ciò rappresenta una limitazione molto seria in quanto la maggior parte delle piante di interesse agricolo è monocotiledone. Fortunatamente sono state sviluppate tecniche alternative di trasformazione nelle quali il DNA è introdotto all’interno della cellula con metodi fisici piuttosto che mediante un vettore plasmidico. Nel metodo dell’elettroporazione si aggiunge il DNA a una sospensione di protoplasti di cellule vegetali e, per introdurre il DNA nella cellula, si sottopone la sospensione a uno shock elettrico ad alto voltaggio. Dopo che le cellule sono state lasciate crescere in coltura per permettere loro di rigenerare la parete cellulare e ricominciare a dividersi, si possono utilizzare procedure opportune per selezionare le cellule che sono state trasformate con successo. Un altro sistema prevede di sparare i geni nelle cellule (con un sistema realizzato da Bio-Listics): si riveste di DNA la superficie di minuscole sferette di tungsteno che sono quindi posizionate sulla punta di un proiettile di plastica, che viene sparato da un’arma speciale. Il proiettile colpisce una piastra di acciaio e le sferette di tungsteno

Tumore (galla del colletto)

batterio e che integra una parte del suo DNA (il T-DNA o DNA trasformante) nei cromosomi delle cellule vegetali.

sono così scagliate attraverso un’apertura della piastra in una camera nella quale sono ospitate le cellule da trasformare. La forza del colpo è sufficiente per introdurre le sferette cariche di DNA all’interno delle cellule. Si applicano poi tecniche di selezione per isolare le cellule trasformate con successo, e queste cellule possono essere usate per la rigenerazione di piante intere.

Applicazioni dell’ingegneria genetica delle piante Nel paragrafo relativo alla tipizzazione del DNA si è già trattato dello sviluppo di numerose colture modificate geneticamente e del fatto che una gran quantità degli alimenti che si comprano in alcuni Paesi, quali gli Stati Uniti, derivi da piante modificate geneticamente. Consideriamo brevemente, come esempio dei tipi di approcci che possono essere seguiti, la produzione di piante che tollerano l’erbicida a largo spettro RoundupTM. Il Roundup contiene la componente attiva glifosato, che uccide le piante inibendo l’EPSPS, un enzima del cloroplasto richiesto per la biosintesi di amminoacidi aromatici essenziali. Il Roundup è usato largamente per uccidere le erbe infestanti, perché è attivo a dosi relativamente basse ed è degradato rapidamente nell’ambiente dai microrganismi del terreno. Se una coltura è resistente al Roundup, si può irrorare il terreno con l’erbicida, affinché uccida le erbe infestanti senza danneggiarla. Gli approcci per creare piante tolleranti al Roundup includono: (1) l’introduzione di una forma batterica mutata di EPSPS resistente all’erbicida, in modo che gli amminoacidi aromatici possano essere sintetizzati anche quando l’enzima del cloroplasto è inibito (Figura 10.25); (2) l’introduzione di geni codificanti per enzimi che convertono l’erbicida in una forma inattiva. La Monsanto ha commercializzato nel 1996 la soia tollerante al Roundup, chiamata Roundup Ready, anche se il suo impiego è stato ed è contestato da alcuni gruppi ambientalisti che mettono in dubbio la si-

262

Capitolo 10

Figura 10.25 La produzione di una pianta di tabacco tollerante all’erbicida RoundupTM, introducendo una forma modificata del gene batterico che codifica l’enzima EPSPS, che è resistente all’azione dell’erbicida. Il gene che codifica l’enzima batterico EPSPS è stato unito a una sequenza di petunia che codifica un peptide di transito che dirige i polipeptidi nel cloroplasto, e il gene è stato inserito in un vettore T-DNA e introdotto nel tabacco mediante trasformazione mediata da Agrobacterium. Sia l’enzima EPSPS endogeno sia quello batterico modificato sono trasportati nel cloroplasto. Quando sulle piante viene spruzzato Roundup, quelle selvatiche muoiono perché hanno soltanto EPSPS endogeno, che è sensibile all’erbicida. Le piante transgeniche invece sopravvivono perché contengono EPSPS batterico, che è resistente all’erbicida.

Vettore T-DNA Sequenza di petunia che indirizza nel cloroplasto

EPSPS batterico insensibile al glifosato

Promotore CaMV

Trasferimento del DNA nel tabacco mediato da Agrobacterium Cloroplasto

Il peptide di transito veicola l’EPSPS endogeno e batterico nel cloroplasto

EPSPS batterico

EPSPS di tabacco Citoplasma Trattamento con glifosato

L’EPSPS vegetale endogeno viene inibito dall’erbicida

EPSPS batterico ancora attivo Citoplasma Selvatiche

curezza ambientale e alimentare delle piante geneticamente modificate. Con approcci più raffinati sarà possibile produrre piante transgeniche che controllano l’espressione dei geni in tessuti diversi. Un esempio è il controllo della durata temporale dei fiori recisi o del tempo di maturazione dei frutti. Per questo motivo nel 1994 è stata approvata la vendita del pomodoro Flavr Savr, geneticamente ingegnerizzato da Calgene Inc. in collaborazione con la Campbell Soup Company. Per poter essere trasportati evitando il danneggiamento, i pomodori prodotti commercialmente e non modificati geneticamente vengono raccolti mentre sono ancora acerbi. Prima del trasporto essi sono sottoposti a trattamento con etilene, che dà l’avvio al processo di maturazione cosicché raggiungano maturi i negozi. Questi pomodori raccolti prematuramente e fatti maturare in modo artificiale non hanno però il sapore dei pomodori raccolti quando sono maturi. Per ottenere il pomodoro Flavr Savr i ricercatori di Calgene hanno trovato il sistema per impedire ai pomodori

Transgeniche

di produrre la normale quantità di poligalatturonasi (PG), un enzima che rende teneri i frutti. Essi hanno quindi introdotto nella pianta una copia del gene PG orientata in senso opposto rispetto al promotore. Quando questo gene è trascritto, l’mRNA è complementare all’mRNA prodotto dal gene normale, ed è chiamato mRNA antisenso. Nella cellula l’mRNA antisenso si lega al normale mRNA “senso”, impedendo che la maggior parte di esso venga tradotta.* In tal modo si produce molto meno enzima PG e il pomodoro matura più lentamente, potendo così rimanere più a lungo sulla pianta senza diventare troppo tenero da maneggiare e trasportare. Una volta raccolto, il pomodoro Flavr Savr è anche meno suscettibile * Sulla base delle nostre conoscenze attuali, si può ipotizzare che il meccanismo alla base del blocco della traduzione sia l’interferenza dell’RNA (RNAi). Vale a dire che il doppio filamento di RNA formato dall’appaiamento fra i filamenti di mRNA senso e antisenso verrebbe processato per produrre un piccolo RNA regolatore a singolo filamento, che legandosi all’mRNA ne impedisce la traduzione (Capitoli 9 e 18).

La tecnologia del DNA ricombinante

al danneggiamento durante il viaggio o a marcire in negozio. Il Flavr Savr è stato pubblicizzato come un pomodoro con un sapore migliore dei pomodori maturati nei negozi e molto simile a quello dei pomodori coltivati nell’orto di casa. Tuttavia era costoso e non è stato un successo commerciale. Per ragioni economiche è stato ritirato dal mercato. Negli ultimi anni un numero sempre più grande di piante coltivate geneticamente modificate è stato immesso sul mercato. Oltre che per la resistenza agli erbicidi, altre colture sono state modificate per aumentare la resistenza agli insetti. Molte di queste piante esprimono una proteina chiamata Bt, normalmente prodotta da determinati batteri. Quando un insetto sensibile ingerisce la proteina Bt (sia come proteina purificata, sia come una componente di una cellula batterica o di una cellula vegetale), questa lo uccide o gli procura un danno. Per anni proteine Bt purificate e batteri che esprimono naturalmente la proteina Bt sono stati usati come insetticidi nell’agricoltura biologica. In teoria, queste coltivazioni di piante geneticamente modificate potrebbero permettere agli agricoltori di diminuire la dipendenza dai pesticidi, senza diminuire la produzione. Altre colture di piante geneticamente modificate sono state alterate al fine di aumentare la produzione di amminoacidi o di vitamine con l’obiettivo di aumentarne il valore nutrizionale. Potenzialmente queste piante potrebbero essere d’aiuto per alleviare la fame nel mondo. Va ricordato tuttavia che in molti Paesi vi è una significativa resistenza del pubblico nei confronti delle piante geneticamente modificate. Di conseguenza, la maggior parte delle piante geneticamente modificate non viene utilizzata come alimento per gli uomini, bensì per la produzione di cibo per animali o di prodotti non alimentari. Le piante transgeniche possono essere utili anche per somministrare vaccini. Il costo di un vaccino sommini-

263

strato mediante iniezione è relativamente elevato e questo è un problema rilevante nei programmi di vaccinazione dei Paesi in via di sviluppo. Inoltre i vaccini richiedono refrigerazione e aghi sterili, che possono essere molto costosi o impossibili da trovare in alcune parti del mondo. La somministrazione attraverso i vegetali costerebbe invece pochi spiccioli. Questi vaccini sono stati chiamati vaccini eduli e l’area della biotecnologia che si occupa di produrre farmaci in piante o animali si chiama pharming (gioco di parole in inglese tra farming, la pratica agricola, e pharmaceutical ovvero “farmaco”). Sostanzialmente si tratta di produrre delle piante transgeniche che esprimano gli antigeni degli agenti infettivi o delle malattie di interesse in modo che, quando il vegetale viene mangiato, l’individuo possa sviluppare gli anticorpi appropriati. In effetti, dopo il successo in esperimenti condotti su animali, i risultati ottenuti nelle prime fasi della sperimentazione clinica negli esseri umani hanno mostrato che mangiare patate crude può stimolare le risposte immunitarie attese qualora le patate esprimano, per esempio, l’antigene di superficie del virus dell’epatite B, la subunità della tossina B di E. coli patogeno (responsabile della diarrea), o la proteina del capside del virus di Norwalk. Sono necessarie ulteriori ricerche per ottenere elevate produzioni di antigene nei vegetali, in modo che dopo l’ingestione ne sia disponibile una quantità sufficiente per determinare una risposta immunitaria protettiva.

Nota chiave Applicando la tecnologia del DNA ricombinante è possibile ottenere piante geneticamente ingegnerizzate. Si ritiene che nel futuro saranno disponibili numerose piante coltivate migliorate attraverso questa nuova tecnologia.

Sommario l Sono stati sviluppati molti vettori specifici per la manipolazione del DNA clonato. Alcuni sono vettori navetta che permettono di trasportare una sequenza clonata da un organismo ospite a un altro. Altri vettori, detti vettori di espressione, sono progettati per esprimere il gene inserito nella cellula ospite. Molti vettori sono progettati affinché il gene inserito possa essere trascritto in vitro. Non tutti i vettori sono basati sui plasmidi. I vettori fagici accettano inserti più lunghi e possono essere propagati a densità maggiori. Alcuni vettori si integrano all’interno del cromosoma ospite, mentre altri sono mantenuti al di fuori del cromosoma. I vettori vengono scelti sulla base delle esigenze del ricercatore. l Per trovare uno specifico gene in una libreria, viene utilizzata una sonda a DNA o a RNA che rileverà tutto o una parte del gene. A seconda dell’esperimento possono essere utilizzati come sonda un gene intero, un frammento di un gene,

tutto o parte di un gene clonato da una specie imparentata, o un oligonucleotide disegnato per essere simile a una parte del gene. Un gene può essere trovato anche se la corrispondenza fra la sonda e il gene non è perfetta. In alternativa può essere utilizzato un anticorpo come sonda per individuare una proteina codificata dal gene di interesse, a condizione che la libreria saggiata sia in un vettore di espressione. l La tecnica del Southern blot è utilizzata per analizzare uno specifico frammento di DNA nel genoma o in una qualsiasi molecola di DNA di grandi dimensioni. Poiché il genoma è ampio, quando il DNA genomico viene digerito con enzimi di restrizione si creano migliaia/milioni di frammenti diversi. Per poter visualizzare solo quei frammenti corrispondenti al gene di interesse viene utilizzata la tecnica dell’elettroforesi su gel di agarosio, che separa i frammenti in base alla dimensione; quindi i frammenti vengono trasferiti su un fil-

264

l

l

l

l

Capitolo 10

tro. Usando trattamenti chimici, il DNA viene convertito in singoli filamenti, che si legano saldamente al filtro. Una sonda marcata a singolo filamento può essere aggiunta al filtro e le condizioni possono venire regolate per consentire la formazione di appaiamenti tra le basi. La sonda si accoppierà alle sequenze simili e questi ibridi possono essere individuati grazie alla loro marcatura. Uno specifico mRNA può essere individuato utilizzando un northern blot, molto simile al Southern blot. In un northern blot l’RNA viene raccolto, separato in base alle dimensioni mediante elettroforesi su gel di agarosio, trasferito su filtro e legato saldamente al filtro. Una sonda marcata viene aggiunta in condizioni che favoriscano l’appaiamento all’RNA. Una volta ancora, l’individuazione della marcatura indica dove la sonda ha trovato una sequenza simile. Questo ci dice se in un insieme di RNA di partenza è presente o meno uno specifico mRNA. La reazione a catena della polimerasi (PCR) ha molte applicazioni nei laboratori di ricerca. La PCR può essere utilizzata durante le procedure per clonare e/o sequenziare un particolare gene in un individuo. È inoltre una tecnica utile per analizzare il genoma di singoli individui al fine di determinarne il genotipo o per determinare se due campioni di DNA corrispondano. La real time PCR permette la quantizzazione del templato. Questa metodica, così come la classica PCR i cui prodotti sono visualizzabili su gel di agarosio, può servire all’amplificazione di RNA, se quest’ultimo è preventivamente retrotrascritto in cDNA (RT-PCR e RTqPCR). La PCR può essere utilizzata per creare specifiche mutazioni in un gene clonato in un processo chiamato mutagenesi sito-specifica. Questi geni mutati possono quindi essere reintrodotti all’interno di una cellula ospite. Questa tecnica viene usata per realizzare specifiche variazioni nella proteina codificata dal gene, per esempio allo scopo di studiare la funzione della proteina alterata nella cellula. Un gene può essere “umanizzato” mediante mutagenesi sito-specifica per rendere un gene di un organismo modello, come il topo, più simile alla corrispondente versione nell’uomo. Successivamente può essere prodotto un topo transgenico in cui il gene umanizzato rimpiazza quello del topo. Questi topi umanizzati vengono usati per studiare come funziona il gene e per saggiare possibili terapie per le malattie genetiche. Le interazioni proteina-proteina nella cellula possono essere rilevate mediante il sistema del doppio ibrido nel lievito. Questo test usa due plasmidi di espressione in una singola cellula di lievito. Un plasmide esprime una proteina di fusione BD-X dove BD è il dominio di legame di una proteina di regolazione e X è una proteina nota utilizzata come esca per identificare proteine con le quali interagisce all’interno della cellula. L’altro plasmide esprime una proteina di fusione AD-Y dove AD è il dominio di attivazione della stessa proteina di regolazione e Y è la proteina codificata da un singolo cDNA in una libreria di cDNA. Il dominio AD è necessario per attivare la trascrizione ma non si lega a un elemento promotore. In ogni cellula trasformata di lievito la natura di Y è differente in quanto essa è codificata da un particolare clone di cDNA della libreria, che la cellula ha ricevuto. Se le proteine X e Y interagiscono normalmente nella cellula, le proteine di fusione BD-X e AD-Y si legano tra di loro.

l

l

l

l

l

l

Quando questo avviene la porzione BD della proteina BD-X si lega all’elemento promotore di un gene reporter (come lacZ) e AD (ora molto vicina per l’interazione X-Y) attiva la trascrizione del gene reporter. L’espressione del gene reporter è quindi il segnale positivo dell’interazione proteina-proteina e l’analisi del clone di cDNA in quelle cellule identifica il gene che ha codificato per il prodotto proteico che ha interagito con la proteina esca. Nel genoma sono presenti molti tipi di polimorfismi del DNA. I polimorfismi sono regioni di DNA per le quali si possono trovare due o più varianti alleliche nella popolazione. Questi polimorfismi possono essere il risultato di variazioni nella sequenza di coppie di basi, come gli SNP (polimorfismi di un singolo nucleotide), oppure differenze nel numero di sequenze ripetute in tandem, come le STR (corte ripetizioni in tandem) e i VNTR (numero variabile di ripetizioni in tandem). I polimorfismi del DNA possono essere utilizzati nella diagnosi di malattie e nell’analisi del DNA di un individuo; per esempio, i polimorfismi del DNA possono essere analizzati per stabilire se un feto o un bambino appena nato possano sviluppare una specifica malattia genetica. Questi polimorfismi possono anche essere utilizzati per determinare se un individuo sia portatore di una malattia genetica. La tipizzazione del DNA, o DNA fingerprinting, permette di confrontare regioni polimorfiche in due o più individui. La tipizzazione del DNA può essere impiegata per stabilire se un campione di DNA proviene da una determinata persona, per esempio un campione di sperma da una persona sospettata di stupro. Tali test possono fornire la prova di innocenza in maniera certa ma non provano in maniera assoluta la colpevolezza, poiché non può essere provato che nessun’altra persona al mondo abbia lo stesso profilo di polimorfismi. La tipizzazione del DNA può anche essere utilizzata per valutare se un particolare individuo è il genitore di un bambino, poiché tutti i polimorfismi devono provenire dalla madre o dal padre. Anche in questo caso non può essere provato in maniera assoluta che un uomo sia il padre di un bambino, ma può essere provato con certezza che non lo sia. La terapia genica è il trattamento di una malattia genetica attraverso alterazione diretta del DNA. Nell’uomo questo è stato limitato alla terapia genica somatica, nella quale i tessuti somatici vengono modificati ma il tessuto riproduttivo non viene alterato. La terapia genica è stata sperimentata per una serie di malattie genetiche umane, ma i successi ottenuti sono limitati e restano ancora molti ostacoli da superare prima che possa diventare un trattamento medico comune. Il DNA ricombinante viene usato nell’industria biotecnologica e farmaceutica. Questo ha portato allo sviluppo di molti prodotti, come vaccini e farmaci, oltre che alla produzione di organismi modificati che possono essere impiegati nell’industria alimentare o nella degradazione di composti chimici pericolosi. L’ingegneria genetica delle piante, che si avvale delle tecniche del DNA ricombinante, è importante per l’agricoltura. Le modificazioni genetiche delle piante comprendono interventi che alterano il tempo di maturazione del frutto e la resistenza delle piante agli erbicidi. Le applicazioni future di queste tecniche dovrebbero alterare radicalmente la produttività della piante coltivate.

La tecnologia del DNA ricombinante

265

Approccio analitico alla soluzione di problemi di genetica D10.1 ROC è un ipotetico locus STR (microsatellite) polimorfico nell’uomo con un’unità ripetuta CAGA. Il locus è illustrato nella Figura 10.A come un riquadro fiancheggiato da sequenze di 25 coppie di basi. a. Volete usare la PCR per tipizzare il locus ROC di alcuni individui. Se gli oligonucleotidi per la PCR devono essere lunghi 18 nucleotidi, quali sequenze utilizzereste per produrre gli oligonucleotidi necessari per amplificare il locus ROC? b. Considerate alleli ROC con 10 e 7 copie dell’unità ripetuta. Usando gli oligonucleotidi che avete disegnato, qual è la dimensione dei frammenti di DNA amplificati per ciascun

allele? c. Per il locus ROC sono noti quattro alleli, rispettivamente con 15, 12, 10 e 7 ripetizioni dell’unità. Quanti genotipi umani possibili vi sono e quali sono? d. Se un genitore è eterozigote per gli alleli 15 e 10, mentre l’altro genitore è eterozigote per gli alleli 10 e 7 del locus ROC, quali sono i genotipi possibili della progenie e con quali frequenze? e. Nella famiglia dei genitori descritti in d crescono tre bambini. Tipizzandoli per il locus ROC si trova che i loro genotipi sono (10,10), (15,10) e (12,7). Che cosa concludete?

Figura 10.A

5„- C T GA T T C T T GA T C T C C T T T AGC T T C 3„- GAC T AAGAAC T AGAGGAAA T CGAAG

ROC

R10.1 Questo problema richiede la conoscenza delle molteplici proprietà dei loci STR (corte ripetizioni in tandem o microsatelliti). Innanzitutto richiede che voi sappiate che, in una popolazione di individui, i cromosomi possono essere polimorfici in un particolare locus STR. Vale a dire che la lunghezza della sequenza ripetuta nel locus STR varia fra cromosomi diversi. Il numero di ripetizioni della sequenza definisce quale allele STR è presente su un particolare cromosoma. In secondo luogo, questo problema richiede che comprendiate che gli alleli STR sono ereditati allo stesso modo di un qualsiasi altro gene nucleare: la progenie riceve un allele da ciascuno dei genitori. È importante rendersi conto che, anche se i membri di una popolazione hanno diversi alleli in un locus STR, la lunghezza della ripetizione di solito non cambia quando questo viene trasmesso. In terzo luogo, questo problema richiede che voi sappiate che le sequenze che fiancheggiano la ripetizione sono identiche su cromosomi diversi e che questo permette di utilizzare la PCR per rilevare la lunghezza della ripetizione. I primer della PCR possono essere progettati sulla base delle sequenze che fiancheggiano la ripetizione e utilizzati per amplificarla. I prodotti della PCR vengono quindi separati secondo le loro dimensioni mediante elettroforesi su gel. Gli alleli presenti in un individuo sono determinati in base alle dimensioni dei prodotti della PCR. Se l’amplificazione con la PCR produce una singola banda, l’individuo ha due alleli identici, e quindi è omozigote, mentre se l’amplificazione produce due bande, l’individuo ha due differenti alleli e perciò è eterozigote. a. Per determinare la dimensione della ripetizione dovete usare i primer della PCR che identificano le sequenze conservate che fiancheggiano immediatamente il locus ROC. I primer devono avere la polarità giusta per amplificare il DNA compreso. Quindi, il primer di sinistra è 5′TTGATCTCCTTTAGCTTC-3′ (i 18 nucleotidi più a destra della sequenza a sinistra del locus, leggendo da sinistra a destra sul filamento superiore), mentre quello di destra è 5′-TCACATAATGAATTATAC-3′ (i 18 nucleotidi più a sinistra della sequenza a destra del locus ROC, leggendo da destra a sinistra sul filamento inferiore).

G T A T AA T T CA T T A T G T GA T AA T GC C -3„ CA T A T T AAG T AA T ACAC T A T T ACGG -5„

b. La PCR amplifica il DNA tra i due primer usati nella reazione. La dimensione dei frammenti è la lunghezza del DNA compreso tra i due primer, più la lunghezza dei due primer. Per l’allele di 10 ripetizioni del locus ROC, con l’unità ripetuta lunga 4 nucleotidi, il prodotto è 18 + (10 × 4) + 18 = 76 coppie di basi. Per l’allele di 7 ripetizioni il frammento è lungo 18 + (7 × 4) + 18 = 64 bp. c. Gli esseri umani sono diploidi, quindi nel genoma vi sono due copie per ciascun locus. Ogni individuo può essere omozigote o eterozigote per ogni locus. Per comprendere quali siano i genotipi, bisogna capire quali sono tutte le combinazioni alleliche. Per 4 alleli STR ci sono 10 genotipi, 4 dei quali sono omozigoti e 6 dei quali sono eterozigoti. I genotipi sono (15,15), (12,12), (10,10), (7,7), (15,12), (15,10), (15,7), (12,10), (12,7) e (10,7). d. Questa domanda fa riferimento alla segregazione degli alleli. Ogni genitore diploide produce gameti aploidi e i gameti di ciascun genitore si appaiano a caso per produrre la progenie diploide. Quindi il genitore (15,10) produce una quantità uguale di gameti che portano l’allele 15 o l’allele 10, mentre il genitore (10,7) produrrà pari quantità di gameti 10 e 7. I gameti prodotti si fonderanno a caso secondo lo schema della figura: (10,7) gameti di un genitore

(15,10) gameti di un genitore

10

7

15

(15,10)

(15,7)

10

(10,10)

(10,7)

I genotipi della progenie sono 1/4 (15,10), 1/4 (15,7), 1/4 (10,10) e 1/4 (10,7). e. Nella parte d vengono indicati i genotipi della progenie per i genitori (15,10) e (10,7). I genotipi di due dei tre bambini sono in accordo con quelli attesi rispetto ai genotipi dei genitori, in particolare i bambini (10,10) e (15,10). Il bambi-

266

Capitolo 10

no (12,7) non può essere prodotto dai genitori indicati. Certamente il genitore (10,7) potrebbe aver fornito l’allele 7, ma l’allele 12 non può derivare da nessuno dei due genitori. Non si può spiegare la situazione senza informazioni ulteriori. Le ipotesi per spiegare il genotipo del bambino

(12,7) possono essere le seguenti: (1) il bambino è stato adottato; (2) il bambino viene da un matrimonio precedente del genitore (10,7) con un individuo che aveva l’allele 12; (3) il bambino è stato scambiato nella culla dell’ospedale alla nascita.

11

La genetica mendeliana

In che modo i singoli geni segregano in un incrocio genetico?

Come viene studiata l’ereditarietà genica nell’uomo?

In che modo due geni segregano in un incrocio genetico?

Attività Per molti secoli gli uomini hanno incrociato animali e piante prendendo in considerazione caratteri specifici. Attraverso gli incroci delle piante di piselli, Gregorio Mendel sviluppò la sua teoria per spiegare la trasmissione dei caratteri ereditari di generazione in generazione. In che cosa consistevano gli esperimenti di Mendel? Qual è la relazione tra geni e caratteri? In che modo la conoscenza delle modalità con cui i caratteri vengono ereditati può consentire l’incrocio per caratteri specifici? Più avanti potrete esercitarvi sull’iAttività relativa a questo capitolo, utilizzando le conoscenze acquisite per l’incrocio di un cucciolo molto particolare.

La genetica è lo studio della struttura, dell’organizzazione, dell’ereditarietà e della funzione dei geni. Nel corso del tempo, gli scienziati hanno affrontato le problematiche genetiche utilizzando gli approcci metodologici possibili in quel momento. Essi hanno focalizzato la loro attenzione su questioni basilari dell’ereditarietà, quali: si tratta di un carattere ereditario? Come viene ereditato? Come vengono trasmessi i geni di generazione in generazione? Come ricombinano i geni? Qual è la specifica posizione di un gene nel genoma? Questi argomenti fanno parte di una sottodisciplina della genetica che prende il nome di genetica della trasmissione. Questo capitolo è il primo di una serie che tratta la trasmissione genetica. Dopo lo sviluppo di metodologie biochimiche e molecolari, i genetisti si sono posti ulteriori domande, tra le quali: qual è la struttura molecolare di un gene? Quali sono i meccanismi che permettono l’espressione genica? Quali sono i meccanismi che determinano le mutazioni di un gene? Lo studio della struttura e della funzione dei geni a livello molecolare rientra nella sottodisciplina della genetica molecolare. La struttura molecolare del gene e i meccanismi molecolari della replicazione del DNA, l’e-

spressione genica e le mutazioni del DNA sono stati discussi nei Capitoli 2-7. La comprensione di come i geni siano trasmessi dai genitori ai figli cominciò con il lavoro di un monaco agostiniano, Gregorio Mendel (1822-1884). Lo scopo di questo capitolo è l’analisi dei principi di base della trasmissione genetica esaminando gli studi compiuti da Mendel, pur nella consapevolezza che, sebbene Mendel abbia analizzato la segregazione dei caratteri ereditari, egli non conosceva la natura dei geni, né sapeva che i geni erano localizzati sui cromosomi, dei quali ignorava persino l’esistenza.

Genotipo e fenotipo Le caratteristiche di un individuo sono definite tratti (denominati anche caratteri). Alcuni caratteri sono ereditabili – trasmissibili di generazione in generazione – mentre altri non lo sono. I caratteri ereditabili sono determinati dai geni (Mendel li chiamò fattori). La costituzione genetica di un organismo è definita genotipo e le caratteristiche visibili (strutturali e funzionali) di un organismo sono chiamate fenotipo. Un fenotipo può essere visibile, per esempio il colore degli occhi, oppure non immediatamente visibile ma misurabile, per esempio una caratteristica come il gruppo sanguigno, oppure una proteina o un enzima alterati. Il fenotipo è determinato dai geni e influenzato dall’ambiente interno e/o esterno. I geni, quindi, determinano soltanto la possibilità che una particolare caratteristica fenotipica si realizzi. Il grado in cui questa capacità potenziale viene sviluppata dipende in molti casi da influenze ambientali e da eventi che si verificano casualmente durante lo sviluppo (Figura 11.1). La statura di una persona, per esempio, è controllata da molti geni, la cui espressione può essere modificata in modo significativo da influenze ambientali, quali gli effetti degli ormoni durante la pubertà (in-

268

Capitolo 11

Genotipo (costituzione genetica)

Influenze ambientali ed eventi casuali durante lo sviluppo

Fenotipo (manifestazione di una caratteristica fisica)

Figura 11.1 Relazione tra genotipo e fenotipo.

fluenza ambientale interna) e l’alimentazione (influenza ambientale esterna). In altre parole, i geni determinano l’estensione dei profili fenotipici mentre l’ambiente precisa dove il fenotipo si situerà nell’ambito dato. È importante sottolineare che, benché il fenotipo sia il risultato di un’interazione tra geni e ambiente, il contributo dell’ambiente è variabile. In alcuni casi l’influenza dell’ambiente è grande, in altri il suo contributo è nullo. Approfondiremo la relazione tra genotipo e fenotipo più in dettaglio, man mano che la trattazione procede.

Nota chiave Il genotipo è la costituzione genetica di un organismo. Il fenotipo è la manifestazione visibile dei caratteri di un organismo. I geni determinano la possibilità di sviluppare i caratteri; queste capacità potenziali sono spesso influenzate da interazioni con altri geni e con l’ambiente. Quindi, individui con lo stesso genotipo possono manifestare fenotipi diversi e individui con lo stesso fenotipo possono avere genotipi diversi.

significato non venne realmente compreso fino al termine del 1800 o, meglio, all’inizio del 1900. L’approccio sperimentale di Mendel fu efficace perché egli interpretò in modo semplice i rapporti tra i tipi di progenie ottenuta dai suoi incroci e perché eseguì successivamente esperimenti diretti e convincenti per saggiare la sua ipotesi. Nei suoi primi esperimenti di incrocio seguì l’approccio più semplice, vale a dire l’analisi dell’ereditarietà di un carattere alla volta (questo è il modo con cui si dovrebbero affrontare i problemi di genetica). Eseguì incroci rigorosamente controllati tra linee di piselli che manifestavano differenze visibili nei caratteri ereditari e, cosa più importante, prese accuratamente nota dei risultati degli incroci. I dati numerici ottenuti gli consentirono di fare una analisi rigorosa della trasmissione dei caratteri ereditari. In generale, gli incroci genetici con gli eucarioti vengono eseguiti nel modo seguente: due individui diploidi producono gameti aploidi attraverso la meiosi. La fusione di gameti maschili e femminili dà origine a zigoti che costituiranno gli individui diploidi della progenie. L’analisi dei fenotipi dei genitori e dei figli fornisce indicazioni sull’ereditarietà di quei fenotipi. Mendel eseguì tutti i suoi esperimenti più significativi con i piselli odorosi (vedi Figura 1.4k). I piselli odorosi furono una buona scelta poiché soddisfano i criteri che rendono un organismo adatto per essere usato in esperimenti di genetica: sono facili da coltivare, danno fiori e frutti nello stesso anno di semina e producono un numero elevato di semi. La Figura 11.3, che illustra la procedura dell’incrocio tra piante di piselli, mostra in alto una sezione trasversale di un fiore, con gli stami (gli organi riproduttivi maschili) e i pistilli (gli organi riproduttivi femminili). I piselli normalmente si riproducono per autofecondazione (anche definita selfing); vale a dire, le antere

Il piano sperimentale di Mendel Il lavoro di Gregorio Mendel (Figura 11.2) è considerato la base della genetica moderna. Nel 1843 egli venne ammesso al monastero agostiniano di Brünn (l’attuale Brno, nella Repubblica Ceca). Nel 1854 cominciò una serie di incroci sperimentali con i piselli odorosi Pisum sativum, per comprendere i meccanismi dell’ereditarietà. Grazie alla sua creatività, Mendel scoprì alcuni principi fondamentali della genetica. In base ai risultati ottenuti dagli incroci tra piante di piselli che manifestavano caratteri differenti, quali la forma e il colore del seme e il colore dei fiori, Mendel sviluppò una teoria semplice per spiegare la trasmissione dei caratteri ereditari da una generazione all’altra (Mendel non conosceva la mitosi e la meiosi, quindi non sapeva che i geni segregano insieme ai cromosomi). Mendel pubblicò le sue conclusioni nel 1865 ma il loro

Figura 11.2 Gregorio Mendel, fondatore della scienza della genetica.

La genetica mendeliana

all’estremità dello stame producono il polline (microspora di una pianta da fiore che germina formando il gametofito maschile [ ]), che si deposita sul pistillo (che contiene il gametofito femminile [ ]) nello stesso fiore e feconda la pianta. Nei suoi esperimenti, Mendel impedì l’autofecondazione, rimuovendo prima della produzione del polline maturo gli stami dal germoglio del fiore in sviluppo. Quindi, prelevò il polline dagli stami di un altro fiore e lo sparse sul pistillo del fiore emasculato, per effettuare la fecondazione. La fecondazione incrociata, o più semplicemente incrocio, è la fusione dei gameti maschili (in questo caso il polline) prodotti da un organismo con i gameti femminili (cellule uovo) prodotti da un altro. Una volta avvenuta la fecondazione incrociata, lo zigote svilupperà i semi (piselli). Alcuni fenotipi vengono analizzati osservando gli stessi semi, altri esaminando le piante che derivano dai semi. Mendel si procurò 34 varietà di piante di piselli che differivano per un certo numero di caratteri. Lasciò autofecondare ogni varietà per molte generazioni, per essere sicuro che i caratteri che voleva studiare fossero ereditari. Questo lavoro preliminare gli diede la sicurezza di lavorare solo con varietà nelle quali il carattere studiato rimaneva immutato dai genitori ai figli per molte generazioni. Tali varietà sono chiamate linee pure. Successivamente Mendel selezionò sette paia di caratteri da studiare negli incroci. Ogni paio influenzava una caratteristica della pianta e le due forme alternative erano facilmente distinguibili (Figura 11.4): 1. colore del fiore e del rivestimento del seme: involucro del seme grigio o bianco e fiori porpora o bianchi (un singolo gene controlla entrambe queste caratteristiche del colore dell’involucro del seme e dei fiori); 2. colore del seme (giallo o verde); 3. forma del seme (liscio o rugoso); 4. colore del baccello (verde o giallo); 5. forma del baccello (pieno o irregolare); 6. lunghezza dello stelo (lungo o corto); 7. posizione del fiore (assiale o terminale).

Incroci di monoibridi e il principio mendeliano della segregazione È necessario chiarire la terminologia usata negli incroci. La generazione parentale è chiamata generazione P. La progenie dell’incrocio P è chiamata prima generazione filiale, o F1. La generazione successiva, prodotta incrociando tra loro gli individui della F1, è definita generazione F2 (seconda generazione filiale). L’incrocio tra i figli di ogni generazione produrrà le generazioni F3, F4, F5 e così via. Nel primo esperimento, Mendel effettuò incroci tra monoibridi – incroci tra linee pure di piselli, che avevano

269

Stame Pistillo

Fenotipo 1

Fenotipo 2

Rimuovere gli stami prima che sia prodotto il polline. Conservare il pistillo e l’ovario (gameti )

Raccogliere il polline dalle antere mature (gameti )

Effettuare una fecondazione incrociata trasferendo il polline dagli stami ai pistilli

Sviluppo dei piselli (semi) nel baccello

Piantare i semi

Osservare i fenotipi della progenie

Figura 11.3 Procedura dell’incrocio di piante di pisello.

forme alternative di un singolo carattere. Per esempio, quando impollinò piante di piselli, che avevano dato origine solo a semi lisci,* con polline proveniente da una linea pura che produceva semi rugosi, il risultato fu una proge* I semi sono la progenie diploide della riproduzione sessuata. Se un fenotipo è relativo al seme stesso, i risultati dell’incrocio possono essere visti direttamente osservando i semi. Se un fenotipo riguarda una parte della pianta adulta, come la lunghezza dello stelo o il colore del fiore, i semi devono essere fatti germinare prima di poter osservare quel fenotipo.

270 1

Capitolo 11 Colore dell’involucro del seme/colore del fiore

2

Colore del seme

Giallo Grigio e porpora

Bianco e bianco

3

Lungo

5

Colore del baccello

Forma del baccello

Verde

Forma del seme

Liscio

6

4

Rugoso

Verde

Giallo

Pieno

7

Lunghezza dello stelo

Corto

Irregolare

Posizione dei fiori

Assiale

Terminale

Figura 11.4 Le sette paia di caratteri del pisello odoroso studiate da Mendel nei suoi esperimenti di incrocio.

nie costituita interamente da semi lisci (Figura 11.5). Quando i genitori venivano scambiati – vale a dire, quando il polline proveniente da una pianta a semi lisci veniva utilizzato per impollinare una pianta di piselli che dava semi rugosi – il risultato ottenuto fu lo stesso: fu ottenuta una progenie costituita interamente da semi lisci. Gli incroci eseguiti in entrambi i modi – femmina [ ] a semi lisci × maschio [ ] a semi rugosi e femmina [ ] a semi rugosi × maschio [ ] a semi lisci – vengono definiti incroci reciproci. Per convenzione, negli incroci tra piante la femmina viene indicata per prima. Se i risultati degli incroci reciproci sono gli stessi, questo significa che l’ereditarietà del carattere non dipende dal sesso. Il risultato significativo di questo incrocio è che tutti i semi della progenie F1 ottenuta dagli incroci reciproci liscio × rugoso erano lisci: relativamente a questo carattere i semi erano esattamente simili a uno solo dei due genitori, anziché essere una miscela di entrambi i fenotipi parentali. Il fatto che tutti i figli di genitori appartenenti a linee pure siano simili tra loro viene talvolta definito come il principio dell’uniformità della F1. Successivamente, Mendel piantò questi semi e lasciò autofecondare le piante della F1 per produrre i semi F2. Nella generazione F2 comparvero semi sia lisci sia rugo-

si, nello stesso baccello. Seguendo il suo approccio analitico agli esperimenti, Mendel contò il numero di semi di ogni tipo. Egli trovò che 5474 semi erano lisci e 1850 erano rugosi (Figura 11.6). Il rapporto calcolato tra lisci e rugosi era di 2,96:1, molto vicino a un rapporto 3:1. Mendel osservò che, benché la F1 manifestasse un fenotipo simile a quello di uno dei due genitori, non si trattava di una linea pura – fatto questo che distingueva la F1 dal genitore al quale assomigliava. La progenie F1, ×

Generazione P Semi lisci

Semi rugosi

Generazione F1

Tutti i semi sono lisci

Figura 11.5 Risultati di uno degli incroci di Mendel. Nella generazione parentale, egli aveva incrociato una linea pura di piselli che produceva semi lisci con una che produceva semi rugosi. Tutti i semi della progenie F1 erano lisci.

La genetica mendeliana

infatti, produceva una progenie F2 della quale una parte manifestava la caratteristica fenotipica parentale scomparsa nella generazione F1. Ma come può un carattere presente nella generazione parentale scomparire nella F1 e poi ricomparire nella F2? Mendel concluse che le forme alternative del carattere analizzato nell’incrocio – la forma liscia o rugosa del seme – erano determinate da fattori particellari. Egli pensò che questi fattori, trasmessi dai genitori alla progenie attraverso i gameti, portassero l’informazione ereditaria. È importante notare che i due fattori rimanevano distinti negli incroci e non si fondevano. Adesso noi chiamiamo questi fattori con un altro nome: geni. Dall’esame di coppie di caratteri (per esempio semi lisci e rugosi), Mendel pensò che ogni fattore esistesse in forme alternative (che noi ora chiamiamo alleli), ognuna delle quali doveva determinare uno dei caratteri. Del gene che controlla il carattere della forma del seme dei piselli esistono un allele che produce un seme liscio e un altro allele che dà un seme rugoso. Mendel, inoltre, pensò che una linea pura dovesse contenere una coppia di fattori identici. Con le conoscenze attuali sappiamo che questo è quello che succede nei piselli poiché diploidi e quindi con due copie di ogni gene su un paio di cromosomi omologhi. Dato che la F2 manifestava entrambi i caratteri, mentre solo uno appariva nella F1, ogni individuo della F1 doveva contenere entrambi i fattori, uno per ciascuno dei caratteri alternativi. In altre parole, l’incrocio tra due diverse linee pure fa unire insieme nella F1 un fattore proveniente da ciascuna linea: le cellule uovo (che sono aploidi, ovvero contengono un sola copia di ciascun cromosoma) ricevono un fattore da una linea parentale e il polline (che è anch’esso aploide) contiene un fattore dell’altra linea. Inoltre, poiché solo uno dei caratteri era visibile nella F1, l’espressione del carattere mancante doveva in qualche modo essere mascherata dal carattere visibile; questa proprietà è chiamata dominanza. Nel caso dell’incrocio liscio × rugoso, i semi F1 erano tutti lisci. Perciò l’allele che determina la forma liscia maschera, o è dominante, sull’allele che determina la forma rugosa; il carattere seme liscio è considerato un carattere dominante e l’allele responsabile di questo carattere viene detto allele dominante. Al contrario, il rugoso è definito recessivo rispetto al liscio, perché il fattore che determina il carattere rugoso non si manifesta fenotipicamente in presenza del dominante e il seme rugoso è considerato un carattere recessivo. L’allele corrispondente viene definito allele recessivo. Si noti che i termini dominante e recessivo riferiti a un allele non hanno significato se non usati in rapporto all’altro allele per lo stesso gene. Gli incroci sono rappresentati usando simboli per gli alleli, come fece Mendel. Nell’incrocio liscio × rugoso attribuiamo il simbolo S all’allele che determina la superficie liscia e il simbolo s all’allele per la superficie ru-

×

Generazione P

Semi rugosi

Semi lisci

Generazione F1

271

Tutti i semi sono lisci

Incrocio F1 × F1

×

Autofecondazione delle piante di F1

Generazione F2

5474 semi lisci

e

1850 semi rugosi

2,96 : 1

Figura 11.6 Progenie F2 dell’incrocio illustrato in Figura 11.5. Quando le piante ottenute dai semi F1 venivano autofecondate, si produceva una progenie F2 costituita da semi sia lisci sia rugosi. Generalmente, entrambi i tipi di semi si ritrovavano nello stesso baccello. Nei suoi esperimenti, Mendel contò alla F2 5474 semi lisci e 1850 semi rugosi, in un rapporto di 2,96:1.

gosa. La lettera usata è l’iniziale (inglese, da smooth, “liscio”) del fenotipo dominante. La convenzione adottata in questo caso è che l’allele dominante si indichi con la lettera maiuscola e l’allele recessivo con la minuscola (questa convenzione è stata usata per molti anni, in particolare dai genetisti delle piante; adesso si usa assegnare la lettera basandosi sul fenotipo recessivo. Questa convenzione più recente verrà seguita più oltre). Usando questi simboli, noi rappresentiamo il genotipo della pianta parentale a semi lisci come SS e quello del genitore a semi rugosi come ss. Organismi che contengono due copie dello stesso specifico allele di un dato gene si definiscono omozigoti relativamente a quel gene (Figura 11.7). Quando piante diploidi producono i gameti aploidi durante la meiosi (vedi Capitolo 12), ogni gamete contiene solo una copia del gene (un allele); le piante derivate dai semi lisci producono gameti contenenti S e le piante ottenute dai semi rugosi producono gameti con s. Quando i gameti si fondono durante il processo di fecondazione, lo zigote diploide risultante contiene un allele S e uno s, quindi il genotipo Ss. Piante che possiedono due alleli diversi di uno specifico gene sono definite eterozigoti. Data la dominanza dell’allele S, le piante Ss producono semi lisci (Figura 11.7).

272

Capitolo 11 Allele dominante

Allele recessivo

Genotipo

S S SS, omozigote

S s Ss, eterozigote

s s ss, omozigote

Fenotipo Semi lisci

Semi rugosi

Figura 11.7 Alleli dominanti e recessivi di un gene che controlla la forma dei semi nei piselli.

La Figura 11.8 schematizza l’incrocio liscio × rugoso utilizzando i simboli della genetica; la produzione della F1 è presentata nella Figura 11.8a e quella della F2 nella Figura 11.8b. (Nelle Figure 11.7 e 11.8 i geni sono rappresentati sui cromosomi poiché la segregazione dei geni attraverso le generazioni segue il comportamento dei cromosomi durante la meiosi e la fecondazione.) Il genitore a semi lisci, appartenente a una linea pura, ha il genotipo SS e il genitore a semi rugosi, a sua volta linea pura, ha il genotipo ss. Dato che ogni genitore appartiene a una linea pura ed è diploide (vale a dire, ha due co-

pie di ogni cromosoma), ciascuno deve possedere due copie dello stesso allele. Tutte le piante della F1 producono semi lisci e sono eterozigoti Ss. Le piante ottenute dai semi F1 differiscono dal genitore liscio, in quanto producono uguali quantità di due tipi di gameti: gameti con S e gameti con s. Tutte le possibili combinazioni gametiche alla F1 sono rappresentate nella matrice di Figura 11.8b, chiamata quadrato di Punnett, dal nome del suo ideatore Reginald Punnett. Queste combinazioni danno origine agli zigoti che costituiscono la generazione F2 Nella F2 vengono prodotti tre tipi di genotipi: SS, Ss e ss. In conseguenza della fusione casuale dei gameti, la proporzione relativa di questi zigoti è 1:2:1, rispettivamente. D’altra parte, dato che l’allele S è dominante su s, i semi sia SS sia Ss sono lisci e quindi i semi della generazione F2 mostrano un rapporto fenotipico semi lisci: semi rugosi di 3:1. Mendel analizzò anche il comportamento delle altre sei paia di caratteri. Qualitativamente e quantitativamente, si ottennero gli stessi risultati (Tabella 11.1). Dalle sette serie di incroci egli trasse le seguenti conclusioni generali sui suoi dati. 1. I risultati degli incroci reciproci erano sempre gli stessi. b) Produzione della generazione F2

a) Produzione della generazione F1 Generazione P

Genitore 1

Genitore 2

Generazione F1

Fenotipo parentale

Semi lisci

Semi rugosi

Fenotipo F1

Semi lisci

Semi lisci

Genotipo diploide F1

Genotipo parentale diploide

SS Gameti aploidi

S

S

Ss

ss

×

s

s

Gameti aploidi F1

S

s

s

×

s

Gameti

Gameti del genitore 2 Generazione F1

Ss

Generazione F2

S

s

della F1

1/ 2

1/ 2

S

s

SS

Ss

Ss

ss

1/2

S

S Ss

Ss Gameti della F1

Gameti del genitore 1

1/ 2

s

S Ss

Ss

Genotipi F1: tutti Ss

Genotipi F2: 1/4 SS, 1/2 Ss, 1/4 ss

Fenotipi F1: tutti lisci (liscio è dominante su rugoso)

Fenotipi F2: 3/4 semi lisci, 1/4 semi rugosi

Figura 11.8 Stesso incrocio delle Figure 11.5 e 11.6, usando i simboli genetici per illustrare il principio della segregazione dei fattori mendeliani.

La genetica mendeliana

2. Tutta la progenie F1 era simile a una delle due linee parentali, dimostrando la dominanza di un allele sull’altro. 3. Nella generazione F2 ricompariva il carattere parentale scomparso nella generazione F1. Inoltre, il carattere manifestato nella F1 (carattere dominante) compariva sempre nella F2 con una frequenza di circa tre volte rispetto a quella dell’altro carattere (carattere recessivo).

Il principio della segregazione

MyLab

In base ai dati discussi, Mendel propose quella che è conosciuta come la sua prima legge, il principio della segregazione: i caratteri recessivi, mascherati alla F1 di un incrocio tra due linee pure, ricompaiono alla F2 in proporzioni definite. In termini moderni, questo significa che i due membri di una coppia genica (alleli) segregano (si separano) l’uno dall’altro nimazione durante la formazione dei gameti in meiosi. Come risultato, Il principio metà dei gameti porta un allele della e l’altra metà porta l’altro allele. segregazione In altre parole, ciascun gamete di Mendel porta solo un singolo allele di ogni gene. La progenie è il risultato della combinazione casuale dei gameti prodotti dai due genitori. Nel proporre il principio della segregazione, Mendel operò una distinzione tra i fattori (geni) che determinano i caratteri (il genotipo) e i caratteri stessi (il fenotipo). Adesso noi sappiamo, ovviamente, che i geni stanno sui cromosomi. La localizzazione specifica di un gene su un cromosoma è definita locus (o locus genico; plurale loci). Inoltre, la prima legge di Mendel stabilisce che i membri di una coppia di alleli si separano durante la meiosi e che ogni figlio riceve da ciascun genitore solo un allele. Quindi, la segregazione dei geni va di pari passo con la separazione delle paia di cromosomi omologhi all’anafase I della meiosi (vedi Capitolo 12).

273

Il Box 11.1 presenta un riepilogo dei concetti e dei termini genetici che abbiamo discusso finora in questo capitolo. Una familiarità completa con questi termini è essenziale per lo studio della genetica.

Nota chiave La prima legge di Mendel, il principio della segregazione, afferma che i due membri di una coppia genica (alleli) segregano (si separano) l’uno dall’altro durante la formazione dei gameti; metà dei gameti contiene un allele e l’altra metà l’altro allele.

La rappresentazione degli incroci mediante uno schema ramificato L’uso del quadrato di Punnett per rappresentare le combinazioni di tutti i possibili tipi di gameti prodotti da due genitori in un incrocio (vedi Figura 11.8) è un modo semplice per prevedere le frequenze relative di genotipi e fenotipi nella generazione successiva. Esiste un metodo alternativo, che si esorta a utilizzare: lo schema ramificato. (Il Box 11.2 discute alcuni principi elementari di probabilità, che aiuteranno nella comprensione di questo metodo.) Per utilizzare lo schema ramificato è necessario conoscere la relazione di dominanza-recessività della coppia allelica, in modo da poter determinare le classi fenotipiche della progenie. La Figura 11.9 illustra l’applicazione del metodo dello schema ramificato per l’analisi dell’autofecondazione della F1 ottenuta dall’incrocio liscio × rugoso rappresentato nella Figura 11.8. I semi F1 prodotti dall’incrocio della Figura 11.8 hanno genotipo Ss. Alla meiosi è atteso un ugual numero di gameti S e di gameti s (vedi Figura 11.9). Quindi, 1/2 è la frequenza attesa per ognuno di questi due tipi. In base alle leggi della probabilità, possiamo prevedere le frequenze attese dei tre possibili genotipi alla generazione F2 usando lo schema ramificato. Da ogni ge-

Tabella 11.1 Risultati degli incroci di Mendel tra piante che differiscono per uno dei sette caratteri Caratterea Semi: lisci o rugosi Semi: gialli o verdi Involucri del seme: grigi o bianchib Fiori: porpora o bianchi Fiori: assiali o terminali Baccelli: pieni o irregolari Baccelli: verdi o gialli Stelo: lungo o corto Totale o media a b

F1 (dominanti) Tutti lisci Tutti gialli Tutti grigi Tutti porpora Tutti assiali Tutti pieni Tutti verdi Tutti lunghi

F2 (numero) dominanti

}

F2 (numero) recessivi

F2 (numero) totale

F2 (rapporto) dominanti : recessivi

5474 6022

1850 2001

7324 8023

2,96:1 3,01:1

705

224

929

3,15:1

651 882 428 787

207 299 152 277

858 1181 580 1064

3,14:1 2,95:1 2,82:1 2,84:1

14 949

5010

19 959

2,98:1

Il carattere dominante è sempre scritto per primo. Un singolo gene controlla sia il colore dell’involucro del seme sia il colore del fiore.

274

Capitolo 11

Box 11.1

Terminologia genetica

Alleli: forme diverse di un gene. Per esempio, gli alleli S e s determinano la superficie liscia o rugosa dei semi di piselli. (Come i simboli dei geni, i simboli degli alleli sono in corsivo.) Aploide: una cellula o un individuo con una sola copia di ogni cromosoma. Carattere: una caratteristica di un individuo che è trasmessa da generazione a generazione. Sinonimo di tratto. Diploide: una cellula eucariote o un organismo con due assetti di cromosomi. La copia di derivazione paterna e quella di derivazione materna di ciascun cromosoma formano una coppia di cromosomi omologhi. Fenotipo: la manifestazione fisica di un carattere genetico, determinata da uno specifico genotipo e dalla sua interazione con l’ambiente. Nel nostro esempio l’allele S è dominante sull’allele s, quindi in condizioni di eterozigosi il seme è liscio. Dunque, sia i semi omozigoti dominanti SS sia i semi eterozigoti Ss hanno lo stesso fenotipo (liscio), anche se hanno genotipo diverso. Gamete: una cellula riproduttiva matura specializzata per la fusione sessuale. Ogni gamete è aploide e si unisce a un’altra cellula aploide derivata dalla meiosi, ma prodotta dal sesso opposto, generando uno zigote diploide. Gene (fattore mendeliano): il determinante genetico di una caratteristica di un organismo (i simboli dei geni sono in corsivo). La sequenza nucleotidica di un gene controlla la sintesi di un polipeptide o di un RNA. Generazione F1 (prima generazione filiale): la progenie derivante dall’accoppiamento tra individui della generazione P.

1/

Gameti

×

Ss

Generazione F1

2 S,

Ss

1/ s 2

1/ S, 1/ s 2 2

La combinazione casuale dei gameti dà: Un genitore

L’altro genitore 1/

2S

Genotipo in F2 1/

Fenotipo in F2

4 SS 3/

1/ S 2 1/

2s

1/

4 Ss 1/

1/

2S

1/

2s

1/

4 Ss

2 Ss

4 S– (forma abbreviata di SS o Ss per indicare che un allele è S e l’altro è S o s; viene prodotto un fenotipo dominante liscio)

1/ s 2 1/

4 ss

1/ ss 4

(rugoso, fenotipo recessivo)

Generazione F2 (seconda generazione filiale): la progenie derivante dall’incrocio degli individui della generazione F1. Generazione P: generazione parentale negli esperimenti di incrocio. Genotipo: la costituzione genetica di un organismo. Un organismo diploide nel quale entrambi gli alleli di un determinato locus genico sono uguali è detto omozigote per quell’allele. Gli omozigoti producono un solo tipo di gameti relativamente a quel locus. Per esempio, i piselli delle linee pure a seme liscio hanno genotipo SS e i piselli delle linee pure a seme rugoso hanno genotipo ss; entrambi sono omozigoti. Il genitore a seme liscio è omozigote dominante; il genitore a seme rugoso è omozigote recessivo. Gli organismi diploidi che possiedono due alleli diversi di uno specifico locus sono definiti eterozigoti. Quindi, le piante ibride della F1 derivata dall’incrocio tra SS e ss hanno un allele S e uno s. Gli individui eterozigoti per due forme alleliche di un gene producono due tipi di gameti (S e s). Incrocio: accoppiamento tra due individui che porta alla fusione dei gameti. Linea pura: quando un carattere studiato rimane invariato dal genitore al figlio per molte generazioni. Solitamente questo significa che c’è omozigosi per l’allele responsabile di quel carattere. Locus (locus genico; plurale loci): il sito specifico su un cromosoma laddove è localizzato un gene. Tratto: una caratteristica di un individuo. Un tratto ereditabile viene trasmesso da generazione a generazione. Sinonimo di carattere. Zigote: la cellula prodotta dalla fusione dei gameti maschile e femminile.

nitore, la frequenza di un gamete S è 1/2 e la frequenza di un gamete s è 1/2. Il gamete S di questo genitore si unisce con il gamete dell’altro genitore. La frequenza del gamete S di quest’altro genitore è 1/2, come la frequenza del gamete s. Per produrre una pianta SS in F2, deve avvenire l’unione di un gamete S di un genitore con un gamete S dell’altro genitore. La frequenza attesa è 1/2 × 1/2 = 1/4. Analogamente, per produrre piante ss in F2 è necessaria l’unione di un gamete s di un genitore con un gamete s dell’altro genitore. La frequenza di questo incrocio è 1/2 × 1/2 = 1/4. Che cosa ci si aspetta per la progenie Ss? Di nuovo, la frequenza di S in un gamete proveniente da un genitoFigura 11.9 Applicazione del metodo dello schema ramificato per calcolare i rapporti fenotipici nella generazione F2 ottenuta dall’incrocio rappresentato nella Figura 11.8.

La genetica mendeliana

Box 11.2

275

Principi elementari di probabilità

Una probabilità è il rapporto tra il numero di volte nelle quali ci si attende che si verifichi un particolare evento e il numero totale di casi possibili. Per esempio, la probabilità di prendere una carta di cuori da un mazzo di 52 carte, dove ci sono 13 cuori, è P(cuori) = 13/52 = 1/4. Vale a dire che noi ci aspettiamo, in media, di prendere una carta di cuori una volta ogni quattro prove. Le probabilità e le leggi del caso sono implicate nella trasmissione dei geni. Per fare un semplice esempio, consideriamo una coppia e la probabilità che un loro figlio sia maschio o femmina. Assumiamo che nasca esattamente lo stesso numero di maschi e di femmine (il che non è del tutto vero, ma lo supponiamo per facilitare la discussione). La probabilità che il figlio sia maschio è 1/2 o 0,5. Analogamente, la probabilità che sia femmina è 1/2. Adesso possiamo introdurre una regola della probabilità: la regola del prodotto. La regola del prodotto stabilisce che la probabilità che due eventi indipendenti si verifichino contemporaneamente è il prodotto delle singole probabilità. Perciò la probabilità che in famiglie con due figli entrambi

re è 1/2 e la frequenza del gamete s dell’altro genitore è ancora 1/2. D’altra parte, la progenie Ss può essere ottenuta in due modi. Il primo consiste nella fusione di un uovo S con il polline s e il secondo nella fusione di un uovo s con il polline S. Utilizzando la regola del prodotto (Box 11.2), la probabilità del verificarsi di ciascuno di questi eventi è 1/2 × 1/2 = 1/4. Usando la regola della somma (Box 11.2), la probabilità del verificarsi dell’uno o dell’altro evento è la somma delle singole probabilità, ovvero 1/4 + 1/4 = 1/2. Quindi, la previsione è che un quarto della progenie F2 sia SS, metà Ss e un quarto ss, esattamente come ottenuto con il metodo del quadrato di Punnett illustrato in Figura 11.8. Entrambi i metodi – il quadrato di Punnett o lo schema ramificato – possono essere applicati a qualsiasi incrocio, ma quando gli incroci diventano più complicati il metodo del quadrato di Punnett diventa poco pratico.

La conferma del principio della segregazione: l’uso dei reincroci Nel formulare il principio della segregazione, Mendel fece una serie di test genetici per essere sicuro della correttezza dei suoi risultati. Egli continuò ad autofecondare ogni generazione fino alla F6 e trovò che a ogni generazione si ritrovavano caratteri dominanti e recessivi. Concluse quindi che il principio della segregazione era valido indipendentemente dal numero delle generazioni implicate.

siano femmine è 1/4. Vale a dire, la probabilità che il primo figlio sia una femmina è 1/2, la probabilità che il anche il secondo sia una femmina è 1/2, e in base alla regola del prodotto la probabilità che il primo e il secondo figlio siano femmine è 1/2 × 1/2 = 1/4. Analogamente, la probabilità di avere tre maschi di seguito è 1/2 × 1/2 × 1/2 = 1/8. Un’altra regola della probabilità è la regola della somma, che stabilisce che la probabilità che si verifichi o l’uno o l’altro di due eventi mutualmente esclusivi è la somma delle singole probabilità. Per esempio, se si lancia un dado, qual è la probabilità di avere un uno o un sei? Le singole probabilità si calcolano nel modo seguente. La probabilità di avere un uno P(uno) è 1/6, perchè un dado ha sei facce. Per la stessa ragione, la probabilità di avere un sei P(sei) è ancora 1/6. La probabilità di un uno o un sei in un singolo lancio implica due eventi mutualmente esclusivi, cosicché per calcolare la probabilità si applica la regola della somma. La somma delle singole probabilità è 1/6 + 1/6 = 2/6 = 1/3. Rifacendosi all’esempio della famiglia, la probabilità di avere due maschi o due femmine è 1/4 + 1/4 = 1/2.

Un’altra verifica importante riguardava le piante F2. Come mostrato nella Figura 11.9, nell’incrocio liscio × rugoso si osserva un rapporto 1:2:1 per i genotipi SS, Ss e ss. Fenotipicamente il rapporto liscio : rugoso è 3:1. Al momento degli esperimenti di Mendel, la presenza di fattori segreganti responsabili dei fenotipi liscio e rugoso poteva essere solo ipotizzata. Per confermare la sua ipotesi, Mendel lasciò autofecondare le piante F2. Come atteso, le piante prodotte dai semi rugosi erano linee pure, a conferma della sua conclusione che fossero omozigoti per il fattore (gene) s. L’autofecondazione delle piante derivate dai semi lisci F2 produsse due diversi tipi di progenie: un terzo dei semi lisci della F2 produsse progenie tutta a semi lisci, mentre gli altri due terzi diedero semi sia lisci sia rugosi in ogni baccello, nel rapporto di 3 lisci : 1 rugoso, ovvero lo stesso rapporto ottenuto nella progenie F2 (Figura 11.10). Questi risultati sono totalmente a favore del principio della segregazione dei geni. La combinazione casuale dei gameti a formare gli zigoti della F2 produce due genotipi ai quali corrisponde il fenotipo liscio (Figure 11.8 e 11.9); la proporzione relativa dei due genotipi SS e Ss è 1:2. I semi SS danno origine a linee pure, mentre i semi Ss producono piante che si comportano esattamente come le piante F1 autofecondate, in quanto producono una progenie con un rapporto liscio : rugoso di 3:1. Mendel spiegò questi risultati proponendo che ogni pianta contenesse due fattori e ogni gamete uno solo. Propose, inoltre, che la combinazione casuale dei

276

Capitolo 11

Autofecondazione F2 × F2

SS × SS

Ss × Ss

Progenie tutta SS (liscia)

3/ S– (liscia) 4 1/ ss (rugosa) 4

Progenie F3

(entrambi i tipi di progenie)

Figura 11.10 Determinazione dei genotipi della progenie F2 a fenotipo liscio della Figura 11.8, mediante autofecondazione delle piante derivate dai semi lisci.

minante, la pianta deve essere omozigote per l’allele dominante. Al contrario, se le piante F2 sono lisce perché eterozigoti Ss, il risultato del reincrocio con una pianta omozigote recessiva ss darà un rapporto 1:1 tra fenotipi dominanti e recessivi. Come mostra la Figura 11.11b, il genitore 1 liscio Ss produce gameti sia S sia s in uguale proporzione e il genitore omozigote ss produce solo gameti s. Come risultato, metà della progenie del reincrocio è eterozigote Ss e ha fenotipo liscio, data la dominanza dell’allele S, e l’altra metà è omozigote ss e ha fenotipo rugoso. In pratica, quindi, se una pianta con il carattere dominante viene reincrociata e la progenie mostra un rapporto 1:1 tra fenotipi dominanti e recessivi, allora la pianta deve essere eterozigote. D’altra parte, se il risultato del reincrocio è un insieme di fenotipi dominanti e recessivi, il genitore con il fenotipo dominante deve essere eterozigote poiché questo è l’unico modo per generare una progenie con un fenotipo recessivo. In sintesi, i reincroci della progenie F2 degli incroci di Mendel che manifestavano il fenotipo dominante diedero un rapporto 1:2 tra genotipi omozigoti dominanti e genotipi eterozigoti nella progenie F2. Vale a dire, se incrociato con l’omozigote recessivo, un terzo della progenie F2 con fenotipo dominante dava origine solo a proge-

gameti generasse una progenie nelle proporzioni osservate. Mendel ottenne gli stessi risultati in tutte le sette serie di incroci. Le piante SS e Ss hanno un genotipo diverso ma lo stesso fenotipo dominante. L’autofecondazione della progenie F2 si rivelò un modo utile per determinare se una pianta con il fenotipo dominante fosse omozigote o eterozigote. Un metodo più utilizzato per ottenere questa informazione consiste nell’effettuare un reincrocio di prova per determinarne il genotipo (in inglese testcross, in italiano si usa abitualmente il termine abbreviato di reincrocio), vale a dire un incrocio tra un individuo che espriSe il genitore 1 è a) me il fenotipo dominante e un inSemi Fenotipo dividuo omozigote recessivo. lisci Si consideri ancora l’incrocio mostrato nella Figura 11.8. PossiaGenotipo mo prevedere il risultato di un reinSS Risultati: crocio delle piante F2 che manifeGenitore 1 × Genitore 2 stano il fenotipo dominante con seme liscio. Se le piante della F2 sono Genotipo parentale lisce perché omozigoti SS, allora diploide dal reincrocio con una pianta ss si SS ss Meiosi avranno semi tutti lisci. Come dimostra la Figura 11.11a, le piante SS, che rappresentano il genitore 1 Gameti liscio, danno solo gameti S. Il geniaploidi S s tore 2 è omozigote recessivo rugoso, ss, quindi produce solo gameti s. Tutti Tutti Ne consegue che tutti gli zigoti soPossibili no Ss e che tutti i semi risultanti genotipi hanno fenotipo liscio. In pratica, della progenie quindi, se una pianta con il caratteTutti Ss re dominante viene reincrociata e la Fenotipi progenie mostra solo il fenotipo do-

della progenie

Semi lisci

Figura 11.11 Determinazione dei genotipi dei semi lisci della generazione F2 (genitore 1) della Figura 11.8, mediante reincrocio tra le piante derivate da questi semi e una linea rugosa omozigote recessiva (ss) (genitore 2).

Tutti Il genitore 1 era

SS

Se il genitore 1 è

b)

Semi lisci

Ss Genitore 1

×

ss

Ss Meiosi

S

s

1/2

s Tutti

1/2

ss

1/2 Ss

1/2

Semi lisci

Semi rugosi

1/2

Conclusioni

Genitore 2

1/2

Il genitore 1 era

Ss

La genetica mendeliana

nie con il fenotipo dominante e quindi era omozigote per l’allele dominante. Gli altri due terzi della progenie F2 con fenotipo dominante davano progenie in un rapporto 1:1 tra progenie a fenotipo dominante e progenie a fenotipo recessivo ed erano quindi eterozigoti.

Nota chiave Un reincrocio viene condotto tra un individuo di genotipo ignoto, che manifesta generalmente il fenotipo dominante, e un individuo omozigote recessivo noto, allo scopo di determinare il genotipo sconosciuto. I fenotipi della progenie del reincrocio rivelano il genotipo dell’individuo in esame.

Il fenotipo recessivo a livello molecolare Perché il fenotipo “rugoso” è recessivo? Per rispondere a questa domanda dobbiamo pensare ai geni a livello molecolare. L’allele funzionale di un gene che predomina (è presente con frequenza maggiore) nella popolazione di organismi presenti in natura è denominato allele wildtype o selvatico. Gli alleli selvatici generalmente codificano un prodotto implicato in una specifica funzione biologica. Quindi, se una mutazione nel gene determina assenza del prodotto proteico del gene, o un prodotto parzialmente funzionale o non funzionale, allora probabilmente la funzione biologica associata va perduta o significativamente diminuita. Queste mutazioni sono definite mutazioni con perdita di funzione e sono generalmente recessive, perché la funzione della singola copia dell’allele wild-type in un eterozigote è solitamente sufficiente per produrre la quantità di proteina per dare il fenotipo normale. Mutazioni con perdita di funzione possono essere causate da eventi diversi, ma più frequentemente la sequenza delle basi di un gene viene alterata determinando la produzione o di una proteina con una funzione alterata dovuta a una sequenza amminoacidica modificata, o di una proteina troncata con poca o nessuna funzione, o di nessun prodotto proteico. La mutazione che determina l’assenza della proteina o una proteina senza funzione è detta mutazione nulla. I piselli rugosi di Mendel sono la conseguenza di una mutazione con perdita di funzione. Nei piselli SS (lisci o wild-type) è prodotta una quantità sufficiente di proteina funzionale che determina granuli di amido grandi, mentre nei piselli ss (rugosi) i granuli di amido sono piccoli e profondamente fessurati. I semi SS e Ss contengono quantità più elevate di amido e livelli più bassi di saccarosio rispetto ai semi ss. La differenza in saccarosio determina un contenuto di acqua più elevato e una dimensione maggiore dei semi ss durante lo sviluppo. Quando i semi maturano, i semi ss subiscono una maggiore riduzione del loro volume, acquisendo il fenotipo rugoso. A

277

livello molecolare, il gene della forma del seme codifica negli embrioni durante lo sviluppo una forma dell’enzima SBEI (Starch-Branching Enzyme), implicato nella ramificazione dell’amido. SBEI è importante nel determinare il contenuto in amido degli embrioni, cosicché nelle piante ss il contenuto in amido è ridotto. D’altra parte, i piselli rugosi degli esperimenti di Mendel non presentavano nel gene della forma del seme un semplice cambiamento di una base, che inattivava SBEI. Piuttosto, l’analisi molecolare delle linee di piante ss derivate direttamente da quelle usate da Mendel nei suoi esperimenti ha dimostrato che l’allele s ha un tratto extra di DNA di 800 bp inserito all’interno del gene S, responsabile dell’interruzione del gene e della sua funzione. Questa sequenza di DNA inserita è un elemento trasponibile (vedi Capitolo 7), un segmento di DNA che può spostarsi (“trasporre”) in diverse posizioni nel genoma.

Incroci di diibridi e il principio mendeliano dell’assortimento indipendente Il principio dell’assortimento indipendente Mendel effettuò anche una serie di incroci nei quali erano implicate contemporaneamente due coppie di caratteri alternativi. In tutti i casi egli ottenne sempre gli stessi risultati. In base a questi nimazione esperimenti, egli propose la sua seconda legge, il prinIl principio cipio dell’assortimento inmendeliano dipendente, che stabilisce dell’assortimento che i fattori che controllano indipendente diverse coppie di caratteri si distribuiscono in modo indipendente gli uni dagli altri. In termini moderni, questo significa che coppie di alleli di geni situati su cromosomi diversi segregano indipendentemente durante la formazione dei gameti. Consideriamo un esempio che riguarda la coppia di caratteri per la forma del seme, liscio (S) e rugoso (s), e la coppia di caratteri per il colore del seme, giallo (Y) e verde (y) (giallo è dominante su verde). Quando Mendel incrociò piante appartenenti a linee pure liscio-giallo (SS YY) con linee rugoso-verde (ss yy), ottenne i risultati mostrati in Figura 11.12. Tutti i semi F1 di quest’incrocio erano lisci e gialli, come previsto in base ai risultati dell’incrocio dei monoibridi. Come mostra la Figura 11.12a, il genitore liscio giallo produce solo gameti S Y, che, dopo fusione con i gameti s y del genitore rugoso verde, daranno zigoti Ss Yy. Data la dominanza dei caratteri liscio e giallo, tutti i semi F1 sono lisci e gialli. La generazione F1 è eterozigote per due coppie di alleli in due loci diversi. Tali individui sono chiamati diibridi e un incrocio tra due di questi diibridi uguali è definito incrocio di diibridi.

MyLab

278

Capitolo 11

Quando Mendel autofecondò le piante diibride F1 per produrre la generazione F2 (Figura 11.12b), vi erano due possibili risultati. Uno era che gli alleli che determinavano la forma e il colore del seme nei genitori venissero trasmessi insieme alla progenie. In questo caso ci si sarebbe aspettato un rapporto fenotipico 3:1 tra lisci-gialli e rugosi-verdi. L’altra possibilità era che gli alleli che determinavano la forma e il colore del seme venissero ereditati indipendentemente l’uno dall’altro. In tal caso, la F1 diibrida avrebbe prodotto quattro tipi di gameti: S Y, S y, s Y e s y. Data l’indipendenza delle due coppie di alleli, è atteso che ogni tipo gametico abbia la stessa frequenza. Negli incroci F1 × F1, è atteso che i quattro tipi di gameti si uniscano a caso in tutte le possibili combinazioni, dando origine agli zigoti e quindi ai semi. Tutte le possibili combinazioni gametiche sono rappresentate nel quadrato di Punnett nella Figura 11.12b. In un incrocio di diibridi sono possibili 16 combinazioni gametiche. Come risultato ci sono nove diversi genotipi, ma, a causa della dominanza, sono previsti solo quattro fenotipi: 1 SS YY, 2 Ss YY, 2 SS Yy, 4 Ss Yy 1 SS yy, 2 Ss yy 1 ss YY, 2 ss Yy 1 ss yy

= = = =

9 lisci, gialli 3 lisci, verdi 3 rugosi, gialli 1 rugosi, verdi

In base alle leggi della probabilità, se gli alleli per le due coppie di caratteri vengono ereditati in modo indipendente in un incrocio di diibridi, allora la F2 ottenuta da un incrocio F1 × F1 mostrerà un rapporto 9:3:3:1 tra le 4 possibili classi fenotipiche. Tale rapporto è il risultato dell’assortimento indipendente delle due coppie di alleli per i due geni nei gameti e della fusione casuale di questi gameti. Il rapporto 9:3:3:1 può essere considerato come la moltiplicazione di due rapporti 3:1 – essendo la moltiplicazione implicata dalla regola del prodotto per eventi indipendenti. (3:1) × (3:1) significa moltiplicare i due fattori di una parentesi per gli altri due fattori dell’altra parentesi: 3 × 3, 3 × 1, 1 × 3 e 1 × 1. Il risultato è 9:3:3:1. Inoltre, assortimento indipendente nel nostro esperimento significa che, sebbene entrambe le coppie di caratteri coinvolgano i semi, forma e colore del seme sono indipendenti l’una dall’altro sia in termini di geni coinvolti sia per come essi funzionano nella generazione dei fenotipi. Questa previsione è stata rispettata in tutti gli incroci di diibridi eseguiti da Mendel. In ogni caso, il rapporto in F2 si avvicinava al 9:3:3:1. Nell’esempio citato egli contò 315 semi lisci gialli, 108 lisci verdi, 101 rugosi gialli e 32 rugosi verdi – un rapporto molto vicino a quello previsto. Per Mendel questo risultato indicava che i fattori (geni) che determinano le due coppie di caratteri che stava analizzando venivano trasmessi in modo indipendente. Quindi, in effetti, Mendel rifiutò la possibilità che i fattori per le due coppie di caratteri venissero ereditati insieme.

a) Produzione della generazione F1 Generazione P

Genitore 1

Genitore 2

Fenotipo parentale

Semi lisci, gialli

Semi rugosi, verdi

Genotipo parentale diploide

SS Gameti aploidi

YY

ss

×

Y

S

yy

s

y

Gameti del genitore 2 Generazione F1

Gameti del genitore 1

s

S

y

Y Ss Yy

Genotipi F1: tutti Ss Yy Fenotipi F1: semi tutti lisci, gialli

Figura 11.12 Il principio dell’assortimento indipendente in un incrocio di diibridi. Questo incrocio, realmente effettuato da Mendel, coinvolge due coppie di caratteri dei piselli, liscio/rugoso e giallo/verde. (Si noti che, in confronto alle figure precedenti di questo tipo, alla F1 è mostrato un solo caso di progenie invece di quattro. Questo perché il genitore 2 produce una sola classe di gameti e così il genitore 1. In precedenza avevamo mostrato due gameti per ciascun genitore, anche se questi gameti erano identici.)

Nota chiave La seconda legge di Mendel, il principio dell’assortimento indipendente, afferma che coppie di alleli per geni su cromosomi diversi segregano in modo indipendente nella formazione dei gameti.

Lo schema ramificato degli incroci di diibridi Come per l’incrocio tra monoibridi, uno schema ramificato può essere usato anche per l’incrocio tra diibridi per calcolare i rapporti fenotipici o genotipici attesi. Con questo approccio noi applichiamo le leggi della probabilità alle coppie di alleli una alla volta. Con la pratica si dovrebbe acquisire la capacità di calcolare le probabilità dei risultati di diversi incroci semplicemente applicando le leggi della probabilità, senza il bisogno di rappresentare lo schema ramificato. Un’attenta analisi degli esercizi aiuta ad affinare questa capacità.

279

La genetica mendeliana b) Incrocio F1 × F1 che produce la generazione F2 Generazione F1 Semi gialli, lisci

Semi gialli, lisci

Fenotipi F1

Genotipi F1 diploidi

Ss Yy Gameti F1 aploidi

S

Y

S

y

s

Ss Yy

Y

s

y

S

Y

S

y

s

Y

s

y

Gameti F1

Generazione F2

1/4

1/4

S

Y

1/4

S

y

1/4

s

Y

s

y

1/ 4

S

Y SS YY

SS Yy

Ss YY

Ss Yy

SS Yy

SS yy

Ss Yy

Ss yy

Ss YY

Ss Yy

ss YY

ss Yy

Ss Yy

Ss yy

ss Yy

ss yy

1/4

S

y

Gameti F1 1/ 4

s

Y

1/4

s

y

Genotipi F2: 1/16

Fenotipi F2:

(SSYY) + 2/16 (Ss YY) + 2/16 (Ss Yy) + 4/16 (Ss Yy) = 9/16 semi lisci, gialli 1/16

(SS yy) + 2/16 (Ss yy) = 3/16 semi lisci, verdi

1/16

(ss YY) + 2/16 (ss Yy) = 3/16 semi rugosi, gialli

Figura 11.12 (segue)

1/16

(ss yy) = 1/16 semi rugosi, verdi

Usando lo stesso esempio, nel quale le due coppie di alleli si distribuiscono indipendentemente nei gameti, considereremo una coppia di alleli per volta. Abbiamo visto in precedenza che un’autofecondazione di una F1 eterozigote Ss dava una progenie costituita da tre quarti di semi lisci e da un quarto di rugosi. Genotipicamente, la prima classe aveva almeno un allele dominante S, essendo SS o Ss. Un modo appropriato per rappresentare questa situazione è usare un trattino, per indicare un allele che non ha effetto sul fenotipo. Perciò S– indica che i semi sono fenotipicamente lisci e genotipicamente SS o Ss. Ora consideriamo la F2 prodotta dall’autofecondazione degli eterozigoti Yy: si osserva un rapporto 3:1, con 3/4 di semi gialli e 1/4 di verdi. Poiché questa segre-

gazione si verifica in modo indipendente dalla segregazione della coppia liscio/rugoso, possiamo considerare tutte le possibili combinazioni delle classi fenotipiche dell’incrocio diibrido. Per esempio, la proporzione attesa di semi F2 lisci e gialli è il prodotto della probabilità che un seme F2 sia liscio e di quella che sia giallo, 3/4 × 3/4 = 9/16. Analogamente, la proporzione attesa della progenie F2 costituita da semi rugosi e gialli è 3/4 × 1/4 = 3/16. Estendendo il calcolo a tutti i possibili fenotipi, come mostrato in Figura 11.13, otteniamo il rapporto di 9 S– Y– (lisci, gialli) : 3 S– yy (lisci, verdi) : 3 ss Y– (rugosi, gialli) : 1 ss yy (rugosi, verdi). Il reincrocio può essere usato per controllare i genotipi delle progenie F1 e F2, ottenute da un incrocio per

280

Capitolo 11

F1 × F1

Ss Yy (liscio, giallo)

Fenotipo F2 per Ss × Ss

Fenotipo F2 per Yy × Yy 3/

Ss Yy (liscio, giallo)

×

Proporzioni fenotipiche F2

=

9/ S– Y– 16 giallo, liscio

4 yy (verde)

=

3/ S– yy 16 verde, liscio

3/ Y– 4 (giallo)

=

3/ ss Y– 16 giallo, rugoso

1/ yy 4 (verde)

=

1/ ss yy 16 verde, rugoso

4 Y– (giallo)

piche. I genotipi possono essere verificati mediante un reincrocio, come è stato dimostrato. La Tabella 11.2 elenca i rapporti fenotipici attesi nella progenie di questi reincroci. Non si osservano due risultati uguali, il che dimostra che il reincrocio è veramente un approccio diagnostico per la conferma del genotipo.

3/ 4

S– (liscio)

1/

1/ 4

ss (rugoso)

Attività Andate nel sito dello studente dedicato all’iAttività Tribble Traits (Caratteri dei triboli) e scoprite come, da allevatore di triboli, potete scegliere la combinazione di caratteri giusta per produrre la creatura più affettuosa.

Figura 11.13 Usando l’approccio dello schema ramificato si possono calcolare le proporzioni fenotipiche in F2 dell’incrocio nella Figura 11.12.

due geni. Nel nostro esempio, la F1 è un doppio eterozigote, Ss Yy, che produce quattro tipi di gameti in uguali proporzioni: S Y, S y, s Y e s y (Figura 11.12b). In un reincrocio con una pianta doppio omozigote recessiva – in questo caso ss yy – il rapporto fenotipico della progenie riflette direttamente il rapporto dei tipi di gameti prodotti dal genitore F1. Quindi, nella progenie di un reincrocio come questo si osserverà un rapporto genotipico 1:1:1:1 (Ss Yy : Ss yy : ss Yy : ss yy), corrispondente a un rapporto fenotipico 1 liscio, giallo : 1 liscio, verde : 1 rugoso, giallo : 1 rugoso, verde. Questo rapporto fenotipico 1:1:1:1 è diagnostico di un reincrocio nel quale il genitore “ignoto” sia un doppio eterozigote. Nella F2 di un incrocio di diibridi si osservano nove diverse classi genotipiche, ma solo quattro classi fenotiTabella 11.2 Frequenze delle classi fenotipiche attese dai reincroci di linee con diversi genotipi relativi a due coppie alleliche Frequenza delle classi fenotipiche Reincroci

A– B–

A– bb

aa B–

aa bb

AA BB × aa bb

1

Aa BB × aa bb

1/

0

0

0

2

0

1/ 2

0

AA Bb × aa bb

1/

2

1/ 2

0

0

Aa Bb × aa bb

1/

4

1/ 4

1/

1/ 4

0

1

0

0

Aa bb × aa bb

0

1/ 2

0

1/ 2

aa BB × aa bb

0

0

1

0

aa Bb × aa bb

0

0

1/

1/ 2

aa bb × aa bb

0

0

0

AA bb × aa bb

4

2

1

Incroci di triibridi Attraverso altri incroci, Mendel confermò le sue leggi anche per la segregazione di tre coppie di caratteri. Tali incroci vengono definiti incroci di triibridi. In questo caso le frequenze genotipiche e fenotipiche nella F2 vengono previste esattamente con la stessa logica usata prima, analizzando ogni carattere in modo indipendente. La Figura 11.14 mostra uno schema ramificato per derivare le classi fenotipiche nella F2 di un incrocio di triibridi. Le coppie di caratteri che si distribuiscono indipendentemente nell’incrocio sono semi lisci/rugosi, semi gialli/verdi e fiori porpora/bianchi. Esistono 64 combinazioni degli otto gameti materni con gli otto gameti paterni. Da queste combinazioni originano 27 genotipi diversi e 8 fenotipi diversi in F2. Il rapporto fenotipico alla F2 è 27:9:9:9:3:3:3:1. Avendo ormai considerato esempi a sufficienza, possiamo ora trarre alcune considerazioni generali sulle classi fenotipiche e genotipiche. In ciascun esempio discusso, la F1 è eterozigote relativamente a ogni gene considerato nell’incrocio e la F2 viene prodotta mediante autofecondazione (quando è possibile) o lasciando incrociare tra loro gli individui F1. Per i monoibridi si osservano due classi fenotipiche in F2; quattro per i diibridi e otto per i triibridi. La regola generale è che vi sono 2n classi fenotipiche in F2, dove n è il numero di coppie alleliche in eterozigosi che si distribuiscono in modo indipendente (Tabella 11.3). (Questa regola è valida solo quando si verifica una relazione di dominanza-recessività per ciascuna delle coppie alleliche.) Inoltre, abbiamo visto che si osservano 3 classi genotipiche in F2 per i monoibridi, 9 per i diibridi e 27 per i triibridi. Una regola semplice è che il numero delle classi genotipiche è 3n, dove n è il numero di coppie di alleli in eterozigosi che si distribuiscono in modo indipendente (Tabella 11.3). Per inciso, la regola fenotipica (2n) può essere anche usata per calcolare il numero di classi che si otterranno dal reincrocio di un eterozigote multiplo in F1. In questo caso, il numero dei genotipi alla generazione successiva

MyLab

La genetica mendeliana

sarà lo stesso del numero dei fenotipi. Per esempio, dall’incrocio Aa Bb × aa bb nella progenie esistono quattro genotipi (2n, dove n è 2) – Aa Bb, Aa bb, aa Bb e aa bb – e quattro fenotipi:

P

SS YY CC liscio, giallo, porpora

F1

1. 2. 3. 4.

entrambi i fenotipi dominanti, A e B; fenotipo dominante A e fenotipo recessivo b; fenotipo recessivo a e fenotipo dominante B; entrambi i fenotipi recessivi, a e b.

La “riscoperta” delle leggi di Mendel

F1 × F1

Fenotipo F atteso

ss yy cc rugoso, verde, bianco

Ss Yy Cc liscio, giallo, porpora

Ss Yy Cc liscio, giallo, porpora Fenotipo F atteso

×

281

×

Ss Yy Cc liscio, giallo, porpora

Fenotipo F atteso

Proporzioni fenotipiche F

2 2 2 2 Mendel pubblicò il suo trattato sull’ereditarietà per Ss × Ss per Yy × Yy per Cc × Cc attese nel 1866 su Verhandlungen des Naturforschen3/ C– 27/ S– Y– C– 4 64 den Vereines a Brünn, ma a qual tempo ottenne (porpora) liscio, giallo, 3/ Y– porpora 4 poca attenzione da parte della comunità scienti(giallo) 9/ S– Y– cc 64 fica. Nel 1985, Iris e Laurence Sandler propose1/ cc liscio, giallo, 4 ro una possibile spiegazione. Essi notarono co(bianco) bianco 3/ S– 4 me sarebbe stato impossibile alla comunità (liscio) 3/ C– 9/ S– yy C– 4 64 scientifica tra il 1865 e il 1900 capire il signifiliscio, verde, 1/ yy porpora cato del lavoro di Mendel, perché questo non si 4 (verde) 3/ S– yy cc 64 adattava alla concezione dell’epoca sulla relaliscio, verde, 1/ cc zione tra l’ereditarietà e le altre scienze. Per i bianco 4 contemporanei di Mendel, l’ereditarietà com3/ C– 9/ ss Y– C– 4 64 prendeva non solo quei concetti che oggi rienrugoso, giallo, porpora trano nella genetica, ma anche quelli relativi al3/ Y– 4 3/ ss Y– cc 64 lo sviluppo. In altre parole, il loro concetto di rugoso, giallo, 1/ cc ereditarietà implicava gli attuali ambiti della gebianco 4 1/ ss 4 netica e dell’embriologia. Più precisamente, es(rugoso) 3/ C– 3/ ss yy C– 4 64 si consideravano l’ereditarietà semplicemente rugoso, verde, come un particolare momento dello sviluppo e porpora 1/ yy 4 1/ ss yy cc non come un processo distinto, che richiede 64 rugoso, verde, un’analisi speciale. A partire dal 1900, tali con1/ cc bianco 4 cezioni mutarono abbastanza da rendere più Figura 11.14 chiaro il significato del lavoro di Mendel. Determinazione mediante lo schema ramificato delle freNel 1900 tre botanici – Carl Correns, Hugo de Vries quenze relative delle otto classi fenotipiche alla F2 e Erich von Tschermak – giunsero indipendentemente di un incrocio di triibridi. alle stesse conclusioni di Mendel. Ciascuno lavorava con ibridi vegetali diversi. Correns con il mais (granoturco) e Tabella 11.3 Numero delle classi fenotipiche e i piselli, de Vries con diverse specie vegetali e von genotipiche attese da autofecondazioni Tschermak con piante di piselli. Dagli esperimenti, ciadi eterozigoti nei quali tutti i geni mostrino dominanza completa scun botanico dedusse le leggi di base dell’ereditarietà dei caratteri genetici, pensando di essere il primo a farlo. Numero di coppie Numero Numero Invece, nel preparare le conclusioni per la pubblicazione, alleliche di classi di classi segreganti fenotipiche genotipiche scoprirono che le stesse leggi erano già state pubblicate da Mendel parecchie decadi prima. Tuttavia, il loro lavo2 3 1a ro fu importante perché la loro riscoperta dei principi di 2 4 9 Mendel rese il mondo scientifico, allora più maturo, con3 8 27 sapevole delle leggi dell’ereditarietà. Essi misero in movimento la ricerca sulla struttura e funzione del gene, co4 16 81 sì produttiva nel XX secolo. n 2n 3n L’idea che il mendelismo potesse essere applicato a Per esempio, da Aa × Aa sono attese due classi fenotipiche, con agli animali emerse nel 1902 dal lavoro di William Bateson, che svolgeva esperimenti sui polli. Bateson corrispondenti classi genotipiche AA, Aa e aa.

282

Capitolo 11

inoltre coniò i termini carattere, genetica, zigote, F1, F2 e allelomorfo (letteralmente “forma alternativa”, per indicare una delle possibili forme diverse di un gene), che altri ricercatori abbreviarono in allele. Il termine gene, in sostituzione del termine mendeliano fattore, venne introdotto da W.L. Johannsen nel 1909. Gene deriva dalla parola greca genos, che significa “nascita”.

Analisi statistica dei dati genetici: il test del chi-quadrato I dati ottenuti dagli incroci genetici sono quantitativi. Un genetista generalmente applica un’analisi statistica per interpretare un insieme di dati ottenuti dagli incroci, allo scopo di comprendere il significato di ogni scostamento dei risultati ottenuti rispetto ai risultati attesi, sulla base dell’ipotesi che si sta saggiando. (Come per tutte le analisi statistiche, è importante avere una grande quantità di dati per poter aumentare la certezza dei risultati.) I rapporti fenotipici osservati nella progenie raramente coincidono esattamente con i rapporti attesi, a causa di fattori casuali insiti nei fenomeni biologici. Viene quindi sviluppata un’ipotesi sulla base dei dati osservati e considerata come ipotesi nulla, in quanto stabilisce che non vi è una reale differenza tra i dati osservati e i dati attesi. Viene applicata un’appropriata analisi statistica per determinare se la differenza sia dovuta al caso. Se così non è, l’ipotesi nulla viene rifiutata e si formula una nuova ipotesi che spieghi i dati. Un’analisi statistica semplice utilizzata per saggiare l’ipotesi nulla è chiamata test del chi-quadrato (χ2), che è essenzialmente un test di bontà dell’adattamento (goodness-of-fit). Negli incroci esaminati finora, la progenie sembrava adattarsi a rapporti definiti (quali 1:1, 3:1 e 9:3:3:1); questo è il caso in cui si può formulare un’ipotesi nulla e il test del chi-quadrato può dirci se i dati si adattano a tale ipotesi. Per illustrare l’uso del test del chi-quadrato, analizzeremo i dati teorici relativi alla progenie di un reincrocio di un doppio eterozigote a seme liscio-giallo (Ss Yy) con un omozigote rugoso-verde (ss yy); vedi Tabella 11.2. (Ulteriori applicazioni del test del chi-quadrato verranno definite nel Capitolo 14.) I dati della progenie sono i seguenti: 154 lisci, gialli 124 lisci, verdi 144 rugosi, gialli 146 rugosi, verdi ______________ Totale 568 L’ipotesi è che un reincrocio debba dare un rapporto tra le quattro classi fenotipiche di 1:1:1:1, se i due geni si distribuiscono in modo indipendente. Il test del chi-quadrato è quindi usato per saggiare l’ipotesi, come mostrato nella Tabella 11.4.

In primo luogo, in colonna 1 sono elencate le quattro classi fenotipiche attese nella progenie di questo incrocio. Quindi sono elencati i numeri osservati (o) per ciascun fenotipo, utilizzando i numeri reali, non le percentuali o le proporzioni (colonna 2). Successivamente, si calcolano il numero di individui attesi (a) per ogni classe fenotipica, considerando il numero totale della progenie (568) e l’ipotesi in esame (in questo caso un rapporto 1:1:1:1). In colonna 3 scriveremo perciò 1/4 × 568 = 142. Ora si sottrae il numero atteso (a) dal numero osservato (o) per ciascuna classe, per trovare la differenza, chiamata valore di deviazione (d). Nella colonna 5 viene indicata la deviazione al quadrato (d2), ottenuta moltiplicando ciascun valore di deviazione indicato in colonna 4 per se stesso. In colonna 6 la deviazione al quadrato viene divisa per il numero atteso (a). Il valore del chi-quadrato χ2 (punto 7 nella tabella) è il totale di tutti i valori di colonna 6. Quanto più i dati osservati si discostano dai dati attesi sulla base dell’ipotesi in esame, tanto più alto sarà il chi-quadrato. Nel nostro esempio χ2 è 3,43. La formula generale è d2 χ2 = ∑ –––, dove ∑ significa “somma” e d2 = (o – a)2 a L’ultimo valore nella tabella, il punto 8, rappresenta i gradi di libertà per questo gruppo di dati. I gradi di libertà in un test che consideri n classi sono normalmente uguali a n – 1. Nel nostro caso abbiamo quattro classi fenotipiche, quindi gradi di libertà = 3. Il valore del chi-quadrato e i gradi di libertà vengono poi utilizzati per determinare la probabilità (P) che la deviazione dei valori osservati da quelli attesi sia dovuta al caso. Per esempio, nel lancio della moneta, la deviazione dal rapporto testa/croce 1:1 può essere dovuta al caso. Ma se una moneta venisse appesantita da un lato, la deviazione del rapporto testa/croce 1:1 non sarebbe il risultato del caso ma sarebbe dovuta all’asimmetria della distribuzione del peso della moneta. Il valore di P per un insieme di dati viene ricavato dalle tavole dei valori di chi-quadrato in base ai diversi gradi di libertà. La Tabella 11.5 riporta parTabella 11.4 Esempio di test del chi-quadrato (1)

(2)

Fenotipo

(3)

(4)

Numero Numero d osservato atteso (= o – a) (o) (a)

(5)

(6)

d2

d2/a

Liscio, giallo

154

142

+12

144

1,01

Liscio, verde

124

142

–18

324

2,28

Rugoso, giallo

144

142

+2

4

0,03

Rugoso, verde

146

142

+4

16

0,11

568

568

0

Totale (7)

χ2

= 3,43 (8) Gradi di libertà = 3

3,43

283

La genetica mendeliana

te di una tavola delle probabilità del chi-quadrato. Nel nostro esempio (χ2 = 3,43 con 3 gradi di libertà) il valore di P è compreso tra 0,30 e 0,50. Questo dato significa che, per l’ipotesi che si sta saggiando, in 30-50 su 100 ripetizioni (vale a dire, nel 30-50% dei casi) dovremmo attenderci dei valori di chi-quadrato di questa grandezza o maggiori dovuti al caso. Possiamo ragionevolmente considerare questa deviazione semplicemente dovuta al caso. D’altra parte, dobbiamo usare con cautela questo risultato, perché esso non ci dice che l’ipotesi è corretta; ci indica solamente che i dati sperimentali non forniscono un argomento valido da un punto di vista statistico contro l’ipotesi. Come regola generale, se la probabilità di ottenere i valori di chi-quadrato osservati è maggiore di 5 su 100 (5% dei casi: P > 0,05), allora la deviazione tra l’atteso e l’osservato è considerata non significativa dal punto di vista statistico e i dati non indicano che l’ipotesi debba essere rifiutata. Supponiamo ora di aver ottenuto, in un’altra analisi di chi-quadrato su dati diversi, un valore di χ2 = 15,85 con 3 gradi di libertà. Cercando il valore nella Tabella

11.5, vediamo che il valore di P è minore di 0,01 e maggiore di 0,001 (0,001 < P < 0,01): ciò significa che da 0,1 a 1 volte su 100 (0,1-1% dei casi) dovremmo aspettarci valori di chi-quadrato di questa grandezza o ancora maggiori solo per caso, se è vera l’ipotesi. Questo valore di P, essendo inferiore a 0,05, indica che i risultati non sono in accordo dal punto di vista statistico con l’ipotesi 1:1:1:1 che si vuole saggiare.

La genetica mendeliana nell’uomo Dopo la riscoperta delle leggi di Mendel, i genetisti dimostrarono che l’ereditarietà dei geni segue gli stessi principi in tutti gli eucarioti a riproduzione sessuata, uomo compreso. W. Farabee, nel 1905, per primo documentò un carattere mendeliano nell’uomo, la brachidattilia (OMIM 112500; http://www.ncbi.nlm.nih.gov/omim), che determina dita anormali grosse e corte (Figura 11.15). Analizzando il carattere nelle famiglie, Farabee vide che la brachidattilia era ereditata come un semplice carattere dominante. In questo paragrafo vengono esaminati alcuni

Tabella 11.5 Probabilità del chi-quadrato Probabilità Gradi di libertà

0,95

0,90

0,70

0,50

0,30

0,20

0,10

0,05

0,01

1

0,004

0,016

0,15

0,46

1,07

1,64

2,71

3,84

6,64

10,83

2

0,10

0,21

0,71

1,39

2,41

3,22

4,61

5,99

9,21

13,82

3

0,35

0,58

1,42

2,37

3,67

4,64

6,25

7,82

11,35

16,27

4

0,71

1,06

2,20

3,36

4,88

5,99

7,78

9,49

13,28

18,47

5

1,15

1,61

3,00

4,35

6,06

7,29

9,24

11,07

15,09

20,52

6

1,64

2,20

3,83

5,35

7,23

8,56

10,65

12,59

16,81

22,46

7

2,17

2,83

4,67

6,35

8,38

9,80

12,02

14,07

18,48

24,32

8

2,73

3,49

5,53

7,34

9,52

11,03

13,36

15,51

20,09

26,13

9

3,33

4,17

6,39

8,34

10,66

12,24

14,68

16,92

21,67

27,88

10

3,94

4,87

7,27

9,34

11,78

13,44

15,99

18,31

23,21

29,59

11

4,58

5,58

8,15

10,34

12,90

14,63

17,28

19,68

24,73

31,26

12

5,23

6,30

9,03

11,34

14,01

15,81

18,55

21,03

26,22

32,91

13

5,89

7,04

9,93

12,34

15,12

16,99

19,81

22,36

27,69

34,53

14

6,57

7,79

10,82

13,34

16,22

18,15

21,06

23,69

29,14

36,12

15

7,26

8,55

11,72

14,34

17,32

19,31

22,31

25,00

30,58

37,70

20

10,85

12,44

16,27

19,34

22,78

25,04

28,41

31,41

37,57

45,32

25

14,61

16,47

20,87

24,34

28,17

30,68

34,38

37,65

44,31

52,62

30

18,49

20,60

25,51

29,34

33,53

36,25

40,26

43,77

50,89

59,70

50

34,76

37,69

44,31

49,34

54,72

58,16

63,17

67,51

76,15

86,66

E-D Accettare - Rifiutare al livello di 0,05

0,001

284

Capitolo 11

Figura 11.15 Mani di un individuo con brachidattilia.

dei metodi utilizzati per determinare i meccanismi della trasmissione ereditaria e avere informazioni su alcuni caratteri ereditari dell’uomo. Il Focus sul genoma di questo capitolo fornisce alcune prospettive genomiche sui caratteri genetici umani nei gemelli.

L’analisi degli alberi genealogici Lo studio della genetica umana è complicato dal fatto che non sono possibili per ragioni etiche incroci proMaschio Femmina Incrocio Genitori e 1 bambino e 1 bambina (in ordine di nascita)

Gemelli dizigoti (due cellule uovo) Gemelli monozigoti (una cellula uovo) Sesso non determinato 3

2

Numero di figli del sesso indicato

grammati. Le modalità di ereditarietà dei caratteri dell’uomo vengono generalmente determinate esaminando come il carattere compare negli alberi genealogici di individui che chiaramente manifestano il carattere. Tale studio, chiamato analisi dell’albero genealogico (o del pedigree), consiste nell’accurata raccolta dei dati fenotipici della famiglia attraverso parecchie generazioni. L’individuo “affetto”, a partire dal quale si ricostruisce l’albero, è definito probando (proposito se maschio, proposita se femmina). La Figura 11.16 riassume i simboli di base usati nell’analisi degli alberi genealogici. (I termini autosomico e legato al sesso verranno spiegati nel Capitolo 12 e vengono qui riportati per completezza). La Figura 11.17 presenta un ipotetico pedigree per mostrare come vengono assegnati i simboli all’albero genealogico. Il carattere presentato nella Figura 11.17 è determinato da un allele recessivo a. Le generazioni sono indicate con i numeri romani e gli individui con i numeri arabi, il che facilita i riferimenti a particolari persone dell’albero. Il carattere nell’albero presentato nella Figura 11.17 è determinato da un’omozigosi per l’allele, conseguenza in questo caso di un matrimonio tra cugini primi. Siccome i cugini hanno in comune una rilevante percentuale dei loro geni, nei loro figli un certo numero di alleli si trova in omozigosi. In questo caso, un allele mutato recessivo è diventato omozigote e ha determinato un carattere genetico riconoscibile. In questo pedigree, per dimostrare la deduzione possibile in base a tale analisi, vengono indicati i simboli dei geni. Il carattere compare la prima volta nella IV generazione. Dato che né l’uno né l’altro genitore (i due cugini) manifestano il carattere, ed essendo nati due figli con il carattere (IV-2 e IV-4), l’ipotesi più semplice è che il carattere sia determinato da un allele recessivo. Quindi, IV-2 e IV-4 avrebbero entrambi genotipo aa e i loro genitori (III-5 e III-6) avrebbero genotipo Aa. Tutti gli altri individui che non manifestavano il carattere devono avere almeno un allele A–, cioè devono essere A– (o AA o Aa). Dato che III-5 e III-6 sono entrambi etero-

Individui affetti Eterozigoti per un gene autosomico recessivo Portatrice di un gene recessivo legato al sesso

Generazione: I 1 A–

Morte Aborto o parto di nato morto (sesso non determinato)

II 1 A–

Proposito Metodo per identificare le persone in un albero genealogico; qui il probando è il bambino 2 della generazione II, o II-2 Incrocio tra consanguinei

Figura 11.16 Simboli usati nell’analisi degli alberi genealogici umani.

2 A–

2 Aa

3 A–

4 Aa

5 A–

III 1 A–

2 A–

3 A–

4 A–

7 A–

6 Aa

5 Aa

IV 1 A–

2 aa

3 A–

4 aa

5 A–

Figura 11.17 Albero genealogico umano, che illustra l’uso dei simboli.

La genetica mendeliana

285

Focus sul genoma Qualche volta identico non è così simile I gemelli identici sono il prodotto di uno stesso evento di fecondazione e iniziano la lora vita con esattamente lo stesso DNA. Studiosi di genomica hanno confrontato gli interi genomi di due gemelli identici per determinare quanto cambia il DNA quando la cellula si divide per mitosi. Questi studiosi hanno usato microarray a DNA per testare la variazione del numero di copie (Copy Number Variation, CNV) nel DNA dei leucociti di una coppia di gemelli. Questo test è anche detto test CNV ed è simile al test ROMA che è già stato descritto nel Capitolo 9. Il test CNV è molto sensibile per determinare duplicazioni e delezioni del genoma che coinvolgono frammenti di DNA di circa 1000 coppie di basi o più di lunghezza. Se la duplicazione del DNA avvenisse sempre senza errori, i due gemelli dovrebbero avere esattamente lo stesso DNA e dovrebbero, presumibilmente, avere le stesse malattie genetiche. Con questo test CNV i ricercatori hanno confrontato il DNA di 19 coppie di gemelli identici. Nove coppie sono state selezionate perché uno dei due gemelli differiva dall’altro fenotipicamente. In ogni coppia di gemelli uno dei due aveva un disturbo neurologico e l’altro gemello o non aveva affatto il disturbo o aveva sintomi molto lievi. Le altre 10 coppie erano controlli e non avevano questi fenotipi discordanti. I ricercatori trovarono variazioni del numero di copie tra i gemelli sia nel gruppo sperimentale sia in quello di controllo. Molte regioni erano le stesse in entrambi i gemelli mentre altre avevano subito

zigoti, almeno uno dei genitori di ciascuno doveva avere un allele a. Inoltre, dato che il carattere è comparso dopo che i cugini hanno avuto figli, l’ipotesi più semplice è che l’allele a sia stato presente solo nei familiari stretti di III-5 e di III-6. Quindi, II-2 e II-4 sono probabilmente entrambi Aa e I-1 o I-2 è Aa.

Esempi di caratteri genetici dell’uomo Caratteri recessivi Un gran numero di caratteri dell’uomo è determinato dall’omozigosi di alleli mutati, recessivi rispetto all’allele normale. Tali alleli recessivi determinano fenotipi mutati a causa di una perdita di funzione o di un cambiamento di funzione del prodotto genico, in entrambi i casi conseguenza della mutazione coinvolta. Molte malattie o anomalie gravi derivano dall’omozigosi di alleli mutati recessivi. Nella Figura 11.18a vengono presentati due individui che manifestano il

qualche sorta di duplicazione o delezione, con un gemello che aveva più copie dell’altro. I gemelli che avevano il fenotipo discordante avevano più differenze cromosomiche, ma i ricercatori trovarono piccole duplicazioni e delezioni anche nei gemelli di controllo che non mostravano un diverso fenotipo. Inoltre i ricercatori mostrarono che una variazione del numero di copie era presente anche all’interno dello stesso individuo. Quando analizzarono il DNA di cellule del sangue di un singolo individuo in maniera più dettagliata, infatti, riuscirono a individuare variazioni del numero di copie che erano presenti in alcune cellule ma assenti in altre: alcuni leucociti avevano delezioni o duplicazioni e altri non le mostravano. I ricercatori continuarono queste ricerche anche confrontando il DNA proveniente da diversi organi di una stessa persona. Ancora una volta notarono che la variazione del numero di copie era presente in uno stesso individuo. Le variazioni presenti nel fegato, per esempio, non erano necessariamente le stesse osservate nella pelle. Questa variabilità tra cellule suggeriva che la variazione del numero di copie fosse la causa della differenza fenotipica neurologica tra i gemelli, anche se, per ovvie ragioni, non si poteva analizzare il DNA del cervello. Sembra ragionevole concludere che delezioni e duplicazioni avvengono frequentemente in tutte le cellule quando il DNA si replica. Questo è un esempio di come mutazioni casuali e l’ambiente possano influenzare la determinazione del fenotipo a partire dallo stesso genotipo.

carattere recessivo dell’albinismo (mancanza di pigmentazione; OMIM 203100) e nella Figura 11.18b è rappresentato un albero genealogico relativo a questo carattere. Gli individui albini non producono il pigmento melanina, che protegge la pelle dalla radiazione ultravioletta nociva. Di conseguenza, la loro pelle e gli occhi mostrano una notevole sensibilità alla luce del sole. La frequenza nella popolazione degli alleli mutati recessivi deleteri è generalmente più alta della frequenza degli alleli mutati dominanti deleteri, dato che gli eterozigoti per gli alleli mutati recessivi non presentano uno svantaggio selettivo significativo (vedi Capitolo 21). Tuttavia, individui omozigoti per alleli mutati recessivi svantaggiosi sono generalmente rari. Negli Stati Uniti circa 1 individuo su 17 000 nella popolazione bianca e 1 su 28 000 nella popolazione afroamericana sono albini. Alcune caratteristiche generali dell’ereditarietà recessiva di un carattere relativamente raro sono le seguenti.

286

Capitolo 11

a) Individui albini: i musicisti di blues Johnny (a sinistra) ed Edgar (a destra) Winter

b) Albero genealogico che mostra la trasmissione del carattere autosomico recessivo dell’albinismo Generazione: I 1

2

3

4

II 1

2

3

4

5

6

7

3 8 -10

III 1

2

3

4

5

6

7

Figura 11.18 Albinismo, un carattere recessivo autosomico.

1. La maggior parte degli individui affetti ha due genitori normali, entrambi eterozigoti. Il carattere compare alla F1, dato che è atteso che un quarto della progenie sia omozigote per l’allele recessivo. Se il carattere è raro, è probabile che un individuo che manifesta il carattere si incroci con un individuo omozigote normale. La generazione successiva derivata da tale incrocio sarebbe costituita da eterozigoti che non esprimono il carattere. In altre parole, i caratteri recessivi spesso saltano le generazioni. Nell’albero della Figura 11.18b, per esempio, II-6 e II-7 devono essere entrambi aa e questo significa che entrambi i genitori (I-3 e I-4) devono essere eterozigoti Aa. Anche I-1 è aa e quindi II-4 deve essere Aa. Dato che II-4 e II-5 hanno figli aa, anche II-5 deve essere Aa. 2. Incroci tra due eterozigoti normali dovrebbero dare sia progenie normale sia progenie che manifesta il carattere nel rapporto 3:1. Tuttavia, nell’analisi delle popolazioni umane (famiglie) è difficile avere un campione abbastanza vasto da rendere i dati statisticamente significativi. 3. Genitori entrambi affetti sono omozigoti per il carattere recessivo e tutti i loro figli manifesteranno il carattere. Caratteri dominanti Sono noti nell’uomo molti caratteri dominanti. Gli alleli mutati dominanti possono determinare dei fenotipi mutati a causa di mutazioni con acquisto di funzione che determinano prodotti genici con nuove funzioni. In altre parole, il fenotipo mutato dominante

deriva dall’acquisizione di una nuova o aumentata caratteristica da parte del gene mutato, piuttosto che da una diminuzione della sua attività normale. La Figura 11.19a illustra uno di questi caratteri, l’acondroplasia (OMIM 100800; nanismo derivato da difetti di crescita delle ossa lunghe), la forma più comune di nanismo con arti corti. Gli individui acondroplastici hanno bassa statura, braccia e gambe sproporzionatamente corti; dita delle mani e dei piedi corte; testa grande con fronte prominente; e spesso gambe arcuate e ginocchia vare. La durata della vita normalmente è nella media. Un pedigree di una famiglia con acondroplasia viene mostrato nella Figura 11.19b. L’acondroplasia è determinata dalla eterozigosi per una mutazione dominante nel gene FGFR3 (recettore 3 per il fattore di crescita dei fibroblasti) sul cromosoma 4. L’omozigosi per la mutazione è letale. Il prodotto normale del gene FGFR3 è un recettore di membrana per particolari fattori di crescita che controllano la crescita e lo sviluppo. Quando un fattore di crescita lega il recettore, il recettore è attivato e innesca una cascata di reazioni molecolari nella cellula che determina una risposta cellulare specifica. La proteina FGFR3 è coinvolta nello sviluppo e nel mantenimento delle ossa e del cervello. Si ritiene che la forma normale della proteina regoli la crescita delle ossa con azione negativa, cioè limitante, sull’ossificazione, cioè la formazione dell’osso dalla cartia) Individuo con acondroplasia a) Individual with achondroplasia

b) Albero genealogico per il carattere autosomico dominante dell’acondroplasia Generazione: I

II

III

IV

Figura 11.19 Acondroplasia, un carattere autosomico dominante.

La genetica mendeliana

lagine. Gli effetti della regolazione sono più evidenti sulle ossa lunghe. La funzione della proteina FGFR3 è controllata finemente. La mutazione dominante con l’acquisto di funzione nel gene FGFR3 in persone con acondroplasia determina l’attività continua della proteina FGFR3 con conseguente accorciamento significativo delle ossa lunghe. Non esiste trattamento per l’acondroplasia; ma più del 99% degli individui con questa malattia ha una o due mutazioni in FGFR3 che hanno portato allo sviluppo di un efficace test molecolare genetico per le mutazioni associate alla malattia. Il fenotipo mutante è evidente in eterozigosi con un allele mutante dominante e un allele wild-type. Dato che molti alleli con mutazioni dominanti, che determinano caratteri riconoscibili sono rari o letali, è estremamente insolito trovare individui omozigoti per l’allele dominante. È probabile che in un albero genealogico una persona affetta sia eterozigote e che la maggior parte degli incroci, relativamente all’allele mutato, sia tra un eterozigote e un omozigote recessivo (selvatico). La maggior parte dei geni mutati dominanti clinicamente significativi (vale a dire, che generano problemi medici) rientra in questa categoria. Alcune caratteristiche generali dell’ereditarietà dominante di un carattere raro sono le seguenti (riferirsi alla Figura 11.19b). 1. Ogni persona affetta dell’albero familiare deve avere almeno un genitore affetto (a meno che non vi sia stata una mutazione ex novo).

287

2. Il carattere generalmente non salta le generazioni. 3. Un individuo affetto eterozigote trasmetterà in media il gene mutato a metà della progenie. Se l’allele mutato dominante è indicato con A e il suo allele selvatico con a, la maggior parte degli incroci sarà Aa × aa. In base ai principi mendeliani, metà della progenie sarà aa (selvatica) e l’altra metà Aa (e manifesterà il carattere). Altri esempi di caratteri dell’uomo dominanti sono la sindrome autosomica dominante del rene policistico (ADPKD, OMIM 173900; formazioni di cisti liquide nel rene potenzialmente in grado di causare la morte per un malfunzionamento del rene – l’ADPKD è una delle malattie più comuni tra quelle potenzialmente letali), la brachidattilia (mani malformate con dita corte) e la sindrome di Marfan (OMIM 154700; difetti del tessuto connettivo che possono causare morte in seguito a rottura dell’aorta).

Nota chiave I principi di Mendel sono validi per l’uomo e per tutti gli altri eucarioti. Lo studio dell’ereditarietà dei caratteri genetici dell’uomo è complicato dal fatto che non possono essere effettuati incroci programmati. In alternativa, i genetisti umani analizzano l’ereditarietà dei caratteri genetici mediante lo studio degli alberi genealogici.

Sommario l Il genotipo è la costituzione genetica di un organismo, mentre il fenotipo è la manifestazione visibile di un carattere o di un insieme di caratteri (strutturali e funzionali) di un organismo derivata dall’interazione tra il suo genotipo e l’ambiente. l Il genotipo determina solo la potenzialità per il fenotipo di un individuo; questa potenzialità può essere alterata dall’ambiente. l La prima legge di Mendel, il principio della segregazione, stabilisce che i due membri di una singola coppia di geni (alleli) si separano l’uno dall’altro alla formazione dei gameti. Relativamente a ogni gene con due alleli, metà dei gameti porta un allele e l’altra metà l’altro allele. Per il principio della segregazione, un incrocio di monoibridi tra due genitori appartenenti a linee pure, uno con il fenotipo dominante e l’altro con il recessivo, darà alla F2 un rapporto fenotipico 3:1 tra fenotipi dominante e recessivo.

l Per determinare un genotipo ignoto (solitamente in un individuo che esprime il fenotipo dominante) viene effettuato un incrocio, detto reincrocio di prova, tra quest’individuo e un individuo omozigote recessivo. l La seconda legge di Mendel, il principio dell’assortimento indipendente, stabilisce che coppie di alleli per geni su cromosomi differenti segregano indipendentemente nella formazione dei gameti. Per il principio dell’assortimento indipendente, in un incrocio tra diibridi, nella F2 i rapporti fenotipici sono 9:3.3:1 tra le quattro classi fenotipiche. l I principi di Mendel sono validi per tutti gli eucarioti. Lo studio dell’ereditarietà dei caratteri genetici dell’uomo è più complicato per il fatto che non possono essere effettuati incroci programmati senza implicazioni etiche. In alternativa, i genetisti umani analizzano i caratteri genetici mediante lo studio degli alberi genealogici – vale a dire esaminando la comparsa di un carattere in alberi genealogici nei quali il carattere segrega.

288

Capitolo 11

Approccio analitico alla soluzione di problemi di genetica Il sistema più pratico per rafforzare la conoscenza dei principi della genetica consiste nel risolvere problemi di genetica. In questo, e in tutti i capitoli che seguiranno, discuteremo come affrontare i problemi di genetica, presentandone alcuni esempi e discutendone le risposte. I seguenti problemi propongono esempi più o meno familiari e pongono domande formulate in modo da sviluppare il pensiero analitico. D11.1 Una pianta di pisello a fiori porpora viene incrociata con una pianta a fiori bianchi. Tutte le piante nella F1 hanno fiori porpora. Quando si lasciano autofecondare le piante F1, 401 piante della F2 hanno fiori porpora e 131 fiori bianchi. Quali sono i genotipi delle piante parentali e della generazione F1? R11.1 Il rapporto fenotipico delle piante della F2 è 3,06:1, che è molto vicino al rapporto 3:1 atteso da un incrocio di monoibridi. Più precisamente, questo rapporto è atteso come risultato di un incrocio F1 × F1 nel quale entrambe le piante siano eterozigoti per una stessa specifica coppia di alleli. Inoltre, poiché i due genitori hanno fenotipo diverso e alla F1 è comparsa una sola classe fenotipica, è probabile che entrambe le piante parentali siano linee pure. Ancora, poiché il fenotipo della F1 è identico a uno dei fenotipi parentali, si può dire che il colore porpora dei fiori è dominante sul bianco. Attribuendo il simbolo P all’allele che determina il colore porpora e il simbolo p alla forma alternativa del gene che determina il colore bianco, possiamo scrivere i genotipi: generazione P: generazione F1:

PP, pianta a fiore porpora; pp, pianta a fiore bianco Pp, pianta che, a causa della dominanza, ha fiori porpora

Possiamo dimostrare ulteriormente, effettuando dei reincroci, che le piante F2 presentano approssimativamente un rapporto 1:2:1 tra PP : Pp : pp. D11.2 Si considerino tre coppie alleliche Aa, Bb e Cc, ognuna delle quali determina un carattere diverso. In ciascun caso la lettera maiuscola indica l’allele dominante e la lettera minuscola l’allele recessivo. I tre geni si distribuiscono in modo indipendente. Si calcoli la probabilità di ottenere: a. uno zigote Aa BB Cc da un incrocio di individui Aa Bb Cc × Aa Bb Cc; b. uno zigote Aa BB cc da un incrocio di individui aa BB cc × AA bb CC; c. un fenotipo A B C (vale a dire, che manifesti i tre caratteri dominanti per ognuno dei tre geni) da un incrocio di individui Aa Bb CC × Aa Bb cc; d. un fenotipo a b c (che manifesti i tre caratteri recessivi per ognuno dei tre geni) da un incrocio di individui Aa Bb Cc × aa Bb cc. R11.2 Per applicare i principi mendeliani fondamentali è necessario scomporre la domanda in parti semplici. La chiave è che i geni si distribuiscono in modo indipendente, quindi per ottenere le risposte dobbiamo moltiplicare le probabilità dei singoli eventi. a. Anzitutto dobbiamo considerare la coppia genica Aa. L’in-

crocio è Aa × Aa, quindi la probabilità di uno zigote Aa è 2/4 = 1/2, dato che la distribuzione attesa dei genotipi è 1 AA : 2 Aa : 1 aa. Quindi, adottando la stessa logica, la probabilità di BB da Bb × Bb è 1/4 e quella di Cc da Cc × Cc è 2/4 = 1/4. Usando la regola del prodotto (vedi Box 2.2), la probabilità di uno zigote Aa BB Cc è 1/2 × 1/4 × 1/2 = 1/16. b. Qui è necessaria una logica simile, anche se, dato che differiscono per tutte le coppie di alleli, dobbiamo essere sicuri dei genotipi parentali. Per la coppia Aa la probabilità di avere Aa da AA × aa deve essere 1. Inoltre, la probabilità di avere BB da BB × bb è 0, quindi solo in base a questi dati non possiamo avere lo zigote richiesto dall’incrocio dato. c. Questa domanda e la successiva chiedono la probabilità di ottenere un certo fenotipo, dunque si deve partire pensando alla dominanza. Di nuovo, consideriamo una coppia di caratteri per volta. In base ai principi mendeliani, la probabilità di un fenotipo A da Aa × Aa è 3/4. Analogamente, la probabilità di un fenotipo B da Bb × Bb è 3/4. Infine, la probabilità di un fenotipo C da CC × cc è 1. In totale, la probabilità di un fenotipo A B C è 3/4 × 3/4 × 1 = 9/16. d. La probabilità di un fenotipo a b c da Aa Bb Cc × aa Bb cc è 1/2 × 1/4 × 1/2 = 1/16. D11.3 Nei polli della razza Leghorn il piumaggio bianco è dominante sul colorato, le zampe con piume sono dominanti sulle zampe lisce e la cresta a fagiolo è dominante sulla cresta singola. Ciascuna coppia allelica segrega in modo indipendente. Se un pollo omozigote bianco, con zampe piumate e cresta a fagiolo viene incrociato con un pollo omozigote colorato, con zampe lisce e cresta singola, e gli individui della F1 vengono lasciati incrociare tra loro, quale proporzione di polli della F2 produrrà solo progenie bianca, piumata e con cresta a fagiolo, se incrociata con individui colorati, a zampe lisce e con cresta singola? R11.3 Questo è un tipico esempio di domanda che presenta dati inconsueti nel tentativo di renderli familiari. L’approccio migliore a queste domande consiste nello scomporle nelle loro parti più semplici e, quando possibile, nell’assegnare i simboli dei geni relativi a ciascun carattere. È noto il carattere dominante per ciascuna delle tre coppie di geni, quindi si può usare W per bianco e w per colorato, F per zampe con piume ed f per zampe lisce, P per cresta a fagiolo e p per cresta singola. L’incrocio riguarda ceppi appartenenti a linee pure e può essere scritto come segue: generazione P: generazione F1:

WW FF PP × ww ff pp Ww Ff Pp

Adesso la domanda chiede la proporzione di individui della F2 che darà solo progenie bianca, con zampe piumate e con cresta a fagiolo, se incrociata con individui colorati, con zampe lisce e cresta singola. Questi ultimi sono omozigoti recessivi per tutti i tre geni – vale a dire ww ff pp, come nella generazione parentale. Per il risultato richiesto, i polli F2 devono essere bianchi, con zampe piumate e cresta a fagiolo, e devono essere omozigoti per gli alleli dominanti dei rispettivi geni per avere solo progenie con il fenotipo dominante. Ciò che

La genetica mendeliana stiamo cercando quindi è la proporzione di polli con genotipo WW FF PP in F2. Sappiamo che ogni coppia allelica segrega in modo indipendente; quindi la risposta può essere calcolata applicando semplici regole della probabilità. Consideriamo una coppia di alleli per volta. Nel caso del bianco/colorato F1 × F1 è Ww × Ww, e sappiamo dai principi mendeliani che la proporzione relativa dei genotipi alla F2 sarà 1 WW : 2 Ww : 1 ww. Quindi la proporzione di polli F2 con genotipo WW sarà 1/4. La stessa relazione vale per le altre due coppie di alleli. Dato che la segregazione delle tre coppie di alleli è indipendente, dobbiamo moltiplicare le probabilità di ogni evento per calcolare la probabilità di avere individui WW FF PP. La risposta è 1/4 × 1/4 × 1/4 = 1/64. D11.4 Considerare l’albero genealogico rappresentato sotto, in cui l’allele mutato, responsabile del carattere patologico, è recessivo (a) rispetto all’allele selvatico (A). Generazione: I 1

2

II 2

1

3

4

5

III 1

2

3

IV 1

2

4

5

6

a. b. c. d.

289

Qual è il genotipo dei genitori I-1 e I-2? Quali sono i genotipi degli individui II-3 e II-4? Quali sono i genotipi dei cugini III-2 e III-3? Qual è la probabilità che l’individuo IV-1 abbia ereditato l’allele mutato? E che abbia ereditato entrambi gli alleli selvatici?

R11.4 a. Dal momento che l’allele mutato è recessivo, si manifesta fenotipicamente solo negli omozigoti per quell’allele (aa). Quindi il genotipo del padre I-1 (come quello degli individui II-2 e IV-2) è aa. La madre, avendo generato un figlio (II-2) che manifesta il carattere, deve essere eterozigote Aa (portatrice). b. Gli individui II-3 e II-4 sono entrambi eterozigoti Aa, in quanto hanno sicuramente ereditato un allele mutato dal padre. Non hanno ereditato invece l’allele mutato dalla madre perché non manifestano il carattere. c. Gli individui III-2 e III-3 sono entrambi eterozigoti Aa, in quanto hanno trasmesso entrambi l’allele mutato alla figlia IV-2. d. Il padre III-2 eterozigote trasmetterà l’allele mutato con una probabilità del 50% (1/2 dei suoi gameti porteranno l’allele A e 1/2 l’allele a). Lo stesso vale per la madre III-3. La probabilità che il figlio erediti almeno un allele mutato è quindi del 50%. La probabilità che abbia ereditato entrambi gli alleli selvatici (genotipo AA) è data dal prodotto delle singole probabilità: 1/2 × 1/2 = 1/4 = 25%.

12

Le basi cromosomiche dell’ereditarietà

Com’è organizzato il genoma nei cromosomi degli eucarioti?

Qual è il ruolo della meiosi negli animali e nelle piante?

Come viene analizzato il corredo cromosomico negli eucarioti?

In che modo la segregazione cromosomica spiega la segregazione genica nella meiosi?

Negli eucarioti, come sono trasmessi i cromosomi da una generazione all’altra durante la mitosi?

Perché i cromosomi sessuali influenzano la modalità di segregazione dei geni?

In che modo i cromosomi eucariotici di cellule diploidi vengono trasmessi ai gameti aploidi?

Come correlano i cromosomi sessuali al sesso di un organismo?

Come si generano nuove combinazioni alleliche nella meiosi?

Come vengono analizzati i caratteri legati al sesso nell’uomo?

Attività Nel caso dell’uomo, gli individui di sesso femminile possiedono due cromosomi X nel proprio corredo cromosomico, mentre gli individui di sesso maschile hanno un cromosoma X e uno Y. I geni presenti su questi cromosomi sono determinanti per il sesso dell’individuo e sono responsabili dell’ereditarietà di un certo numero di caratteri. In questo capitolo esaminerete il comportamento dei cromosomi durante la divisione nucleare negli eucarioti, le modalità di determinazione del sesso nell’uomo e in altri organismi e i caratteri dell’uomo associati al sesso. Dopo aver letto e studiato questo capitolo, potete applicare quello che avete imparato esercitandovi nella iAttività, nella quale analizzerete l’ereditarietà della sordità in una famiglia.

Sulla base dei principi di Mendel, i primi genetisti cominciarono a formulare delle ipotesi, saggiate mediante incroci appropriati, e iniziarono a studiare la natura dei fattori mendeliani. Ora è acquisito che i fattori mendeliani sono i geni e che i geni sono localizzati sui cromosomi. In questo capitolo ci concentreremo sul comportamento dei geni e dei cromosomi esaminando inizialmente la trasmissione dei cromosomi da una cellula a un’altra. Considereremo poi la prova dell’associazione tra geni e cromosomi analizzando la segregazione dei geni localizzati sui cromosomi sessuali. Successivamente dis-

cuteremo i diversi meccanismi di determinazione del sesso, e i caratteri legati al sesso nell’uomo. Lo scopo di questo capitolo è imparare a considerare la segregazione dei geni in termini di schemi di ereditarietà dei cromosomi.

I cromosomi e la riproduzione cellulare L’associazione tra i cromosomi e i geni è stata determinata in seguito agli sforzi compiuti dai citologi, che hanno osservato il comportamento dei cromosomi, e dei genetisti, che hanno osservato il comportamento dei geni. In questo paragrafo discuteremo la struttura generale dei cromosomi eucariotici e la trasmissione dei cromosomi da una divisione cellulare all’altra e da una generazione all’altra, rispettivamente attraverso i processi di mitosi e di meiosi.

I cromosomi eucariotici Il genoma degli eucarioti è suddiviso in più cromosomi lineari; il numero dei cromosomi è caratteristico per ciascuna specie. Molti eucarioti hanno due copie di ciascun tipo di cromosoma presente nel nucleo e, per questo motivo, il loro assetto cromosomico è detto diploide, vale a dire 2N. Gli eucarioti diploidi sono prodotti in seguito alla fusione di due gameti aploidi (cellule riproduttive mature che sono specializzate nella fusione sessuale), uno di origine materna e l’altro di origine paterna; questa fu-

292

Capitolo 12 Aploide (N)

Diploide (2N)

Una copia di un genoma ripartito nei cromosomi

Due copie di un genoma ripartito nei cromosomi

Tre cromosomi non omologhi

Tre coppie di cromosomi omologhi

Figura 12.1 Organizzazione cromosomica degli organismi aploidi e diploidi.

sione produce uno zigote diploide, che successivamente va incontro allo sviluppo embrionale. Ciascun gamete possiede soltanto una serie di cromosomi ed è definito aploide (N). Con il termine di genoma si definisce il contenuto completo dell’informazione genetica in un corredo cromosomico aploide. Due esempi di organismi diploidi sono l’uomo, con 46 cromosomi (23 coppie), e Drosophila melanogaster, con 8 cromosomi (4 coppie). Al contrario, i ceppi di laboratorio del lievito S. cerevisiae hanno 16 cromosomi e sono aploidi. Nella Figura 12.1 è raffigurata l’organizzazione cromosomica di ipotetici organismi aploidi e diploidi con un corredo rispettivamente di tre cromosomi non omologhi e di tre coppie di cromosomi omologhi. Negli organismi diploidi, i componenti di ciascuna coppia cromosomica che contengono gli stessi geni e che si appaiano in meiosi sono detti cromosomi omologhi; ciascun componente della coppia rappresenta un omologo, e un omologo è ereditato da ciascun genitore. Pertanto, ciascun cromosoma omologo può contenere alleli diversi per gli stessi geni: se gli alleli in corrispondenza dello stesso locus genico sono gli stessi, la cellula sarà omozigote per quel gene, altrimenti sarà eterozigote. I cromosomi che contengono geni diversi e che non si appaiano alla meiosi sono chiamati cromosomi non omologhi. Negli animali e in alcune piante, le cellule maschili e femminili si distinguono per il loro corredo di cromosoMetacentrico Acrocentrico Submetacentrico Telocentrico

Figura 12.2 Classificazione generale dei cromosomi eucariotici in metacentrici, submetacentrici, acrocentrici e telocentrici, sulla base della posizione del centromero.

mi sessuali – quei cromosomi che sono rappresentati in modo differente nei due sessi in molti organismi eucarioti. Un sesso ha un paio di cromosomi sessuali uguali, l’altro sesso possiede due cromosomi non equivalenti oppure un singolo cromosoma del sesso. Nella specie umana, per esempio, le femmine hanno due cromosomi X (XX), mentre i maschi hanno un cromosoma X e uno Y (XY). I cromosomi non sessuali sono detti autosomi. Discuteremo dei cromosomi X in maggior dettaglio più avanti in questo capitolo. Dall’osservazione al microscopio risulta che i cromosomi differiscono tra specie diverse ed entro la stessa specie per dimensione e morfologia. Ogni cromosoma presenta, lungo la sua lunghezza, una costrizione chiamata centromero, che è importante per il comportamento dei cromosomi durante la divisione cellulare. La collocazione del centromero nel cromosoma è utile per la classificazione dei cromosomi eucariotici (Figura 12.2). Un cromosoma metacentrico ha il centromero localizzato circa al centro e risulta così diviso in due bracci di lunghezza quasi uguale. I cromosomi submetacentrici hanno un braccio più lungo dell’altro, i cromosomi acrocentrici mostrano un braccio con una breve appendice che spesso mostra un “rigonfiamento” (denominato satellite), e i cromosomi telocentrici hanno soltanto un braccio, poiché il centromero è situato a un’estremità. I cromosomi si differenziano anche per la lunghezza relativa. I cromosomi del topo, per esempio, hanno tutti più o meno la stessa lunghezza, mentre la lunghezza di quelli umani varia in modo considerevole. La lunghezza del cromosoma e la posizione del centromero sono costanti per ogni cromosoma e sono di aiuto nell’identificazione dei singoli cromosomi. I cromosomi sono tipicamente visibili durante la metafase, la fase della mitosi nella quale si trovano nel loro stato di maggiore condensazione, che li rende più facilmente osservabili al microscopio dopo colorazione. Un insieme completo di tutti i cromosomi metafasici di una cellula è definito cariotipo (letteralmente “tipo nucleare”). Il cariotipo è specie-specifico cosicché, negli organismi eucarioti, è osservabile un’ampia gamma di numeri, dimensioni e forme di cromosomi. Anche organismi strettamente correlati possono avere cariotipi molto differenti. La Figura 12.3a mostra il cariotipo di una cellula umana maschile normale. Nei cariotipi è convenzione disporre i cromosomi in ordine secondo la dimensione e la posizione del loro centromero. Questo cariotipo mostra 46 cromosomi: 2 coppie per ciascuno dei 22 autosomi e 1 per ciascuno dei cromosomi del sesso X e Y (che sono molto diversi tra loro per dimensione). In un cariotipo umano i cromosomi sono numerati per una facile identificazione. Convenzionalmente, il paio di cromosomi omologhi più lungo è designato come 1, il successivo più lungo come 2 e così via. Benché in realtà il cromoso-

Le basi cromosomiche dell’ereditarietà

ma 21 sia più piccolo del cromosoma 22, è chiamato 21 per ragioni storiche. Come viene mostrato nella Figura 12.3a, i gruppi di cromosomi umani con morfologia simile sono designati con una lettera (da A a G). Quando i diversi cromosomi sono colorati in modo uniforme, è difficile distinguerli in modo non ambiguo basandosi solo sulla loro dimensione e forma. Fortunaa) Bandeggio G in un cariotipo di sesso maschile

1

2

4

3

5

A

6

7

B

8

9

10

11

12

X

C

13

14

15

16

17

D 19

20 F

18

E 21

22

Y

G

b) Colorazione dei cromosomi in un cariotipo di sesso maschile

293

tamente, è stata sviluppata una serie di tecniche che colorano alcune regioni o bande cromosomiche più intensamente di altre. I bandeggi sono specifici per ogni cromosoma e ciò consente di identificare inequivocabilmente ogni cromosoma del cariotipo. Una di queste tecniche di colorazione è chiamata bandeggio G. Questa tecnica è usata comunemente nella costruzione dei cariotipi nelle analisi cliniche dei cromosomi umani. Nel bandeggio G, i cromosomi sono trattati a calore moderato o con enzimi proteolitici (enzimi che digeriscono le proteine) per digerire parzialmente le proteine cromosomiche, e vengono quindi colorati con il colorante Giemsa per produrre delle bande scure chiamate bande G (vedi Figura 12.3a). Nell’uomo, nei cromosomi metafasici possono essere evidenziate circa 300 bande G. Per convenzione i disegni (ideogrammi) che rappresentano i cromosomi umani indicano le bande G. È stata inoltre fissata una nomenclatura standard di riferimento dei cromosomi basata sui profili di bandeggio, cosicché gli scienziati possano parlare di geni o marcatori facendo riferimento a regioni e sottoregioni specifiche. Ogni cromosoma ha due bracci cromosomici separati dal centromero. Il braccio più corto è indicato con la lettera p (petit), quello più lungo con la lettera q. Le regioni e sottoregioni sono numerate a partire dal centromero, verso il corrispondente telomero; in questo modo la regione 1 è quella più vicina al centromero. Per esempio, il gene per la suscettibilità al cancro della mammella Breast Cancer 1 o BRCA1 è in posizione 17q21, cioè sul braccio lungo del cromosoma 17 nella regione 21. Le sottoregioni sono indicate con numeri decimali, dopo il numero che indica la regione. Il gene della fibrosi cistica, per esempio, si estende nelle sottoregioni 7q31.2-q31.3, ovvero è localizzato nelle sottoregioni 2 e 3 della regione 31 del braccio lungo del cromosoma 7. I cromosomi umani in un cariotipo possono essere anche distinti usando un metodo più recente nel quale sonde di DNA specifiche per regioni di particolari cromosomi ibridano cromosomi depositati su un vetrino per microscopio. Le sonde di DNA sono marcate con molecole fluorescenti che hanno emissione di fluorescenza con diverse lunghezze d’onda. La fluorescenza emessa è analizzata da un computer e processata per generare un’immagine colorata di ogni cromosoma. Nel caFigura 12.3 Cariotipo umano.

294

Capitolo 12

riotipo mostrato nella Figura 12.3b, la combinazione delle sonde specifiche per ogni cromosoma è responsabile del caratteristico alternarsi di colori. Il metodo, conosciuto come colorazione dei cromosomi (chromosome painting), ha diverse varianti che permettono all’utilizzatore di colorare ogni cromosoma o con diversi colori (come nell’esempio mostrato in figura) o con un colore solo. La colorazione dei cromosomi è usata solo raramente nei cariotipi delle analisi cliniche dei cromosomi umani.

Nota chiave Le cellule eucariotiche diploidi hanno due assetti cromosomici aploidi, ciascuno dei quali proviene da un genitore. I componenti di una coppia cromosomica, ognuno derivato da un genitore, sono chiamati cromosomi omologhi. Le cellule eucariotiche aploidi hanno invece un’unica serie di cromosomi. L’assetto completo dei cromosomi di una cellula è definito cariotipo. Il cariotipo è specie-specifico. La colorazione con particolari coloranti produce un bandeggio caratteristico, che ha portato a un sistema di numerazione per definire regioni e sottoregioni cromosomiche.

Mitosi

Mitosi (1 ora) Intervallo di post-sintesi (4 ore) G2

M

Divisione

~ 24 ore

G1 Intervallo di pre-sintesi (10 ore)

e

MyLab

Sia negli eucarioti unicellulari sia in quelli pluricellulari, la riproduzione cellulare è un processo ciclico di crescita, mitosi (divisione nucleare o nimazione cariocinesi) e (generalmente ma non sempre) divisione cellulare Mitosi (citocinesi). Il ciclo di crescita, la mitosi e la divisione cellulare costituiscono il ciclo cellulare. Nelle cellule somatiche in proliferazione, il ciclo cellulare consta di due fasi: la fase di mitosi (M), vale a dire di divisione, e un’interfase tra una divisione e l’altra (Figura 12.4). L’interfase è caratterizzata da tre tappe successive: G1 (da gap, “inter-

vallo”, 1), S e G2 (gap 2). In G1 (fase di pre-sintesi), la cellula si prepara alla replicazione del DNA e dei cromosomi, che avviene nella fase S. In G2 (fase di post-sintesi), la cellula si prepara alla divisione cellulare, o fase M. In altre parole, la replicazione cromosomica avviene nell’interfase, alla quale segue la mitosi, che assicura la distribuzione di un assetto cromosomico completo a ciascuno dei due nuclei figli. Il tempo relativo che una cellula passa in ciascuno dei quattro stadi della mitosi varia molto a seconda del tipo cellulare. In un dato organismo, le differenze nella lunghezza del ciclo cellulare dipendono essenzialmente dalla durata di G1, mentre la durata di S, G2 ed M è approssimativamente la stessa in tutti i tipi cellulari. Per esempio, G1 dura minuti in alcune cellule tumorali e nelle cellule umane embrionali precoci, mentre può durare ore in cellule adulte differenziate. Alcune cellule escono dal ciclo cellulare in G1 ed entrano in uno stato di quiescenza e non-divisione chiamato G0. (Il rientro della cellula nel ciclo cellulare è generalmente indotto da stimoli extracellulari come per esempio fattori di crescita.) Durante l’interfase, i singoli cromosomi sono despiralizzati e sono difficilmente visibili al microscopio ottico. Il DNA di ciascun cromosoma si replica nella fase S, dando origine a due copie esatte, chiamate cromatidi fratelli, tenuti insieme dal centromero, duplicato ma non ancora diviso. (Poiché i centromeri non si sono separati, al microscopio è visibile un’unica struttura centromerica.) Più precisamente un cromatidio è ciascuna delle subunità longitudinali, visibili in modo distinto, che costituiscono i cromosomi replicati e che diventano visibili tra l’inizio della profase e la metafase mitotica. (I due cromatidi contengono gli stessi geni e gli stessi alleli perché sono il risultato della replicazione del cromosoma parentale.) Successivamente, quando i centromeri si separano, i cromatidi vengono indicati come cromosomi figli. La mitosi avviene sia nelle cellule diploidi, sia in quelle aploidi. Nelle cellule diploidi ciascun omologo si replica autonomamente ed entra in mitosi in forma dicromatidica. I cromatidi si separano durante la mitosi e segregano ciascuno in una delle due cellule figlie (contenenti ciascuna una copia del cromosoma parentale). La mitosi è un processo continuo che, per semplicità di esposizione, è solitamente suddiviso in cinque tappe citologicamente distinguibili chiamate profase, prometafase, metafase, anafase e telofase. La Figura 12.5 mostra questi cinque stadi secondo diagrammi semplificati. Le fotografie della Figura 12.6 mostrano la morfologia tipica che assumono i cromosomi nell’interfase e nelle cinque fasi della mitosi in cellule animali.

Sintesi del DNA (9 ore)

S

s rfa

Inte

Figura 12.4 Ciclo cellulare di una cellula eucariote. Questo ciclo considera una durata di 24 ore, anche se la lunghezza del ciclo in realtà varia molto a seconda dell’organismo e del tipo di cellula.

Le basi cromosomiche dell’ereditarietà Profase iniziale I cromosomi e i centrioli si replicano prima della fine dell’interfase. Le coppie di centrioli si separano. I cromosomi si accorciano, si ispessiscono e iniziano a diventare visibili. Il nucleolo incomincia a scomparire.

Figura 12.5 Interfase e mitosi di una cellula animale.

Due coppie di centrioli Interfase La citocinesi è completa. I cromosomi sono decondensati e non sono più visibili.

295

Tarda profase Il fuso mitotico si assembla tra i centrioli fuori dal nucleo. I cromosomi replicati diventano visibili come due cromatidi fratelli. L’involucro nucleare si dissolve verso la fine della profase.

Fuso mitotico iniziale Cinetocore Nucleolo

Telofase La membrana nucleare incomincia a ricostituirsi. I cromosomi si rilassano e diventano meno visibili. Si riforma il nucleolo. La citocinesi prosegue.

Prometafase Il fuso occupa l’area nucleare. I microtubuli associati al cinetocore si attaccano al cinetocore dei cromatidi fratelli. Microtubulo non associato al cinetocore Microtubulo associato al cinetocore

Fibre del fuso

Tarda anafase I due assetti di cromosomi arrivano ai poli. Ha inizio la citocinesi (divisione della cellula).

Fuso

Inizio dell’anafase I due centromeri dei cromatidi fratelli si separano e i due cromosomi figli che ne derivano cominciano a migrare verso i due poli opposti.

Profase Nella fase G2 del ciclo cellulare, appena prima dell’inizio della fase M, ogni cromosoma è formato da due cromatidi fratelli, e i centrioli si sono duplicati in due coppie (Figure 12.5 e 12.6a). Nella profase (Figure 12.5 e 12.6b) i cromatidi si condensano cosicché appaiono al microscopio più corti e più spessi. In tarda profase, ogni cromosoma, che si è duplicato nella precedente fase S dell’interfase, è costituito da due cromatidi fratelli. Men-

Metafase I microtubuli associati al cinetocore orientano i cromosomi duplicati sulla piastra metafasica.

tre avviene la condensazione, il nucleolo si riduce e in molte specie scompare. Molti eventi mitotici dipendono dal fuso mitotico (apparato del fuso), una struttura costituita da fibre composte da microtubuli a loro volta formati da proteine specializzate chiamate tubuline. Il fuso mitotico si organizza al di fuori del nucleo durante la profase. Nella maggior parte delle cellule animali, i centrioli (Figura 1.5b) sono i fo-

296

Capitolo 12

a) Interfase

b) Profase

c) Prometafase

d) Metafase

e) Anafase

f) Telofase

Figura 12.6 Interfase e fasi della mitosi nei primi stadi di sviluppo dell’embrione del pesce coregone.

ci di assemblaggio del fuso. (Le cellule delle piante superiori, pur mancando generalmente di centrioli, possiedono ugualmente un apparato del fuso.) I centrioli sono organizzati in coppie e, prima della fase S, la coppia di centrioli cellulari si replica. Successivamente, ciascuna nuova coppia di centrioli diventa il centro di una raggiera di microtubuli detta aster. All’inizio della profase i due aster sono affiancati, vicini alla membrana nucleare. In profase avanzata i due aster si allontanano l’uno dall’altro, lungo l’esterno del nucleo, ma rimangono uniti dalle fibre microtubulari del fuso.

i cromosomi in metafase (Figura 12.7) fossero la forma più condensata di cromosomi in mitosi (e meiosi, come vedremo). Recentemente, l’esame di una ricostruzione 3D di immagini al microscopio di cellule vive di mammifero, ottenuta con un microscopio ad alto potere risolutivo, ha rivelato che un’ulteriore condensazione cromosomica avviene subito dopo che i cromosomi si sono separati in anafase. Questa condensazione tardiva è utile per minimizzare il problema della possibile estensione dei bracci dei cromosomi oltre il piano di divisione, che potrebbe portare a danni meccanici a loro carico.

Prometafase L’involucro nucleare si dissolve alla fine della profase, indicando l’inizio della prometafase (Figure 12.5 e 12.6c). Il fuso che si sta formando penetra nella regione precedentemente occupata dal nucleo. Un complesso multiproteico specializzato chiamato cinetocore si lega a ciascun centromero. I cinetocori sono i siti di attacco dei cromosomi ai microtubuli del fuso, chiamati microtubuli associati al cinetocore. Per una coppia di cromatidi fratelli, da uno a molti microtubuli di un polo si attaccano a un cinetocore, e un numero equivalente di microtubuli dell’altro polo si attacca al cinetocore dell’altro cromatidio. Microtubuli non associati al cinetocore che non legano i cinetocori si originano da ogni polo del fuso e si sovrappongono a metà del fuso.

Anafase Durante l’anafase (Figure 12.5 e 12.6e) i centromeri uniti dei due cromatidi fratelli si separano, dando origine a due cromosomi figli. Allorché i cinetocori ap-

Metafase Durante la metafase (Figure 12.5 e 12.6d) i microtubuli del cinetocore orientano i cromosomi in modo che i centromeri siano allineati a livello della piastra metafasica, un piano a metà strada tra i due poli del fuso, con l’asse longitudinale dei cromosomi disposto a 90 gradi rispetto all’asse del fuso. Per anni si è pensato che

a) Fotografia al microscopio elettronico a trasmissione di un cromosoma metafasico

Figura 12.7 Cromosoma umano metafasico.

b) Fotografia al microscopio elettronico a scansione di un cromosoma metafasico

Le basi cromosomiche dell’ereditarietà

paiati di ciascun cromosoma si separano, la coppia di cromatidi fratelli va incontro a disgiunzione (separazione) e i cromosomi figli si muovono verso i poli opposti. Nell’anafase i cromosomi figli sono tirati verso i poli opposti della cellula dall’accorciamento dei microtubuli agganciati al cinetocore. In questa fase di trazione i cromosomi assumono una forma caratteristica, dovuta alla posizione del centromero su di essi. Un cromosoma metacentrico, per esempio, assumerà una forma a V, poiché i bracci cromosomici di lunghezza pressoché uguale seguono il centromero nel suo movimento verso il polo, e un cromosoma submetacentrico apparirà come una J, con un braccio lungo e uno corto. La migrazione continua fino a che i cromosomi figli separati hanno raggiunto i due poli; a quel punto la segregazione cromosomica risulta completata. Telofase All’inizio della telofase (Figure 12.5 e 12.6f) le due serie di cromosomi figli si riuniscono in due gruppi alle estremità opposte della cellula. I cromosomi incominciano a distendersi e ad assumere la forma allungata caratteristica dell’interfase. Attorno a ciascun gruppo di cromosomi si forma una membrana nucleare, i microtubuli del fuso scompaiono e il nucleolo o i nucleoli si riformano. A questo punto la divisione nucleare è completata e la cellula possiede ora due nuclei. Citocinesi La citocinesi è la divisione del citoplasma; generalmente segue la divisione nucleare della mitosi ed è completata alla fine della telofase. Con la citocinesi si realizza la separazione dei due nuovi nuclei in cellule figlie distinte, completando la mitosi e il processo di divisione cellulare (Figura 12.8). Nelle cellule animali la citocinesi procede con la formazione di un anello al centro della cellula, che si contrae fino alla produzione di due cellule figlie (Figura 12.8a). Nella citocinesi delle cellule vegetali, la costituzione di una nuova membrana e di una nuova parete cellulare tra i due nuclei forma una piastra cellulare (Figura 12.8b). Il materiale della parete cellulare riveste la piastra cellulare da entrambi i lati, dando origine alle due cellule figlie. La segregazione dei cromosomi durante la mitosi Nella mitosi una copia di ogni cromosoma replicato è distribuita in entrambe le due cellule figlie. In questo modo in una cellula aploide (N) la replicazione dei cromosomi produce una cellula nella quale ciascun cromosoma ha raddoppiato il proprio contenuto. La mitosi quindi ha come risultato la produzione di due cellule figlie aploidi, ciascuna con una serie completa di cromosomi (un genoma). In una cellula diploide (2N), che ha due serie di cromosomi (due genomi), la replicazione dei cromosomi produce una cellula nella quale ogni serie di cromosomi ha replicato il proprio contenuto. La mitosi porta allora a due cellule figlie diploidi geneticamente identiche, cia-

297

Nota chiave La mitosi è il processo di divisione nucleare degli eucarioti. Rappresenta una tappa del ciclo cellulare (costituito dalle fasi G1, S, G2 e M) e porta alla produzione di nuclei figli che hanno lo stesso numero cromosomico e che sono geneticamente identici tra loro e al nucleo genitore dal quale si sono originati. Prima della mitosi, i cromosomi si replicano. La mitosi è generalmente seguita dalla citocinesi. Sia le cellule aploidi sia le cellule diploidi si dividono per mitosi.

scuna con due serie di cromosomi (due genomi). Ne derivano un’uguale ripartizione e nessuna perdita di materiale genetico.

Meiosi La meiosi è costituita da due divisioni in successione di un nucleo diploide dopo un unico ciclo di replicazione del DNA (replicazione cromosominimazione ca). Il nucleo diploide di partenza contiene un assetto cromosomico Meiosi aploide di origine materna e un assetto aploide di origine paterna (con l’eccezione degli organismi in grado di autofecondarsi, come molte piante, nel qual caso entrambi gli assetti cromosomici derivano dallo stesso genitore). La meiosi avviene solo in un momento specifico del ciclo vitale dell’organismo. Negli animali la meiosi porta alla formazione di gameti aploidi (cellule uovo e spermatozoi) mediante la gametogenesi; nelle piante porta alla formazione di meiospore aploidi nella sporogenesi. a) Citocinesi di una cellula animale

Figura 12.8 Citocinesi (divisione cellulare).

b) Citocinesi di una cellula vegetale

MyLab

298

Capitolo 12

(Una meiospora va incontro a mitosi e produce una fase multicellulare chiamata gametofito, che dà origine ai gameti.) Prima della meiosi, il DNA che costituisce i cromosomi omologhi si replica, e durante la meiosi queste coppie di cromosomi si appaiano e subiscono due divisioni (meiosi I e meiosi II), ciascuna delle quali comprende una serie di fasi (Figura 12.9). La meiosi I porta alla riduzione del numero cromosomico in ciascuna celProfase precoce I Sono visibili i cromosomi già replicati. La coppia di centrioli comincia a separarsi e tra questi si forma il fuso.

lula da un assetto diploide a uno aploide (divisione riduzionale; ogni paio di cromatidi fratelli uniti costituisce un singolo cromosoma), mentre la meiosi II determina la separazione dei cromatidi fratelli (divisione equazionale; il singolo cromatidio costituisce il cromosoma figlio). In seguito a ciò, ciascuno dei quattro nuclei risultanti dalle due divisioni meiotiche riceve soltanto un cromatidio per ciascuna coppia di cromosomi omologhi (vale a dire, un

Fase intermedia della profase I I cromosomi omologhi si accorciano e si ispessiscono. I cromosomi vanno incontro a sinapsi e avviene il crossing-over.

Profase I tardiva/Prometafase I I risultati del crossing-over si manifestano come chiasmi. La membrana nucleare scompare. Il fuso meiotico occupa l’area dove prima si trovava il nucleo. I microtubuli del cinetocore si attaccano ai cromosomi. Metafase I I microtubuli del cinetocore allineano ogni coppia di cromosomi omologhi (tetradi) sulla piastra metafisica.

Telofase II 4 gameti

Anafase I I cromosomi di ogni tetrade si separano e migrano verso i poli opposti.

Anafase II

Telofase I I cromosomi (ciascuno costituito da due cromatidi fratelli) completano la migrazione ai poli e i nuovi involucri nucleari si riformano. (Sono possibili altre modalità di assortimento.)

Metafase II

Profase II

Citocinesi Nella maggior parte delle specie avviene la citocinesi con produzione di due cellule. Le cellule entrano nella meiosi II senza replicare il DNA.

Figura 12.9 Le fasi della meiosi in una cellula animale.

Le basi cromosomiche dell’ereditarietà

genoma aploide completo). Nella maggior parte dei casi le divisioni sono accompagnate da citocinesi, per cui la meiosi produce da una singola cellula diploide quattro cellule aploidi. Meiosi I: la prima divisione meiotica La meiosi I, durante la quale il numero cromosomico è ridotto da diploide ad aploide, comprende cinque stadi: profase I, prometafase I, metafase I, anafase I e telofase I (Figura 12.9). Profase I Quando la profase I ha inizio, i cromosomi si sono già replicati, e ciascuno di essi consiste in due cromatidi fratelli uniti da un centromero (Figura 12.9). La profase I è suddivisa in numerose sottofasi. La profase I della meiosi è simile alla profase della mitosi. Una differenza importante è che in meiosi i cromosomi omologhi si appaiano e avviene il crossing-over. Nel leptonema (profase I precoce, stadio di leptotene) i cromosomi decondensati incominciano ad avvolgersi e diventano visibili come fili lunghi e sottili. Una volta che la cellula entra nel leptotene, essa è destinata al processo meiotico. Nello zigonema (fase precoce/mediana della profase I, stadio di zigotene) i cromosomi continuano a condensarsi. I due omologhi di ogni coppia si cercano attivamente l’un l’altro e si allineano grossolanamente per tutta la loro lunghezza. Ogni coppia di omologhi va incontro quindi a sinapsi, che consiste nella formazione lungo i cromatidi di una struttura simile a una cerniera chiamata complesso sinaptinemale, che allinea in modo preciso, base per base, i due omologhi. I telomeri dei cromosomi svolgono un ruolo importante nel dare l’avvio alla sinapsi. Durante la meiosi I, cioè, i telomeri sono raggruppati sulla membrana nucleare e formano una disposizione definita a bouquet in quanto assomiglia alla disposizione dei culmi di un bouquet di fiori recisi. In un certo qual modo i telomeri muovono i cromosomi in modo tale che gli omologhi si allineino e vadano incontro a sinapsi. Il pachinema (fase mediana della meiosi I, stadio di pachitene) incomincia quando la sinapsi è stata completata. Poiché la replicazione è già avvenuta, ciascun insieme di cromosomi omologhi in sinapsi è costituito da quattro cromatidi ed è indicato col termine di bivalente o tetrade. Durante il pachinema avviene uno degli eventi più significativi della meiosi: il crossing-over, ovvero lo scambio fisico reciproco di segmenti cromosomici localizzati nella stessa posizione tra la coppia di omologhi (Figura 12.9). Il punto nel quale avviene il crossing-over lungo il cromosoma è casuale e varia da una meiosi all’altra. Lo scambio fisico che avviene durante il crossingover è facilitato dall’allineamento dei cromosomi omologhi determinato dal complesso sinaptinemale. Se ci sono delle differenze genetiche tra gli omologhi, il crossingover può produrre in un cromatidio nuove combinazioni

299

alleliche. Durante il crossing-over non si ha né perdita né acquisizione di materiale genetico, perché si determina uno scambio reciproco. (Nel caso di errori di appaiamento, in corrispondenza per esempio di sequenze ripetute, si può verificare un crossing-over ineguale che porta all’insorgenza di mutazioni, come vedremo nel Capitolo 16.) Un cromosoma che risulti dalla meiosi con una combinazione di alleli che differisce dalla combinazione di partenza è definito cromosoma ricombinante. Quindi il crossing-over è un meccanismo che determina la ricombinazione genetica. Alla fine del pachinema il complesso sinaptinemale è disassemblato. Nel diplonema (fase mediana/terminale della profase I, stadio di diplotene) il complesso sinaptinemale si disgrega e i cromosomi omologhi incominciano a separarsi. L’esito del processo di crossing-over diventa visibile con la formazione di strutture cruciformi chiamate chiasmi (Figure 12.9 e 12.10). In corrispondenza di ciascun chiasma i cromosomi omologhi sono associati tra loro molto strettamente. Poiché tutti i quattro i cromatidi possono essere coinvolti in eventi di crossing-over in qualsiasi punto lungo gli omologhi, la forma che il chiasma assume in questo stadio può essere molto complicata. Nella maggior parte degli organismi il diplonema è seguito rapidamente dalle altre fasi della meiosi. Tuttavia, gli oociti (cellule uovo) di numerosi animali possono rimanere nella fase di diplonema per parecchio tempo. Nelle donne, per esempio, gli oociti entrano in meiosi I e arrivano al diplonema entro il settimo mese dello sviluppo fetale, arrestandosi in questo stadio per parecchi anni. Dall’inizio della pubertà fino al raggiungimento della menopausa, per ogni ciclo mestruale un solo oocita completa la meiosi I e avviene l’ovulazione. Se l’oocita è fecondato da uno spermatozoo mentre discende attraverso la tuba di Falloppio, esso completa rapidamente la meiosi II e per fusione con lo spermatozoo aploide viene prodotto uno zigote funzionale. Nella diacinesi (fase terminale della profase I), i cromosomi si condensano ancora, rendendo ora visibili i

Punti di crossing-over e chiasmi

Coppia di cromosomi omologhi con due cromatidi per cromosoma

Figura 12.10 Comparsa dei chiasmi nel diplonema, prova visibile del fenomeno del crossing-over.

300

Capitolo 12

quattro bracci delle tetradi. In questo stadio è chiaramente visibile il chiasma. I fenomeni di sinapsi e di crossing-over che avvengono nella profase I riguardano i cromosomi omologhi, e più precisamente gli autosomi. Benché i cromosomi del sesso non siano cromosomi omologhi, il cromosoma Y dei mammiferi euterici (placentati) ha piccole porzioni a ciascuna delle estremità terminali che sono omologhe a regioni del cromosoma X. Queste regioni pseudoautosomiche (PAR) durante la meiosi maschile si appaiano e possono andare incontro a crossing-over. Quando la regione PAR è deleta dal braccio corto del cromosoma Y, l’appaiamento tra i cromosomi X e Y non avviene e il maschio è sterile. Pertanto, l’appaiamento e il crossingover delle regioni PAR sono stati considerati necessari per la segregazione corretta dei cromosomi X e Y durante la progressione della meiosi. È interessante osservare che i geni che si trovano nelle regioni PAR variano, anche tra i primati. Anche le regioni PAR dell’uomo e del topo sono molto diverse. Inoltre non tutti i mammiferi posseggono regioni PAR: esse sono assenti in alcuni roditori e nei cromosomi di tutti i marsupiali, e durante la meiosi i cromosomi X e Y di questi animali non si appaiano e non mostrano crossing-over. Tuttavia i cromosomi X e Y segregano in modo normale durante la meiosi dei marsupiali, a indicare che in questi mammiferi non è necessaria una PAR per l’appaiamento dei cromosomi sessuali e la fertilità maschile. Prometafase I Nella prometafase I i nucleoli scompaiono, la membrana nucleare si dissolve e il fuso meiotico che si è formato tra le coppie di centrioli che si sono separate occupa l’area nucleare (Figura 12.9). Come avviene nella mitosi, i microtubuli associati al cinetocore si attaccano ai cromosomi; ovvero i microtubuli provenienti da un polo prendono contatto con entrambi i cinetocori fratelli di un cromosoma duplicato e quelli provenienti dall’altro polo lo fanno con entrambi i cromatidi fratelli dell’altro cromosoma duplicato nella tetrade. I microtubuli non associati al cinetocore provenienti da ogni polo si sovrappongono al centro della cellula. Metafase I Nella metafase I (Figura 12.9) i microtubuli associati al cinetocore allineano le tetradi sulla piastra metafasica. È importante sottolineare che sulla piastra metafasica si trovano le coppie di omologhi (le tetradi). Al contrario, nella mitosi, i cromosomi omologhi replicati (le coppie di cromatidi fratelli) si allineano in modo indipendente sulla piastra metafasica (si confrontino le Figure 12.5 e 12.9). Anafase I Nell’anafase I (Figura 12.9) i cromosomi di ciascuna tetrade si separano, in modo tale che i cromosomi di ciascuna coppia di omologhi si distacchino e migrino ai poli opposti, dove si formeranno i nuovi nuclei. (In questo stadio ciascuno dei cromosomi separati costitui-

sce una diade.) Questa migrazione presuppone che i centromeri di derivazione materna e paterna si distribuiscano in modo casuale a ciascun polo (ovviamente, porzioni cromosomiche potrebbero esser state scambiate durante il crossing-over), e che a ciascun polo si trovi una serie aploide di centromeri replicati con associati cromatidi fratelli. In questo stadio i cromosomi omologhi segregano l’uno dall’altro, ma i cromatidi fratelli rimangono attaccati tra loro attraverso i rispettivi centromeri. Quindi, le differenze fondamentali tra meiosi I e mitosi sono che nella meiosi i cromatidi fratelli rimangono uniti dopo la metafase (mentre si separano nella mitosi) e che la cellula figlia ha la metà di cromosomi della cellula madre, avendo “perso” un membro della coppia di omologhi (mentre nella mitosi entrambi i cromosomi omologhi sono presenti nelle cellule figlie). Telofase I Nella telofase I (Figura 12.9) le diadi completano la loro migrazione ai poli opposti della cellula e il fuso si disassembla. In alcune specie, ma non in tutte, una nuova membrana nucleare si forma intorno a ogni nucleo aploide. Nella maggior parte delle specie si ha citocinesi e vengono prodotte due cellule aploidi. La meiosi I quindi incomincia con una cellula diploide, che contiene una serie cromosomica derivata dalla madre e una derivata dal padre, e termina con due nuclei, ciascuno dei quali è aploide e contiene una serie parentale di diadi mista. Dopo la citocinesi, ciascuna delle due cellule figlie ha un nucleo con una serie aploide di diadi. Meiosi II: la seconda divisione meiotica Tra la meiosi I e la meiosi II non avviene duplicazione del DNA. La meiosi II è simile alla divisione mitotica (Figura 12.9). Nella profase II (Figura 12.9) i cromosomi si condensano e si forma il fuso. Nella prometafase II (non mostrata), la membrana nucleare (se si è formata nella telofase I) si rompe e il fuso si organizza nella cellula. I microtubuli associati al cinetocore provenienti dai poli opposti prendono contatto con i cinetocori di ogni cromosoma. Nella metafase II (Figura 12.9) il movimento dei microtubuli associati al cinetocore allinea i cromosomi sulla piastra metafasica. Durante l’anafase II (Figura 12.9) i centromeri si separano e i nuovi cromosomi figli sono trascinati ai poli opposti del fuso. Un cromatidio fratello di ciascun paio muove verso un polo, l’altro al polo opposto; i cromatidi ormai separati sono considerati ora cromosomi a tutti gli effetti. Nell’ultimo stadio, la telofase II (Figura 12.9), i cromosomi cominciano a decondensarsi, la membrana nucleare si forma attorno a ogni serie di cromosomi e avviene la citocinesi. Dopo la telofase II, i cromosomi conti-

Le basi cromosomiche dell’ereditarietà

nuano a decondensarsi e non sono più visibili al microscopio ottico. Il prodotto finale delle due divisioni meiotiche, da un’unica cellula diploide di partenza, è costituito da quattro cellule aploidi (negli animali i gameti). Ognuna delle quattro cellule figlie possiede un cromosoma da ciascuna coppia di cromosomi omologhi. Questi cromosomi non sono le copie esatte di quelli originari a causa del crossing-over. La Tabella 12.1 mette a confronto i due processi di divisione cellulare appena descritti, ossia la mitosi e la meiosi. Generazione di nuove combinazioni alleliche nella meiosi La meiosi porta a tre risultati significativi. 1. La meiosi produce nuclei aploidi con un numero di cromosomi dimezzato rispetto a quello della cellula diploide che è andata incontro al processo meiotico. Questo avviene poiché due divisioni cellulari seguo-

301

no un unico ciclo di replicazione del DNA (fase S). La fusione dei nuclei aploidi durante la fecondazione ristabilisce il numero diploide. Quindi, negli organismi che si riproducono sessualmente, il numero cromosomico viene mantenuto attraverso un ciclo di meiosi e di fusione. 2. Nella metafase I, ogni cromosoma di origine materna o paterna ha identiche probabilità di allinearsi da una parte o dall’altra della piastra equatoriale metafasica. (L’allineamento casuale dei cromosomi paterni e materni è alla base dell’assortimento indipendente dei geni – seconda legge di Mendel, descritta nel Capitolo 11.) Per questo motivo ogni nucleo prodotto per meiosi conterrà solitamente una combinazione di cromosomi di origine paterna e di cromosomi di origine materna. (A causa del precoce crossing-over i cromosomi sono in realtà un insieme di sequenze materne e paterne. Per semplicità diciamo che i cromosomi con il centromero materno sono cromosomi materni e quelli con il centromero paterno sono cromosomi paterni.)

Tabella 12.1 Confronto fra meiosi e mitosi Caratteristica

Mitosi

Meiosi

Scopo

Produrre cellule geneticamente identiche per il mantenimento e la crescita dell’organismo

Produrre gameti geneticamente differenti per la riproduzione sessuata

Localizzazione

Cellule somatiche

Cellule germinali

Meccanismi

Un ciclo di replicazione del DNA seguito da un ciclo di divisione cellulare

Un ciclo di replicazione del DNA seguito da due cicli di divisione cellulare (meiosi I e II). È il meccanismo alla base delle leggi dell’ereditarietà di Mendel

Cromosomi omologhi

Non si appaiano. Raramente vanno incontro a ricombinazione

Formano sinapsi durante la profase I. Vanno incontro a ricombinazione durante la profase I

Cromatidi fratelli

Durante la metafase si attaccano alle fibre del fuso provenienti dai poli opposti.

Durante la metafase I si attaccano alle fibre del fuso provenienti dallo stesso polo.

Durante l’anafase si separano e migrano verso i poli opposti

Migrano verso gli stessi poli in anafase I. Durante la metafase II si attaccano alle fibre del fuso provenienti dai poli opposti. Durante l’anafase II si separano e migrano verso i poli opposti

Due cellule figlie diploidi geneticamente identiche che continuano a dividersi tramite mitosi

Quattro cellule aploidi geneticamente differenti che maturano formando gameti. Questi possono essere coinvolti nella fecondazione e formare uno zigote diploide

Prodotti

302

Capitolo 12

Il numero delle possibili combinazioni cromosomiche nei nuclei aploidi derivanti dall’assortimento indipendente dei cromosomi in meiosi è grande, specialmente quando il numero cromosomico di un organismo è elevato. Consideriamo un ipotetico organismo con due coppie di cromosomi in una cellula diploide che entri in meiosi. La Figura 12.11 illustra le due possibili combinazioni di cromosomi paterni e materni che possono aver luogo sulla piastra metafasica. La comprensione di questo concetto è di aiuto per affrontare l’argomento della segregazione dei geni, presentato nel Capitolo 11. La formula generale per stabilire il numero possibile di arrangiamenti cromosomici alla piastra metafasica è 2n – 1, dove n è il numero di coppie di cromosomi nella cellula diploide. Allo stesso modo, la formula generale per stabilire il numero di possibili combinazioni cromosomiche nei gameti risultanti dall’assortimento indipendente dei cromosomi in meiosi è 2n. In Drosophila, che ha quattro coppie di cromosomi, il numero di combinazioni possibili nei gameti che derivano dall’assortimento indipendente dei cromosomi in meiosi è pari a 24, ovvero 16; nell’uomo, che ha 23 coppie di cromosomi, sono possibili oltre 4 milioni di combinazioni (senza considerare il crossing-over). Quindi, poiché ci sono molte possibili differenze alleliche tra i cromosomi di origine materna e quelli di origine paterna, i nuclei prodotti per meiosi saranno geneticamente molto diversi da quello della cellula parentale e tra di loro. 3. Il crossing-over, che avviene durante la meiosi I tra coppie di cromatidi materni e paterni, produce un’ulteriore variabilità nelle combinazioni cromosomiche finali. Il crossing-over ha luogo in tutte le meiosi* e, poiché i siti di crossing-over cambiano da una meiosi all’altra, il numero di tipi diversi di nuclei filiali prodotti da questo processo è estremamente grande. Questo significa che, con l’eccezione dei gemelli identici, la sequenza del genoma di un individuo della specie umana quasi certamente non è mai esistita prima e non esisterà mai più nel futuro in maniera naturale. La comprensione della meiosi, per le sue caratteristiche genetiche, è di importanza fondamentale per capire il comportamento dei geni. In effetti, gli eventi che si verificano durante la meiosi sono alla base della segregazione e dell’assortimento indipendente dei geni secondo le leggi di Mendel, come è stato discusso nel Capitolo 11. Il Focus sul genoma di questo capitolo spiega come la genomica ha identificato alcuni geni il cui prodotto svolge una funzione nella segregazione cromosomica durante la meiosi. * Ci sono alcune eccezioni. Per esempio, non c’è crossing-over nella meiosi delle cellule germinali dei maschi di Drosophila.

Due coppie di cromosomi omologhi

Direzione di separazione

Possibili combinazioni di appaiamento

Figura 12.11 Le possibili combinazioni che due paia di cromosomi omologhi possono assumere sulla piastra metafasica nella prima divisione meiotica. I cromosomi paterni sono indicati in blu, quelli materni in rosso.

Nota chiave La meiosi ha luogo in tutti gli eucarioti che si riproducono sessualmente. Si tratta di un processo attraverso il quale una cellula specializzata diploide (2N) o un nucleo cellulare con un doppio corredo cromosomico vengono trasformati in quattro cellule o nuclei aploidi (N), dotati ciascuno di un unico set di cromosomi. Ciò è reso possibile da una duplice divisione cellulare a seguito di un unico evento di replicazione del DNA. Durante la prima delle due divisioni hanno luogo l’appaiamento, la sinapsi e il crossingover dei cromosomi omologhi. Il processo meiotico, di concerto con la fecondazione, conserva il numero dei cromosomi da una generazione alla successiva. Inoltre, esso genera variabilità genetica attraverso i vari modi in cui i cromosomi materni e paterni si ricombinano nei nuclei della progenie e mediante il crossing-over (lo scambio fisico di segmenti cromosomici nelle posizioni corrispondenti di coppie di cromosomi omologhi).

La meiosi negli animali e nelle piante Per finire, discuteremo brevemente il ruolo della meiosi negli animali e nelle piante. La meiosi negli animali Gli animali pluricellulari sono generalmente diploidi per la maggior parte del ciclo vitale. In essi la meiosi produce gameti aploidi; la fusione di due gameti aploidi produce uno zigote diploide allorché i loro nuclei si fondono durante la fecondazione. Lo zi-

Le basi cromosomiche dell’ereditarietà

303

Focus sul genoma I geni coinvolti nella segregazione cromosomica in meiosi Nel Capitolo 9 abbiamo discusso del problema dei geni FUN (funzione sconosciuta) nel lievito Saccharomyces cerevisiae. I geni FUN sono quei geni, identificati dall’analisi del genoma del lievito, che sono omologhi a geni di altri organismi nei database di sequenza ma dei quali non si conosce la funzione. Anche la specie correlata Schizosaccharomyces pombe (il lievito di fissione) ha numerosi geni FUN. Le tecniche genomiche descritte di seguito sono state utilizzate per identificare le funzioni meiotiche dei prodotti di parecchi geni di questo tipo. Analizzando il profilo di espressione genica mediante uso di microarray a DNA (vedi Capitoli 8 e 9) di cellule di lievito durante la sporulazione, sono stati trovati circa 200 geni maggiormente espressi in meiosi (a metà della sporulazione) rispetto ad altri momenti. Tali geni non avevano una funzione nota. I ricercatori hanno quindi inattivato (vedi Capitolo 9) ognuno di questi geni singolarmente – hanno cioè eliminato la sequenza del gene così da perderne completamente la funzione – e analizzato i risultati di questa mutazione. In due casi si è

gote si divide mitoticamente per produrre un nuovo organismo diploide. Questa serie di eventi, che coinvolge l’alternanza di fasi diploidi e aploidi, è la riproduzione sessuata. In questo modo i gameti costituiscono l’unica fase aploide del ciclo vitale. Nei maschi il gamete è lo spermatozoo, prodotto attraverso il processo di spermatogenesi. Il gamete femminile è la cellula uovo, prodotta per oogenesi (Figura 12.12). I gameti sono prodotti solo da cellule specializzate. Negli animali maschi le cellule spermatiche (spermatozoi) sono prodotte nei testicoli che contengono le cellule germinali progenitrici (spermatogoni primari). Attraverso la mitosi, le cellule germinali progenitrici producono gli spermatogoni secondari, che si trasformano in spermatociti primari (meiociti), ognuno dei quali subisce una meiosi I dando origine a due spermatociti secondari. Ogni spermatocita secondario va incontro alla meiosi II e il risultato di queste due divisioni sono quattro spermatidi aploidi che si differenziano successivamente nei gameti maturi, gli spermatozoi. Nelle femmine delle specie animali, le ovaie contengono le cellule germinali progenitrici (oogoni primari), che per mitosi danno origine agli oogoni secondari. Queste cellule si trasformano in oociti primari, che si accrescono fino alla fine dell’oogenesi. L’oocita primario diploide va incontro a meiosi I e a una citocinesi ineguale,

avuta una totale inefficienza della meiosi. Uno dei geni così identificati, sgo1+, codifica per una proteina della famiglia delle shugoshine. I membri di questa famiglia prevengono la separazione dei cromatidi fratelli sia in meiosi sia in mitosi. Sembra che la proteina ne protegga un’altra, la coesina, che tiene uniti i cromatidi fratelli. In meiosi, sia le coesine sia le shugoshine sono richieste per permettere ai cromatidi fratelli di rimanere attaccati al centromero dopo l’anafase I. La distruzione di questo gene in S. pombe induce gravi difetti della segregazione cromosomica in meiosi. Il secondo gene identificato, mde2, codifica per una proteina che è richiesta per la formazione delle rotture della doppia elica nel DNA per il crossing-over. Queste sono cruciali per la formazione dei chiasmi e per la corretta segregazione meiotica in quasi tutti gli organismi. Questo approccio genomico funzionale, quindi, ha identificato una proteina che tiene insieme i cromatidi fratelli e un’altra proteina che è richiesta per la formazione dei chiasmi. Entrambi i processi sono necessari per una corretta segregazione cromosomica in meiosi.

che dà origine a due cellule: quella più grande è l’oocita secondario, mentre quella più piccola è il primo corpo polare. Nella meiosi II, l’oocita secondario produce due cellule aploidi. Una di esse è molto piccola e prende il nome di secondo corpo polare; l’altra, più grande, si differenzia rapidamente in cellula uovo matura, o uovo. Il primo corpo polare può dividersi o meno durante la meiosi II. I corpi (o globuli) polari non svolgono alcuna funzione nella maggior parte delle specie e degenerano. Solo la cellula uovo è un gamete vitale. (In molti animali, incluso l’uomo, la cellula che viene fecondata in realtà è l’oocita secondario; tuttavia, perché avvenga la fusione nucleare è necessario il completamento della meiosi da parte di quell’oocita). Nelle femmine delle specie animali, quindi, la meiosi di una cellula diploide produce un unico gamete maturo (l’uovo). Nella specie umana, tutti gli oociti si formano durante la vita fetale e, nella femmina adulta, un solo oocita completa la meiosi I ogni mese ma non procede ulteriormente nella meiosi, a meno che non sia stimolato dalla fecondazione da parte di uno spermatozoo. La meiosi nelle piante Il ciclo vitale delle piante che si riproducono sessualmente ha due fasi tipiche, il gametofito, o stadio aploide, durante il quale sono prodotti i gameti, e lo sporofito, o stadio diploide, durante il quale sono prodotte per meiosi le spore.

304

Capitolo 12 Spermatogenesi

Figura 12.12 Spermatogenesi e oogenesi in cellule animali.

Oogenesi

Spermatogonio (2N)

Oogonio (2N)

Spermatocita primario (2N)

Oocita primario (2N)

La teoria cromosomica dell’ereditarietà

Meiosi I

Oocita secondario

Spermatociti secondari

Primo corpo polare

Meiosi II

Spermatidi (N)

dazione incomincia la generazione sporofitica diploide, che produce le cellule aploidi specializzate chiamate spore, completando in questo modo il ciclo.

Ootide Secondo (N) corpo polare Differenziamento (N)

Corpi polari (N)

Tipicamente i corpi polari non hanno funzione Uovo (N)

Spermatozoi (N)

Nelle angiosperme (le piante superiori con fiore) il fiore è la struttura nella quale avviene la riproduzione sessuata. Nella Figura 12.13 è illustrato un tipico fiore che contiene gli stami e i pistilli, rispettivamente gli organi riproduttivi maschili e femminili. Ogni stame è formato da un singolo peduncolo, il filamento che porta in cima un’antera. L’antera rilascia i granuli di polline, che sono i gametofiti immaturi maschili (prodotti nella fase di produzione dei gameti). Il pistillo, che contiene i gametofiti femminili, è costituito in genere dallo stigma, una superficie appiccicosa specializzata a ricevere il polline, dallo stilo, un peduncolo sottile lungo il quale cresce il tubo pollinico proveniente dal granulo di polline adeso, e dall’ovario, la struttura basale entro la quale sono contenuti gli ovuli. Ogni ovulo contiene un gametofito femminile (il sacco embrionale) che contiene una singola cellula uovo. Quando l’uovo è fecondato, l’ovulo si sviluppa in forma di seme. Le piante sono gli unici organismi viventi che producono i gameti da entità specializzate chiamate gametofiti. Di conseguenza, nelle piante si distinguono due fasi riproduttive distinte, che danno luogo a un’alternanza di generazioni (Figura 12.14). La meiosi e la fecondazione sono i momenti di transizione tra le due fasi. La generazione gametofitica aploide incomincia dopo che le spore sono state prodotte per meiosi. Nelle piante superiori con fiore le spore sono le cellule che, alla fine, diventeranno il polline e il sacco embrionale. Con la fecon-

Attorno all’inizio del XX secolo i citologi avevano stabilito che per una determinata specie il numero totale di cromosomi è costante in tutte le cellule, mentre il numero cromosomico varia considerevolmente tra specie diverse (Tabella 12.2). Nel 1902 Walter Sutton e Theodor Boveri riconobbero in maniera indipendente la correlazione tra l’ereditarietà dei fattori di cui parlava Mendel e la trasmissione dei cromosomi da una generazione all’altra. Questa correlazione permise loro di elaborare la teoria, nota come teoria cromosomica dell’ereditarietà, secondo la quale i geni sono localizzati sui cromosomi. In questo paragrafo, consideriamo alcune delle prove ottenute dai citologi e dai genetisti in favore di questa teoria.

I cromosomi del sesso La dimostrazione della teoria cromosomica dell’ereditarietà venne da esperimenti che mettevano in relazione la trasmissione ereditaria di determinati geni e la trasmissione dei cromosomi del sesso, che, come ricorderete, sono cromosomi rappresentati in forma diversa nei due sessi negli eucarioti, e presenti, insieme agli autosomi, in tutte le cellule. I cromosomi del sesso furono scoperti nei primi anni del XX secolo allorché Clarence E. McClung, Nettie Stevens ed Edmund B. Wilson, che lavoravano tutti sugli insetti, ottennero in modo indipendente la prova che particolari cromosomi determinavano il sesso di Stigma Pistillo Stilo Ovario

Stame Antera Filamento

Figura 12.13 Struttura generale di un fiore.

305

Le basi cromosomiche dell’ereditarietà Generazione gametofitica (N) Gametofito maschile (N) (microgametofito) Gametofito femminile (N) (megagametofito)

Spore (N)

Uovo (N)

Meiosi

Mitosi Sperma (N)

Fecondazione Zigote (2N)

Ovulo

Embrione (nel seme)

Antera Seme

(XX relativamente ai cromosomi del sesso) e il maschio ha un cromosoma X e un cromosoma Y (XY). La Figura 12.15a mostra un maschio e una femmina di Drosophila e la Figura 12.15b indica gli assetti cromosomici dei due sessi. Poiché il maschio produce due tipi di gameti relativamente ai cromosomi del sesso (X o Y) e la femmina un solo tipo di gamete (X), il maschio è definito sesso eterogametico e la femmina sesso omogametico. In Drosophila i cromosomi X e Y hanno dimensioni simili, ma forma differente. (Si noti che in alcuni organismi il maschio è omogametico e la femmina eterogametica.) La modalità di trasmissione dei cromosomi X e Y attraverso le generazioni è molto chiara (Figura 12.16). In questa figura il cromosoma X è rappresentato come una

Tabella 12.2 Numero cromosomico di vari organismia Pianta adulta Generazione sporofitica (2N)

Figura 12.14 Alternanza tra la generazione gametofitica e quella sporofitica nelle piante con fiori.

un organismo. In uno di questi studi, condotto nel 1905, Stevens rilevò che, nelle cavallette, la femmina aveva un numero pari di cromosomi mentre il maschio ne aveva un numero dispari. Nella femmina c’erano due copie di uno dei cromosomi, mentre nel maschio ce n’era una sola. Stevens chiamò il cromosoma aggiuntivo (extra) cromosoma X. Il sesso della progenie delle cavallette, quindi, è determinato dal possesso, o meno, di un cromosoma X da parte dello spermatozoo. Tutte le cellule uovo posseggono un cromosoma X. Se anche lo spermatozoo ne è dotato, allora la cellula uovo fecondata avrà una coppia di cromosomi X e l’individuo che si svilupperà sarà una femmina. Se lo spermatozoo non ha il cromosoma X, la cellula uovo fecondata avrà un singolo cromosoma X e darà luogo a un maschio. A differenza dalle cavallette, alcuni insetti hanno due distinte tipologie di cromosomi del sesso. Per esempio, Stevens trovò che nel comune verme della farina, Tenebrio molitor, il maschio possedeva un cromosoma, molto più piccolo e chiaramente distinguibile, partner del cromosoma X. Stevens chiamò il cromosoma partner cromosoma Y. Le cellule spermatiche del verme della farina conterranno alternativamente un cromosoma X o Y, e il sesso della progenie è determinato dal tipo di cellula spermatica che feconda la cellula uovo che porta il cromosoma X: i vermi XX saranno femmine e i vermi XY saranno maschi. Analoghi cromosomi sessuali X e Y sono stati ritrovati in altri organismi, compresi gli esseri umani e i moscerini della frutta, Drososphila melanogaster. Nella maggior parte dei casi la femmina ha due cromosomi X

Organismo

Numero totale di cromosomi

Uomo

46

Scimpanzè

48

Cane

78

Gatto

72

Topo

40

Cavallo

64

Pollo

78

Rospo

36

Pesce rosso

94

Pesce stella

36

Moscerino della frutta (Drosophila melanogaster)

8

Zanzara

6

Formica australiana (Myrecia pilosula) Nematode Neurospora (aploide) Muschio sphagnum (aploide) Equiseto

1, 11,

2 12 7 23 216

Sequoia gigante

22

Tabacco

48

Cotone

52

Patata

48

Pomodoro

24

Frumento tenero

42

Lievito (Saccharomyces cerevisiae) (aploide)

16

a Tranne dove indicato, tutti i numeri cromosomici si riferiscono a cellule diploidi.

306

Capitolo 12

a) Femmina (a sinistra) e maschio (a destra) di Drosophila adulta (in alto) e schema della superficie ventrale del loro addome (in basso) Pettini sessuali sulle zampe anteriori

produce sia gameti con il cromosoma X, sia gameti con il cromosoma Y. L’unione casuale dei gameti maschili e femminili produce una progenie, nella quale 1/2 di moscerini è XX (femmine) e 1/2 XY (maschi).

Ereditarietà legata al sesso Addome arrotondato Addome appuntito

b) Cromosomi di Drosophila femmina (a sinistra) e maschio (a destra) II III II III IV

IV

I X

I X

X

Y

Figura 12.15 Drosophila melanogaster (moscerino della frutta), un organismo ampiamente utilizzato in esperimenti di genetica.

struttura lineare molto simile a un trattino obliquo e il cromosoma Y come una struttura analoga che termina in alto con un uncino curvato a destra. La femmina produce solo gameti portatori del cromosoma X e il maschio

La prova a favore della teoria cromosomica dell’ereditarietà giunse nel 1910 quando Thomas Hunt Morgan della Columbia University pubblicò i risultati di esperimenti di genetica in Drosophila. Morgan ricevette nel 1933 il Premio Nobel per la Fisiologia o Medicina per “le sue scoperte relative al ruolo svolto dai cromosomi nell’ereditarietà”. In una delle sue linee pure, Morgan trovò un moscerino maschio con occhi di colore bianco, anziché del color rosso mattone caratteristico del selvatico. Il termine selvatico (o wild-type) si riferisce a un ceppo, a un organismo, o a un allele che sia il più frequente nella popolazione naturale di quell’organismo, relativamente a genotipo e fenotipo. Per esempio, un ceppo di Drosophila con tutti gli alleli selvatici dei geni che determinano il colore degli occhi li avrà di color rosso mattone. Varianti di un ceppo selvatico originano da cambiamenti mutazionali degli alleli selvatici che producono alleli mutanti; il risultato sono ceppi con caratteristiche diverse rispetto al selvatico. Gli alleli mutanti possono essere recessivi o Genitore 1

Generazione P

Femmina

Fenotipo parentale

Genitore 2 Maschio

Genotipo parentale diploide XX

XY

Gameti aploidi

Nota chiave Negli eucarioti con sessi separati, il cromosoma del sesso è un cromosoma o un gruppo di cromosomi diversi nei due sessi. In molti degli organismi incontrati negli studi della genetica, un sesso possiede un paio di cromosomi identici (i cromosomi X), mentre l’altro sesso possiede una coppia di cromosomi visibilmente diversi: uno è il cromosoma X e l’altro, strutturalmente e funzionalmente diverso, è detto cromosoma Y. Comunemente il sesso XX è femminile e il sesso XY è maschile. Il sesso XX è detto sesso omogametico perché, rispetto ai cromosomi sessuali, produce un solo tipo di gameti, e il sesso XY è detto sesso eterogametico perché produce due tipi di gameti in relazione ai cromosomi sessuali.

X

X

X

Y

Gameti del genitore 2 Progenie X

Y

Gameti del genitore 1 X

Genotipi della progenie: Fenotipi della progenie:

XX

XY

1/ XX, 2 1/2

1/ XY 2

femmine 1/2 maschi

Figura 12.16 Trasmissione dei cromosomi X e Y negli organismi nei quali la femmina è XX e il maschio XY.

Le basi cromosomiche dell’ereditarietà

dominanti rispetto all’allele selvatico; per esempio, l’allele mutante che determina gli occhi bianchi nella Drosophila è recessivo rispetto all’allele selvatico (occhio rosso). Morgan incrociò il maschio con occhi bianchi con una femmina con occhi rossi proveniente dallo stesso ceppo e trovò che tutti i moscerini della F1 avevano gli occhi rossi. Concluse quindi che il carattere occhio bianco era recessivo. Successivamente lasciò che la progenie F1 si incrociasse e osservò nella generazione F2 3470 moscerini con occhi rossi e 782 con occhi bianchi. (Il numero di individui con fenotipo recessivo era troppo basso per essere in accordo con il rapporto mendeliano di 3:1. Più tardi, Morgan scoprì che il numero inferiore all’atteso di moscerini con fenotipo recessivo era la conseguenza di una più bassa vitalità dei moscerini con occhi bianchi.) Inoltre, Morgan notò che tutti i moscerini con occhi bianchi erano maschi. Questo fu un risultato nuovo; fino ad allora, negli altri incroci genetici tra diversi mutanti, il fenotipo mutante non era mai stato attribuito a un solo sesso. La Figura 12.17a schematizza gli incroci. La simbologia usata per indicare i geni di Drosophila è diversa da quella utilizzata per gli incroci di Mendel ed è descritta nel Box 12.1. La simbologia dei geni di Drosophila è più rappresentativa di quella utilizzata nella maggior parte degli esempi di genetica, e dovrebbe quindi essere compresa prima di proseguire in questa trattazione. Procedendo, si noti che il profilo di ereditarietà madre-figlio maschio presentata nella Figura 12.17 è il risultato della segregazione di geni localizzati su un cromosoma del sesso. Morgan propose che il gene che determina la variante del colore dell’occhio fosse localizzato sul cromosoma X. La condizione dei geni associati al cromosoma X nei maschi è definita emizigote, dato che il gene è presente solo una volta nell’organismo, e non c’è alcun allele corrispondente sul cromosoma Y. Per esempio, i maschi di Drosophila con occhi bianchi hanno un cromosoma X con l’allele bianco e nessun altro allele di questo gene nel loro genoma; questi maschi sono emizigoti per l’allele bianco. Dato che l’allele bianco è recessivo, il maschio originale con occhi bianchi doveva portare sul suo cromosoma X l’allele recessivo per gli occhi bianchi (indicato con w; vedi Box 12.1). La femmina con occhi rossi proveniva da un ceppo di linea pura, quindi entrambi i suoi cromosomi X dovevano portare l’allele dominante per gli occhi rossi, w+. I moscerini della F1 vengono prodotti nel modo seguente (Figura 12.17a): i maschi ricevono dalla madre il loro unico cromosoma X e quindi hanno l’allele w+ e gli occhi rossi. Le femmine ricevono un allele dominante w+ dalla madre e un allele recessivo w dal padre, quindi hanno anch’esse gli occhi rossi. Nella F2, prodotta incrociando i moscerini della F1, i maschi che hanno ricevuto dalla madre un cromosoma X con l’allele w hanno gli occhi bianchi; quelli che hanno

307

ricevuto un X con l’allele w+ hanno gli occhi rossi (Figura 12.17a). La trasmissione di un allele mostrata in questo incrocio – da un genitore maschio attraverso una figlia femmina a un nipote maschio – è chiamata ereditarietà crisscross. Morgan inoltre incrociò una femmina con occhi bianchi proveniente da una linea pura (omozigote per l’allele w) con un maschio con occhi rossi (emizigote per l’allele w+; Figura 12.17b). Questo è l’incrocio reciproco del primo effettuato da Morgan – maschio con occhio bianco × femmina con occhio rosso – mostrato nella Figura 12.17a. Tutte le femmine della F1 ricevono un cromosoma X che porta w+ dal padre e un cromosoma X che porta w dalla madre (Figura 12.17b). Di conseguenza, sono eterozigoti w+/w e hanno gli occhi rossi. Tutti i maschi della F1 ricevono un cromosoma X con w dalla madre e un cromosoma Y dal padre, quindi hanno gli occhi bianchi (Figura 12.17b). Questo risultato è diverso da quello dell’incrocio della Figura 12.17a. Inoltre, tutti i risultati ottenuti sono diversi da quelli di un normale incrocio reciproco, a causa della modalità di ereditarietà del cromosoma X. L’incrocio tra moscerini della F1 (Figura 12.17b) avviene tra un maschio w/Y e una femmina w+/w e produce nella F2 numeri approssimativamente uguali di maschi e di femmine con occhi rossi e con occhi bianchi. Questo rapporto è diverso dai risultati del primo incrocio, nel quale si otteneva un valore approssimativo di 3:1 tra moscerini con occhi rossi e moscerini con occhi bianchi e dove nessuna femmina e circa la metà dei maschi mostravano il fenotipo con gli occhi bianchi. La differenza tra i rapporti fenotipici nelle due serie di incroci riflette la modalità di trasmissione dei cromosomi del sesso e dei geni in essi localizzati. Gli incroci effettuati da Morgan con Drosophila prendevano in considerazione caratteristiche del colore dell’occhio, che ora sappiamo essere determinate da un gene localizzato sul cromosoma X. Queste caratteristiche e i geni che le controllano sono definiti come legati o associati al sesso – più corretnimazione tamente legati o associati al cromosoma X – dato che il locus Ereditarietà genico è parte del cromosoma X. legata al Si usa il termine di ereditacromosoma X rietà associata al cromosoma X per indicare la modalità di trasmissione ereditaria dei geni legati all’X. Quando non si ottengono gli stessi risultati da incroci reciproci e si osservano rapporti diversi per i due sessi della progenie, si può pensare che siano implicate caratteristiche legate al sesso. Invece, i risultati degli incroci reciproci sono sempre identici quando sono implicati geni localizzati sugli autosomi con la stessa distribuzione dei fenotipi dominanti o recessivi nei maschi e nelle femmine. I risultati di Morgan, e questo è il dato più significativo, dimostrarono che l’eredi-

MyLab

308

Capitolo 12 b) Incrocio femmina con occhi bianchi µ maschio con occhi rossi

a) Incrocio femmina omozigote con occhi rossi µ maschio con occhi bianchi Genitore 1

Generazione P Fenotipo parentale

Genitore 2

Generazione P

Occhi bianchi

Fenotipo parentale

Occhi rossi (selvatico)

Genotipo parentale diploide

w+

w+ XX

Gameti aploidi

Genotipo parentale diploide

w

w+

X

Gameti aploidi X

XY

X

Y

X

Gameti del genitore 1

Generazione F1

w+

w+ X 1/2

Genotipi in F1: Fenotipi in F1:

w+/w,

X Gameti del genitore 1

w+

XX 1/2

w+/Y

Y

w

w

XX

X

1/2

Genotipi in F1: tutti con occhi rossi (selvatici) Fenotipi in F : 1

XY

w+/w,

1/2

w/Y

1/2

femmine 1/2 maschi con con occhi rossi occhi bianchi

Incrocio F1 µ F1

Incrocio F1 µ F1 Generazione F1

Generazione F1

Fenotipo F1

Occhi rossi

Genotipo F1 diploide

XX

w+

Generazione F2

w+

w+

w+ X

w+

Y

XY

w

X

w X X Gameti della F1

Generazione F2

w+ X

X

w+

w+ XY

XX

w+ X

Gameti della F1

Y

w

Y

w+

w

w XX

Gameti aploidi della F1

X X Gameti della F1

Occhi bianchi

w+

XY

w

X

Genotipo F1 diploide

w+

w

Occhi rossi

Fenotipo F1

Occhi rossi

w+

Gameti aploidi della F1

w+

w

XY

1/2 femmine, 1/2 maschi,

Y

w+

Y

w

X

Gameti del genitore 2

w X

w+

w

w

Gameti del genitore 2 Generazione F1

w+

w XX

w

X

Occhi rossi (selvatico)

w

XY

w+

Genitore 2

Genitore 1 Occhi bianchi

Y

w+

w XX

XY

Gameti della F1 w+

w X

w

w

Genotipi in F2: 1 w+/w, 1 w+/w+, 1 w+/ Y, Fenotipi in F2: 3/4 occhi rossi (2 , 1

w XY

XX

X

)

Fenotipi in F2:

1/ 2

w

w

XX 1/

Genotipi in F2:

1 w/Y

) 1/4 occhi bianchi (1

w

4

XY

w+/w, 1/4 w+/Y,

selvatico (1 , 1

)

1/ 4

w/w, 1/4 w/Y

1/ 2

occhi bianchi (1 , 1

)

Figura 12.17 Ereditarietà legata al cromosoma X relativamente agli occhi rossi e bianchi in Drosophila melanogaster. I simboli w e w+ indicano gli alleli per l’occhio bianco e per l’occhio rosso,

rispettivamente. La figura mostra le differenze ottenute dagli incroci reciproci.

tarietà del gene w segue in parallelo l’ereditarietà del cromosoma X e avvalorarono la teoria cromosomica dell’ereditarietà di Sutton-Boveri. Morgan trovò molti altri esempi di geni localizzati sul cromosoma X di Dro-

sophila e di altri organismi, dimostrando così che le sue osservazioni non erano limitate a una sola specie. Più avanti in questo capitolo tratteremo l’analisi dei caratteri legati all’X nell’uomo.

Le basi cromosomiche dell’ereditarietà

Box 12.1

309

Rivisitazione dei simboli genetici

Purtroppo, i genetisti non hanno adottato un unico sistema di simboli per rappresentare i geni; i simboli usati per i geni di Drosophila sono diversi da quelli usati nel Capitolo 11 per i piselli. Questa simbologia impiegata per Drosophila è comunemente, ma non esclusivamente, usata oggi in genetica. In questo sistema il simbolo [+] indica l’allele selvatico di un gene. Una lettera minuscola indica alleli mutati di un gene, recessivi rispetto all’allele selvatico, e una lettera maiuscola (o un’iniziale maiuscola e seguita da minuscola) è usata per alleli mutati dominanti sull’allele selvatico. Le lettere sono scelte sulla base del fenotipo dell’organismo che esprime l’allele mutato e sono l’iniziale del termine inglese. Per esempio, un ceppo variante di Drosophila ha gli occhi di color arancio brillante, anziché del normale rosso mattone. L’allele mutante in questione è recessivo rispetto all’allele selvatico rosso mattone e, dato che il colore arancio brillante dell’occhio si avvicina al vermiglio, l’allele è chiamato v ed è definito allele vermilion. L’allele selvatico di v è v+, che, se non c’è possibilità di confusione con altri geni in un incrocio, è spesso abbreviato in +. Invece, secondo la terminologia “mendeliana” usata finora, l’allele recessivo mutante sarebbe v e il suo allele selvatico V. Un modo convenzionale di rappresentare i cromosomi (invece di quello che è stato usato nelle figure) consiste nell’usare la barra obliqua (/). Quindi, v+/v o

Nota chiave I geni localizzati sui cromosomi sessuali, così come le caratteristiche fenotipiche che essi controllano, sono detti associati al sesso o al cromosoma X o Y. Il lavoro pionieristico di Morgan nei riguardi dell’ereditarietà dei geni legati all’X di Drosophila avvalorò notevolmente la teoria cromosomica dell’ereditarietà.

Non-disgiunzione del cromosoma X La prova a favore della teoria cromosomica dell’ereditarietà provenne dal lavoro di uno studente di Morgan, Calvin Bridges. Il lavoro di Morgan aveva dimostrato che, da un incrocio di femmine con occhi bianchi (w/w) con maschi con occhi rossi (w+/Y), tutti i maschi della F1 avrebbero dovuto avere gli occhi bianchi e tutte le femmine gli occhi rossi. Bridges trovò rare eccezioni a questo risultato: circa 1 su 2000 moscerini della F1 di questo incrocio era o femmina con occhi bianchi o maschio con occhi rossi.

+/v indica due cromosomi omologhi, uno con l’allele selvatico (v+ o +) e l’altro con l’allele recessivo (v). Il cromosoma Y è generalmente rappresentato come una Y o una barra obliqua ripiegata (/ ). L’incrocio di Morgan tra un moscerino femmina di linea pura con occhi rossi e un maschio con occhi bianchi potrebbe essere scritto w+/w+ × w/Y oppure +/+ × w// . Le stesse regole sono valide quando gli alleli considerati sono dominanti rispetto all’allele selvatico. Per esempio, alcuni mutanti di Drosophila, chiamati curly, hanno le ali arrotolate alle estremità, invece delle normali ali diritte. Il simbolo di questo allele mutante è Cy e l’allele selvatico è Cy+, o + nella versione abbreviata. Quindi, un eterozigote sarebbe Cy+/Cy o +/Cy. Nel resto del libro saranno usate le simbologie A/a (“mendeliana”), a+/a (Drosophila), e altre ancora. Siccome parlando è più facile usare i simboli mendeliani (per esempio A grande e a piccola), molti esempi useranno questa simbologia, anche se i simboli di Drosophila per molti versi sono più informativi. Infatti, con il sistema di Drosophila, gli alleli selvatico e mutante risultano subito evidenti, dato che l’allele selvatico è indicato con a+. Il sistema “mendeliano” è utilizzato comunemente negli incroci di piante e di animali. Una buona ragione per questo è il fatto che dopo molti anni (talvolta secoli) di incroci può non essere più chiaro quale sia il gene “normale” (selvatico).

Per spiegare questi moscerini d’eccezione, Bridges ipotizzò che fosse intervenuto un problema durante la segregazione cromosomica nella meiosi. Normalmente, i cromosomi omologhi (nella meiosi I) o i cromatidi fratelli (nella meiosi II) si muovono verso i poli opposti in anafase; se questo movimento fallisce per qualche motivo, si ha la non-disgiunzione cromosomica. La non-disgiunzione può coinvolgere sia gli autosomi sia i cromosomi del sesso. Per gli incroci analizzati da Bridges, occasionalmente non si erano separati i due cromosomi X, così le uova prodotte avevano o due o nessun cromosoma X invece dell’abituale unico esemplare. Questo nimazione particolare tipo di non-disgiunzione è detto non-disgiunzione del Noncromosoma X (Figura 12.18) disgiunzione Quando avviene negli individui con un normale assetto cromosomico, è detto non-disgiunzione primaria. La normale disgiunzione del cromosoma X è illustrata nella Figura 12.18a e la non-disgiunzione dei cromosomi X in meiosi I e II è mostrata nelle Figure 12.18b e 12.18c, rispettivamente. (La stessa modalità può essere applicata alla non disgiunzione degli autosomi in meiosi I o II.)

MyLab

310

Capitolo 12 a) Segregazione normale del cromosoma X

b) Non-disgiunzione in meiosi I

c) Non-disgiunzione in meiosi II

Cellula diploide all’inizio della meiosi

Non-disgiunzione

Prima divisione meiotica

Seconda divisione meiotica

Non-disgiunzione

X

X

X

X

XX

Figura 12.18 Non-disgiunzione del cromosoma X nella meiosi. In rosso è indicato il cromosoma materno e in blu il cromosoma paterno. (La non disgiunzione degli autosomi in meiosi può avvenire nello stesso modo.)

Come può la non-disgiunzione dei cromosomi X spiegare i moscerini eccezionali ottenuti nell’incrocio di Bridges? Quando la non-disgiunzione avviene nelle femmine w/w durante la meiosi I (Figura 12.19b), vengono prodotte con uguale (e bassa) frequenza due classi eccezionali di uova: quelle con due cromosomi X e quelle con nessun cromosoma X. Il maschio XY è w+/Y e normalmente produce un numero uguale di spermatozoi con w+ e con Y. Quando queste uova sono fertilizzate da uno dei due tipi, si formano quattro tipi di zigoti: uno XXX (triplo X) con genotipo w+/w /w, uno XXY con genotipo w/w, uno X0 con genotipo w+ e uno Y0 (“0” indica l’assenza del cromosoma del sesso). Lo zigote Y0 muore perché gli manca il cromosoma X e i suoi geni che codificano per funzioni cellulari essenziali, e lo zigote XXX muore perché evidentemente i moscerini non sopravvivono con una dose extra di geni del cromosoma X. Le classi che sopravvivono sono i maschi X0 con occhi rossi (in Drosophila, l’assetto X0 produce maschi sterili ma comunque normali) senza cromosoma Y e con un allele w+ sull’X, e le femmine XXY con occhi bianchi (in Drosophila XXY è una femmina fertile) con un allele w su ogni X. I maschi hanno gli occhi rossi poiché ricevono il cromosoma X dal padre e le femmine hanno occhi bianchi poiché i loro due cromosomi X derivano dalla madre. (Questo risultato è diverso da quanto atteso in mammiferi placentati, dove il sesso maschile è dato dalla presenza del cromosoma Y e quindi il cromosoma X è ereditato dalla madre.) L’ipotesi di Bridges fu verificata esaminando l’assetto cromosomico dei moscerini eccezionali: le femmine con occhi bianchi erano XXY e i maschi con occhi rossi erano X0. (La condizione nella quale uno o più cromoso-

XX

0

0

XX

0

X

X

mi interi di un assetto normale mancano o sono presenti in soprannumero, come in questo caso, è definita aneuploidia; vedi Capitolo 16.) Bridges verificò ulteriormente la sua ipotesi incrociando le femmine eccezionali XXY con occhi bianchi Genitore 1

Generazione P

Genitore 2

Occhi bianchi

Fenotipi

Genotipi diploidi

w

Occhi rossi (selvatico)

w+

w XX

XY

Non-disgiunzione dei gameti w w nella ; gameti normali nel ; XX

w+ 0

X

Y

Gameti del genitore 2 Progenie attesa

w+ X

w

w

X X Gameti del genitore 1 (uova eccezionali) 0

w+ X

w

Y

w

X X Muore

Fenotipi della F1:

w

X

X

Y

w+ X

Genotipi della F1:

w

1/ 4

w+/w /w, 1/4 Y0,

1/2 muore nella fase iniziale di sviluppo

Y 1/ 4

w /w / Y,

Muore 1/ 4

w+/ 0

1/4 femmine 1/4 maschi con occhi con occhi bianchi rossi (sterile)

Figura 12.19 Non-disgiunzione primaria (rara) durante la meiosi in una femmina di Drosophila melanogaster con occhi bianchi e risultati di un incrocio con un maschio normale con occhi rossi. La progenie XXX e Y0 muore.

Le basi cromosomiche dell’ereditarietà

con maschi normali XY con occhi rossi (Figura 12.20). La femmina XXY è omozigote per l’allele w sui suoi due cromosomi X. Il maschio porta l’allele w+ sul suo cromosoma X. Era atteso che i due cromosomi X del genitore XXY segregassero in gameti diversi: un gamete sarebbe stato X e l’altro XY. L’unione con uno spermatozoo contenente il cromosoma X, proveniente dal padre, avrebbe prodotto una progenie XX e XXY rispettivamente, in entrambi i casi eterozigote w+/w e perciò con occhi rossi. Di nuovo, da questo incrocio si ottennero moscerini con fenotipi inattesi: una piccola percentuale della progenie maschile aveva gli occhi rossi e analogamente una piccola percentuale della progenie femminile li aveva bianchi. Per spiegare questi fenotipi strani, Bridges ipotizzò che la segregazione dei cromosomi nella meiosi di una femmina XXY potesse avvenire in due modi. Nella disgiunzione normale, i due cromosomi X si separano e migrano ai poli opposti e uno di essi migra insieme al cromosoma Y, per produrre un numero uguale di cellule uovo X e XY.

Questa modalità è quella che i cromosomi X dovrebbero seguire durante la meiosi (Figura 12.20a). Nella seconda situazione, che si verifica solo nel 4% circa dei casi, avviene una non-disgiunzione dei cromosomi X (Figura 12.20b). Bridges chiamò questa segregazione non-disgiunzione secondaria, perché si era verificata nella progenie di femmine prodotte da una non-disgiunzione primaria. La non-disgiunzione secondaria consiste nella migrazione dei due cromosomi X a un polo e del cromosoma Y all’altro. Le cellule uovo sono XX e Y. Quando queste cellule uovo vengono fecondate dai due tipi di spermatozoi (X e Y), le due classi che sopravvivono sono eccezionali maschi con occhi rossi (XY) e femmine con occhi bianchi (XXY). Come indicato prima, le altre due classi, quelle XXX e YY, di solito muoiono precocemente durante lo sviluppo. Bridges verificò la sua ipotesi della non-disgiunzione secondaria mediante analisi al microscopio dei cromosomi dei moscerini ottenuti dall’incrocio. Nel complesso, gli esperimenti di Bridges mostrarono che questa particolare modalità di ereditarietà era sempre strettamente asso-

F1

F1

Occhi bianchi

Fenotipo parentale Genotipo parentale

w

Occhi rossi (selvatico)

w+

w XXY

Gameti possibili

w

w X

XY

w+

w

w

XY

311

XX

Y

X

Y

Meiosi con una normale Meiosi con una nonsegregazione cromosomica disgiunzione secondaria a) Segregazione cromosomica normale

b) Non-disgiunzione secondaria

Gameti w+

w+

X

w+

w

Gameti derivanti dalla meiosi con normale segregazione cromosomica

w+

w X

Genotipi della F2: Fenotipi della F2:

Y

1/ 4 1/4

X

w

w

X Y

X

w+/w ,

con occhi rossi

1/4

w

w

X

X

X

Y

w

X

X

Gameti

w+/w / Y,

1/4

Gameti X derivanti dalla nondisgiunzione secondaria

Y

Y

Y

w / Y, 1/4 w / Y / Y

1/ con occhi 1/ con occhi 4 2 rossi bianchi

Figura 12.20 Risultati di un incrocio tra la femmina eccezionale XXY con occhi bianchi della Figura 12.19 e un maschio normale XY con occhi rossi. La progenie XXX e YY muore.

w+

w

X

X

Y

w

w

X

X Muore

w

w

X

X

Y

w+

Y

X

Y

Genotipi della F2: 1/4 w /w /w+, 1/4 Y / Y, Fenotipi della F2:

1/2

Y

1/4

w+/ Y,

muore durante 1/4 con occhi fasi precoci dello sviluppo rossi

Y

1/4

Muore w / w /Y

1/4 con occhi bianchi

(a) Segregazione normale dei cromosomi X nella femmina XXY. (b) Non-disgiunzione secondaria dei cromosomi X omologhi durante la meiosi I della femmina XXY.

312

MyLab

Capitolo 12

ciata a specifiche classi aneuploidi (X0 e XXY), dimostrando senza dubbi che un fenotipo specifico era associato a uno specifico assetto cromosomico. Riassumendo, la modalità di segregazione dei geni segue la modalità di comportamento dei cromosomi nella meiosi. Nella Figura 12.21 questo parallelismo è illustrato per una cellula diploinimazione de con due coppie di cromosomi omologhi. La cellula ha geSegregazione notipo Aa Bb, con la coppia gedei geni e dei nica A/a su una coppia di omocromosomi loghi e quella B/b sull’altra. nella meiosi Come illustrato nella figura, le due coppie di cromosomi omologhi si dispongono sulla piastra metafasica nei due possibili orientamenti in modo indipendente, determinando due diverse possibili segregazioni delle due coppie di geni: A può segregare con B (e quindi a con b) oppure A può segregare con b (e quindi a con B). Dato che ciascuna delle due disposizioni, e di conseguenza ciascuna delle due possibili segregazioni, è ugualmente probabile, la meiosi produce con la stessa frequenza cellule con genotipi A B, a b, A b e a B. I genotipi A B e a b derivano da una disposizione dei cromosomi e i genotipi A b e a B dall’altra. In termini di leggi di Mendel, possiamo vedere come il principio della segregazione (i due membri di una coppia genica si separano l’uno dall’altro nella formazione dei gameti) si applica alla segregazione di un paio di cromosomi omologhi e della coppia di geni associati, mentre il principio dell’assortimento indipendente (geni che controllano caratteri diversi si distribuiscono in modo indipendente l’uno dall’altro durante la produzione dei gameti) si applica alla segregazione di entrambe le coppie di cromosomi omologhi e delle due coppie di geni associati.

Nota chiave Una modalità inaspettata di ereditarietà di un gene mutato legato al cromosoma X in Drosophila si dimostrò correlata direttamente a un evento raro durante la meiosi, chiamato non-disgiunzione, in cui i membri di una coppia di cromosomi omologhi non segregano ai poli opposti. La correlazione tra la modalità di segregazione genica e il comportamento dei cromosomi in meiosi dimostrò la teoria cromosomica dell’ereditarietà.

I cromosomi sessuali e la determinazione del sesso In questo paragrafo viene discussa la relazione tra i cromosomi sessuali e il sesso di un organismo. Analizzeremo la determinazione genotipica del sesso, nella

quale i cromosomi del sesso svolgono un ruolo fondamentale e la determinazione genica del sesso, nella quale i cromosomi sessuali non sono coinvolti. A b A a

Cellula 2N in interfase

a

b B B

La cellula entra in meiosi: i cromosomi si replicano e gli omologhi si appaiano

A

B

A a

B b

a

b

Metafase I: le due paia di omologhi si dispongono in uno dei due modi possibili, ciascuno ugualmente probabile

A

b

A a

b B

a

B

Anafase I A

b

B

A

A A

B

a

b B

a

b a

a

B

b

A

B

A

B

A

b

A

b

Telofase I a

b

a

B

a

b

a

B

Meiosi II: produce quattro cellule per ogni meiosi A

B

A

b

A

B

A

b

a

b

a

B

a

b

a

B

Figura 12.21 Comportamento parallelo dei geni mendeliani e dei cromosomi alla meiosi. L’ipotetica cellula diploide Aa Bb contiene una coppia di cromosomi omologhi, che portano la coppia di alleli A/a, e una coppia di cromosomi omologhi che portano la coppia B/b. La disposizione indipendente delle due coppie di cromosomi omologhi in metafase I ha come risultato uguali frequenze dei quattro prodotti meiotici A B, a b, A b e a B, a dimostrazione del principio di Mendel dell’assortimento indipendente.

Le basi cromosomiche dell’ereditarietà

Determinazione genotipica del sesso La determinazione del sesso nei mammiferi Negli esseri umani e negli altri mammiferi placentati esiste un meccanismo di determinazione del sesso nel quale il cromosoma Y determina il sesso dell’individuo. Gli individui che hanno un cromosoma Y sono geneticamente maschi, e gli individui senza un cromosoma Y sono geneticamente femmine. Questa dicotomia si realizza perché il cromosoma Y porta in modo unico un gene importante (o forse più geni) che dà l’avvio al differenziamento sessuale maschile. Il prodotto del gene è chiamato fattore di determinazione testicolare, e il gene corrispondente è chiamato gene del fattore di determinazione testicolare. Il fattore di determinazione testicolare fa sì che il tessuto che formerà le gonadi si differenzi in testicoli anziché in ovaie. In assenza di un cromosoma Y le gonadi si sviluppano come ovaie. Il fattore di determinazione testicolare e il modo in cui un cromosoma Y determina il sesso nei mammiferi saranno analizzati in dettaglio nel Capitolo 19. Dimostrazione del meccanismo di determinazione del sesso dovuto al cromosoma Y La prima dimostrazione del meccanismo di determinazione del sesso basato sul cromosoma Y nei mammiferi è derivata da studi di casi nei quali una non-disgiunzione meiotica produceva un assetto anomalo relativamente ai cromosomi del sesso. La non-disgiunzione, per esempio, può produrre individui X0. Nell’uomo, gli individui X0 con normale assetto autosomico sono femmine sterili, che manifestano la sindrome di Turner (Figura 12.22a). Gli individui affetti da sindrome di Turner hanno un solo cromosoma del sesso: un cromosoma X. Queste femmine aneuploidi hanno un assetto indicato come 45,X, a indicare che hanno un totale di 45 cromosomi (un cromosoma del sesso + 22 paia di autosomi), invece dei normali 46 (Figura

1

6

2 A

3

7

8

313

12.22b). L’assetto relativo ai cromosomi del sesso è costituito da un cromosoma X. L’incidenza alla nascita di individui con sindrome di Turner è di 1 su 10 000 femmine. Gran parte degli embrioni 45,X muore prima della nascita. Gli individui con sindrome di Turner che sopravvivono non manifestano alterazioni significative fino alla pubertà, momento in cui non sviluppano i caratteri sessuali secondari. Tendono ad avere statura inferiore alla media, pterigio del collo, mammelle poco sviluppate e organi sessuali interni immaturi. Hanno una capacità ridotta di interpretare le relazioni spaziali e sono generalmente sterili. Tutte queste anomalie negli individui X0 indicano che sono necessari due cromosomi X durante la fase iniziale dello sviluppo affinché una femmina si sviluppi normalmente. Nell’uomo, una non-disgiunzione può anche dar luogo a individui XXY, che sono maschi con la sindrome di Klinefelter (Figura 12.23a). Circa 1 maschio su 1000 nati è affetto da sindrome di Klinefelter. Questi maschi 47,XXY hanno testicoli sottosviluppati e sono spesso più alti della media. Nel 50% circa degli individui affetti si osserva un certo grado di sviluppo delle mammelle; alcuni hanno un’intelligenza inferiore alla media. Si osservano anche individui aventi un fenotipo simile con un numero più elevato di cromosomi X e/o Y, per esempio 48,XXXY e 48,XXYY. Le anomalie osservate negli individui Klinefelter dimostrano che per un normale sviluppo maschile sono necessari un cromosoma X e un cromosoma Y. Alcuni individui hanno un cromosoma X e due Y: la sindrome XYY. Questi individui 47,XYY sono maschi, data la presenza dell’Y. Il cariotipo XYY è il risultato di una non-disgiunzione del cromosoma Y alla meiosi. Circa 1 maschio su 1000 nati ha la sindrome XYY. Gli affetti tendono a essere più alti della media e occasionalmente possono avere problemi di fertilità.

5

4 B

9

10

11

12

16

17 E

18

C

13

14 D

19

15

20 F

a) Individuo con la sindrome di Turner

b) Cariotipo della sindrome di Turner

21

22 G

X Cromosoma del sesso

Figura 12.22 Sindrome di Turner (45,X).

314

Capitolo 12

Circa 1 femmina su 1000 nate ha tre cromosomi X invece dei due normali. Queste femmine 47,XXX (triplo-X) sono per la maggior parte assolutamente normali, benché siano lievemente meno fertili. Le bambine triplo-X hanno in media un QI 11 punti al di sotto delle bambine normali. Le aneuploidie descritte derivano principalmente dalla non-disgiunzione dei cromosomi sessuali nella prima o nella seconda divisione meiotica materna o paterna. Per esempio, la sindrome di Turner (X0) deriva dall’unione di un gamete privo di cromosomi sessuali e un gamete con un cromosoma X; la sindrome di Klinefelter più comune (XXY) può derivare dall’unione di un gamete XX con un gamete Y oppure da quella di un gamete XY con un gamete X. La Tabella 12.3 riassume le conseguenze di aneuploidie relativamente ai cromosomi X e Y nell’uomo. In tutti i casi indicati, l’assetto cromosomico degli autosomi risulta normale.

Tabella 12.3 Le conseguenze di diverse anormalità numeriche dei cromosomi X e Y nell’uomo, che mostrano il ruolo di Y nella determinazione del sesso

2 A

6

7

Descrizione dell’individuo

46,XX

♀ Normale

1

46,XY

♂ Normale

0

45,X

♀ Sindrome di Turner

0

47,XXX

♀ Triplo-X

2

47,XXY

♂ Sindrome di Klinefelter

1

48,XXXY

♂ Sindrome di Klinefelter

2

48,XXYY

♂ Sindrome di Klinefelter

1

47,XYY

♂ Sindrome XYY

0

a

Il primo numero indica il numero totale di cromosomi nel nucleo, X e Y indicano l’assetto relativo ai cromosomi del sesso.

Meccanismo di compensazione di dose per i geni legati all’X nei mammiferi Gli organismi con i cromosomi del sesso hanno un diverso dosaggio genico (numero di copie geniche) nei due sessi; vale a dire che vi sono due copie di geni legati al cromosoma X nelle femmine e una copia nei maschi. In molti di questi organismi, se l’espressione genica relativa al cromosoma X non è equilibrata, si verifica una letalità precoce durante lo sviluppo. Durante l’evoluzione si sono sviluppati vari sistemi di compensazione di dose. Nei mammiferi, i nuclei delle cellule somatiche di femmine normali XX contengono una massa di cromatina fortemente condensata denominata corpo di Barr – dal nome del suo scopritore, Murray Barr – non visibile nei nuclei delle normali cellule maschili XY. Vale a dire, le cellule somatiche di individui XX hanno un corpo di Barr e le cellule somatiche di

1

Numero di corpi di Barr attesi

Costituzione cromosomicaa

individui XY non lo hanno (Figura 12.24 e Tabella 12.3). Nel 1961 questo concetto fu sviluppato da Mary Lyon e da Lillian Russell in quella che oggi è chiamata ipotesi di Lyon, che propone quanto segue: 1. Il corpo di Barr è un cromosoma X altamente condensato e (per la maggior parte dei casi) geneticamente inattivo (è diventato “lyonizzato”, in un processo definito lyonizzazione). Ne consegue che i geni localizzati sul cromosoma X sono espressi solo da uno dei due cromosomi, come avviene nei maschi che possiedono un unico X. (In realtà l’inattivazione del cromosoma X non coinvolge tutti i geni presenti; circa un 15% di essi resta trascrizionalmente attivo. Per questi geni non c’è quindi compensazione di dose tra maschi e femmine.)

3

4

5 B

8

9

10

11

16

17

12

C

13

14 D

19

20

15

21

F a) Individuo con la sindrome di Klinefelter

18 E

b) Cariotipo della sindrome di Klinefelter

22 G

X X Y Cromosomi del sesso

Figura 12.23 Sindrome di Klinefelter (47,XXY).

Le basi cromosomiche dell’ereditarietà a) Nuclei di cellule femminili XX, con presenza di un corpo di Barr

b) Nuclei di cellule maschili (XY) senza corpi di Barr

Corpo di Barr

Figura 12.24 Immagini al microscopio ottico che mostrano come i corpi di Barr possano essere osservati nei nuclei di cellule femminili ma non in quelli di cellule maschili.

2. Il cromosoma X inattivato è scelto a caso tra i cromosomi X di derivazione materna e paterna, secondo un processo indipendente da cellula a cellula. (Ma una volta che un cromosoma X materno o paterno è inattivato in una cellula, tutti i discendenti da quella cellula ereditano quel tipo di inattivazione.) L’inattivazione del cromosoma X è un esempio di fenomeno epigenetico, un cambiamento dell’espressione genica ereditabile che avviene senza un cambiamento di sequenza di DNA. In altre parole, l’inattivazione del cromosoma X è il silenziamento epigenetico di uno dei due cromosomi X (discusso nel Capitolo 18). L’inattivazione del cromosoma X avviene nell’uomo circa al sedicesimo giorno dopo la fecondazione (quando l’embrione che si sta sviluppando è formato da 500-1000 cellule) e nel topo tra i giorni 3,5 e 6,5 dopo la fecondazione. A causa dell’inattivazione del cromosoma X, nei mammiferi le femmine eterozigoti per caratteri legati all’X sono effettivamente dei mosaici genetici; vale a dire che alcune cellule mostrano il fenotipo relativo a un cromosoma X e le altre cellule hanno il fenotipo corrispondente all’altro

Figura 12.25 Un gatto calico.

315

cromosoma X. Questo mosaicismo è facilmente osservabile, per esempio, nelle chiazze arancione e nere dei gatti calico (Figura 12.25). Un gatto calico è una femmina con genotipo Oo B–, ovvero omozigote o eterozigote per l’allele dominante B di un gene autosomico che determina il pelo nero ed eterozigote per un gene legato al cromosoma X che determina il pelo arancione. Se è espresso l’allele dominante O del gene legato all’X, il pelo sarà arancione indipendentemente da quali altri geni del colore del pelo il gatto possieda. Ne deriva che vengono prodotte delle chiazze arancione e nere a causa dell’inattivazione casuale dell’X nella femmina. Le chiazze arancione si trovano dove il cromosoma con l’allele O non è inattivato, cosicché l’allele O attivo maschera gli alleli B (per effetto di epistasi; vedi Capitolo 13). Le chiazze nere si ritrovano dove il cromosoma con l’allele O è stato inattivato, il che ha permesso l’espressione di B. (Le zone bianche nei gatti calico sono il risultato dell’attività di un altro gene che controlla il colore del pelo che, se espresso, maschera l’espressione di qualsiasi altro gene del colore, lasciando il pelo bianco. Molto raramente un gatto calico è maschio; in questo caso si tratta di un gatto XXY con l’appropriato genotipo per i geni del colore del pelo.) Nell’uomo, un fenotipo simile, ma meno evidente, si osserva nelle femmine eterozigoti per una mutazione legata al cromosoma X che determina l’assenza delle ghiandole sudoripare (displasia ectodermica anidrotica; OMIM 305100). In questa condizione, si verifica una situazione a mosaico di chiazze della pelle dove sono assenti le ghiandole sudoripare. Il processo di inattivazione dell’X spiega come i mammiferi tollerino bene anomalie nel numero dei cromosomi del sesso, mentre, con rare eccezioni, con un numero anormale di autosomi generalmente muoiano. Quando la lyonizzazione si verifica in cellule con cromosomi X soprannumerari, tutti tranne uno si inattivano producendo corpi di Barr; tale meccanismo non esiste per gli autosomi soprannumerari. Una formula generale che indichi il numero dei corpi di Barr è il numero dei cromosomi X meno uno. La Tabella 12.3 elenca il numero di corpi di Barr associato alle diverse aneuploidie dei cromosomi sessuali nell’uomo. Gli eventi molecolari coinvolti nell’inattivazione del cromosoma X saranno discussi nel Capitolo 19. La determinazione del sesso in Drosophila e Caenorhabditis Nel moscerino della frutta Drosophila melanogaster e nel nematode Caenorhabditis elegans (C. elegans) il sesso è determinato dal rapporto tra il numero di cromosomi X e il numero delle serie di autosomi. In questo sistema di bilanciamento tra cromosomi X e autosomi, il cromosoma Y (se presente) non ha nessun effet-

316

Capitolo 12

to sulla determinazione del sesso. Quando c’è il cromosoma Y, questo potrebbe essere necessario per la fertilità maschile. In Drosophila il sesso omogametico è la femmina (XX) e quello eterogametico è il maschio (XY). Che il cromosoma Y non determini il sesso si capisce dal fatto che un moscerino XXY è femmina e uno X0 è maschio. La Tabella 12.3 presenta alcuni assetti cromosomici e il risultante sesso dei moscerini per illustrare la relazione tra il sesso e il rapporto tra cromosomi X e corredi autosomici. Una femmina normale ha due cromosomi X e due assetti di autosomi; il rapporto X:A è 1,00. Un maschio normale ha un rapporto di 0,5. Se il rapporto X:A è maggiore o uguale a 1, il moscerino è femmina; se il rapporto è minore o uguale a 0,5, è maschio. Se il rapporto è compreso tra 0,5 e 1,0, il moscerino non è né maschio né femmina: è un intersesso. L’aspetto dei moscerini intersesso è variabile, in generale con presenza contemporanea di attributi maschili e femminili negli organi sessuali interni e nei genitali esterni. Questi moscerini sono sterili. Alcuni dettagli molecolari della complicata cascata di eventi regolatori alla base di questo sistema di determinazione del sesso in Drosophila sono presentati nel Capitolo 19. Anche in Drosophila avviene la compensazione di dose per i geni legati all’X, ma con modalità diversa rispetto ai mammiferi. Nei maschi il livello di trascrizione dei geni legati al cromosoma X è più elevato che nelle femmine, in modo da equilibrare i livelli di espressione dei due cromosomi X femminili. In C. elegans ci sono due tipi sessuali: gli ermafroditi e i maschi. Geneticamente, gli ermafroditi sono XX e i maschi sono X0, relativamente ai cromosomi del sesso; entrambi hanno cinque coppie di autosomi. Vale a dire che un rapporto tra cromosomi X e autosomi di 1,0 produce gli ermafroditi e un rapporto di 0,5 i maschi. La maggior parte degli individui è ermafrodita, possiede cioè entrambi gli organi sessuali, un ovario e due testicoli. Gli spermatozoi sono prodotti allo stadio larvale e lo sperma viene immagazzinato mano a mano che lo sviluppo procede. Negli adulti, l’ovario produce cellule uovo, che sono fecondate mentre migrano nell’utero dagli spermatozoi tenuti da parte. In questo modo l’autofecondazione produce quasi sempre una maggioranza di ermafroditi. Tuttavia, nello 0,2% dei casi, dall’autofecondazione risultano dei maschi come esito di una non-disgiunzione. Questi maschi possono fecondare gli ermafroditi, se avviene l’accoppiamento; tali unioni producono circa un ugual numero di ermafroditi e di maschi, dato che lo sperma dei maschi ha un vantaggio competitivo sullo sperma conservato nell’ermafrodita. La compensazione di dose per i geni legati all’X in C. elegans avviene mediante un altro meccanismo. In questo caso, vengono trascritti geni da entrambi i cromosomi X nell’ermafrodita XX, ma il tasso di trascrizione dei

Tabella 12.4 Teoria del bilanciamento nella determinazione del sesso in Drosophila melanogaster Assetto dei cromosomi del sesso

Assetto degli autosomi (A)

Rapportoa X:A

Sesso dei moscerini

XX

AA

1,00



XY

AA

0,50



XXX

AA

1,50

Metafemmina (sterile)♀

XXY

AA

1,00



XXX

AAAA

0,75

Intersesso (sterile)

XX

AAA

0,67

Intersesso (sterile)

X

AA

0,50

♂ (sterile)

a

Se il rapporto cromosomi X:autosomi è maggiore o uguale a 1,00 (X:A ≥ 1,00), il moscerino è una femmina. Se il rapporto cromosomi X : autosomi è minore o uguale a 0,50 (X : A ≤ 0,50), il moscerino è un maschio. Tra questi due rapporti, il moscerino è un intersesso.

geni legati a ciascun cromosoma è la metà di quello dei geni legati al singolo cromosoma X nel maschio X0. I cromosomi del sesso in altri organismi In uccelli, farfalle, falene e alcuni pesci, la situazione dei cromosomi del sesso è l’opposto di quella dei mammiferi. Il maschio è il sesso omogametico e la femmina quello eterogametico. Per non generare confusione con la convenzione dei cromosomi X e Y, i cromosomi del sesso in questi organismi sono designati Z e W: quindi i maschi sono ZZ e le femmine ZW. I geni sul cromosoma Z si comportano come i geni legati all’X, ma l’emizigosi si osserva solo nelle femmine. Tutte le figlie di un maschio omozigote per un gene recessivo legato allo Z manifestano il carattere recessivo. È interessante osservare che l’analisi della localizzazione dei geni sui cromosomi del sesso ha mostrato che i cromosomi W e Z degli uccelli sono molto diversi dai cromosomi X e Y dei mammiferi. I geni legati ai cromosomi X e Y dei mammiferi in genere si trovano sui cromosomi 1 e 4 degli uccelli, mentre i geni legati ai cromosomi W e Z si trovano sui cromosomi 5 e 9 dei mammiferi. L’interpretazione di ciò è che i cromosomi del sesso dei mammiferi e degli uccelli si siano evoluti da diverse coppie di autosomi. Le piante presentano una grande varietà di situazioni relative agli organi sessuali. Alcune specie (il ginkgo, per esempio) hanno piante a sessi separati, con le piante maschili che hanno fiori che contengono solo stami e le piante femminili fiori che contengono solo pistilli. Queste specie sono chiamate dioiche (dal greco “due case”). Altre specie hanno sia gli organi sessuali maschili sia quelli femminili sulla stessa pianta; tali piante sono dette

Le basi cromosomiche dell’ereditarietà

monoiche (“una casa”). Se entrambi gli organi sessuali sono nello stesso fiore, come nella rosa e nel ranuncolo, esso viene definito fiore perfetto. Se gli organi sessuali stanno in fiori diversi della stessa pianta, come per esempio nel mais, il fiore è detto fiore imperfetto. Alcune piante dioiche hanno cromosomi del sesso diversi nei due sessi e una grande percentuale di queste piante ha un sistema X-Y. Tali piante hanno un sistema di determinazione del sesso basato sul bilanciamento cromosoma X-autosomi, simile a quello di Drosophila. D’altra parte, nelle piante dioiche si osservano molti altri sistemi di determinazione del sesso.

Determinazione genica del sesso Molte altre specie eucariote, in particolare i microrganismi eucarioti, non hanno cromosomi del sesso, ma la determinazione del sesso si basa su un sistema genico. In questo sistema i sessi sono determinati da semplici differenze alleliche a livello di uno o di un piccolo numero di loci. Per esempio, il lievito Saccharomyces cerevisiae è un eucariote aploide con due “sessi” a e α definiti tipi sessuali. I tipi sessuali sono morfologicamente indistinguibili, ma gli incroci possono avvenire solo tra individui di tipo sessuale opposto. Questi tipi sessuali sono determinati rispettivamente dagli alleli MATa e MATα di un singolo gene.

Nota chiave Molti organismi eucariotici hanno cromosomi sessuali presenti in forma diversa nei due sessi; nell’uomo e in molti altri mammiferi il maschio è XY e la femmina XX. In altri eucarioti il maschio è ZZ e la femmina ZW. In molti casi la determinazione del sesso dipende dai cromosomi sessuali. Per l’uomo e molti altri mammiferi, per esempio, la presenza del cromosoma Y determina la mascolinità e la sua assenza è alla base della femminilità. Drosophila e Caenorhabditis hanno un sistema di determinazione del sesso che consiste in un bilanciamento tra cromosomi X e autosomi: il sesso dell’individuo dipende dal rapporto tra il numero di cromosomi X e il numero di assetti di autosomi. Negli eucarioti sono noti parecchi altri sistemi di determinazione del sesso, quali i sistemi genici, presenti in particolare negli eucarioti inferiori.

L’analisi dei caratteri legati al sesso nell’uomo Nel Capitolo 11 è stata introdotta l’analisi dei caratteri recessivi e dominanti nell’uomo; quei caratteri non erano legati al sesso, ma erano determinati da alleli localizzati

317

sugli autosomi. In questo paragrafo saranno discussi degli esempi di analisi di caratteri legati al cromosoma X e al cromosoma Y nell’uomo. Per l’analisi di tutti gli alberi genealogici, sia per un carattere autosomico, sia per uno legato al sesso, raccogliere dati affidabili è un lavoro difficile. Per esempio, in molti casi i ricercatori si devono basare sui ricordi della famiglia. Inoltre, possono non esserci abbastanza individui affetti da permettere una determinazione senza ambiguità del meccanismo di ereditarietà in questione, soprattutto se il carattere è raro e la famiglia è piccola. Inoltre, il grado di espressione di un carattere può variare, quindi alcuni individui possono essere erroneamente classificati come normali. Infine, poiché lo stesso fenotipo mutato può essere determinato da mutazioni in più di un gene, è possibile che alberi familiari diversi possano, del tutto correttamente, suggerire meccanismi differenti di ereditarietà per lo “stesso” carattere.

Attività Andate alla iAttività It runs in the family (Vizio di famiglia) nel sito dedicato agli studenti e assumete il ruolo di consulente genetico che aiuta una coppia a determinare se la sordità possa essere trasmessa ai propri figli.

Ereditarietà recessiva legata al cromosoma X Un carattere dovuto a un allele mutato recessivo portato dal cromosoma X è definito un carattere recessivo legato all’X. Sono noti almeno 100 caratteri dell’uomo, per i quali la trasmissione è stata attribuita al cromosoma X. La maggioranza di questi caratteri riguarda alleli recessivi. Il carattere recessivo legato all’X più noto è quello dell’emofilia A (OMIM 306700), che è stata riscontrata, nell’esempio più famoso, nella famiglia della Regina Vittoria di Gran Bretagna (Figura 12.26). L’emofilia è una grave patologia, nella quale il sangue manca di un fattore della coagulazione, cosicché una ferita o anche una contusione possono essere fatali. Analizzando l’albero familiare della Regina Vittoria, si osserva il primo caso di emofilia in uno dei suoi figli maschi. Dato che ha trasmesso l’allele mutato solo ad alcuni dei suoi figli (gli altri maschi sono sani e solo alcune femmine sono portatrici), la Regina stessa era portatrice (eterozigote). Gli scienziati ritengono che la mutazione sia insorta in un cromosoma X nelle cellule germinali di uno dei suoi genitori. Per i caratteri recessivi legati all’X, le femmine che manifestano il carattere mutato devono essere omozigoti per l’allele recessivo. Il carattere si esprime nei maschi che possiedono una sola copia dell’allele mutato sul cromosoma X. Quindi, i maschi affetti trasmettono l’allele mutato a tutte le figlie femmine e a nessuno dei figli ma-

MyLab

318

Capitolo 12

Figura 12.26 Ereditarietà recessiva legata al cromosoma X. (a) Ritratto della Regina Vittoria da giovane. (b) Albero genealogico della Regina Vittoria (III-2) e dei suoi discendenti, che illustra la trasmissione dell’emofilia. (Si faccia riferimento alla Figura 11.16, per una spiegazione dei simboli usati negli alberi genealogici. In quello qui rappresentato i partner di un matrimonio, normali relativamente al carattere, sono stati tralasciati per risparmiare spazio.) Dato che la Regina Vittoria era eterozigote per l’allele recessivo dell’emofilia legato al sesso e non vi erano casi fra i suoi antenati, il carattere può essere insorto per mutazione in una delle cellule germinali (le cellule che danno origine ai gameti) dei suoi genitori.

a) La Regina Vittoria

b) Albero genealogico della Regina Vittoria Generazione: I

Louis II Grand Duke of Hesse

George III …

II

… Edward Duke of Kent (1767–1820)

Duke of Saxe-Coburg-Gotha

III

Albert Victoria Empress Frederick

IV

Kaiser Wilhelm II

V

Victoria (1819–1901)

Edward VII

Irene Princess Henry

George V

Frederick William

Alix Tsarina Nikolas II

Waldemar

VI

VII

Duke of Windsor Elizabeth II

George VI Prince Philip

Margaret

Earl Mountbatten of Burma

Henry Prince Sigismund of Prussia

VIII Diana Charles Anne

Leopold Duke of Albany

Helena Princess Christian

Alice of Hesse

Andrew Edward

3

3

2

Lady May ? Abel Smith

Alexis Anastasia

?

?

Beatrice

Alice of Athlone

Victoria Eugenie, Leopold wife of Maurice Alfonso XIII ?

Rupert Viscount Trematon

? Gonzalo

Alfonso

Sophie ?

?

?

?

? Juan Carlos

?

?

IX William

Kate

Harry

X George

schi. L’osservazione in un albero familiare della trasmissione di un carattere padre-figlio maschio tende a far escludere un’ereditarietà recessiva legata all’X. Altre caratteristiche della trasmissione recessiva legata al cromosoma X sono le seguenti (si faccia riferimento alla Figura 12.26). 1. Per gli alleli mutati recessivi legati al cromosoma X, molti più maschi che femmine dovrebbero manifestare il carattere (nei maschi è sufficiente un solo cromosoma X con l’allele mutato per essere malati). 2. Tutti i figli maschi di una madre affetta (omozigote per l’allele mutato) dovrebbero manifestare il carattere, dato che i maschi ricevono il loro unico cromosoma X dalla madre. 3. Nei figli maschi di madri eterozigoti (portatrici) si dovrebbe osservare approssimativamente un rapporto 1:1 tra individui normali e individui che manifestano il carattere; infatti, a+/a × a+/Y dà maschi metà a+/Y e metà a/Y. 4. Da un incrocio tra una femmina portatrice e un maschio normale nascono femmine fenotipicamente normali, di cui la metà è portatrice. Infatti, a+/a × a+/Y dà figlie femmine per metà a+/a+ e per metà a+/a. A sua volta, metà dei figli maschi di queste femmine portatrici manifesterà il carattere.

Femmina portatrice Maschio emofiliaco

?

? Stato incerto 3 Tre femmine ecc.

5. Un maschio che manifesta il carattere, coniugato a una femmina normale omozigote, avrà figli (maschi e femmine) normali; tutte le femmine, tuttavia, saranno portatrici. Vale a dire, l’incrocio a+/a+ × a/Y dà femmine a+/a e maschi a+/Y (normali). Altri esempi di caratteri recessivi legati all’X nell’uomo sono la distrofia muscolare di Duchenne (degenerazione progressiva dei muscoli con riduzione della durata della vita) e due forme di daltonismo.

Ereditarietà dominante legata al cromosoma X Un carattere determinato da un allele mutato dominante localizzato sul cromosoma X è definito un carattere dominante legato al cromosoma X. Solo pochi di questi caratteri sono stati identificati. Un esempio di carattere dominante legato al cromosoma X è quello che determina uno smalto dei denti difettoso con conseguente scolorimento dei denti (ipoplasia ereditaria dello smalto, OMIM 130900; Figura 12.27a). Nell’albero genealogico (Figura 12.27b) tutte le figlie femmine, ma nessun figlio maschio, di un padre affetto (III-1) sono affette, e le madri eterozigoti (IV-3) trasmettono il carattere a metà dei figli maschi e a metà

Le basi cromosomiche dell’ereditarietà a) Carattere dominante legato al cromosoma X che determina lo smalto difettoso

Generazione: 1

I

II

III

b) Albero genealogico di una famiglia con lo smalto difettoso Generazione: I

1

II

1

1

? 2

3

IV 1

3 4

2

5

6

7

8

9 10 11

V 1

2

3

4

5

6

1

2

2

3

5

4

1

2

Figura 12.28 Albero genealogico che mostra l’ereditarietà di un carattere legato al cromosoma Y.

Ereditarietà legata al cromosoma Y

?

III

319

7 8

Figura 12.27 Ereditarietà dominante legata al cromosoma X. L’albero genealogico nella parte (b) mostra una convenzione per abbreviare, che tralascia i genitori che non manifestano il carattere. Quindi è sottinteso che la femmina della generazione I era coniugata con un maschio che non manifestava il carattere.

delle figlie femmine. Altri caratteri dominanti legati al cromosoma X sono le punte palmate delle dita dei piedi in una famiglia del South Dakota (studiata negli anni trenta del secolo scorso) e una grave anomalia emorragica chiamata trombopatia costituzionale. In questo secondo caso (anch’esso studiato negli anni trenta del secolo scorso), l’emorragia non è causata dall’assenza di un fattore della coagulazione (come nell’emofilia), ma piuttosto da un’interferenza con la formazione delle piastrine del sangue, necessarie alla coagulazione. Le stesse regole di trasmissione dei caratteri recessivi valgono per quelli dominanti legati al cromosoma X, con l’eccezione che le femmine eterozigoti manifestano il carattere. In generale, poiché le femmine hanno un numero doppio di cromosomi X rispetto ai maschi, i caratteri dominanti legati al cromosoma X sono più frequenti nelle femmine che nei maschi. Tuttavia, i caratteri dominanti legati al cromosoma X tendono a essere meno gravi nella femmina che nel maschio (per il meccanismo di inattivazione dell’X la femmina eterozigote può esprimere l’allele selvatico in alcuni tessuti). Se il carattere è raro, le femmine che lo manifestano sono probabilmente eterozigoti. Queste femmine trasmettono il carattere a 1/2 della loro progenie maschile e a 1/2 della loro progenie femminile. Maschi che manifestino un carattere dominante legato al cromosoma X trasmettono il carattere a tutte le figlie femmine e a nessuno dei figli maschi.

Un carattere dovuto a un gene mutato localizzato sul cromosoma Y, senza controparte sul cromosoma X, è definito carattere legato all’Y ovvero olandrico (“interamente maschile”). Questi caratteri sono generalmente più facilmente riconoscibili, in quanto tutti i figli maschi (e nessuna femmina) di un padre affetto dovrebbero manifestare il carattere. (Un esempio di trasmissione di un carattere legato al cromosoma Y è mostrato in Figura 12.28). Sono stati ipotizzati diversi caratteri con trasmissione legata al cromosoma Y. Nella maggior parte dei casi le prove genetiche di tale trasmissione sono scarse o nulle. Un possibile esempio di ereditarietà legata all’Y è il carattere orecchio peloso (OMIM 425500), in conseguenza del quale peli tipo setole di lunghezza anormale fuoriescono dalle orecchie. Questo carattere è frequente in alcune zone dell’India e in alcune altre popolazioni. Anche se questo carattere mostra una trasmissione padre-figlio maschio, è probabile che si tratti di un fenotipo complesso. Inoltre, molti degli alberi familiari raccolti possono essere interpretati in modo diverso, per esempio in termini di trasmissione autosomica. Il carattere potrebbe anche essere il risultato dell’interazione di un gene con l’ormone maschile testosterone, noto per essere la causa della comparsa di peli sulla faccia e sul petto.

Nota chiave L’analisi dell’ereditarietà dei geni nell’uomo si basa sull’analisi degli alberi genealogici, che consiste in uno studio accurato, esteso a parecchie generazioni, dei dati fenotipici della famiglia. I dati ottenuti dall’analisi degli alberi familiari consentono ai genetisti di determinare, a vari livelli di affidabilità, se un gene mutato è ereditato come allele autosomico recessivo, autosomico dominante, recessivo legato al cromosoma X, dominante legato al cromosoma X o legato al cromosoma Y.

320

Capitolo 12

Sommario l Le cellule eucariote diploidi hanno due serie aploidi di cromosomi, una per genitore. Ogni membro di una coppia cromosomica è detto cromosoma omologo. La serie completa di cromosomi nella cellula eucariote è chiamata cariotipo. l La mitosi è il processo di divisione nucleare nelle cellule eucariote indicato da M nel ciclo cellulare (che è costituito dalle fasi G1,S, G2 e M). La mitosi comprende un ciclo di replicazione del DNA seguita da un ciclo di divisione nucleare (accompagnata spesso da divisione cellulare). La mitosi determina la formazione di nuclei figli che hanno lo stesso numero di cromosomi e che sono geneticamente identici l’uno all’altro e al nucleo dal quale derivano. l La meiosi avviene in tutti gli eucarioti a riproduzione sessuata. Una cellula diploide specializzata (o il nucleo di una cellula) con due serie aploidi di cromosomi dà origine, attraverso un ciclo di replicazione del DNA e due cicli di divisione nucleare, a quattro nuclei aploidi (spesso in quattro cellule), ognuno con una sola serie cromosomica. l La meiosi genera variabilità genetica attraverso il processo di rimescolamento dei cromosomi materni e paterni nei nuclei figli e attraverso il crossing-over tra i membri di una coppia di cromosomi omologhi. l La teoria cromosomica dell’ereditarietà afferma che i geni sono localizzati sui cromosomi. La prova a favore della teoria cromosomica dell’ereditarietà è derivata da esperimenti

l

l

l

l

che hanno messo in relazione il comportamento di alcuni geni con la trasmissione dei cromosomi del sesso di generazione in generazione. Negli eucarioti con i sessi separati, il cromosoma del sesso è un cromosoma o un gruppo di cromosomi che sono rappresentati diversamente nei due sessi. Negli organismi che possiedono i cromosomi sessuali, un sesso è omogametico e l’altro è eterogametico. Il legame con il sesso è l’associazione fisica dei geni con i cromosomi sessuali negli eucarioti. Questi geni sono detti geni legati al sesso. I geni sul cromosoma sessuale X sono chiamati geni legati all’X, e i geni sul cromosoma sessuale Y sono chiamati geni legati all’Y. In molti organismi eucariotici, la determinazione del sesso è correlata ai cromosomi sessuali. Nell’uomo e in altri mammiferi, per esempio, la presenza del cromosoma Y specifica la mascolinità e la sua assenza determina la femminilità. Si conoscono anche altri meccanismi di determinazione del sesso negli eucarioti. Nell’uomo, l’allele responsabile di un carattere può essere ereditato in uno tra cinque modi principali: autosomico recessivo, autosomico dominante, recessivo legato al cromosoma X, dominante legato al cromosoma X o legato al cromosoma Y. Come per i caratteri autosomici, i caratteri legati al sesso sono studiati nell’uomo analizzando gli alberi genealogici.

Approccio analitico alla soluzione di problemi di genetica I concetti introdotti in questo capitolo possono essere approfonditi mediante la soluzione di problemi di genetica simili a quelli introdotti nel Capitolo 11. Quando si ha a che fare con l’eredità associata al sesso, bisogna ricordare che un sesso ha due cromosomi diversi, mentre l’altro sesso ne ha un solo tipo; questo fatto altera lievemente le modalità di ereditarietà. D12.1 Una femmina appartenente a una linea pura di Drosophila con occhi color vermiglio è incrociata con un maschio di una linea pura selvatica con occhi rossi. Nella F1 tutti i maschi hanno occhi vermigli e tutte le femmine occhi rossi. Quali conclusioni potete trarre sul meccanismo di ereditarietà del carattere occhio vermiglio e come potete verificarle? R12.1 L’osservazione è quella tipica che suggerisce che si tratti di un carattere legato al sesso. Dato che nella F1 nessuna delle figlie femmine manifesta il carattere e tutti i maschi lo manifestano, il carattere è probabilmente recessivo legato al cromosoma X. I risultati sono in accordo con questa ipotesi, poiché i maschi della F1 ricevono il cromosoma X con il gene v dalla madre omozigote v/v. Inoltre le femmine della F1 sono v+/v, dato che ricevono un cromosoma X con v+ dal padre selvatico e un cromosoma X con v dalla madre. Se il carattere fosse stato autosomico recessivo, tutti i moscerini della F1 avrebbero avuto gli occhi rossi (selvatici). Se fosse stato auto-

somico dominante, sia i maschi sia le femmine in F1 avrebbero avuto gli occhi vermigli. Se fosse stato un carattere dominante legato al cromosoma X tutti i moscerini avrebbero avuto occhi vermigli. Il modo più facile per verificare quest’ipotesi è lasciar incrociare tra loro i moscerini della F1. Quest’incrocio è v+/v ♀ × v/Y ♂ e nella F2 è atteso un rapporto 1:1 di occhi rossi : occhi vermigli in entrambi i sessi. Infatti metà delle femmine sarà v+/v e metà v/v; metà dei maschi sarà v+/Y e metà v/Y. Questo non è certamente il rapporto 3:1 che si otterrebbe da un incrocio F1 × F1 per un gene autosomico. D12.2 Nell’uomo, l’emofilia è causata da un gene recessivo legato al cromosoma X. Una donna normale ha il padre emofiliaco. Sposa un uomo normale e pianifica di avere dei figli. Calcolate la probabilità di emofilia nei figli e nelle figlie. R12.2 Poiché l’emofilia è un carattere legato al cromosoma X, e dato che suo padre era emofiliaco, la donna deve essere eterozigote per questo allele recessivo. Se assegniamo il simbolo h a questa mutazione recessiva e h+ all’allele selvatico (non emofiliaco), la donna deve essere h+/h. Suo marito è normale per quanto riguarda la coagulazione, quindi deve essere emizigote h+ vale a dire h+/Y. Tutte le loro figlie ricevono un cromosoma X dal padre, perciò ognuna deve avere un gene h+. Infat-

Le basi cromosomiche dell’ereditarietà ti, metà delle figlie è h+/h+ e l’altra metà è h+/h. Dato che l’allele selvatico è dominante, nessuna delle figlie è emofiliaca. D’altra parte, tutti i figli maschi ricevono il cromosoma X dalla madre. Perciò hanno una probabilità di 1/2 di ricevere il cromosoma con l’allele h, e quindi di essere emofiliaci. Perciò la probabilità dell’emofilia per le figlie nate da questo matrimonio è 0 e per i figli è 1/2. D12.3 I triboli sono animali ipotetici che hanno un meccanismo X-Y di determinazione del sesso, come l’uomo. Il carattere colore chiazzato (b), con macchie pigmentate, è legato all’X e recessivo rispetto a colore uniforme (b+); il carattere colore chiaro (l) è autosomico e recessivo rispetto a colore scuro (l+). Se si realizzano incroci reciproci tra triboli di una linea pura di colore chiazzato e chiaro e triboli di una linea pura di colore uniforme e scuro, vi aspettate un rapporto 9:3:3:1 nella F2 di entrambi gli incroci o di uno dei due? Spiegate la vostra risposta. R12.3 Questa domanda mette a fuoco le basi della segregazione del cromosoma X e degli autosomi in un incrocio e verifica se avete assimilato i principi della segregazione dei geni. La Figura 12.A schematizza i due incroci coinvolti e la risposta può essere discussa facendovi riferimento. Consideriamo anzitutto l’incrocio di una femmina selvatica (b+/b+, l+/l+) con un maschio doppio mutante (b/Y, l/l). La parte a della figura schematizza questo incrocio. La progenie F1 è

¥

a) Uniforme, scuro (selvatico) chiazzato, chiaro

Generazione P

¥

b+/b+ l +/l + (uniforme, scuro)

b / Y l /l (chiazzato, chiaro)

b /b l /l (chiazzato, chiaro)

¥

b+/b l +/l (uniforme, scuro)

b+/b l +/l (uniforme, scuro)

b+/ Y l +/l (uniforme, scuro)

Generazione F2

l + (l +/l + e l +/l; scuro) 1/ l (l / l; chiaro) 4 3/ l + (scuro) 4 1/ l (chiaro) 4 3/

b+(b+/ Y; uniforme)

3/

b (b / Y; chiazzato)

1/

4

4

l + (scuro)

4

l (chiaro)

Totale

1/ 4

b+(b+/ b+; uniforme)

1/ 4

b (b / b ; chiazzato)

1/ 4

b+ (b+/ Y; uniforme)

1/ 4

b (b / Y; chiazzato)

l +(l +/l + e l +/l; scuro) l (l /l ; chiaro) 3/ l + (scuro) 4 1/ l (chiaro) 4 3/ 1/

4 4

l + (scuro) l (chiaro) 3/ l + (scuro) 4 1/ l (chiaro) 4 3/ 1/

4 4

Rapporti fenotipici:

Rapporti fenotipici:

Figura 12.A

b / Y l +/l (chiazzato, scuro)

Risultati genotipici:

b+(1/2 b+/b+ 1/2 b+/b; uniforme)

Uniforme scuro

¥

Fenotipi e genotipi autosomici

Fenotipi e genotipi legati al sesso

Risultati genotipici:

1/ 4

b+/ Y l +/l + (uniforme, scuro)

Generazione F2 Fenotipi e genotipi autosomici

Fenotipi e genotipi legati al sesso

1/ 4

¥

Generazione F1

Generazione F1

1/ 2

tutta normale con corpo di colore uniforme e chiaro dato che per il carattere autosomico entrambi i sessi sono eterozigoti, e per il carattere legato all’X la femmina è eterozigote e il maschio emizigote per l’allele b+ ricevuto dalla madre normale. Per analizzare la progenie F2, l’approccio migliore è considerare separatamente il carattere legato all’X e quello autosomico. Per il carattere legato all’X, la combinazione casuale dei gameti prodotti dà nella progenie un rapporto genotipico di 1 b+/b+ (femmina di colore uniforme) : 1 b+/b (femmina di colore uniforme) : 1 b+/Y (maschio di colore uniforme) : 1 b/Y (maschio chiazzato). Raggruppando i fenotipi, vediamo che 1/2 della progenie è costituito da femmine di colore uniforme, 1/4 da maschi di colore uniforme e 1/4 da maschi chiazzati. Per il carattere autosomico, F1 × F1 è un incrocio tra due eterozigoti, quindi ci aspettiamo in F2 un rapporto di 3 triboli di colore scuro : 1 tribolo di colore chiaro. Dato che la segregazione degli autosomi è indipendente dalla trasmissione del cromosoma X, per calcolare le frequenze relative moltiplichiamo le probabilità di comparsa del carattere legato al sesso e di quello autosomico. I calcoli sono riportati in basso nella parte a della figura. Il primo incrocio, quindi, presenta nella F2 un rapporto di 9:3:3:1 tra i quattro possibili fenotipi. D’altra parte, si noti che il rapporto in ogni sesso non è 9:3:3:1, a causa della modalità di trasmissione del cromosoma X. Questo risultato è nettamente in contrasto con la segregazione indipendente di due geni autosomici per i quali si osserva un rapporto 9:3:3:1 in entrambi i sessi.

b) Chiazzato, chiaro ¥ uniforme, scuro (selvatico)

Generazione P

Uniforme chiaro

Chiazzato scuro

Chiazzato chiaro

b+l + 6 3

: :

b+l 2 1

: :

b l+ 0 3

: :

bl 0 1

9

:

3

:

3

:

1

321

Uniforme scuro

Totale

Uniforme chiaro

Chiazzato scuro

Chiazzato chiaro

b+ l + 3 3

: :

b+ l 1 1

: :

b l+ 3 3

: :

bl 1 1

6

:

2

:

6

:

2

322

Capitolo 12

Il secondo incrocio (incrocio reciproco) è schematizzato nella parte b della figura. Dato che in questo incrocio la madre è omozigote per il carattere legato al sesso, tutti i maschi della F1 saranno chiazzati. I maschi e le femmine della F1 differiscono genotipicamente da quelli del primo incrocio relativamente al cromosoma del sesso, ma sono identici per quanto riguarda l’autosoma. Di nuovo, considerando per primo il cromosoma X, nella F2 troviamo un rapporto genotipico di 1 femmina di colore uniforme : 1 femmina chiazzata : 1 maschio di colore uniforme : 1 maschio chiazzato. In questo caso, allora, metà sia dei maschi sia delle femmine è di colore uniforme e metà è chiazzata, contrariamente ai risultati del primo incrocio nel quale in F2 non si osservavano femmine chiazzate. Per il carat-

tere autosomico, ci aspettiamo in F2 un rapporto 3 scuro : 1 chiaro, come prima. Mettendo insieme i due caratteri, facciamo i calcoli presentati nella parte b della figura. (Nota: usiamo qui il totale 6:2:6:2 anziché 3:1:3:1, perché la somma è 16, come per 9:3:3:1.) Quindi, in questo caso, non otteniamo un rapporto 9:3:3:1; inoltre il rapporto è lo stesso nei due sessi. Questa domanda ci ha obbligati a ragionare sulla segregazione di due tipi di cromosomi e ha dimostrato che bisogna fare attenzione nel fare previsioni sui risultati di incroci nei quali sono coinvolti i cromosomi del sesso. Tuttavia, i principi basilari dell’analisi sono uguali a quelli applicati prima: scomponete le domande nelle loro parti fondamentali e poi ricomponete il rompicapo un passo dopo l’altro.

13

Estensioni e deviazioni dai principi della genetica mendeliana

Quante forme alleliche può avere un gene?

Come si può determinare il numero dei geni coinvolti in un insieme di mutanti con lo stesso fenotipo?

In che modo i rapporti fenotipici possono essere influenzati dalla dominanza incompleta e dalla codominanza?

Come può l’interazione tra due geni modificare i rapporti mendeliani in un incrocio?

Qual è l’effetto di una mutazione in un gene essenziale per una funzione della cellula o di un organismo?

Come può un gene mascherare o modificare l’espressione fenotipica associata a un altro gene?

In che modo l’ambiente esterno e quello interno possono influenzare l’espressione genica?

Qual è il meccanismo di ereditarietà dei geni extranucleari (geni presenti nel genoma mitocondriale o nei cloroplasti)?

Che cos’è l’effetto materno?

Attività Mezzo secolo prima che Watson e Crick determinassero la struttura del DNA, Karl Landsteiner scoprì che individui diversi hanno gruppi sanguigni diversi e che questi gruppi sanguigni sono ereditari. D’altra parte l’ereditarietà dei gruppi sanguigni non segue sempre le modalità previste dalle leggi di Mendel. Risulta, infatti, che i gruppi sanguigni siano un esempio di carattere che ha una modalità di ereditarietà più complessa di quella descritta da Mendel. In questo capitolo apprenderete secondo quali modalità ha luogo la trasmissione dei gruppi sanguigni, e di altri caratteri, che rappresentano eccezioni ed estensioni dei principi di Mendel. Quindi, nella iAttività, potrete applicare le vostre conoscenze su questi profili di ereditarietà per aiutare a risolvere una controversia sulla paternità che riguarda l’attore Charlie Chaplin. In questo capitolo imparerete anche i meccanismi di ereditarietà non mendeliana dei geni extranucleari, cioè di quei geni localizzati sui cromosomi nei mitocondri e nei cloroplasti. Nella seconda iAttività potrete usare le vostre conoscenze dell’ereditarietà mendeliana e non mendeliana per studiare un’insolita malattia umana.

I principi di Mendel sono validi per tutti gli organismi eucarioti e rappresentano la base dalla quale partire per formulare previsioni sui risultati di incroci nei quali si verifichino una segregazione e un assortimento indipendente. Tuttavia, quanto più numerosi sono diventati gli

esperimenti dei genetisti, tanto più è apparso chiaro che i principi di Mendel non vi si applicano perfettamente. I caratteri legati al sesso, discussi nel capitolo precedente, sono un esempio dell’estensione dei principi mendeliani. I geni segregano, in seguito alla segregazione cromosomica, come avviene per i geni studiati da Mendel, ma i rapporti fenotipici differiscono da quelli che Mendel aveva osservato e misurato nei suoi esperimenti. In questo capitolo saranno discussi parecchi di questi casi, con lo scopo di ampliare le conoscenze sull’analisi genetica, in modo particolare relativamente alla relazione tra geni e fenotipo di un organismo. Per prima cosa, questo capitolo analizzerà l’estensione dei principi mendeliani che interessano geni singoli (alleli multipli, modificazioni delle relazioni di dominanza, geni essenziali e alleli letali, espressione genica e ambiente, effetto materno). Successivamente si discuterà dell’estensione dei principi mendeliani che coinvolgono due o più geni (determinazione del numero dei geni per mutazioni con lo stesso fenotipo, interazioni geniche e rapporti mendeliani modificati, interazione genica che coinvolge geni modificatori e geni epistatici) e si concluderà discutendo le eccezioni ai principi di Mendel che coinvolgono geni extranucleari, che si trovano nel genoma di organelli citoplasmatici.

Alleli multipli Finora, nelle nostre analisi genetiche, abbiamo parlato dei geni come se essi avessero solo due alleli: un allele

324

Capitolo 13 Tabella 13.1 Numero di genotipi degli alleli multipli

Allele selvatico (A) 5¢ ...T C T C A T A C A AGA T T CC T A CG ... 3¢ 3¢ ...AGAG T A T G T T C T A AGGA T GC ... 5¢

Alleli multipli (mutanti) del gene nella popolazione 5¢ ...T C T A A T A C A AGA T T CC T A CG ... 3¢ 3¢ ...AGA T T A T G T T C T A AGGA T GC ... 5¢

a1

5¢ ...T C T C A T AGA AGA T T CC T A CG ... 3¢ 3¢ ...AGAG T A T C T T C T A AGGA T GC ... 5¢

a2

5¢ ...T C T C A T A C A AGA T T CC T GCG ... 3¢ 3¢ ...AGAG T A T G T T C T A AGGA CGC ... 5¢

a3

Sito di mutazione

Figura 13.1 Illustrazione del concetto di alleli multipli di un gene. Viene mostrato un corto segmento teorico di DNA di un gene per l’allele selvatico A e tre alleli mutanti nella popolazione a1, a2 e a3, ognuno dei quali ha una coppia di basi diversa rispetto all’allele selvatico. (Si noti che su ciascun cromosoma è sempre presente solo una di queste forme alleliche.)

normale e uno mutante. Un esempio è costituito dal seme liscio e dal seme rugoso dei piselli. In una popolazione di individui, d’altra parte, un dato gene può avere parecchi alleli (spesso uno selvatico e gli altri mutati), non solo due. Si dice, in tal caso, che esistono alleli multipli di tale gene e che gli alleli costituiscono una serie allelica multipla. A livello molecolare gli alleli multipli rappresentano forme diverse della sequenza del DNA di un gene; la Figura 13.1 illustra tale concetto con un breve segmento di DNA teorico. Benché di un gene possano esistere molti alleli in una data popolazione di individui, un singolo individuo diploide può possedere al massimo due di questi alleli, uno su ciascuno dei due cromosomi omologhi sui quali è localizzato il locus genico. Il numero dei genotipi possibili nelle serie di alleli multipli dipende dal numero degli alleli coinvolti (Tabella 13.1). Con un allele è possibile un solo fenotipo (come A). Con due alleli sono possibili tre genotipi, cioè due omozigoti e un eterozigote (per esempio, AA, aa e Aa). La formula generale per n alleli è n(n + 1)/2 genotipi possibili, dove n sono omozigoti e n(n – 1)/2 eterozigoti. Per i quattro alleli (uno selvatico e tre mutanti) della Figura 13.1 ci sono 10 possibili genotipi.

Numero di alleli

Genotipi

Omozigoti

Eterozigoti

1 2 3 4 5 n

1 3 6 10 15 n(n + 1)/2

1 2 3 4 5 n

0 1 3 6 10 n(n – 1)/2

I componenti di una serie allelica multipla possono avere gli uni con gli altri differenti relazioni di dominanza. Per esempio, il colore della pelliccia dei conigli è determinato da un singolo gene del quale si conoscono quattro differenti alleli: C, cch, ch e c. Questo gene produce la tirosinasi, enzima attivo nella via biochimica della sintesi della melanina (che conferisce il colore della pelliccia nei mammiferi e della pelle nell’uomo). L’allele C è dominante su tutti gli altri mentre c è sempre recessivo; l’allele cch è dominante su ch. Differenti combinazioni dei quattro alleli producono quattro tipi di pelliccia: il tipo selvatico (C/C, C/cch, C/ch, C/c), il cincillà (cch/cch, cch/ch o cch/c), l’himalaiano (ch/ch o ch/c) e l’albino (c/c). I rapporti di dominanza risultano quindi C > cch > ch > c (Figura 13.2).

I gruppi sanguigni AB0

Un esempio di alleli multipli di un gene è costituito dal sistema del gruppo sanguigno AB0 dell’uomo, che è stato scoperto da Karl Landsteiner all’inizio del secolo scorso. Per la sua scoperta dei gruppi sanguigni umani gli fu assegnato il Premio Nobel per la Fisiologia o Medicina nel 1930. Dato che esiste incompatibilità tra alcuni gruppi sanguigni AB0, questi alleli rivestono particolare rilevanza quando vengono effettuate trasfusioni di sangue. (Esistono, oltre al sistema AB0, molte altre serie di gruppi sanguigni, che a loro volta possono causare problemi nelle trasfusioni di sangue.) 0, A, B e AB sono i quattro fenotipi del sangue nel sistema AB0. Diverse combinazioni dei tre alleli del sistema AB0 IA, IB e i determinano i quattro fenotipi (Tabella 13.2). Le persone di gruppo sanguigno 0 sono omozigoti per l’allele recessivo i. Sia IA sia IB sono dominanti su i. Gli individui di gruppo A sono alternativamente IA/IA o IA/i e quelli di gruppo B sono o IB/IB o IB/i. Gli individui eterozigoti IA/IB appartengono al gruppo AB, vale a dire che manifestano entrambi i gruppi sanguigni A e B contemporaneamente (si veda la discussione sulla coFigura 13.2 Serie allelica per la determinazione del colore della pelliccia dei conigli. dominanza in questo capitolo).

Estensioni e deviazioni dai principi della genetica mendeliana Tabella 13.2 Gruppi sanguigni AB0 nell’uomo, determinati dagli alleli Fenotipo (gruppo sanguigno) 0 A B AB

I A, I B

ei

Genotipo i/i I A/I A o I A/i I B/I B o I B/i I A/I B

La genetica di questo sistema segue i principi di Mendel. Un individuo di gruppo 0, per esempio, deve avere genotipo i/i. Quindi ognuno dei suoi genitori deve essere alternativamente omozigote i o eterozigote con i come uno dei due alleli. Quindi, entrambi i genitori potrebbero essere 0 (i/i × i/i), o entrambi A (IA/i × IA/i che determina 1/4 della progenie i/i) o entrambi B (IB/i × IB/i), ovvero uno potrebbe essere A e uno B (IA/i × IB/i); alternativamente, uno dei due genitori dovrebbe essere 0 (i/i) e l’altro un eterozigote A (IA/i) o B (IB/i). La tipizzazione sanguigna (la determinazione del gruppo sanguigno di un individuo) e l’analisi dell’ereditarietà dei gruppi vengono usate talvolta nei casi di controversa paternità o maternità. In tali casi l’analisi genetica sulla base del gruppo sanguigno può solo essere usata per dimostrare che un individuo non è il genitore di un dato bambino, ma non prova che l’individuo ne è il genitore. Per esempio, un bambino di fenotipo AB (genotipo IA/IB) non potrebbe essere il figlio di un genitore di gruppo 0 (genotipo i/i). (Secondo le leggi della maggior parte degli Stati, i dati relativi ai gruppi sanguigni da soli non sono generalmente sufficienti per una decisione legale sulla paternità o maternità. Per questo sono tipicamente richiesti i risultati più precisi che derivano dal DNA fingerprinting, discusso nel Capitolo 10.) In caso di trasfusioni di sangue bisogna confrontare attentamente i gruppi sanguigni dei donatori e dei riceventi, dato che gli alleli che determinano il gruppo sanguigno specificano gruppi molecolari, chiamati antigeni cellulari, che si trovano sulla superficie esterna dei globuli rossi. Un antigene (una sostanza che genera un anticorpo) è una qualsiasi molecola che, riconosciuta come estranea da un organismo, stimola la produzione di specifiche molecole proteiche chiamate anticorpi, che si legano all’antigene. Un anticorpo è una molecola proteica che riconosce e lega la sostanza estranea (antigene) e che viene prodotta dall’organismo come parte della risposta immunitaria idonea a eliminare l’antigene dal corpo. Ogni determinato individuo possiede su cellule e tessuti un gran numero di antigeni, molti dei quali sono dei corpi estranei per un altro individuo; da qui la necessità di porre attenzione al gruppo sanguigno nelle trasfusioni e al tipo di tessuto nei trapianti d’organo. Con l’eccezione delle malattie autoimmuni, gli antigeni propri (self) non vengono generalmente riconosciuti come estranei dall’individuo che li produce.

325

L’allele IA del sistema AB0 codifica per un prodotto necessario per la biosintesi dell’antigene A, ma che non è coinvolto nella biosintesi dell’antigene B. Individui di gruppo sanguigno A (genotipo IA/IA o IA/i) possiedono solo l’antigene A sui loro globuli rossi, e quindi l’antigene B per loro è estraneo. Nel loro siero vi sono anticorpi contro l’antigene B (detti anticorpi anti-B), ma nessun anticorpo contro l’antigene A. Gli anticorpi contro l’antigene B provocheranno l’aggregazione di tutti i globuli rossi che possiedono l’antigene B. Dato che le cellule agglutinate non possono muoversi attraverso i capillari sottili, l’agglutinazione può portare all’insufficienza della funzione di alcuni organi e anche alla morte. L’allele IB del sistema AB0 codifica per un prodotto necessario per la biosintesi dell’antigene B, ma non è coinvolto nella biosintesi dell’antigene A. Quindi, gli individui che hanno il gruppo sanguigno di tipo B (genotipo IB/IB o IB/i) espongono l’antigene B sui globuli rossi e il loro siero ha naturalmente anticorpi anti-A, ma non antiB. Persone che hanno gruppo sanguigno AB (genotipo IA/IB) hanno entrambi gli antigeni A e B sui globuli rossi e nel loro siero non vi sono né anticorpi anti-A né anti-B. Infine, l’allele i codifica per prodotti non coinvolti nella biosintesi dell’antigene A e dell’antigene B. Quindi, le persone con gruppo sanguigno 0 (i/i) sui loro globuli rossi non hanno né l’antigene A né l’antigene B e il loro siero contiene sia gli anticorpi anti-A sia gli anti-B. Le relazioni antigene-anticorpo sono riassunte nella Figura 13.3. L’aggregazione (o agglutinazione) dei globuli rossi si osserva in tutti i casi in cui un anticorpo interagisce con l’antigene specifico. Quali trasfusioni sono sicure, quindi, tra individui con diverso gruppo sanguigno relativamente al sistema AB0? 1. Individui di gruppo sanguigno A producono l’antigene A, quindi il loro sangue può essere trasfuso solo a riceventi che non abbiano l’anticorpo anti-A, vale a dire a individui di gruppo A e AB. 2. Individui di gruppo sanguigno B producono l’antigene B, quindi il loro sangue può essere trasfuso solo a riceventi che non abbiano l’anticorpo anti-B, vale a dire a persone di gruppo B e AB. 3. Individui di gruppo sanguigno AB producono entrambi gli antigeni A e B, quindi il loro sangue può essere trasfuso solo a riceventi che non abbiano né l’anticorpo anti-A né l’anticorpo anti-B, vale a dire a persone di gruppo AB. 4. Individui di gruppo sanguigno 0 non producono né l’antigene A né il B, quindi il loro sangue può essere trasfuso a qualsiasi ricevente, vale a dire a persone di gruppo A, B, AB o 0. Da questa discussione deriva che le persone di gruppo AB sono riceventi universali poiché possono ricevere trasfusioni di sangue da persone di uno qualsiasi dei quat-

326

Capitolo 13

Siero del tipo di gruppo sanguigno

Anticorpi presenti nel siero

0

Anti-A Anti-B

A

Anti-B

B

Anti-A

AB



Cellule del tipo di gruppo sanguigno 0

A

B

tro gruppi sanguigni, e gli individui di gruppo 0 sono donatori universali poiché il loro sangue non scatena alcuna reazione in nessuno dei quattro gruppi sanguigni. La relazione tra gli alleli AB0 e gli antigeni sui globuli rossi è la seguente: i geni per il gruppo sanguigno AB0 codificano delle glicosiltransferasi, enzimi che aggiungono uno zucchero a un polisaccaride preesistente combinato con un lipide a formare un glicolipide (Figura 13.4). I glicolipidi si associano alle membrane dei globuli rossi a costituire gli antigeni dei gruppi sanguigni. La maggior parte degli individui produce un glicolipide chiamato antigene H. L’allele IA codifica per una glicosiltransferasi che aggiunge un tipo particolare di zucchero all’antigene H, l’␣-N-acetil-galattosamina, per produrre l’antigene A. L’allele IB codifica per una diversa glicosiltransferasi, che aggiunge uno zucchero diverso, il galattosio, all’antigene H per produrre l’antigene B. È importante sottolineare che le differenze nella sequenza del DNA degli alleli IA e IB determinano due glicosiltrasferasi funzionalmente diverse ma altamente correlate. La piccola differenza nella struttura degli antigeni A e B prodotta da questi enzimi è riconosciuta dal sistema immunitario. Nell’eterozigote IA/IB vengono prodotti entrambi gli enzimi, quindi qualche antigene H viene trasformato nela-N-acetilgalattosamina

Allele I A

Antigene A

AB

Figura 13.3 Reazioni antigeniche che caratterizzano il sistema del gruppo sanguigno umano AB0. Il siero di ciascuno dei quattro gruppi sanguigni è stato miscelato con le cellule del sangue dei quattro tipi in tutte le possibili combinazioni. In alcuni casi, per esempio unendo il siero B con le cellule A, si verifica agglutinazione delle cellule.

l’antigene A e qualche altro nell’antigene B. I globuli rossi possiedono sulla superficie entrambi gli antigeni, dunque l’individuo è di gruppo sanguigno AB. Gli individui omozigoti per l’allele i non producono gli enzimi necessari alla trasformazione dell’antigene glicolipidico H. Quindi, i loro globuli rossi possiedono solo l’antigene H. Questo antigene non induce una risposta immunitaria in individui di altri gruppi sanguigni, dato che il suo componente polisaccaridico è il componente base sia dell’antigene A sia dell’antigene B, e di conseguenza non viene riconosciuto come sostanza estranea. Individui eterozigoti per l’allele i hanno il gruppo sanguigno corrispondente all’altro allele. Per esempio, negli individui IB/i, l’allele IB determina la conversione di alcuni degli antigeni H in antigeni B, determinando il gruppo sanguigno dell’individuo. L’antigene H viene prodotto dall’azione dell’allele dominante H di un locus diverso dai geni del gruppo sanguigno AB0. Individui omozigoti per l’allele recessivo mutato, h, non producono l’antigene H; quindi, indipendentemente dalla presenza degli alleli IA o IB a livello dei gruppi sanguigni AB0, non vengono prodotti antigeni A o B. Questi individui h/h, molto rari, sono simili agli individui di gruppo 0, nel senso che mancano degli antigeni A e B; si dice che appartengono al gruppo sanguigno Bombay (dal nome della città in cui venne riscontrato per la prima volta). D’altra parte, individui di gruppo Bombay producono anticorpi contro l’antigene H, il che non avviene negli individui di gruppo 0. (L’alterazione del fenotipo AB0 per effetto di mutazioni del gene H è un esempio di epistasi recessiva, trattata più avanti in questo capitolo).

Attività

Antigene H Galattosio

Allele I B

Antigene B

Figura 13.4 Produzione degli antigeni del sistema del gruppo sanguigno umano AB0. Conversione dell’antigene H nell’antigene A per opera del prodotto dell’allele I A, e nell’antigene B per opera del prodotto dell’allele I B.

Andate all’iAttività Was she Charlie Chaplin’s child? (Era figlia di Charlie Chaplin?) sul sito web degli studenti: potrete utilizzare le vostre conoscenze per interpretare i risultati del test dei gruppi sanguigni che possono provare se il grande attore e regista del cinema muto Charlie Chaplin fosse il padre di Carol Ann Berry.

MyLab

Estensioni e deviazioni dai principi della genetica mendeliana a) Femmina con occhi bianco-eosina × maschio con occhi bianchi Generazione P

Genitore 1

Fenotipo parentale

Occhi eosina

Genotipo parentale diploide

we

Occhi bianchi

we

we

b) Femmina dell’F1 × maschio selvatico

Genitore 2 Occhi eosina

Fenotipo parentale Genotipo parentale diploide

w

XX Gameti aploidi

we

XY

we

X

327

w+

w XX

Gameti aploidi

w

X

Occhi rossi (selvatico)

we

Y

X

XY

w+

w X

X

Gameti del genitore 2

X

Y

Gameti Progenie

Generazione F1

w+

w X

X

Y

Y

Gameti del genitore 1 we

we X

w

we

XX

we

w+ X

XY

we

we XY

XX

Gameti Genotipi dell’F1:

1/2

we/w,

1/2

we/Y w+

w Fenotipi F1: tutti con occhi eosina,

1/ 2

femmine,

1/ 2

maschi

Figura 13.5 Risultati di incroci di Drosophila melanogaster che coinvolgono due alleli mutati dello stesso locus, white (w) e white-eosin (we). (a) occhi bianco-eosina (w e/w e) × occhi bianchi (w/Y). (b) F1 (w e/w e) × occhi rossi (selvatico) (w+/Y).

Il colore dell’occhio in Drosophila Un altro esempio di alleli multipli riguarda il locus per l’occhio bianco (w) di Drosophila. Occorre ricordare dal Capitolo 12 che l’allele w+ determina occhi rossi e l’allele recessivo w, se omozigote o emizigote, determina occhi bianchi. Sono noti più di 100 alleli recessivi mutanti al locus w. Ogni allele, in omozigosi, ha un colore specifico nello spettro tra il bianco e il rosso. Il colore specifico dell’occhio di ogni mutante dipende da quanto è stato perso della funzione della proteina codificata dall’allele coinvolto w, e questo determina quanto pigmento viene depositato nell’occhio. Un allele del locus bianco è eosina che, quando è presente in omozigosi, dà il colore arancio-rossastro dell’occhio. Il simbolo per questo allele è w e. Gli incroci genetici realizzati da Alfred Sturtevant nel 1913 dimostrarono che: (1) l’occhio rosso (selvatico) è dominante su eosina e su w; (2) eosina è recessivo sul selvatico ma dominante su w. La Figura 13.5 illustra queste proprietà. Nella Figura 13.5a, una femmina omozigote con occhi eosina è incrociata con un maschio con occhi bianchi. Le femmine in F1 sono w e/w e hanno occhi eosina poiché w e è do-

X Genotipi della progenie: Fenotipi della progenie:

w

w XY

XX

1/

4

w+/we, 1/4 w+/w,

1/ 2

femmine selvatiche

1/

4w

e/Y,

1/

4

w/Y

1/4

maschi 1/4 maschi con occhi con occhi eosina bianchi

minante su w. Quando queste femmine della F1 vengono incrociate con maschi con occhi rossi, che sono w+/Y (Figura 13.5b), tutta la progenie femminile è eterozigote con occhi rossi, poiché ha l’allele w+; si tratterà di genotipi w+/we o w+/w. Metà della progenie maschile ha occhi color eosina (w e/Y) e l’altra metà occhi bianchi (w/Y).

Relazione tra alleli multipli e genetica molecolare La sequenza delle basi di un gene determina la sequenza di amminoacidi di una proteina e la funzione di una proteina dipende dalla sua sequenza di amminoacidi. In base a questa prospettiva moderna, non dovrebbe essere sorprendente trovare alleli multipli di un gene. Per esempio, il cambiamento di un amminoacido in uno dei molti siti della proteina può influenzare in modo negativo la sua funzione, e la posizione e il tipo di cambiamento dell’amminoacido determinano l’entità della perdita di funzione della proteina. Gli alleli del gene w in Drosophila illustrano questo concetto. Se verificate in OMIM (http://www.ncbi.nlm.nih.gov/omim) le osservazioni relative a molte malattie genetiche dell’uomo – come per

328

Capitolo 13

esempio il gene per la suscettibilità al tumore della mammella BRCA1 (OMIM 113705), il gene APC (poliposi adenomatosa del colon; OMIM 1751000) che è mutato nella poliposi adenomatosa familiare, una malattia autosomica dominante tipicamente individuata come cancro colorettale, e il gene della fenilalanina idrossilasi (OMIM 261600), che è mutato negli individui con la fenilchetonuria – troverete spesso che molti alleli (classificati come “variante allelica”) sono stati identificati e associati a malattie. Due conseguenze pratiche dell’esistenza degli alleli multipli nel caso di malattie genetiche umane sono che i sintomi della malattia possono variare a seconda dell’allele e che quindi in questi casi è importante determinare specificatamente gli alleli dei pazienti.

Nota chiave In una popolazione possono esistere molte forme alleliche di un gene. Quando questo si verifica, si dice che il gene ha alleli multipli e che gli alleli implicati costituiscono una serie allelica multipla. D’altra parte, qualsiasi individuo diploide può possedere al massimo due alleli diversi di un determinato gene. Gli alleli multipli obbediscono alle stesse regole di trasmissione degli alleli dei quali esistono solo due forme, benché le relazioni di dominanza tra alleli multipli possano variare tra elementi della stessa serie.

Modificazioni delle relazioni di dominanza La dominanza completa è il fenomeno per cui un allele è dominante sull’altro, e quindi il fenotipo dell’eterozigote è indistinguibile da quello dell’omozigote dominante. Con la recessività completa, l’allele recessivo si esprime fenotipicamente solo in omozigosi. La dominanza completa e la recessività completa sono i due estremi della gamma delle relazioni di dominanza per due alleli. Mentre tutte le coppie alleliche studiate da Mendel mostravano relazioni di dominanza completa o recessività completa, molte coppie alleliche non manifestano questa relazione.

La dominanza incompleta

MyLab

Quando un allele di un gene non è completamente dominante su un altro allele dello stesso gene, si dice che dimostra una dominanza incompleta, detta anche semidominanza o dominanza parzianimazione le. Nel caso di dominanza inDominanza completa, il fenotipo dell’eteroincompleta e zigote si trova nello spettro tra il codominanza fenotipo degli individui omozi-

goti per l’uno o per l’altro allele interessato. Il fenotipo dell’eterozigote è tipicamente ricondotto a un fenotipo intermedio, anche se potrebbe non essere esattamente a metà tra i fenotipi dei due omozigoti. Un esempio di dominanza incompleta è il colore del fiore della bocca di leone, che coinvolge due alleli del gene C della pianta, CR e CW. (Si noti che i simboli allelici per indicare alleli a dominanza incompleta sono espressi con la lettera maiuscola del gene – in questo caso C – per dare lo stesso peso ai due alleli, dove nessuno dei due domina il fenotipo, mentre “R” e “W” indicano il fenotipo che ciascuno dei due alleli darebbe in omozigosi: CR/CR = rosso, red; CW/CW = bianco, white.) L’incrocio tra linee pure di bocche di leone con fiori rossi (omozigoti CR/CR) e fiori bianchi (omozigoti CW/CW) produce alla F1 piante con fiori di colore intermedio, cioè rosa (eterozigoti CR/CW). Alla F2, tali piante daranno una progenie costituita da piante con fiori rossi (1/4), rosa (1/2) e bianchi (1/4). Il rapporto genotipico è quello atteso per caratteri mendeliani ma il rapporto fenotipico è di 1:2:1, caratteristico della dominanza incompleta (e della codominanza come vedremo più avanti). In termini molecolari, la dominanza incompleta può essere spiegata con una diversa concentrazione di prodotto proteico, per esempio del pigmento del fiore, nei diversi genotipi: due alleli CR nell’omozigote producono una dose doppia di pigmento rispetto all’eterozigote CR/CW; l’omozigote CW/CW non ne produce affatto. Un altro esempio di dominanza incompleta riguarda il cavallo palomino, che ha corpo color giallo-dorato e criniera e coda quasi bianche. Due alleli del gene C, C e Ccr, sono implicati nella generazione dei palomino. L’allele C, in omozigosi, permette lo sviluppo totale del colore del mantello, definito da altri geni. L’allele Ccr è un allele modificatore che diluisce l’espressione del colore del mantello nel cavallo in maniera dipendente dalla dose. I cavalli eterozigoti C/Ccr hanno il colore del mantello meno diluito dei cavalli omozigoti Ccr/Ccr. Se il colore del mantello nel cavallo è castano chiaro, la presenza del genotipo C/Ccr diluisce questo colore potenziale e determina un palomino. Incroci tra palomini C/Ccr × C/Ccr danno una progenie con un rapporto 1 C/C, castano chiaro : 2 C/Ccr, palomino (colore castano chiaro parzialmente diluito) : 1 Ccr/Ccr, cremello (colore castano chiaro totalmente diluito; vedi Figura 13.6). Alcune malattie umane mostrano dominanza incompleta, cioè si esprimono più severamente negli individui omozigoti per l’allele mutato rispetto agli eterozigoti. Un esempio è l’ipercolesterolemia familiare (OMIM 143890) dovuta, nella sua forma più frequente, a una mutazione nel gene (situato sul cromosoma 19) che codifica per il recettore per la lipoproteina a bassa densità (LDL), coinvolta nel trasporto e nel metabolismo del colesterolo. La totale assenza di questo recettore (negli omozigoti per l’allele mutato) determina un elevato au-

Estensioni e deviazioni dai principi della genetica mendeliana Genitori

Genitore 1

Fenotipo parentale

Genitore 2

Palomino

Genotipo parentale diploide C/C cr Gameti aploidi

C/C cr

C cr

C

C cr

C

Gameti del genitore

Progenie

C

C cr

329

Il sistema del gruppo sanguigno umano MN è un altro esempio di codominanza. In termini di compatibilità trasfusionale, questo sistema è di minor importanza clinica rispetto all’AB0, perché non causa problemi durante le trasfusioni di sangue. Nel sistema MN gli alleli LM e LN di un gene determinano i gruppi sanguigni. Esistono tre gruppi sanguigni: M, MN, e N, specificati rispettivamente dai genotipi LM/LM, LM/LN e LN/LN. Come nel sistema AB0, gli alleli MN determinano la formazione di antigeni sulla superficie dei globuli rossi. In questo caso l’eterozigote ha entrambi gli antigeni M e N e manifesta i fenotipi di entrambi gli omozigoti.

Confronto tra dominanza completa, dominanza incompleta e codominanza a livello molecolare

C C/C

C/C cr

C/C cr

C cr/C cr

Gameti del genitore 1 C cr

Genotipi della progenie: Fenotipi della progenie:

1/4 C/C, 1/4

castano chiaro

1/ 2 1/ 2

C/C cr,

1/4 cr cr C /C

palomino

1/4 cremello

Figura 13.6 Dominanza incompleta nei cavalli. Il cavallo palomino è eterozigote per il gene del colore del mantello che mostra dominanza incompleta. L’incrocio fra cavalli palomino produce una progenie nel rapporto di 1 castano chiaro : 2 palomino : 1 castano chiaro estremamente diluito (cremello).

mento dei livelli di colesterolo nel sangue che inducono aterosclerosi precoce con elevato rischio di infarto miocardico prima dei 20 anni. Gli eterozigoti, che possiedono solo la metà della normale quantità di recettori per le LDL, mostrano un aumento di colesterolo di circa due o tre volte rispetto ai livelli normali e quindi un fenotipo più lieve (dominanza incompleta).

La codominanza Un’altra modificazione delle relazioni di dominanza è la codominanza. Nella codominanza l’eterozigote manifesta i fenotipi di entrambi gli omozigoti (a differenza della dominanza incompleta, in cui l’eterozigote manifesta un fenotipo intermedio tra i due omozigoti). Il sistema dei gruppi sanguigni AB0, discusso in precedenza in questo capitolo, rappresenta un buon esempio di codominanza. Gli individui eterozigoti IA/IB sono di gruppo AB perché vengono prodotti sia l’antigene A (prodotto dell’allele IA) sia l’antigene B (prodotto dall’allele IB). Dunque, gli alleli IA e IB sono codominanti.

Nel corso dei capitoli precedenti abbiamo parlato di dominanza e recessività come comportamento degli alleli durante gli incroci il cui risultato è l’espressione o meno di un dato fenotipo in un individuo eterozigote. In base a queste caratteristiche abbiamo ora definito i concetti di dominanza completa (in cui un solo fenotipo è osservabile nell’eterozigote, cioè quello dominante), dominanza incompleta (espressione nell’eterozigote di un fenotipo intermedio rispetto ai due omozigoti) e codominanza (espressione nell’eterozigote di entrambi i fenotipi degli omozigoti). Come possiamo spiegare tali comportamenti a livello molecolare? Partiamo dal definire un allele dominante come un allele che codifica per un prodotto funzionale, in grado di esprimersi fenotipicamente. Generalmente in un eterozigote per un gene che dimostra normale dominanza (dominanza completa), metà della quantità di proteina prodotta dall’omozigote è sufficiente per una funzione cellulare normale. A volte, l’espressione del solo allele normale nell’eterozigote può essere aumentata a produrre livelli di proteina che assicurano una funzione cellulare normale. In entrambi questi casi il gene viene detto aplosufficiente, a indicare che una sola (aplo) copia del gene in un organismo diploide è sufficiente per produrre un fenotipo normale. Nella codominanza, i prodotti di entrambi gli alleli presenti in un eterozigote sono funzionali e quindi la natura del fenotipo relativo a entrambi può essere osservata simultaneamente. Per esempio, gli individui LM/LN esprimono entrambi gli antigeni M e N sulla superficie dei globuli rossi. Nella dominanza incompleta, nei casi che coinvolgono gli alleli che determinano una perdita di funzione, solo un allele è espresso nell’eterozigote per dare un prodotto funzionale e la quantità del prodotto è importante per il fenotipo. In un omozigote per l’allele espresso, quindi, vi sono due dosi del prodotto genico con una conseguente espressione fenotipica completa (negli esempi già citati,

330

Capitolo 13

cavalli castano chiaro o bocche di leone rosse). Nell’omozigote per l’allele che non viene espresso, si osserva un fenotipo corrispondente all’assenza di espressione genica (cavalli cremello o bocche di leone bianche). Nell’eterozigote, all’unico allele espresso corrisponde solo una dose di prodotto, sufficiente per un fenotipo intermedio (cavalli palomino o bocche di leone rosa). Esiste anche il caso della dominanza incompleta che coinvolge alleli che determinano un guadagno di funzione. In questo caso, l’omozigosi per gli alleli selvatici dà un fenotipo selvatico, due dosi dell’allele mutato nell’omozigote determinano un fenotipo totalmente mutante e una sua singola dose nell’eterozigote determina un fenotipo mutante intermedio tra il selvatico e il fenotipo completamente mutato. Un certo numero di malattie genetiche umane dominanti segue questo modello, con individui omozigoti per l’allele mutante dominante che mostrano sintomi molto più severi (a volte letali) di quelli degli individui eterozigoti. Un esempio già discusso è l’acondroplasia (OMIM 100800; vedi Capitolo 11), in cui l’omozigosi è una condizione letale in epoca neonatale.

recessivo, solo gli omozigoti per tale allele manifesteranno il fenotipo letale. Un esempio di allele recessivo letale è l’allele mutato AY (yellow) del locus agouti (A; utilizzato anche come esempio di epistasi recessiva più avanti in questo capitolo). Tale mutazione risulta in un carattere distintivo nel topo in eterozigosi (AY/A), ossia nel colore giallo del pelo accompagnato da obesità. Quindi riguardo il colore del pelo, l’allele AY risulta dominante (guadagno di funzione) rispetto all’allele selvatico agouti (e per questo è indicato con la lettera maiuscola). I topi vitali con il colore del mantello giallo sono tutti eterozigoti per l’allele giallo; non esistono topi gialli omozigoti. L’allele AY si comporta come allele recessivo letale: in omozigosi (AY/AY), infatti, determina la morte allo stato embrionale. In altre parole, l’allele giallo ha un effetto dominante rispetto al fenotipo ma si comporta come un allele recessivo rispetto alla letalità. Da un incrocio topo giallo × topo giallo (genotipicamente AY/A × AY/A; vedi Figura 13.7) il rapporto genotiGenitore 1

Generazione P

Genitore 2

Topo giallo

Fenotipo parentale

Topo giallo

Nota chiave In caso di dominanza completa, si ha lo stesso fenotipo se l’allele dominante è in condizione eterozigote o omozigote. Con recessività completa, l’allele è espresso fenotipicamente solo se il genotipo è omozigote recessivo; l’allele recessivo non ha alcun effetto sul fenotipo dell’eterozigote. La dominanza completa e la recessività completa sono i due estremi tra i quali sono possibili tutti i gradi di transizione della dominanza. Nella dominanza incompleta, il fenotipo dell’eterozigote è intermedio tra quelli dei due omozigoti, mentre nella codominanza l’eterozigote manifesta entrambi i fenotipi dei due omozigoti.

Genotipo parentale diploide

A Y/A Gameti aploidi

A Y/A

AY

Per qualche anno dopo la riscoperta dei principi elaborati da Mendel, i genetisti credettero che le mutazioni potessero cambiare solamente l’aspetto di un organismo, ma poi scoprirono che un allele mutato poteva causarne la morte. In un certo senso, una tale mutazione è ancora un cambiamento del fenotipo, se si considera come tale la letalità. Un allele che determini la morte di un organismo è definito allele letale e il gene in questione è chiamato gene essenziale. I geni essenziali sono geni che, mutati, determinano un fenotipo letale. Se la mutazione è dovuta a un allele letale dominante, sia gli omozigoti sia gli eterozigoti per quell’allele manifesteranno il fenotipo letale. Se la mutazione è dovuta a un allele letale

A

Gameti del genitore 2 Generazione F1

AY

AY

Geni essenziali e alleli letali

AY

A

A

muore precocemente nello sviluppo

Gameti del genitore 1

A Y/A Y

A Y/A

A Y/A

A/A

A

1/ A Y/A Y, Genotipi della 4 generazione F1: 1/

Fenotipi della generazione F1:

4

muore

2

A Y/A,

1/

1/

giallo

1/ 4

1/

2

4

A/A

agouti

della progenie vitale: 2/3 giallo, 1/3 agouti

Figura 13.7 Ereditarietà di un gene letale AY nei topi. Un incrocio tra due topi gialli dà 1/4 di topi agouti, 1/2 di topi gialli e 1/4 di aborti. I topi vitali gialli sono gli eterozigoti AY/A e gli aborti sono gli omozigoti AY/AY.

Estensioni e deviazioni dai principi della genetica mendeliana

pico atteso nella progenie è 1/4 AY/AY : 2/4 AY/A : 1/4 A/A. Tuttavia, i topi AY/AY muoiono prima della nascita, dando nei nati un rapporto di 2/3 AY/A (gialli) : 1/3 A/A (agouti). Tipicamente, gli alleli letali recessivi si riconoscono per il rapporto 2:1 della progenie di un incrocio di due eterozigoti. Il gene agouti è stato clonato, il che ha consentito l’analisi dell’allele letale giallo. Nei topi selvatici agouti, il gene è espresso in campioni di cute prelevati pochi giorni dopo la nascita, nel momento della produzione della banda gialla nel pelo e nella cute che rigenera il pelo dopo uno strappo, e in nessun altro tessuto in nessun altro momento. Nei topi eterozigoti (AY/A) l’allele giallo viene espresso a livelli elevati in tutti i tessuti e in tutti gli stadi di sviluppo, dimostrando che la regolazione tessuto-specifica della sua espressione è andata perduta. La spiegazione è che l’allele AY abbia avuto origine in seguito a una delezione di un ampio tratto di DNA compreso tra il locus agouti e un gene a monte chiamato Raly; ne consegue che il promotore di Raly e la prima parte di questo gene sono fusi al gene agouti. Il promotore di Raly quindi controlla l’espressione del gene agouti adiacente. L’espressione in tutti i tessuti è dovuta ai segnali di regolazione del promotore di Raly. Questa mutazione rende quindi l’allele A costitutivamente attivato in tutti i tessuti del topo, per cui risulta dominante sul fenotipo. D’altra parte, la delezione comporta anche la perdita di funzione del gene adiacente Raly necessario per lo sviluppo embrionale (gene essenziale), risultando quindi recessiva letale. La letalità embrionale degli omozigoti gialli è quindi dovuta all’assenza di attività del gene Raly, piuttosto che a un gene agouti difettoso. Geni essenziali sono stati trovati in tutti gli organismi. Ci si potrebbe aspettare, per esempio, che almeno alcuni dei geni coinvolti nelle funzioni chiave dell’organismo, come la replicazione del DNA, la trascrizione e la traduzione, siano essenziali. In uno studio metodico nel quale tutti i geni che codificano per una proteina nel lievito sono stati inattivati uno alla volta, i ricercatori hanno trovato che circa 1800 di approssimativamente 5700 geni sono essenziali. Nell’uomo sono noti molti alleli letali recessivi. Ne è un esempio la malattia di Tay-Sachs (OMIM 272800; vedi Capitolo 4). Il gene implicato, HEXA, codifica per l’enzima esosamminidasi A. Gli omozigoti alla nascita sembrano normali, ma intorno al primo anno di vita cominciano a mostrare sintomi di deterioramento del sistema nervoso centrale. Seguono un progressivo ritardo mentale, cecità e perdita del controllo neuromuscolare. I bambini affetti generalmente muoiono tra i 3 e i 4 anni. Il difetto genetico nella Tay-Sachs è la mancanza di un enzima necessario per una corretta funzione nervosa. La maggior parte delle mutazioni del gene HEXA, causa della malattia, è costituita da sostituzioni di una singola base, che determinano cambiamenti di un am-

331

minoacido nella proteina o alterano lo splicing del premRNA del gene. Esistono mutazioni letali legate al cromosoma X, come anche mutazioni letali autosomiche, sia dominanti sia recessive. Nell’uomo, per esempio, la malattia genetica emofilia (OMIM 306700) è causata da un allele recessivo legato all’X (vedi Capitolo 12) ed è letale se non si attua una terapia. I geni letali dominanti esercitano il loro effetto negli eterozigoti, generalmente con esito infausto. I geni letali dominanti non possono essere studiati per diverse generazioni in una famiglia, a meno che la morte non sopravvenga dopo che l’organismo abbia raggiunto l’età riproduttiva. Per esempio, i sintomi della malattia autosomica dominante corea di Huntington (OMIM 143100; vedi Capitolo 7) – movimenti involontari e degenerazione progressiva del sistema nervoso centrale – possono non comparire fino a circa trent’anni di età; ne consegue che i genitori possono aver trasmesso il gene ai figli prima di aver saputo di essere affetti dalla malattia. La morte generalmente si verifica quando le persone affette sono attorno ai quaranta o cinquanta anni. Il noto cantante folk americano Woody Guthrie è morto della malattia di Huntington nel 1967.

Nota chiave Un allele letale risulta fatale all’individuo. Esistono alleli letali dominanti e recessivi, sia legati all’X sia autosomici. L’esistenza di alleli letali di un gene indica che il prodotto del gene normale è essenziale per il funzionamento dell’organismo; quindi, il gene è un gene essenziale.

Espressione genica e ambiente Lo sviluppo di un organismo multicellulare a partire da uno zigote è un processo di crescita e differenziamento regolati, risultato dell’interazione del genoma dell’organismo con l’ambiente interno ed esterno alla cellula. Si deve pensare allo sviluppo come a un intreccio di vie biochimiche complesse. L’ambiente interno o esterno può influenzare ciascuna di queste vie, modificando i prodotti dei geni che le controllano. Questo fenomeno si può studiare più facilmente negli organismi da laboratorio nei quali i genotipi sono inequivocabilmente noti. Il grado della manifestazione degli effetti di un gene può allora essere misurato in diverse condizioni ambientali. Considereremo nel paragrafo seguente alcuni esempi che sottolineano il concetto importante, presentato all’inizio del Capitolo 11, secondo cui i geni determinano solo il potenziale per lo sviluppo di un certo fenotipo e la realizzazione di questo potenziale dipende dall’interazione con altri geni e con i loro prodotti e, in molti casi, dalle influenze ambientali e da eventi casuali nel processo di sviluppo (Figura 11.1).

332

Capitolo 13

Penetranza ed espressività In alcuni casi, non tutti gli individui con un particolare genotipo manifestano il fenotipo atteso. La percentuale di individui con un certo genotipo che mostrano il fenotipo corrispondente è detta penetranza del genotipo (Figura 13.8a). La penetranza dipende sia dal genotipo (per esempio, la presenza di geni epistatici o di altri geni), sia dall’ambiente (interno e/o esterno). La penetranza è completa (100%) quando tutti gli omozigoti recessivi manifestano un fenotipo, tutti gli omozigoti dominanti mostrano un altro fenotipo e tutti gli eterozigoti sono simili. Per esempio, se tutti gli individui che portano un allele dominante manifestano il fenotipo corrispondente, l’allele è completamente penetrante. Molti geni mostrano penetranza completa; gli esempi includono le sette coppie alleliche negli esperimenti di Mendel e gli alleli del sistema del gruppo sanguigno AB0 dell’uomo. Se meno del 100% degli individui con un particolare genotipo manifesta il fenotipo atteso, la penetranza è incompleta. Se, per esempio, l’80% degli individui portatori di un certo allele manifesta il fenotipo corrispondente, vi è l’80% di penetranza. Nell’uomo, molti geni manifestano una penetranza incompleta. Per esempio, la brachidattilia (OMIM 112500), un carattere dominante autosomico che com-

a) Penetranza incompleta confrontata con la penetranza completa Penetranza completa A genotipi identici noti corrisponde nel 100% dei casi il fenotipo atteso

Penetranza incompleta Il fenotipo atteso corrisponde in meno del 100% dei casi a genotipi identici noti

porta accorciamento e malformazioni delle dita, manifesta dal 50 all’80% di penetranza. Anche alcuni geni che determinano predisposizione al cancro manifestano una penetranza bassa o moderata, aumentando la difficoltà di identificarli e caratterizzarli. I geni possono influenzare un fenotipo a diversi livelli. L’espressività è il grado in cui un gene o un genotipo penetrante è espresso fenotipicamente in un individuo. La Figura 13.8b illustra questo concetto. Come la penetranza, l’espressività dipende sia dal genotipo sia dall’ambiente e può essere costante o variabile. In termini molecolari, si può pensare in modo semplice all’espressività come risultato di diversi gradi di funzionamento della proteina codificata dal gene. Un esempio di variabilità dell’espressività si osserva nell’uomo nella condizione patologica chiamata osteogenesi imperfetta (OMIM 166200). Le tre principali caratteristiche di questa malattia sono: colore blu delle sclere (il bianco dell’occhio), ossa molto fragili e sordità. L’osteogenesi imperfetta è ereditata come carattere autosomico dominante con quasi il 100% di penetranza. D’altra parte, il carattere mostra un’espressività variabile: un portatore dell’allele mutato può manifestare una qualsiasi delle caratteristiche della malattia o qualsiasi combinazione delle tre. Inoltre, anche il grado di fragilità delle ossa in chi manifesta la malattia è molto variabile.

b) Espressività variabile confrontata con l’espressività costante Espressività costante A genotipi identici noti senza effetto sull’espressività corrisponde nel 100% dei casi il fenotipo atteso

c) Penetranza incompleta ed espressività variabile Penetranza incompleta con espressività variabile Genotipi identici noti producono un ampio spettro di fenotipi

Espressività variabile A genotipi identici noti con effetto sull’espressività corrisponde uno spettro di fenotipi

Figura 13.8 Illustrazione dei concetti di penetranza ed espressività nella manifestazione fenotipica di un genotipo.

Estensioni e deviazioni dai principi della genetica mendeliana

Infine, molti geni manifestano penetranza incompleta ed espressività variabile. La Figura 13.8c illustra questo concetto. Per esempio, la neurofibromatosi (OMIM 162200) è una malattia autosomica dominante, che mostra una penetranza dal 50 all’80% e un’espressività variabile (Figura 13.9). Nella sua forma più lieve, la malattia determina negli individui affetti solo poche zone pigmentate sulla pelle (chiamate macchie caffellatte per il loro colore). Nei casi più gravi si possono osservare uno o più sintomi, compresi neurofibromi di varie dimensioni, un’elevata pressione sanguigna, disturbi della parola, emicranie, testa larga, bassa statura, tumori dell’occhio, del cervello o del midollo spinale, curvatura della colonna vertebrale. Vediamo quindi che in genetica medica è importante riconoscere che l’espressione di un allele può variare ampiamente, un aspetto questo che rende molto più difficile il compito della consulenza genetica.

333

Età di insorgenza L’età dell’organismo determina variazioni dell’ambiente interno che possono influenzare l’espressione fenotipica associata a un allele. Non tutti i geni sono attivi contemporaneamente. Piuttosto, nel tempo, a mano a mano che l’organismo si sviluppa, si verificano un’attivazione e una disattivazione programmata di geni. Alcuni caratteri genetici umani non sono osservabili dalla nascita, malgrado esista il genotipo per quel carattere, ma piuttosto si evidenziano in relazione all’età. Per esempio, la calvizie (OMIM 109200) solitamente compare nei maschi tra i 20 e i 30 anni e i sintomi della distrofia muscolare di Duchenne (DMD; OMIM 310200) si manifestano nei bambini tra i 2 e i 5 anni. Nella maggior parte dei casi non è nota la natura della dipendenza dall’età.

Sesso L’espressione fenotipica associata a un allele può essere influenzata dal sesso dell’individuo. Nel caso dei geni legati al sesso, come riferito in precedenza, le differenze tra i fenotipi dei due sessi sono in relazione ai diNota chiave versi assetti genici dei cromosomi sessuali. D’altra parte, in alcuni casi, geni localizzati sugli autosomi controllano La penetranza è la frequenza con la quale un genoun particolare carattere che si manifesta in un sesso e non tipo si manifesta negli individui di una popolazione. nell’altro. Caratteri di questo tipo sono definiti caratteri L’espressività è il tipo o il grado di manifestazione limitati al sesso. fenotipica in un dato individuo di un allele o di un Esempi di caratteri limitati al sesso negli animali sogenotipo penetrante. no la produzione di latte nel bestiame (ovviamente i geni implicati agiscono nelle femmine, ma non nei maschi), la comparsa delle corna in alcune specie di pecore (i maL’effetto dell’ambiente schi con i geni per le corna le hanno e le femmine con i In questo paragrafo considereremo alcuni esempi dell’in- geni per le corna non le hanno) e la capacità di produrre cellule uovo o spermatozoi. Un esempio nell’uomo è la fluenza dell’ambiente sul fenotipo. distribuzione dei peli facciali. Una situazione lievemente differente si osserva nei caratteri influenzati dal sesso, che, come i caratteri limitati al sesso, sono spesso controllati da geni autosomici. Tali caratteri si manifestano in entrambi i sessi, ma lo fanno con una diffeMacchia rente frequenza di comparsa o con una divercaffellatte sa relazione tra genotipo e fenotipo. Un esempio di carattere influenzato dal sesso nell’uomo è la manifestazione della calvizie (Figura 13.10). Questo carattere è controllato da un gene autosomico con un allele per la calvizie, b, che si comporta da dominante nei maschi e da recessivo (o almeno viene espresso a un più basso livello) nelle femmine. Vale a dire che il genotipo b/b determina la calvizie sia nei maschi sia nelle femmine, e il genotipo b+/b+ determina un feAmpio numero di neurofibromi notipo non calvo in entrambi i sessi. La diffecutanei (crescite renza risiede nell’eterozigote b+/b: nei masimiltumorali) schi si ha un fenotipo calvo e nelle femmine Figura 13.9 Espressività variabile in individui affetti da neurofibromatosi.

334

Capitolo 13

a) Femmina non calva × maschio calvo b/b Genitore 1

Non calva

Fenotipo parentale

b) Incrocio F1 × F1 Genitore 2 Fenotipi

Calvo

Non calva

Calvo

Genotipo diploide

Genotipo parentale diploide

b + /b + Gameti aploidi

b+

Progenie

b + /b

b/ b

b+

b

b

Gameti del genitore 2

Gameti aploidi F1

b+

Progenie

b+

b+

b

b

Gameti

b+

b

b + /b +

b + /b

b

Gameti del genitore 1

b + /b

b+ +

b /b

Gameti Genotipi della progenie: Fenotipi della progenie:

tutti b + /b calvi ; non calve poiché il tratto è influenzato dal sesso

b b + /b

Genotipi dell’F2: Fenotipi dell’F2:

Figura 13.10 Ereditarietà influenzata dal sesso della calvizie nell’uomo. L’allele b è recessivo in un sesso e dominante nell’altro.

uno non calvo. Considerando un vasto campione della progenie di matrimoni tra due eterozigoti, 3/4 delle figlie non sono calve e 1/4 lo sono, e 3/4 dei figli sono calvi e 1/4 non lo sono. Il profilo di ereditarietà ed espressione genica influenzata dal sesso spiega perché la calvizie sia molto più frequente tra gli uomini che tra le donne. L’espressione dell’allele b è influenzata dall’ormone maschile testosterone; pertanto nei maschi, anche quando l’allele è presente in singola copia, risulta espresso e dominante fenotipicamente. Infine, la calvizie non è un carattere semplice da analizzare, per il fatto che vi è un’espressività variabile nel fenotipo: come risulta evidente da un’analisi della popolazione adulta, la calvizie può insorgere precocemente o in età tardiva, può comparire dapprima alla sommità del capo o a partire dalla fronte, e può variare da un grado minimo a uno estremo. Infatti, molti geni controllano la presenza dei capelli sulla testa,

1/

4

b /b

b + /b + ,

Non calvo, maschio o femmina

1/

2

b + /b,

Non calva se femmina, calvo se maschio

1/ 4

b/b

Calvo, femmina o maschio

3 calvo : 1 non calvo nei maschi 1 calva : 3 non calve nelle femmine

tra cui il gene della calvizie. Il fenotipo finale, quindi, è il risultato dell’interazione tra l’ambiente e la presenza di uno specifico insieme di quei geni. Per esempio, anche se le femmine b/b manifestano la calvizie, l’insorgenza del fenotipo in queste donne si verifica molto più tardi nella vita rispetto agli uomini, a causa dell’influenza degli ormoni presenti nell’ambiente interno femminile. Altri esempi di caratteri influenzati dal sesso nell’uomo sono il labbro leporino e la palatoschisi (fusione incompleta del labbro superiore e del palato; OMIM 119530), per il quale vi è un rapporto 2:1 del carattere tra maschi e femmine; il piede equino (OMIM 119800; rapporto 2:1); la gotta (OMIM 138900; rapporto 8:1); l’artrite reumatoide (OMIM 180300; rapporto 1:3); l’osteoporosi (OMIM 166710; rapporto 1:3) e il lupus eritematoso sistemico (OMIM 152700, una malattia autoimmune; rapporto 1:9).

Estensioni e deviazioni dai principi della genetica mendeliana

335

Temperatura Le reazioni biochimiche nelle cellule sono catalizzate dagli enzimi. Normalmente, gli enzimi non sono influenzati da cambiamenti di temperatura che si verifichino entro un ambito ragionevole. D’altra parte, alcuni alleli di un gene che codifica per un enzima possono determinare un enzima sensibile alla temperatura; vale a dire che l’enzima può funzionare correttamente a una temperatura, ma può non funzionare a un’altra. Un esempio di effetto della temperatura sull’espressione di un gene è il colore della pelliccia nei gatti siamesi (Figura 13.11). I gatti siamesi sono omozigoti per l’allele recessivo cs, siamese, allele del locus C, che codifica per la tirosinasi. Nel genotipo cs/cs, la sintesi della melanina nella pelliccia del corpo è bloccata a causa della presenza di una tirosinasi mutata che, per la sua natura termosensibile, assume una conformazione funzionale a basse temperature. Alla nascita, i gattini siamesi sono color crema o bianchi a causa della temperatura uniforme dei loro corpi. D’altra parte, appena crescono, le loro estremità o “punte” (orecchie, naso, zampe e coda) diventano relativamente più fredde in relazione all’aumento della distanza dal centro del corpo. La temperatura più bassa permette l’attività della tirosinasi, cosicché viene sintetizzata la melanina e le estremità diventano più scure. Il resto del corpo conserva un colore più chiaro (sebbene non bianco) dovuto al minor livello di attività della tirosinasi. (Una situazione simile si verifica nei conigli himalayani che sono omozigoti per l’allele ch, hymalayano, allele del locus C per il colore della pelliccia; vedi Figura 13.2).

biochimica del metabolismo dell’amminoacido fenilalanina (Capitolo 4). Negli individui omozigoti per l’allele recessivo si manifestano diversi sintomi e principalmente un ritardo mentale in età precoce. La gravità dei sintomi della PKU dipende dalla dieta. I problemi alimentari derivano da proteine che contengono fenilalanina, come quelle del latte materno. La PKU può essere curata con limitazioni della quantità di fenilalanina nella dieta. (La PKU è discussa ulteriormente nel Capitolo 4.) In un’altra malattia genetica dell’uomo, il favismo (malattia recessiva legata al cromosoma X; OMIM 134700), l’influenza delle sostanze chimiche è stata ampiamente descritta. Tale patologia è dovuta a una mutazione recessiva del gene per l’enzima glucosio-6-fosfatodeidrogenasi, essenziale per proteggere le cellule (in particolare i globuli rossi) dallo stress ossidativo. La carenza di questo enzima provoca un’improvvisa distruzione dei globuli rossi e quindi la comparsa di una grave anemia emolitica. L’assunzione di sostanze ossidanti presenti in alcuni alimenti (come le fave o i piselli) o in alcuni farmaci agisce da fattore scatenante della crisi emolitica.

Sostanze chimiche Alcune sostanze chimiche possono avere effetti significativi sull’espressione fenotipica di un determinato genotipo. Per esempio, la malattia dell’uomo fenilchetonuria (PKU; OMIM 261600) è un carattere autosomico recessivo, che comporta un difetto nella via

Ereditarietà e ambiente

Figura 13.11 Effetto della temperatura sull’espressione genica. Un gatto siamese con un colore chiaro su buona parte del corpo e un colore scuro nei punti dove la temperatura è più bassa (orecchie, naso, zampe e coda).

Nota chiave L’espressione fenotipica di un gene dipende da parecchi fattori, tra i quali le relazioni di dominanza, la costituzione genetica del resto del genoma e le influenze dell’ambiente interno ed esterno.

Abbiamo appena visto che per molti caratteri i fenotipi sono influenzati sia dai geni sia dall’ambiente. Quali sono però i contributi relativi dei geni e dell’ambiente nel determinare il fenotipo? (Il problema ereditarietà-ambiente viene discusso più ampiamente nel Capitolo 22.) Consideriamo l’espressione di alcuni caratteri nell’uomo per rendere l’idea della complessità di questo problema. L’altezza, o statura, dell’uomo è in larga misura determinata dai geni. Mediamente, genitori alti tendono ad avere figli alti e genitori bassi tendono ad avere figli bassi. Nell’uomo vi sono anche diverse forme genetiche di nanismo. L’acondroplasia è un tipo di nanismo nel quale le ossa delle braccia e delle gambe sono più corte, ma il tronco e la testa sono di dimensioni normali; l’acondroplasia è dovuta alla presenza di un singolo allele dominante. Ma anche l’ambiente svolge un ruolo nel determinare la statura nell’uomo. Per esempio, l’altezza è aumentata di circa 2,5 cm per generazione negli ultimi 100 anni, come risultato di un’alimentazione migliore e di una maggior cura della salute. Quindi, i geni e l’ambiente hanno interagito nel controllare la statura dell’uomo. Per un carattere come l’altezza, i geni stabiliscono dei limiti per il fenotipo (o ne determinano le potenziali-

336

Capitolo 13

tà). Il fenotipo di un individuo si svilupperà entro questi limiti a seconda dell’ambiente. I limiti di variabilità dei potenziali fenotipi che un singolo genotipo può svilupparare se viene esposto a una gamma di condizioni ambientali vengono definiti norma di reazione. Per alcuni genotipi, la norma di reazione è piccola, ovvero, il fenotipo prodotto da un genotipo è quasi lo stesso in ambienti diversi. Per altri genotipi, la norma di reazione è ampia e il fenotipo determinato dal genotipo varia moltissimo in ambienti diversi. Molti caratteri comportamentali dell’uomo sono il risultato di un’interazione tra geni e ambiente esterno. Un esempio è l’alcolismo, che rappresenta un problema medico rilevante negli Stati Uniti: circa 14 milioni di americani hanno problemi associati all’assunzione di alcol. Molti studi hanno dimostrato che l’alcolismo è influenzato da geni. Per esempio, i figli di padri alcolizzati, separati dai loro genitori biologici alla nascita e adottati da famiglie con genitori non alcolizzati, hanno una probabilità di diventare alcolizzati quattro volte maggiore dei figli adottati alla nascita i cui genitori biologici non erano alcolizzati. D’altra parte, nessun gene spinge una persona a bere alcol. In altri termini, non si diventa alcolizzati a meno che non si sia esposti a un ambiente in cui l’alcol sia disponibile e il bere incoraggiato. L’azione dei geni consiste nel rendere alcune persone più o meno suscettibili all’abuso di alcol; questi geni aumentano o diminuiscono il rischio di sviluppare l’alcolismo. Come i geni influenzino la nostra suscettibilità all’abuso di alcol non è ancora chiaro. Potrebbero influenzare il modo in cui l’alcol viene metabolizzato, che a sua volta potrebbe influenzare quanto beviamo. Oppure, i geni potrebbero influenzare alcuni aspetti della nostra personalità, che ci rendono più o meno inclini a bere pesantemente. Il punto importante è che un carattere comportamentale come l’alcolismo può essere influenzato dai geni, ma i geni da soli non determinano il fenotipo. In nessun caso il ruolo relativo dei geni e dell’ambiente è stato maggiormente oggetto di controversie che nello studio dell’intelligenza umana. Nel passato, si tendeva a considerare l’intelligenza umana come o programmata geneticamente o determinata totalmente dall’ambiente. Il conflitto tra queste visioni opposte è stato definito la controversia ereditarietà-ambiente. Oggi i genetisti riconoscono che né l’una né l’altra di queste opinioni estreme è corretta: l’intelligenza umana è il prodotto sia dei geni sia dell’ambiente. Che i geni influenzino l’intelligenza è chiaramente dimostrato dalle malattie genetiche che determinano ritardo mentale, come la PKU (vedi Capitolo 4) e la sindrome di Down (vedi Capitolo 16). Molti studi indicano anche che i geni influenzano le differenze nell’IQ tra individui non ritardati. (L’IQ, o quoziente d’intelligenza, è una misura standardizzata dell’età mentale confrontata con l’età cronologica; è relativamente stabile nel tempo.

Comunque, è importante considerare che ciò che generalmente consideriamo intelligenza è molto più complesso di ciò che misuriamo con il test IQ.) Per esempio, studi sull’adozione hanno dimostrato che l’IQ dei bambini adottati è più vicino a quello dei loro genitori biologici che non a quello dei genitori adottivi. D’altra parte, l’IQ è anche influenzato dall’ambiente. Gemelli identici spesso differiscono nell’IQ, un fatto che può essere spiegato in base a differenze ambientali. La dimensione della famiglia, l’alimentazione e la cultura sono fattori ambientali noti per la loro influenza sull’IQ. Quindi il quoziente d’intelligenza è il risultato dall’interazione dei geni con l’ambiente. Di conseguenza, se due persone (non gemelli identici) differiscono nell’IQ, è impossibile attribuire la differenza esclusivamente ai geni o all’ambiente, dato che entrambi questi fattori interagiscono nel determinare il fenotipo. Quindi, benché non sia possibile modificare i nostri geni, è possibile modificare l’ambiente e di conseguenza influenzare un carattere fenotipico come l’intelligenza.

Nota chiave La variabilità nella maggior parte dei caratteri genetici considerati nella discussione sui principi mendeliani è determinata principalmente da differenze nel genotipo; vale a dire che le differenze fenotipiche derivano da differenze genotipiche. Per numerosi caratteri, d’altra parte, i fenotipi sono influenzati sia dai geni sia dall’ambiente. Il dibattito sul contributo relativo dei geni e dell’ambiente sul fenotipo è stato definito la controversia ereditarietà-ambiente.

Effetto materno L’effetto materno è il fenomeno per cui il fenotipo dei figli è determinato non dal loro genotipo ma dal genotipo nucleare della madre, senza alcuna influenza del genoma nucleare paterno. L’effetto materno è il risultato di mRNA o proteine che sono depositati nell’oocita prima della fecondazione, e che dirigono lo sviluppo iniziale dell’embrione. I geni che codificano questi prodotti sono conosciuti con il nome di geni con effetto materno. L’effetto materno si rileva nelnimazione la trasmissione ereditaria del verso L’effetto di spiralizzazione della conchiglia materno della chiocciola Limnaea peregra. Il verso della torsione della conchiglia dipende da una singola coppia di alleli nucleari: l’allele dominante D, che determina una spirale verso destra (spirale destrorsa), e l’allele recessivo d, che determina una spirale a sinistra (spirale sinistrorsa). Il fenotipo di spiralizzazione della conchiglia è determinato sem-

MyLab

Estensioni e deviazioni dai principi della genetica mendeliana

pre dal genotipo della madre. Ciò è dimostrato dai risultati degli incroci reciproci tra linee pure di chiocciole sinistrorse e destrorse (Figura 13.12). Nell’incrocio tra una chiocciola femmina (D/D) destrorsa con un maschio (d/d) sinistrorso (Figura 13.12a), le chiocciole in F1 sono tutte genotipicamente D/d e fenotipicamente destrorse. L’autofecondazione della F1 produce chiocciole in F2 che segregano con il rapporto 1:2:1 dei genotipi D/D, D/d e d/d. Tutte le chiocciole della F2 sono destrorse, anche quelle con genotipo d/d; queste ultime, infatti, hanno il fenotipo di torsione della conchiglia che non dipende dal loro genotipo, ma da quello della loro madre (D/d). L’autofecondazione delle chiocciole della F2 produce una progenie F3 che è per 3/4 destrorsa e per 1/4 sinistrorsa. Queste ultime chiocciole sono la progenie d/d delle chiocciole della F2 con genotipo d/d e sono sinistrorse perché il loro fenotipo riflette il genotipo della madre (d/d). L’incrocio reciproco è quello tra una femmina (d/d) sinistrorsa con un maschio (D/D) destrorso (Figura 13.12b). Le chiocciole in F1 hanno genotipo D/d ma sono tutte sinistrorse nel fenotipo poiché il genotipo della madre è d/d. L’autofecondazione della F1 produce in F2 una progenie che è tutta destrorsa, per gli stessi motivi spiegati prima. I genotipi e i fenotipi delle generazioni F2 ed F3 sono uguali a quelli dell’incrocio reciproco, sempre per le stesse ragioni. Quali sono le basi della spiralizzazione? L’orientamento del fuso mitotico nella prima divisione mitotica dopo la fecondazione determina il senso della spiralizzazione. La madre codifica per prodotti che si depositano × sinistrorsa

a) Destrorsa Spiralizzazione destrorsa

Spiralizzazione sinistrorsa

×

Generazione P

d /d

D /D

Generazione F1 D /d Autofecondazione Generazione F2 D /D

D /d

D /d

d /d

337

nell’oocita e che dirigono l’orientamento del fuso mitotico e, quindi, la direzione della divisione cellulare. Quindi una madre con genotipo D/– depositerà prodotti genici che specificano una spiralizzazione destrorsa. Una madre con genotipo d/d o non produce un prodotto genico oppure ne produce uno non funzionale, e questo determinerà la spiralizzazione sinistrorsa. L’effetto materno è anche evidente per certi geni coinvolti nella formazione assiale durante lo sviluppo embrionale di Drosophila melanogaster. Questi geni sono discussi nel Capitolo 19.

Nota chiave Nell’effetto materno, un carattere ereditato è controllato dal genotipo nucleare materno prima della fecondazione dell’uovo, e la sua espressione non viene influenzata dal genotipo paterno.

Determinazione del numero di geni implicati in un profilo di mutazioni con lo stesso fenotipo

Fino a questo punto del volume, ogni mutazione analizzata era a carico di un gene diverso. Ora cominceremo a incontrare casi in cui questo non si verifica. Sarà d’aiuto, per l’analisi e la discussione di questi casi, una comprensione più in dettaglio della relazione tra il fenotipo e il gene. Abbiamo imparato che l’approccio genetico generale per lo studio di un processo biologico consiste nell’isolamento b) Sinistrorsa × destrorsa di mutanti relativi a quel procesSpiralizzazione Spiralizzazione so. Questi mutanti sono identifisinistrorsa destrorsa cati in base al loro fenotipo, il fenotipo mutante, che è diverso × dal fenotipo selvatico. Consideriamo un’analisi genetica nella d /d D /D quale sia stato isolato un gran numero di mutanti, tutti con lo stesso fenotipo alterato. Il nostro scopo è capire la struttura e la D /d funzione dei geni che controllano il processo biologico coinvolto. Ogni mutante definisce un gene diverso oppure no? Possiamo rispondere a questa domanda con il test di compleD /D D /d D /d d /d mentazione, denominato anche

Autofecondazione Generazione F3

3/4

destrorse

1/4

sinistrorse

3/4

destrorse

1/4

sinistrorse

Figura 13.12 Ereditarietà del verso di torsione nella conchiglia Limnaea peregra, esempio dell’effetto materno.

338

Capitolo 13

test cis-trans, che chiarisce se due mutanti con lo stesso fenotipo isolati indipendentemente hanno mutazioni nello stesso gene o in geni diversi. Il test di complementazione fu sviluppato da Edward Lewis per studiare i geni di Drosophila. In un test di complementazione si incrociano due mutanti che mostrano lo stesso fenotipo e si osserva il fenotipo della progenie. Se le due mutazioni sono a carico di geni diversi, allora la progenie sarà costituita da eterozigoti selvatico/mutante per ciascuno dei due geni implicati. Dato che vi è una copia selvatica di ciascun gene, il fenotipo sarà selvatico, non mutante (Figura 13.13a). Si dice che le due mutazioni si complementano. D’altra parte, se le due mutazioni interessano lo stesso gene, allora la progenie erediterà una versione mutata diversa del gene su ciascuno dei due omologhi, e il fenotipo sarà mutante (Figura 13.13b). In questo caso si dice che i due mutanti a) Mutazioni in geni diversi: complementazione Genitori Gene 1

Gene 2

Gene 1

Gene 2

×

Gene 1 mutato Gene 2 selvatico

Gene 1 selvatico Gene 2 mutato

Fenotipo mutante

Fenotipo mutante

Progenie

Gene 1

Gene 2

Gene 1 selvatico Gene 1 mutato Gene 2 selvatico Gene 2 mutato Fenotipo selvatico b) Mutazioni nello stesso gene: nessuna complementazione Genitori Gene

non si complementano. Naturalmente, dato che il test viene effettuato su genotipi sconosciuti, l’interpretazione è invertita. Vale a dire che, se due mutazioni si complementano, devono essere a carico di geni diversi, e, se due mutazioni non si complementano, devono essere a carico dello stesso gene. Il numero di geni definiti da un insieme di mutazioni dipende dal numero di geni implicati nel processo biologico oggetto dello studio genetico. Consideriamo un esempio in Drosophila. Due linee pure mutanti hanno corpo color nero invece del grigio giallastro tipico del selvatico. Quando i due ceppi vengono incrociati, tutti i moscerini della F1 hanno il corpo del colore selvatico (Figura 13.14). Qual è l’interpretazione di questi dati? La spiegazione più semplice è che si sia verificata complementazione tra mutazioni in due geni, ciascuno dei quali è implicato nel fenotipo del colore del corpo. Vale a dire che l’omozigosi per un allele mutante recessivo di un gene autosomico, black (b), determina il colore nero del corpo. L’omozigosi per un allele mutato recessivo di un altro gene autosomico, ebony (e), che è localizzato su un altro autosoma, determina a sua volta, se omozigote, il colore nero del corpo. Dato che i due genitori sono omozigoti, sono genotipicamente b+/b+ e/e e b/b e+/e+, e ciascuno è fenotipicamente nero. Il genotipo della F1 è b+/b e+/e. I moscerini della F1 hanno il colore selvatico del corpo, perché vi è ora un allele selvatico di ciascun gene, che può complementare la funzione mancante dell’allele mutato. È importante notare che nessun evento di ricombinazione è implicato nella complementazione. Qui il doppio eterozigote è derivato semplicemente dalla fusione dei gameti prodotti dai due genitori appartenenti a linee pure. Se i moscerini della F1 ottenuti dall’incrocio tra due ceppi mutanti isolati indipendentemente, appartenenti a linee pure e recessivi con il corpo nero, fossero stati tutti fenotipicamente neri, questo avrebbe significato che le due mutazioni analizzate non si complementavano. Questo risultato avrebbe indicato che si trattava di due mutazioni nello stesso gene. La complementazione può

Gene

× Mutazioni in entrambi gli alleli dello stesso gene

Mutazioni in entrambi gli alleli dello stesso gene

Fenotipo mutante

Fenotipo mutante

Progenie

× b+/b+ e/e Colore nero del corpo

b /b e+/e+ Colore nero del corpo

Gene

Entrambe le copie del gene mutate Fenotipo mutante

Figura 13.13 Test di complementazione per determinare se due mutazioni che danno lo stesso fenotipo sono localizzate nello stesso gene o in geni diversi.

b+/b e+/e Colore selvatico del corpo risultante dalla complementazione dei due geni mutati

Figura 13.14 Complementazione tra due mutazioni di Drosophila melanogaster che determinano il corpo nero.

Estensioni e deviazioni dai principi della genetica mendeliana

essere osservata anche nell’uomo, nella progenie di individui omozigoti per mutazioni recessive in due geni diversi ma con identico fenotipo. Tale progenie infatti, essendo geneticamente eterozigote in entrambi i loci genici, risulterà di fenotipo selvatico. (Un esempio è quello dell’albinismo riportato nel Capitolo 4.)

Nota chiave Il test di complementazione determina se due mutanti con lo stesso fenotipo (linee pure isolate indipendentemente) hanno mutazioni nello stesso gene o in geni diversi. Se la combinazione dei due mutanti determina un fenotipo selvatico, le due mutazioni sono in geni diversi. Se la combinazione dei due mutanti determina un fenotipo mutante, le due mutazioni sono nello stesso gene.

Interazioni tra geni e rapporti mendeliani modificati Nessun gene agisce da solo nel determinare il fenotipo di un individuo; al contrario, il fenotipo è il risultato di una serie di reazioni molecolari integrate, molto complesse e sotto il diretto controllo genico. Tutti gli esempi genetici discussi hanno delle precise basi molecolari e in diversi casi, mediante l’analisi genetica, si possono rilevare delle interazioni complesse tra geni. Di seguito vengono esaminati alcuni di questi esempi. Consideriamo due geni che si distribuiscono indipendentemente, ognuno con due alleli: A e a, B e b. Il risultato di un incrocio tra individui, di cui ciascuno sia un doppio eterozigote (A/a B/b × A/a B/b), sarà rappresentato da 9 genotipi nelle seguenti proporzioni: 1/16 A/A B/B 2/16 A/A B/b 1/16 A/A b/b 2/16 A/a B/B 4/16 A/a B/b 2/16 A/a b/b 1/16 a/a B/B 2/16 a/a B/b 1/16 a/a b/b Se i fenotipi determinati dalle due coppie alleliche sono riconoscibili l’uno dall’altro – per esempio piselli lisci o rugosi, steli lunghi o corti – e vi è dominanza completa, allora si osserva l’ormai familiare rapporto fenotipico di 9:3:3:1, dove le quattro classi fenotipiche rappresentano i fenotipi normale e mutante controllati dai due geni coinvolti (vedi Figura 11.12b). La deviazione dal rapporto standard di 9:3:3:1 dei fenotipi selvatici e mutanti indica che ha luogo un’interazione tra alleli di geni diversi.

339

Come è stato illustrato nel Capitolo 11, i genotipi corrispondenti al rapporto fenotipico 9:3:3:1 possono essere rappresentati in modo abbreviato come A/– B/–, A/– b/b, a/a B/–, a/a b/b rispettivamente. Il trattino indica che il fenotipo è lo stesso, sia il gene dominante allo stato omozigote o eterozigote. Per esempio, A/– significa A/A o A/a. Questo sistema non può essere usato nel caso di dominanza incompleta o di codominanza, perché ai genotipi A/A o A/a corrispondono fenotipi diversi. I diversi paragrafi che seguono discutono le principali situazioni che portano a rapporti mendeliani modificati. Le discussioni sono confinate agli incroci tra diibridi nei quali le due coppie di alleli segregano indipendentemente. Nel mondo reale esistono numerosissimi esempi complessi di interazione genica che coinvolgono più di due coppie di alleli e/o coppie di alleli che non segregano indipendentemente. Per alcuni degli esempi che discuteremo vengono presentate delle interpretazioni molecolari ipotetiche. È importante ricordare che si tratta di interpretazioni teoriche. Esse vengono incluse perché il procedimento della scienza sperimentale implica tipicamente la formulazione di ipotesi basate su teorie o modelli e la pianificazione di esperimenti progettati per saggiare le ipotesi. È quindi corretto prendere in considerazione dei modelli che siano compatibili con i rapporti mendeliani modificati in discussione. Si tenga presente che più di un modello potrebbe spiegare un risultato.

Interazioni geniche che determinano nuovi fenotipi Se le due coppie di alleli in un incrocio di diibridi influenzano la stessa caratteristica fenotipica, l’interazione tra i loro prodotti genici potrebbe determinare nuovi fenotipi, con rapporti fenotipici modificati o meno, a seconda della particolare interazione tra i prodotti dei geni non allelici. Questi esempi differiscono da esempi apparentemente simili che coinvolgono alleli multipli o casi di codominanza poiché gli alleli di due o più geni, non quelli di uno solo, interagiscono per produrre nuovi fenotipi. Consideriamo due geni particolari, entrambi coinvolti nella determinazione del colore dell’occhio di Drosophila. L’omozigosi per l’allele autosomico recessivo di un gene, bw (brown), determina occhi di colore marrone, e l’omozigosi per l’allele autosomico recessivo di un altro gene indipendente, st (scarlet), determina occhi di colore scarlatto. Quando vengono incrociati moscerini di linee pure con occhi marrone e con occhi scarlatto, tutta la F1 ha un nuovo fenotipo, selvatico, con occhi rosso mattone (Figura 13.15a). Quando i moscerini della F1 vengono incrociati, non solo danno origine a moscerini con occhi di color rosso mattone (selvatico), marrone e scarlatto, ma anche a individui con occhi bianchi non pigmentati (Figura 13.15b). Questi quattro fenotipi per il

340

Capitolo 13

a) Moscerino di linea pura con occhi marrone × moscerino di linea pura con occhi scarlatto

Generazione P Fenotipo parentale

Genitore 2

Genitore 1

Occhi marrone

b) F1 × F1

Generazione F2 Rapporto fenotipico in F2 per bw + /bw × bw + /bw

Occhi scarlatto

Genotipo parentale diploide bw /bw st + /st +

Gameti aploidi

bw + /bw + st /st

bw +

st +

bw

3/ 4

Gameti del genitore 1

bw

Genotipi dell’F1:

Proporzioni fenotipiche attese in F2

3/

4

st + /–

9/ 16

bw + /– st + /–

9/ rosso 16 (selvatico)

1/

4

st / st

3/ 16

bw + /– st / st

3/

3/

4

st + /–

3/ 16

bw / bw st + /– 3/16 marrone

1/

4

st / st

1/ 16

bw / bw st / st

16

scarlatto

st

1/ 4

bw +

Rapporti combinati in F2

bw + /–

Gameti del genitore 2

Generazione F1

Rapporto fenotipico in F2 per st + /st × st + /st

st

bw/ bw 1/ 16

bianco

st + bw + /bw st + /st Occhi rossi (selvatico) +

+

tutti bw / bw st /st

Fenotipi dell’F1: tutti con occhi rossi (selvatico)

colore dell’occhio sono in rapporto di 9 selvatico : 3 scarlatto : 3 marrone : 1 bianco. Questo rapporto è caratteristico della progenie F2 che deriva da due genitori ognuno dei quali è eterozigote per due geni, tuttavia la comparsa di un nuovo fenotipo indica la presenza di interazioni geniche. La spiegazione di questo risultato è la seguente (vedi Figura13.15b): il colore degli occhi selvatico dipende dagli alleli selvatici dei geni per il colore dell’occhio brown e scarlet. Questi due geni segregano indipendentemente. Le relazioni tra genotipo e fenotipo in questo caso sono bw+/– st+/– = selvatico; bw+/– st/st = scarlatto; bw/bw st+/– = marrone; e bw/bw st/st = bianco. (Molte altre coppie di geni per il colore dell’occhio in Drosophila hanno concettualmente gli stessi rapporti fenotipo-genotipo nei quali il doppio recessivo dà origine a un nuovo colore dell’occhio.) La spiegazione molecolare del fenotipo con occhio bianco nell’esempio precedente può essere la seguente. Il colore selvatico dell’occhio è il risultato di una combinazione di un pigmento marrone e di uno rosso scarlatto, che produce un colore rosso mattone. I pigmenti rosso scarlatto e marrone sono il prodotto finale di due distinte catene biosintetiche, ognuna delle quali è controllata da un certo numero di geni (Figura 13.16). I moscerini con il genotipo bw+/– st/st non producono il pigmento marrone ma sintetizzano quello rosso scarlatto, quindi hanno occhi di quest’ultimo colore. I moscerini con il genotipo bw/bw st+/– non producono il pigmento rosso scarlatto ma sintetizzano quello marrone, quindi hanno occhi di

Figura 13.15 Interazione genica che produce nuovi fenotipi. Incrocio genetico che mostra l’interazione di geni per il colore dell’occhio in Drosophila.

colore marrone. I moscerini con il genotipo bw/bw st/st non producono pigmento marrone né pigmento rosso e quindi hanno occhi bianchi, non pigmentati.* Un altro esempio di interazione genica coinvolge la forma della cresta nel pollo, che dipende da due geni che segregano indipendentemente, R e P. Polli con genotipo R/– P/– hanno cresta a noce, così chiamata perché ricorda metà di un gheriglio di noce. Un incrocio R/r P/p × R/r P/p dà la seguente progenie: 9 R/– P/– cresta a noce : 3 R/– p/p, cresta a rosa (larga, quasi piatta alla sommità e molle, con la punta assottigliata) : 3 r/r P/–, cresta a pisello (lunghezza media, bassa, con tre sporgenze per l’intera lunghezza) : 1 r/r p/p, cresta singola (sottile, molle, relativamente alta rispetto alla testa e al becco, e con scanalature multiple). Da un punto di vista molecolare, la cresta singola è il fenotipo “base” che si manifesta in assenza dei pro* Precedentemente, in questo capitolo abbiamo discusso l’allelia multipla del locus w (white) legato all’X in Drosophila. Abbiamo appreso che l’allele w, quando in omozigosi nella femmina o in emizigosi nel maschio, determina occhi bianchi. In quell’esempio, una mutazione del singolo gene determina occhi bianchi. Il meccanismo per il fenotipo con occhi bianchi in questo caso è il seguente: l’allele selvatico del locus white codifica per un prodotto necessario per l’accumulo dei pigmenti rossi e marroni nell’occhio. Nei moscerini w/w o w/Y, i pigmenti rossi e marroni sintetizzati in seguito all’attività di geni che controllano le vie biosintetiche dei pigmenti rosso e marrone non vengono accumulati nell’occhio.

Estensioni e deviazioni dai principi della genetica mendeliana a) bw + /– st + /–

b) bw/bw st + /–

occhio rosso (selvatico)

341

c) bw + /– st /st

occhio marrone

occhio scarlatto

Composto a

Composto d

Composto a

Composto d

Composto a

Composto d

Composto b

Composto e

Composto b

Composto e

Composto b

Composto e

bw + /–

Prodotto c scarlatto

st + /–

Prodotto f marrone

bw /bw

No prodotto c

d) bw / bw st /st occhio bianco

Composto a

Composto b

bw / bw

No prodotto c

Composto d

Composto e

st / st

No prodotto f

dotti genici dei loci R e P. La presenza di almeno un allele funzionale nel locus R (R/– p/p) modifica il fenotipo base in cresta a rosa mentre un allele funzionale nel locus P (r/r P/–) modifica il fenotipo base in cresta a pisello. Infine, i prodotti genici R e P interagiscono a dare un nuovo fenotipo, la variante cresta a noce (R/– P/–).

L’epistasi L’epistasi (letteralmente “stare al di sopra”) è l’interazione tra gli alleli di due o più geni che controllano un unico fenotipo. L’interazione implica che un gene mascheri l’espressione fenotipica di un altro gene. In questo fenomeno sono coinvolti geni che contribuiscono a differenti passaggi di una stessa via biosintetica. Per questo, le mutazioni di un gene possono mascherare gli effetti di un altro gene nella produzione di un particolare fenotipo. In seguito a questo tipo di interazione tra geni

st + /–

Prodotto f marrone

bw + /–

Prodotto c scarlatto

st /st

No prodotto f

Figura 13.16 Schema semplificato della via biosintetica che porta alla produzione del pigmento dell’occhio di Drosophila. Sono illustrati i risultati delle mutazioni indicate. (I substrati delle reazioni e i loro prodotti sono indicati, per semplificare, con lettere.)

non vengono prodotti nuovi fenotipi. Un gene che maschera l’espressione di un altro gene è definito epistatico e il gene del quale viene mascherata l’espressione è detto ipostatico. Dati due loci non allelici A e B, con A epistatico su B, l’epistasi può essere causata dall’omozigosi recessiva dell’allele A (a/a, epistasi recessiva, cioè dalla mancanza del suo prodotto genico), oppure derivare dalla presenza di un allele dominante nel locus A (A/–, epistasi dominante, cioè dalla presenza del suo prodotto genico). In entrambi i casi, l’espressione fenotipica del gene nel locus B viene mascherata, indipendentemente dagli alleli in esso presenti (B/– o b/b). L’epistasi può anche avvenire tra alleli di due geni in entrambe le direzioni (epistasi duplicata). Tutte queste possibilità possono produrre un gran numero di modificazioni del rapporto 9:3:3:1 in un incrocio di diibridi. Alcuni esempi di epistasi vengono descritti di seguito. Epistasi recessiva Se consideriamo i genotipi della F2 di un incrocio di diibridi (A/– B/–, A/– b/b, a/a B/– e a/a b/b in rapporto fenotipico 9:3:3:1), nell’epistasi recessiva del locus A sul locus B, gli individui a/a B/– e a/a b/b hanno lo stesso fenotipo. Questo determina un rapporto fenotipico di 9:3:4 in F2 piuttosto che 9:3:3:1. Un esempio è il colore del pelo nei roditori. I topi selvatici hanno il pelo di colore grigiastro, perché i peli nel mantello hanno una banda gialla tra due bande nere. Come già accennato, questa modalità di colorazione è chiamata agouti, ha una funzione mimetica ed è presen-

342

Capitolo 13

te in molti altri roditori selvatici, tra i quali le cavie e gli scoiattoli grigi. Nei roditori domestici si osservano vari altri colori del mantello. Il colore nero, in particolare, è il risultato dell’assenza del pigmento giallo presente nell’agouti e si osserva in omozigosi recessiva dell’allele a (recessivo rispetto all’agouti, A). Gli albini, invece, mancano completamente di pigmento nella pelliccia e nell’iride degli occhi, quindi hanno pelo bianco e occhi rosa. Gli albini sono linee pure (omozigoti recessivi per gli alleli del locus C, c/c) e si comportano come recessivi completi rispetto a ogni altro colore. Quando topi agouti appartenenti a linee pure vengono incrociati con albini, tutta la progenie F1 risulta agouti, e quando questi agouti F1 vengono incrociati tra di loro, la progenie F2 è costituita approssimativamente da 9/16 di animali agouti, 3/16 di neri e 4/16 di albini (Figura 13.17). Questo si verifica perché sia i topi A/– c/c sia i topi a/a c/c risultano fenotipicamente albini (invece che agouti e neri, rispettivamente) essendo entrambi omozigoti per gli alleli del locus C. In altre parole, il pelo dei topi c/c è bianco indipendentemente dagli alleli presenti nel locus A. Questo è un esempio di epistasi recessiva, in quanto il locus C è epistatico sul locus A quando gli alleli in esso presenti sono entrambi recessivi (c/c). (Nota: i simboli utilizzati sono quelli reali usati per i geni implicati nel controllo del colore del pelo dei roditori. Non si deve confondere questo locus a con il locus a teorico al quale si fa riferimento nella discussione generale sui rapporti modificati.)

× A/A C /C agouti

P

a/a c/c albino

F1

A/a C/c agouti

F1 × F1

Rapporto in F2 per A/a × A/a

3/

1/

4

4

×

A/a C /c agouti Rapporto in F2 per C/ c × C /c

Rapporti combinati in F2

A/a C/c agouti Proporzioni fenotipiche in F2

3/ 4

C /–

9/ 16

A/– C/–

9/ 16

agouti

1/ 4

c /c

3/ 16

A/– c/c

3/ 16

albino

3/ 4

C /–

3/ 16

a/a C/–

3/ 16

nero

1/ 4

c /c

1/ 16

a/a c/ c

1/ 16

albino

A/–

Cerchiamo di comprendere dal punto di vista molecolare perché la mancanza del prodotto del locus C può mascherare il fenotipo dovuto al prodotto del locus A. Nei fenotipi del colore del pelo dei roditori qui descritti sono implicati 3 geni. Relativamente al locus C, l’allele dominante C codifica l’enzima tirosinasi, un enzima chiave nella via biosintetica del pigmento nero eumelanina. L’allele recessivo c, se omozigote, determina l’assenza del pigmento eumelanina, indipendentemente dai genotipi degli altri geni coinvolti nel colore del pelo. Quindi i topi con genotipo c/c saranno sempre bianchi. Nel locus agouti, l’allele dominante A determina la colorazione agouti e il suo allele recessivo a allo stato omozigote determina topi non agouti. Il prodotto del locus agouti è una proteina segnale che regola i pigmenti prodotti dalle cellule che sintetizzano la melanina nei follicoli piliferi. Nei roditori con genotipo A/–, il pattern di bande nere e gialle è dovuto al fatto che l’allele A non è sempre espresso durante la crescita dei peli. All’inizio della crescita del pelo, la proteina segnale per l’agouti non è espressa dall’allele A. Questo significa che viene sintetizzato il pigmento nero, l’eumelanina. A metà della crescita del pelo, l’allele A diventa attivo. La proteina segnale per agouti sposta la sintesi di melanina verso forma feomelanina, che nei roditori è di colore giallo. Infine, l’allele A diventa di nuovo inattivo e il pigmento nero si deposita nei peli. Complessivamente, l’azione di un allele agouti dominante produce peli che hanno una banda gialla tra due nere. I roditori omozigoti a/a non agouti hanno peli neri perché non è prodotto nessun segnale peptidico attivo per l’agouti e, quindi, il pigmento prodotto non passa mai da melanina a feomelanina. Si noti che in questa discussione si è assunto che il topo sia altrimenti selvatico per i geni del colore del mantello, e ciò significa che la sintesi di eumelanina determina il colore nero del pelo. (L’omologo umano del gene agouti del topo è il gene per la proteina segnale agouti [OMIM 600201]. Questo gene è espresso nei testicoli, nelle ovaie e nel cuore, e a livelli più bassi nel fegato, nei reni e nel prepuzio. La proteina segnale agouti è secreta ed è coinvolta nella regolazione della produzione di melanina. A differenza dell’attività del prodotto agouti nei roditori, la proteina segnale agouti nell’uomo può influenzare la qualità della pigmentazione del pelo piuttosto che la modalità di deposizione del pigmento melanina.) Ci sono più di 60 geni

a /a 4/ 16

albino

Figura 13.17 Epistasi recessiva: comparsa in F2 di un rapporto 9 agouti : 3 neri : 4 bianchi in relazione al colore del pelo nei roditori.

Estensioni e deviazioni dai principi della genetica mendeliana

343

di 9 neri : 3 color cioccolato : 4 gialli. Da un punto di vista molecolare, il gene E codifica per una proteina chiamata recettore 1 della melanocortina (MC1R). MC1R è un regolatore chiave per il colore dei peli e della pelle. Cani con genotipo E/– producono una proteina MC1R normale e quindi hanno una pelliccia scura, mentre cani con genotipo e/e producono MC1R non funzionale e hanno pelliccia gialla. Il Focus sul genoma di questo capitolo descrive gli studi sul gene che codifica MC1R nei mammut e nell’uomo di Neandertal. Epistasi dominante Nell’epistasi dominante, gli individui A/– B/– e A/– b/b hanno lo stesso fenotipo, quindi il rapporto fenotipico alla F2 è 12:3:1 anziché 9:3:3:1. In altre parole, nell’epistasi dominante, un gene, se dominante, in questo caso A, è epistatico sull’altro gene. Un esempio di epistasi dominante può essere osservato nel colore del frutto della zucca, che presenta comunemente tre colori: bianco, giallo e verde. Negli incroci tra bianco e giallo e tra bianco e verde, il bianco è sempre espresso. Negli incroci tra giallo e verde, è espresso il giallo. Il giallo quindi è recessivo rispetto al bianco, ma dominante sul verde. Consideriamo due geni, ognuno con una coppia di alleli: W/w e Y/y. Il colore della zucca gialla è dovuto alla presenza di un allele dominante Y, mentre l’allele recessivo y produce una zucca verde. Questo avviene in assenza del prodotto del locus W il quale, se presente, impedisce l’espressione fenotipica del giallo e del verde e la zucca risulta bianca. Quindi, nelle zucche con genotipo W/– il frutto è bianco, indipendentemente dal genotipo dell’altro locus. Nelle piante w/w il frutto è giallo se è presente un allele dominante dell’altro locus, ma verde se è assente. In altre parole, le piante W/– Y/– e W/– y/y hanno frutti bianchi, le piante w/w Y/– frutti gialli e le piante w/w y/y frutti verdi. La progenie F2 di un’autofecondazione degli individui doppi eterozigoti della F1 mostra un rapporto 12:3:1 di piante a frutti bianchi : gialli : verdi (Figura 13.19).

Figura 13.18 Epistasi recessiva nei cani labrador. A sinistra: labrador nero, genotipo B/– E/–. Al centro: labrador giallo, genotipo –/– e/e. A destra: labrador color cioccolato, genotipo b/b E/–.

per il colore del mantello nei topi, per questo in questi animali sono evidenziabili molte varianti del colore del pelo. Il terzo gene per il nostro esempio di epistasi, discusso qui di seguito, rappresenta uno di questi geni. Il colore nero, infatti, è determinato dall’allele dominante B di un terzo gene, che codifica per un prodotto coinvolto nella produzione di eumelanina, cioè la proteina 1 correlata alla tirosinasi. Il ruolo esatto di questa proteina nella determinazione del colore del mantello non è chiaro: un modello prevede che la proteina agisca per stabilizzare la tirosinasi. (Nell’uomo, la perdita di funzione del gene tirosinasi determina una forma di albinismo oculocutaneo [OMIM 203100] caratterizzato da poca o nessuna pigmentazione della pelle, dei capelli e degli occhi.) Un altro esempio di epistasi recessiva riguarda il colore del pelo nei cani labrador. Un locus B/– determina la formazione di un pigmento nero, mentre b/b determina la produzione di un pigmento bruno. Un gene indipendente E/– consente l’espressione del gene B, mentre e/e non la permette, e quest’ultima situazione produce colore giallo. Quindi, al genotipo B/– E/– corrisponde un labrador nero, a b/b E/– un labrador color cioccolato (bruno) e a –/– e/e un labrador giallo (–/– significa o B o b su ciascun cromosoma) (Figura 13.18). Vi è una lieve differenza tra i labrador gialli, in quanto i cani con genotipo F1 × F1 W /w Y /y B/– e/e hanno muso e labbra scuri, mentre i cani con frutti bianchi genotipo b/b e/e li hanno chiari. Quindi, se incrociaRapporto Rapporto mo un labrador nero omozigote di genotipo B/B E/E alla F2 per alla F2 per W/w × W/w Y/ y × Y /y con uno giallo omozigote di genotipo b/b e/e, la F1 sarà costituita tutta da cani neri di genotipo B/b E/e. 3/ Y/– 4 L’incrocio tra labrador con questo genotipo produr3/ W/– 4 rà 9 B/– E/– neri : 3 B/– e/e gialli : 3 b/b E/– color 1/ y/y 4 cioccolato : 1 b/b e/e gialli, nel rapporto fenotipico Figura 13.19 Epistasi dominante: comparsa alla F2 di un rapporto 12 bianchi : 3 gialli : 1 verde in relazione al colore del frutto nella zucca.

1/

4

×

W/ w Y /y frutti bianchi

Rapporti combinati alla F2

Proporzioni fenotipiche alla F2

9/ 16

W/– Y /–

9/

16

bianco

3/ 16

W/– y/y

3/

16

bianco

12 / bianco 16

3/

4

Y/–

3/ 16

w/w Y /–

3/

16

giallo

1/

4

y/y

1/ 16

w/w y/y

1/

16

verde

w/w

344

Capitolo 13

Focus sul genoma Rossi del passato Il gene MC1R codifica per una proteina di membrana che agisce come interruttore tra la produzione di feomelanina, giallo rossastra, e di eumelanina, marrone nerastra. Tra gli uomini, alcuni possono attribuire la loro pelle chiara e i loro capelli rossi a un allele MC1R che codifica per una versione meno funzionale di questo enzima. Gli scienziati, utilizzando tecniche genomiche, tra le quali l’analisi degli SNP (vedi Capitolo 8), e tecniche molecolari standard modificate, come la reazione a catena della polimerasi (PCR, vedi Capitolo 9), hanno studiato campioni di DNA antico proveniente da mammut e da uomini di Neandertal e hanno trovato mutazioni simili. Un osso di mammut di 43 000 anni ha dato una quantità sufficiente di DNA da consentire di sequenziare il gene MC1R, e i ricercatori hanno trovato che il mammut aveva due versioni distinte del gene. Una codificava per una proteina MC1R molto attiva e l’altra per una proteina con una capacità molto limitata di rispondere ai segnali che danno istruzione alla cellula di produrre eumelanina. Sono stati trovati numerosi mammut mummificati, e alcuni avevano il pelo più chiaro degli altri: sembra così che questa variazione genetica possa aver determinato una variazione del colore nei mammut. Le modificazioni del gene MC1R sono molto simili a quelle osservate in una popolazione di topi da spiaggia, in cui sono comuni sia individui con pelo chiaro sia individui

Nella Figura 13.20 viene illustrata una teorica via metabolica per spiegare il rapporto 12:3:1 per il colore della zucca. L’assunto è che una sostanza verde sia convertita in un prodotto finale giallo, attraverso una reazione che richiede il prodotto dell’allele dominante Y, e che il prodotto dell’allele dominante W possa convertire sia la sostanza verde sia quella gialla in quella bianca. Quindi, Allele Y

Verde (w /w y /y)

Giallo (w /w Y /–) Allele W

Bianco (W /– Y /– o W /– y /y)

Figura 13.20 Epistasi dominante: ipotetica via metabolica per spiegare il rapporto di 12 frutti bianchi : 3 gialli: 1 verdi nella zucca alla F2.

con pelo scuro. Almeno due uomini di Neandertal, uno in Spagna e uno in Italia, erano portatori di versioni ugualmente alterate di MC1R. Quando fu testata in cellule umane in laboratorio, l’attività del prodotto del gene MC1R di Neandertal risultò molto simile a quella di un allele umano che determina pelle chiara e capelli rossi. Questi due individui non erano strettamente imparentati, poiché la datazione dei resti evidenziava che le ossa ritrovate in Italia risalivano a 7000 anni prima di quelle ritrovate in Spagna. Questo portò i ricercatori a concludere che quell’allele dovesse essere piuttosto diffuso nella popolazione, poiché era stato trovato in due individui notevolmente distanti, sia nello spazio sia nel tempo. I ricercatori si chiesero se questo specifico allele fosse comune tra gli uomini moderni. Essi sequenziarono il gene MC1R dal DNA ottenuto da un panel di linee cellulari rappresentative della diversità genomica umana, una collezione di colture cellulari ottenute da più di 1000 uomini moderni con un background genetico diverso, e analizzarono anche la sequenza di questo gene in altri 2800 uomini moderni. Trovarono molti alleli per il gene MC1R ma non trovarono mai un allele identico a quello trovato nel DNA dei Neandertal. Conclusero che, pur essendo presenti geni MC1R mutati nell’uomo moderno, l’allele mutato è molto più raro che nell’uomo di Neandertal.

tutte le piante che hanno almeno un allele W avranno i frutti bianchi, indipendentemente dagli alleli presenti al locus Y, poiché il verde o il giallo è convertito in bianco. I frutti non bianchi, w/w, sono gialli se Y/– o verdi se y/y. Un altro esempio di epistasi dominante è alla base dell’ingrigimento nei cavalli. Se un cavallo è genotipicamente G/– mostrerà una progressiva argentatura del colore del mantello fino a diventare, da animale adulto, con pelo grigio (in realtà, quasi bianco). Cavalli con genotipo g/g non ingrigiscono diventando adulti; al contrario, rimangono del colore che avevano alla nascita. Epistasi a carico di geni duplicati Un gene o un genotipo in un locus può determinare un fenotipo identico a quello prodotto da un gene o genotipo in un secondo locus. In questo caso, si dice che sono coinvolti geni duplicati. Quando è implicata epistasi dominante o recessiva con entrambi i geni, questo determina una modificazione del rapporto 9:3:3:1 nei modi che vedremo e in tal caso si parla di epistasi duplicata.

Estensioni e deviazioni dai principi della genetica mendeliana

×

C /C p /p bianco

P

F1

Figura 13.21 Epistasi duplicata recessiva: comparsa alla F2 di un rapporto di 9 porpora : 7 bianchi in relazione al colore del fiore nel pisello odoroso.

c /c P /P bianco

C /c P /p porpora

F 1 × F1

Rapporto F2 C /c × C /c

3/ 4

1/ 4

×

C /c P /p porpora

Rapporto F2 P /p × P /p

I geni C e P codificano per prodotti che controllano diversi passaggi della stessa via biosintetica. Solo nelle piante C/– P/– può essere prodotto un composto finale porpora, mentre tutte le altre piante non riescono a fare fiori porpora e hanno fiori bianchi, poiché è bloccata la conversione dell’intermedio bianco in porpora, con genotipo C/– p/p, o la conversione del precursore bianco nell’intermedio bianco, con genotipo c/c P/– o c/c p/p.

C /c P /p porpora

Rapporto F2 combinati

Rapporto fenotipico F2

3/ 4

P /–

9/

16

C /– P /–

9/

1/ 4

p /p

3/

16

C /– p /p

3/ 16

bianco

3/ 4

P /–

3/

16

c /c P /–

3/ 16

bianco

1/ 4

p /p

1/

16

c /c p /p

1/ 16

bianco

16

porpora

C /–

7/ 16

bianco

c /c

Epistasi recessiva duplicata Nell’epistasi recessiva duplicata (detta anche azione genica complementare) a/a è epistatico su B e b, e b/b è epistatico su A e a. Un esempio riguarda il colore del fiore nei piselli, in cui il purpureo è dominante sul bianco. Una mutazione recessiva nel gene C o P, se in omozigosi, produce fiori bianchi. Fiori porpora sono prodotti solo da genotipi con almeno un allele C normale e un allele P normale. D’altra parte, incroci tra due linee pure bianche con genotipo C/C p/p con linee pure bianche con genotipo c/c P/P danno solo piante a fiori purpurei con genotipo C/c P/p in F1 (Figura 13.21). (Notare che il fenotipo purpureo è ripristinato nella progenie C/c P/p per complementazione delle due mutazioni nei loci C e P presenti nelle piante parentali bianche.) Quando questi ibridi F1 vengono autofecondati, producono una generazione F2 con le seguenti relazioni tra genotipo e fenotipo: 9 C/– P/– (fiori purpurei) : 3 C/– p/p (fiori bianchi) : 3 c/c P/– (fiori bianchi) : 1 c/c p/p (fiori bianchi), per un rapporto fenotipico finale di 9 fiori porpora : 7 fiori bianchi. Questo poiché il genotipo recessivo c/c è epistatico su P e p, e il genotipo recessivo p/p è epistatico su C e c. Per la produzione del pigmento porpora può essere immaginata la seguente via biosintetica puramente teorica: Gene C

Precursore (bianco) (c /c p /p, c /c P /–)

Gene P

Intermedio (bianco) (C /– p /p)

345

Prodotto finale porpora (C /– P /–)

Epistasi dominante duplicata Nell’epistasi dominante duplicata A è epistatico su B e b, e B è epistatico su A e a. Un esempio è rappresentato dalla forma del frutto nella pianta Capsella bursa pastoris. Quando una pianta di linea pura che produce frutti a forma di cuore viene incrociata con una pianta a frutti stretti, le piante della F1 producono tutte frutti a forma di cuore. Quando le piante della F1 con frutti a forma di cuore vengono incrociate, la F2 mostra un rapporto di 15 piante con frutti a forma di cuore : 1 pianta con frutti stretti. Questa è una modificazione del rapporto 9:3:3:1, dove i genotipi A/– B/–, A/– b/b e a/a B/– determinano tutti il fenotipo frutto a forma di cuore e il genotipo a/a b/b produce l’altro fenotipo frutto stretto. In altre parole, vi sono geni duplicati coinvolti nel fenotipo della forma del frutto e l’allele dominante di ognuno dei due geni è epistatico su qualsiasi allele dell’altro. In sintesi, sono possibili molti tipi di modificazioni dei rapporti fenotipici, come risultato di interazioni tra i prodotti di diverse coppie di alleli che contribuiscono allo stesso carattere. I genetisti scoprono queste interazioni quando osservano deviazioni rispetto ai rapporti fenotipici attesi negli incroci. L’analisi delle interazioni tra geni e i corrispondenti rapporti fenotipici è ulteriormente complicata quando una o entrambe le coppie alleliche manifestano dominanza incompleta o codominanza, o quando le coppie alleliche non segregano in modo indipendente. La Tabella 13.3 riassume le interazioni epistatiche che abbiamo discusso nel presente capitolo. L’epistasi svolge un ruolo in molte malattie dell’uomo, complicando pertanto la loro analisi. In questi casi si verificano interrelazioni complesse. Per esempio, molti casi di disordine bipolare (anche chiamato malattia maniaco-depressiva), una malattia genetica umana complessa che comporta disturbi patologici dell’umore, implicano un’epistasi tra molti geni e possono coinvolgere altri meccanismi genetici più complessi.

346

Capitolo 13

Tabella 13.3 Schema riassuntivo dei rapporti fenotipici epistatici della F2 da un incrocio di F1 A/a B/b μ F1 A/a B/b per il quale si dimostra dominanza completa per ogni coppia di alleli Rapporto fenotipico in F2 da un incrocio A/a B/b × A/a B/b Interazione genica

A/– B/–

A/– b/b

a/a B/–

a/a b/b

Nessuna

9

3

3

1

Epistasi recessiva a/a epistatico su B e b

9

3

Epistasi dominante A epistatico su B e b Epistasi duplicata recessiva (azione genica complementare) a/a epistatico su B e b e b/b epistatico su A e a

12

3

9

Epistasi duplicata dominante A epistatico su B e b e B epistatico su A e a

Nota chiave In molti casi, alleli di geni diversi interagiscono nel determinare le caratteristiche fenotipiche. In alcuni casi, un’interazione tra i prodotti genici produce nuovi fenotipi senza modificare i tipici rapporti mendeliani. Nell’epistasi, l’interazione tra geni determina modifiche dei rapporti mendeliani perché un genotipo interferisce con l’espressione fenotipica di un altro genotipo (o di altri genotipi).

Interazione genica che coinvolge geni modificatori Nella nostra discussione sull’epistasi, abbiamo appreso di alleli che possono avere effetti rilevanti nell’alterare il fenotipo mascherando l’espressione di un particolare genotipo. Un gene modificatore agisce anch’esso con un altro gene non allelico ma, invece di mascherarlo, modifica in maniera più lieve il fenotipo associato all’espressione degli alleli di quel gene. Sulla base del tipo di modificazione causata, i geni modificatori sono divisi in due gruppi: attivatori, che amplificano il fenotipo controllato da un altro gene, e riduttori, che diminuiscono l’espressione fenotipica di un altro gene. (Si noti che il termine attivatori utilizzato in questo paragrafo è diverso da quello usato nel Capitolo 18 per indicare gli elementi del DNA che mediano l’attivazione dei geni negli eucarioti.) Quando un gene modificatore cambia il fenotipo associato a un allele mutante di un altro gene in un fenotipo associato all’allele selvatico dello stesso gene, questo è detto gene soppressore.

4 1

7

15

1

Una semplice dimostrazione dell’effetto di un gene modificatore è data dal colore del pelo nei gatti (e nei roditori). L’allele dominante D del gene pigmento compatto codifica una proteina necessaria per il trasporto e la deposizione del pigmento nei peli in crescita. I gatti di genotipo D/– hanno un colore intenso che dipende dagli altri colori presenti nel loro pelo. Per esempio, gatti con genotipo B/– D/– sono neri poiché l’allele dominante B produce la quantità massima di pigmento nero e l’allele dominante D determina il trasporto completo e la deposizione di quel pigmento nei peli. D’altra parte, gatti con genotipo d/d hanno una ridotta capacità di trasportare e depositare il pigmento nei peli che stanno crescendo. La densità minore del pigmento nel pelo produce un colore più chiaro di quello del gatto D/– che condivide lo stesso set di geni per il colore del pelo. Per esempio, gatti con genotipo B/– d/d sono grigi piuttosto che neri. Allo stesso modo, il genotipo d/d modifica il colore marrone in marrone chiaro, cannella in rosso chiaro e arancione in panna. È noto che i geni modificatori influenzano l’espressione fenotipica degli alleli mutanti responsabili di un certo numero di sindromi genetiche umane. È probabile che molti sintomi di una malattia genetica umana siano influenzati dai geni modificatori. Per contro, la variabilità dei sintomi tra individui con lo stesso genotipo relativamente alla stessa malattia genetica potrebbe essere dovuta all’azione di geni modificatori. Per esempio, i fenotipi della fibrosi cistica (CF) sono molto variabili. Sono più di quanti potrebbero essere spiegati dal fatto che esistono più di 1000 mutazioni del gene responsabile che causano la malattia. L’ipotesi più semplice è che i geni modificatori influenzino l’espressione fenotipica degli alleli mutanti per la fibrosi cistica. Si sa inoltre che i geni modificatori influenzano la gravità di una forma gene-

Estensioni e deviazioni dai principi della genetica mendeliana

tica di sordità: mutazioni nel gene cadherin 3 causano sordità nell’uomo (così come in altri mammiferi), e i ricercatori hanno dimostrato che le alterazioni di un altro gene, V586M, aumentano la gravità della sordità causata da mutazioni del gene cadherin 3. In questo esempio, V586M è un gene modificatore che influenza l’espressione fenotipica del gene cadherin 3.

Nota chiave Un gene modificatore interagisce con un altro gene non allelico influenzando il fenotipo associato all’espressione degli alleli di quel gene, piuttosto che mascherando la loro espressione, come si è visto nell’interazione genica dell’epistasi.

Ereditarietà extranucleare Nella cellula eucariote, oltre al DNA nucleare, è presente anche il DNA degli organelli, quali i mitocondri e i cloroplasti. I geni contenuti nel DNA mitocondriale (mtDNA) o cloroplastico sono conosciuti come geni extranucleari, geni extracromosomiali, geni citoplasmatici, geni non mendeliani o geni degli organelli. Il termine non mendeliano è informativo, poiché i geni extranucleari non seguono le regole mendeliane di trasmissione ereditaria, come fanno invece i geni nucleari. In molti organismi, infatti, il citoplasma con i suoi organelli è ereditato dalla madre, quindi l’ereditarietà dei geni extranucleari in essi è strettamente materna. L’ereditarietà extranucleare differisce dall’effetto materno visto precedentemente per due aspetti correlati: (1) il fenotipo nell’ereditarietà extranucleare è determinato dai geni degli organelli dell’individuo, mentre il fenotipo nell’effetto materno è determinato dai geni nucleari della madre dell’individuo; (2) il fenotipo dell’individuo nell’ereditarietà extranucleare è associato al suo genotipo, mentre il fenotipo di un individuo nell’effetto materno non è associato al suo genotipo, ma a quello di sua madre.

Genomi extranucleari I mitocondri, organelli che si trovano nel citoplasma di tutte le cellule eucariote aerobiche, sono coinvolti nella respirazione cellulare. Essi ossidano il piruvato, il prodotto della glicolisi nel citosol, a diossido di carbonio e acqua, con la produzione concomitante di ATP. Il DNA dei mitocondri contiene l’informazione per un certo numero di componenti mitocondriali, quali i tRNA, gli rRNA e alcune subunità polipeptidiche della citocromoossidasi, della NADH-deidrogenasi e dell’ATPasi. Le altre componenti che si trovano nei mitocondri, di fatto la maggior parte delle proteine in essi presenti, sono codificate da geni nucleari e poi importate nei mitocondri.

347

Tra esse ci sono la DNA polimerasi e le altre proteine necessarie per la replicazione dell’mtDNA, l’RNA polimerasi e tutte le altre proteine implicate nella trascrizione, le proteine ribosomali per l’assemblaggio dei ribosomi, i fattori proteici per la traduzione, le amminoacil-tRNA sintetasi e le altre subunità polipeptidiche della citocromo ossidasi, della NADH-deidrogenasi e dell’ATPasi. Il genoma dei mitocondri è costituito da una molecola di DNA generalmente circolare a doppia elica e superavvolto, con l’eccezione di alcuni protozoi e funghi in cui è lineare e privo di proteine strutturali associate. Le sue dimensioni variano enormemente tra diversi organismi, dalle 16,5 kb nei mammiferi fino alle 2000 kb in alcune piante superiori. La differenza di dimensioni riscontrata tra le specie non è dovuta ad un numero maggiore di geni ma alla presenza di DNA non codificante. Sia il DNA di lievito sia quello dell’uomo sono stati sequenziati (vedi Capitolo 8). Il numero di molecole di mtDNA varia nelle cellule di diverse specie per la presenza sia di un diverso numero di mitocondri, sia di un diverso numero di copie di DNA all’interno di un singolo mitocondrio, distribuite in regioni dette nucleoidi. In una cellula umana, per esempio, si trovano generalmente alcune migliaia di mitocondri con in media 2 copie di mtDNA ciascuno. I cloroplasti sono organelli cellulari presenti soltanto nelle piante verdi e nei protisti fotosintetici e sono il luogo della fotosintesi nelle cellule che li contengono. La fotosintesi è realizzata in due fasi che comportano reazioni alla luce e reazioni al buio. Nelle reazioni alla luce la clorofilla viene usata per convertire l’energia luminosa in energia chimica, specificamente in ATP e NADPH. Nelle reazioni al buio, l’anidride carbonica e l’acqua sono convertite in carboidrati utilizzando l’energia chimica presente sotto forma di ATP e NADPH. Il DNA dei cloroplasti (cpDNA) è, con rare eccezioni, circolare a doppia elica e ha dimensioni tra le 120 e le 160 kb nelle piante superiori e fino a quasi 300 kb nelle alghe verdi. I cloroplasti possono essere singoli o numerosi nella cellula vegetale e contenere un numero variabile di molecole di cpDNA anch’esse distribuite in regioni nucleoidi come il DNA mitocondriale. Nell’alga unicellulare Chlamydomonas, per esempio, un singolo cloroplasto contiene tra le 500 e le 1500 copie di DNA. Il genoma del cloroplasto contiene i geni per tutti gli rRNA cloroplastici, per i tRNA e per alcune proteine necessarie per la trascrizione e la traduzione dei geni codificati dal cpDNA (quali proteine ribosomali, subunità dell’RNA polimerasi e fattori di traduzione) e per la fotosintesi. La maggior parte delle proteine che si trovano nei cloroplasti è codificata da geni nucleari.

Le leggi dell’ereditarietà extranucleare Le modalità di trasmissione ereditaria mostrate dai geni extranucleari sono note come ereditarietà extranuclea-

348

Capitolo 13

re o ereditarietà non mendeliana e differiscono notevolmente dal comportamento mostrato dai geni nucleari. Infatti, se i risultati ottenuti da un incrocio genetico non si conformano alle attese di un incrocio che coinvolge geni nucleari, c’è una valida ragione per sospettare un’ereditarietà extranucleare. Le caratteristiche principali dell’ereditarietà non mendeliana sono quattro. 1. Non si ottengono i tipici rapporti di segregazione mendeliana, poiché non è coinvolta segregazione dei cromosomi nucleari durante la meiosi. Le molecole di mtDNA e cpDNA si replicano autonomamente dal DNA nucleare e segregano insieme agli organelli che le contengono in maniera casuale durante la divisione cellulare (sia mitotica sia meiotica). Di conseguenza, il numero di organelli e di molecole di DNA nelle cellule figlie può non essere uguale. 2. Negli eucarioti multicellulari, i risultati di incroci reciproci che coinvolgono geni extranucleari non sono uguali a quelli di incroci che coinvolgono geni nucleari, poiché non è implicata segregazione mendeliana basata sulla meiosi. (Come discusso nei Capitoli 11 e 12, in un incrocio reciproco si inverte il sesso dei genitori. Per esempio, se A e B rappresentassero genotipi contrastanti, A × B e B × A sarebbero un paio di incroci reciproci.) Se i geni trasmessi sono localizzati sui cromosomi nucleari, i risultati di incroci reciproci tra un selvatico e un mutante sono generalmente uguali (con l’eccezione dei geni nucleari legati al sesso, la cui ereditarietà è stata trattata nel Capitolo 12). I geni mitocondriali e cloroplastici, invece, manifestano generalmente ereditarietà uniparentale da una generazione a quella successiva. Nell’ereditarietà uniparentale tutta la progenie, sia maschile sia femminile, ha il fenotipo di un genitore soltanto. Negli eucarioti multicellulari il fenotipo espresso in modo esclusivo è generalmente quello della madre, un fenomeno che prende il nome di ereditarietà materna. L’ereditarietà materna dipende dal fatto che, al momento della fecondazione, lo zigote riceve la maggior parte del suo citoplasma contenente i geni extranucleari presenti negli organelli (mitocondri e, se ci sono, cloroplasti), quasi esclusivamente dal gamete femminile, che presenta una quantità elevata di citoplasma rispetto a quello maschile. (Si noti che l’ereditarietà materna è distinta dall’effetto materno poiché nella prima la progenie ha spesso il fenotipo materno. Al contrario, nell’effetto materno, la progenie spesso ha il fenotipo determinato dal genotipo materno nucleare.) Nel Box 13.1 si discute come l’ereditarietà materna del genoma mitocondriale possa essere usata per studiare le relazioni genetiche nella popolazione umana.

3. I geni extranucleari non possono essere mappati sui cromosomi nucleari. 4. L’ereditarietà non mendeliana non cambia in seguito ad approcci sperimentali di sostituzione nucleare. Mutazioni nel genoma extranucleare non possono cioè essere corrette con la sostituzione del genoma nucleare.

Nota chiave L’ereditarietà dei geni extranucleari segue regole diverse rispetto a quella dei geni nucleari. In particolare non è coinvolta la segregazione meiotica, si manifesta spesso un’ereditarietà uniparentale (perlopiù materna), i geni extranucleari non possono essere mappati su cromosomi nucleari e il fenotipo permane anche dopo sostituzione nucleare.

Esempi di ereditarietà extranucleare In questo paragrafo, per illustrare meglio i principi che regolano l’ereditarietà non mendeliana, prenderemo in esame le caratteristiche di un numero selezionato di mutazioni nei cromosomi extranucleari. Il mutante [poky] di Neurospora – ereditarietà materna Il fungo Neurospora crassa (Capitolo 4) è un aerobio obbligato, richiede ossigeno per crescere e sopravvivere, e quindi la funzionalità dei mitocondri è essenziale per la sua crescita. Il mutante [poky] di Neurospora cresce molto più lentamente del selvatico. Il mutante dipende da cambiamenti nell’mtDNA, e la convenzione, in questo caso, è quella di mettere parentesi quadre intorno al simbolo usato per il mutante. Il mutante [poky] è difettivo nella respirazione aerobica in seguito a cambiamenti nel complemento mitocondriale del citocromo. Il cambiamento dello spettro del citocromo influenza la capacità dei mitocondri di produrre sufficiente ATP per sostenere una crescita rapida, e questo spiega la crescita lenta del mutante. Il ciclo vitale di Neurospora è stato presentato nella Figura 4.2. La fase sessuale del ciclo vitale incomincia subito dopo la fusione dei nuclei derivati da genitori di tipo A e a. Un incrocio sessuale può essere fatto in uno di questi due modi: ponendo entrambi i tipi parentali contemporaneamente sullo stesso terreno di crescita, oppure inoculando il terreno con un ceppo e, dopo incubazione a 25 °C per tre o quattro giorni, aggiungendo il secondo ceppo parentale. In quest’ultimo caso, il genitore messo in terreno di crescita per primo produce tutti i protoperiteci, i corpi vegetativi che daranno origine ai veri corpi fruttiferi, nei quali ci sono gli aschi con le spore sessuali.

Estensioni e deviazioni dai principi della genetica mendeliana

Box 13.1

349

Studiare le relazioni genetiche attraverso l’analisi dell’mtDNA

Nel Capitolo 10 abbiamo discusso alcuni metodi di analisi del DNA che fanno riferimento ai polimorfismi nelle sequenze di DNA nucleare. Brevemente, un polimorfismo del DNA è una delle due o più forme alternative (alleli) di un locus cromosomico che differisce nella sequenza nucleotidica o nel numero variabile di sequenze di DNA ripetute in tandem. Questa definizione estende il concetto di allele anche a sequenze non geniche. I polimorfismi del DNA si trovano anche nel genoma extranucleare come quello dei mitocondri e dei cloroplasti. Nel genoma mitocondriale umano c’è una regione di 400 coppie di basi altamente polimorfica. Questo polimorfismo, insieme al fatto che la grande maggioranza dei mitocondri è di origine materna, fa sì che le linee di discendenza femminile siano praticamente uniche. È possibile così studiare le relazioni delle linee di discendenza femminile tra individui mediante l’analisi in PCR del polimorfismo a carico dell’mtDNA. Un esempio dell’impiego dello studio dell’mtDNA è quello relativo agli ultimi zar di Russia e ai loro figli. Durante la rivoluzione bolscevica del 1917 lo zar Nicola II Romanov venne esautorato ed esiliato. Nel 1918 guardie bolsceviche giustiziarono lo zar e la sua famiglia. Tuttavia corse la voce che una delle figlie dello zar, la principessa Anastasia, fosse riuscita a sfuggire all’esecuzione. Nel 1922 una donna proveniente da Berlino, col nome di Anna Anderson, sostenne di essere la principessa Anastasia. Anna Anderson si trasferì negli Stati Uniti nel 1928 dove visse fino al 1984, sostenendo fino alla morte di essere la principessa Anastasia. All’epoca non c’erano informazioni sufficienti per confermare o confutare quanto affermato dalla Anderson. Nel 1993 fu condotta l’analisi sul DNA mitocondriale proveniente dalle ossa ritrovate due anni prima in una fossa in una città russa. I campioni di DNA furono confron-

Rispetto ai conidi (le spore asessuate), i protoperiteci hanno una quantità notevole di citoplasma. Quindi possono essere considerati i genitori femminili, allo stesso modo di una cellula uovo animale o vegetale. Utilizzando un ceppo che produce protoperiteci come genitore femminile e conidi dell’altro ceppo come genitore maschile, i genetisti possono realizzare incroci reciproci, per determinare se un carattere mostra un’ereditarietà di tipo extranucleare. Dall’incrocio reciproco tra [poky] e selvatico si ottengono i seguenti risultati: [poky] × selvaticoDprogenie di tutti [poky] selvatico × [poky]Dprogenie di tutti selvatici

tati con il DNA estratto dal sangue del principe Filippo, duca di Edimburgo, che è il pronipote dell’ultima zarina Alessandra (la principessa Vittoria, infatti, sorella di Alessandra, era la nonna del principe Filippo). I profili del DNA mitocondriale delle ossa concordavano perfettamente con quello del principe Filippo, dimostrando così che essi appartenevano alla stessa linea di discendenza femminile. Ricerche successive dimostrarono in modo inequivocabile che le ossa appartenevano ai resti della zarina e di tre dei suoi cinque figli. Le ossa dello zar furono identificate nello stesso modo, confrontando il profilo del DNA mitocondriale con quello di due parenti dello zar ancora in vita. Non molto tempo dopo lo stesso tipo di analisi sul polimorfismo del DNA mitocondriale dimostrò che Anna Anderson non era Anastasia, poiché il profilo del suo mtDNA non concordava con quello del principe Filippo. Non è chiaro se i resti di uno dei tre figli di Alessandra siano quelli della principessa Anastasia, anche se una commissione preposta dal governo russo ha dichiarato che c’è una “prova conclusiva” che dimostra che uno degli scheletri ritrovati è quello di Anastasia. Il caso dei Romanov è un esempio di come l’analisi dell’mtDNA sia stata uno strumento potente per studiare la linea di discendenza femminile negli esseri umani. Il DNA mitocondriale viene analizzato anche per studiare le relazioni genetiche in molti altri organismi (vedi Capitolo 23). È utilizzato, per esempio, negli studi riguardanti la biodiversità per stabilire il grado di variabilità genetica presente nelle popolazioni naturali. Uno di questi studi ha riguardato la specie a rischio dell’orso grizzly del parco nazionale di Yellowstone, una popolazione modello anche per altre specie di predatori in pericolo di estinzione.

In altre parole, tutta la progenie mostra lo stesso fenotipo del genitore materno, indicando che la mutazione [poky] ha un’ereditarietà materna. Il fenotipo con deficienza del citocromo nel mutante [poky] dipende da un difetto nella sintesi proteica mitocondriale. Il mutante [poky] ha una delezione di 4 coppie di basi nel promotore del gene che codifica per l’rRNA 19S della subunità piccola dei ribosomi mitocondriali. La mutazione determina una ridotta disponibilità della subunità piccola del ribosoma nell’organello, e, conseguentemente, una riduzione sensibile nella capacità di sintesi proteica. La sintesi delle proteine mitocondriali, compresa quella dei citocromi, è ridotta e il fungo cresce lentamente.

350

Capitolo 13

Nota chiave Il mutante di Neurospora crassa a crescita lenta [poky] mostra un’ereditarietà di tipo materno e presenta delle deficienze in alcuni citocromi mitocondriali. Il difetto molecolare nel mutante [poky] è costituito da una delezione di 4 coppie di basi nel promotore del gene che codifica per l’rRNA della subunità piccola del ribosoma mitocondriale, che porta a una deficienza di alcuni citocromi mitocondriali e al fenotipo a crescita lenta.

Malattie genetiche umane e alterazioni nel DNA mitocondriale Un certo numero di malattie genetiche umane dipende da mutazioni di geni localizzati sul DNA mitocondriale. Queste malattie hanno ereditarietà materna, e qui di seguito ne descriveremo brevemente alcuni esempi. •





Neuropatia ottica ereditaria di Leber (LHON; OMIM 535000, http://www.ncbi.nlm.nih.gov/omim). Questa malattia colpisce generalmente individui adulti e causa cecità completa o parziale per una degenerazione del nervo ottico. Mutazioni in geni mitocondriali che codificano per otto proteine della catena di trasporto degli elettroni e dell’ATPasi 6 possono causare la LHON. La catena di trasporto degli elettroni dirige la produzione di ATP cellulare per fosforilazione ossidativa. Si pensa che la morte del nervo ottico nella LHON sia dovuta in generale a difetti nella fosforilazione ossidativa, qui causata dall’inibizione della catena di trasporto degli elettroni. Sindrome di Kearns-Sayre (OMIM 530000). Le persone colpite da questa sindrome presentano tre difetti neuromuscolari principali: la paralisi progressiva di alcuni muscoli dell’occhio, l’accumulo anormale di materiale pigmentato sulla retina, che porta all’infiammazione cronica e alla degenerazione della retina, e miocardiopatia. Estese delezioni in vari punti dell’mtDNA causano la sindrome. Secondo un modello proposto, ciascuna delezione elimina uno o più geni per i tRNA, essenziali per la sintesi proteica mitocondriale. Con un meccanismo ancora ignoto ciò porta allo sviluppo della sindrome. Epilessia mioclonica a “fibre rosse stracciate” (MERRF; OMIM 545000). Gli individui con questa malattia presentano “fibre rosse stracciate”, un’anomalia tissutale osservabile al microscopio. Il sintomo più caratteristico della MERRF è la comparsa di attacchi mioclonici (improvvisi e brevi spasmi e convulsioni delle gambe o dell’intero corpo). Altri sintomi principali sono atassia (difetti di coordinazione dei movimenti) e accumulo di acido lattico nel

sangue. La malattia è causata dalla sostituzione di un singolo nucleotide nel gene per il tRNA della lisina. Il tRNA mutato ha un effetto negativo sulla sintesi proteica mitocondriale e ciò, in qualche modo, causa i vari fenotipi connessi alla malattia. Le malattie mitocondriali causate da mutazioni dell’mtDNA mostrano una espressività variabile dovuta al fatto che le cellule degli individui affetti sono eteroplasmiche, cioè hanno una miscela di mitocondri normali e di mitocondri alterati. Come già detto, infatti, la segregazione dei mitocondri nelle cellule figlie durante le divisioni cellulari è casuale e queste possono ricevere un numero casuale di mitocondri con DNA mutato. Le proporzioni dei due diversi tipi di mitocondri variano da tessuto a tessuto e da individuo a individuo, entro uno stesso albero genealogico. La gravità dei sintomi della malattia è approssimativamente associata alla quantità relativa di mitocondri mutati. (È da notare che non tutte le malattie mitocondriali sono dovute a mutazioni dell’mtDNA ma possono essere causate da mutazioni di geni nucleari che codificano per proteine mitocondriali.)

Attività Andate alla iAttività Mitochondrial DNA and Human Disease (Il DNA mitocondriale e le malattie umane) nel sito web degli studenti, dove potrete costruire un albero genealogico per determinare se è stata ereditata una malattia neurologica.

Sterilità maschile citoplasmatica e produzione di semi ibridi Le varietà ibride sono molto importanti nell’agricoltura commerciale. Una varietà ibrida è prodotta incrociando due varietà che non sono strettamente imparentate tra di loro. Gli ibridi crescono generalmente più vigorosi e producono più semi rispetto a entrambi i genitori. Il fenomeno è definito eterosi o superiorità dell’eterozigote ed è descritto in maggior dettaglio nel Capitolo 21. Gli agricoltori acquistano i semi ottenuti da piante ibride, cioè i semi che germinando producono piante ibride, il che significa che i selezionatori di piante devono fare degli incroci controllati tra le due varietà parentali su scala commerciale. Il mais è stata la prima specie vegetale usata per produrre semi ibridi. Le piante di mais possono autofecondarsi, ma l’infiorescenza maschile (pennacchio) e l’infiorescenza femminile (spiga) sono separate. Pertanto, per fare incroci controllati, la pianta usata come femmina, cioè portatrice del seme che sarà prodotto, viene privata degli stami (emasculata) manualmente e fecondata con il polline derivato dalla pianta usata come maschio. (Si ricordi che l’eliminazione degli stami faceva parte della procedura degli incroci controllati da Mendel.)

MyLab

Estensioni e deviazioni dai principi della genetica mendeliana

Nel mais l’eliminazione degli stami è un procedimento relativamente facile, ma può essere molto laborioso in altre specie coltivate. Fortunatamente i selezionatori possono sfruttare mutazioni che causano sterilità maschile. La sterilità maschile può derivare da mutazioni di geni nucleari o extranucleari, producendo rispettivamente sterilità maschile genetica e sterilità maschile citoplasmatica (CMS). La mutazione di tipo CMS è nel genoma mitocondriale. Come i cloroplasti, i mitocondri sono ereditati nei vegetali per via materna. Ovvero, tutti i mitocondri presenti nello zigote derivano dalla cellula uovo e non dal polline. La mutazione CMS determina un difetto nella formazione del polline, in modo che la pianta presenti sterilità maschile. Nonostante ciò, quando si usa una pianta CMS come genitore femminile in un incrocio controllato, il seme ibrido germinerà e produrrà nuove piante. Queste piante presenteranno sterilità maschile poiché hanno ereditato la mutazione CMS, e ovviamente non potranno produrre seme per autofecondazione. È comprensibile che l’agricoltore non sarebbe affatto contento delle piante ibride, perché dovrebbe seminare piante maschili fertili per fecondare gli ibridi. La soluzione a questo problema coinvolge un gene nucleare che ripristina la fertilità (Rf). L’allele dominante Rf supera il blocco della sterilità dovuta a CMS, mentre l’allele rf recessivo non può farlo. La Figura 13.22 mostra come si possono produrre semi ibridi usando CMS e il gene Rf. Il genitore femminile con sterilità maschile è [CMS] rf/rf e il maschio fertile è [CMS] Rf/rf (dove [CMS] indica il citoplasma per la sterilità maschile citoplasmatica). La progenie F1 mostrerà il desiderato vigore ibrido e tutti gli individui avranno il citoplasma [CMS]. Gli ibridi segregheranno 1 Rf/rf : 1 rf/rf. Le piante Rf/rf hanno fertilità maschile perché il gene ripristinatore ha recuperato la mutazione CMS. Le piante rf/rf mostrano comunque sterilità maschile, perché manca l’effetto sul citoplasma [CMS]. Tuttavia, queste ultime piante saranno facilmente fecondate dal polline proveniente dalle piante Rf/rf nel campo. Attualmente, per la produzione di piante con sterilità maschile esiste un approccio nuovo di ingegneria genetica. Questo approccio non coinvolge geni extranucleari, ma prevede invece la produzione di piante transgeniche usando metodi standard di trasformazione delle piante. Sono necessari due geni, entrambi derivati dal batterio del suolo Bacillus amyloliquefaciens. Un gene codifica per la barnasi, un’RNasi che è secreta dal batterio come meccanismo di difesa contro altri organismi. L’altro gene codifica per barnstar, una proteina che lega e inibisce la barnasi, proteggendo così il batterio dal suo stesso enzima. Una pianta selvatica è trasformata con il gene della barnasi fuso al promotore TA29. Il promotore TA29 deriva da un gene che è espresso soltanto

351

nel “tappeto”, un tessuto che circonda il sacco pollinico e che è essenziale per la produzione di polline vitale. Nel “tappeto” di piante transgeniche con il gene TA29barnasi viene prodotta barnasi che distrugge gli RNA di questo tessuto, rendendo la pianta un maschio sterile. Questa pianta viene usata come genitore femminile in un incrocio con una pianta transgenica che contiene il gene TA29-barnstar. I semi derivati dalla pianta usata come femmina producono piante ibride nelle quali nel “tappeto” sono prodotte sia proteine barnasi sia proteine barnstar. Barnstar si lega alla barnasi, inibendone l’attività RNasica, prevenendo così la sterilità maschile: gli ibridi sono maschi fertili. Eccezioni all’ereditarietà materna Si parla di ereditarietà materna in senso stretto nel caso di mutazioni extranucleari negli animali e nelle piante nelle quali il gamete femminile contribuisce alla maggior parte del citoplasma dello zigote. Esistono comunque delle eccezioni, di cui riportiamo alcuni esempi. 1. Sfruttando le differenze di sequenza nel DNA mitocondriale di ceppi diversi di topi, i ricercatori hanno usato la PCR (reazione a catena della polimerasi, Capitolo 9) per dimostrare che, negli ibridi ottenuti dal loro incrocio, le molecole di mtDNA di origine paterna sono presenti con una frequenza di 10–4 rispetto alle molecole di mtDNA materno. Questa eteroplasmia di mitocondri di origine biparentale ci rende cauti nel fare delle affermazioni circa l’ereditarietà esclusivamente materna dell’mtDNA. A questo si aggiunge anche la possibilità di eventi di ricombinazione, rari ma in alcuni casi riscontrati anCMS Femmina

Maschio fertile

[CMS]

[CMS]

rf/rf

Pianta della F1

µ

Rf/rf

[CMS]

[CMS]

Rf/rf

rf/rf

Fertile

Pianta sterile ma impollinata da piante fertili

Figura 13.22 La produzione di un seme ibrido usando la sterilità maschile citoplasmatica (CMS) e un gene che ripristina la fertilità.

352

Capitolo 13

che nell’uomo, tra il mtDNA materno e quello paterno in seguito a fusione dei mitocondri di origine materna con quelli paterni. 2. Nella maggior parte delle angiosperme (le piante fiorite), i cloroplasti sono ereditati solo per via materna. Tuttavia, in alcune specie i cloroplasti vengo-

no ereditati con alta frequenza da entrambi i genitori, o addirittura per via prevalentemente paterna. Per esempio, nell’Oenothera (primula della sera) l’eredità dei cloroplasti è biparentale. L’ereditarietà paterna dei cloroplasti è la norma nelle conifere, che sono delle gimnosperme.

Sommario l Un gene può esistere in molte forme alleliche in una popolazione e questi alleli sono definiti alleli multipli. Tuttavia, un individuo diploide può possedere solo due diversi alleli della serie allelica multipla. l Nella dominanza completa si osserva lo stesso fenotipo se un allele è in eterozigosi o in omozigosi. Nella dominanza incompleta il fenotipo dell’eterozigote è intermedio tra quelli dei due omozigoti. Nella codominanza l’eterozigote manifesta i fenotipi di entrambi gli omozigoti. l Alleli di determinati geni comportano la mancata produzione di un prodotto genico necessario a una funzione, e questa carenza determina un fenotipo letale. Tali alleli letali possono essere recessivi o dominanti. L’esistenza di alleli letali di un gene indica che il prodotto normale del gene è essenziale per la vitalità dell’organismo. l La penetranza è la frequenza (in percentuale) con la quale un allele si manifesta fenotipicamente in una popolazione. L’espressività descrive il grado di manifestazione fenotipica di un gene o genotipo in un particolare individuo. Sia la penetranza sia l’espressività possono manifestarsi per lo stesso carattere e dipendono sia dal genotipo sia dall’ambiente esterno. l La costituzione genetica dello zigote specifica solo la potenzialità di un organismo di svilupparsi e di svolgere determinate funzioni. Man mano che un organismo si sviluppa e si differenzia, l’espressione fenotipica associata a un allele può essere influenzata da vari fattori. Tra questi vi sono le influenze ambientali interne ed esterne. Esempi di fattori interni ambientali sono il sesso e l’età; esempi di fattori ambientali esterni sono la nutrizione, la luce, agenti chimici, temperatura e agenti infettivi. l La variazione di gran parte dei caratteri genetici considerata nella precedente discussione dei principi mendeliani è determinata principalmente dalle differenze nel genotipo; cioè, le differenze fenotipiche derivano dalle differenze genotipiche. Per molti caratteri, invece, il fenotipo è influenzato sia dai geni sia dall’ambiente.

l L’effetto materno è il fenomeno per cui il genotipo nucleare della madre determina il fenotipo dei figli, indipendentemente dal loro genotipo. L’effetto materno è il risultato dei prodotti genici accumulati nell’oocita prima della fecondazione, che influenzano lo sviluppo nelle prime fasi dell’embrione. I geni che codificano per questi prodotti sono detti geni con effetto materno. l Il test di complementazione determina se due mutanti con lo stesso fenotipo isolati indipendentemente hanno mutazioni nello stesso gene o in geni diversi. Se la combinazione dei due mutanti ripristina un fenotipo selvatico, le due mutazioni sono in geni diversi. Se la combinazione dei due mutanti determina un fenotipo mutante, le due mutazioni sono nello stesso gene. l In alcuni casi, geni diversi interagiscono per determinare le caratteristiche fenotipiche. Alcuni tipi di interazioni geniche producono la comparsa di un nuovo fenotipo. In altri casi, come nell’epistasi, il fenotipo associato alla combinazione allelica di un gene viene mascherato dal prodotto di un altro locus genico. l Un gene modificatore interagisce con un altro gene non allelico influenzando il fenotipo associato all’espressione degli alleli di quel gene senza mascherarlo, come avviene nell’epistasi. l Sia i mitocondri sia i cloroplasti contengono un proprio genoma a DNA, presente in un numero variabile di copie, che contiene geni per alcune componenti di questi organelli. Tale DNA è generalmente circolare a doppia elica e ha dimensioni variabili tra gli organismi per la presenza di diverse quantità di sequenze ripetute. L’ereditarietà dei geni dei mitocondri e dei cloroplasti segue regole diverse da quelle dei geni nucleari: non si osserva la segregazione mendeliana basata sulla meiosi, è evidente un’ereditarietà uniparentale (solitamente materna), i geni extranucleari non possono essere mappati a partire dai gruppi di geni nucleari noti e il fenotipo determinato da una mutazione extranucleare persiste dopo la sostituzione nucleare.

Approccio analitico alla soluzione di problemi di genetica D13.1 Nella bocca di leone il colore rosso del fiore (CR) mostra dominanza incompleta sul colore bianco (CW); l’eterozigote ha fiori rosa. Inoltre, le foglie larghe normali (LB) mostrano dominanza incompleta sulle foglie strette (LN); l’eterozigote ha fo-

glie di larghezza intermedia. Se una bocca di leone a fiori rossi e foglie strette viene incrociata con una pianta a fiori bianchi e foglie larghe, quali saranno i fenotipi della F1 e della F2 e le frequenze delle diverse classi?

Estensioni e deviazioni dai principi della genetica mendeliana

353

Figura 13.A CR/CW LB/LN

!

Genotipo, fenotipo per la prima coppia allelica

1/

1/

1/

4

2

4

CR/CR, rosso

CR/CW, rosa

CW/CW, bianco

CR/CW LB/LN Genotipo, fenotipo per la seconda coppia allelica

Risultato totale

1/ 4

LB/LB, largo

1/

16 rosso,

1/ 2

LB/LN, intermedio

2/

16

rosso, intermedio

1/ 4

LN/LN, stretto

1/

16

rosso, stretto

1/ 4

LB/LB, largo

2/

16

rosa, largo

1/ 2

LB/LN, intermedio

4/

16

rosa, intermedio

1/ 4

LN/LN, stretto

2/

16

rosa, stretto

1/ 4

LB/LB, largo

1/

16

bianco, largo

1/ 2

LB/LN, intermedio

2/

16

bianco, intermedio

1/ 4

LN/LN, stretto

1/

16

bianco, stretto

largo

R13.1 Questa domanda di base sulla segregazione genica è relativa alle conseguenze della dominanza incompleta. Nel caso della dominanza incompleta, bisogna ricordare che il genotipo può essere ricavato direttamente dal fenotipo. Quindi non dobbiamo domandarci se un ceppo è una linea pura, perché a ogni fenotipo corrisponde un genotipo diverso (e perciò noto). L’approccio migliore consiste nell’assegnare i genotipi alle bocche di leone parentali. CR/CR LN/LN rappresenta la pianta rossa a foglie strette e CW/CW LB/LB la pianta bianca a foglie larghe. Le piante della F1 ottenute dall’incrocio saranno tutte doppi eterozigoti, CR/CW LB/LN. A causa della dominanza incompleta, queste piante hanno fiori rosa e foglie di larghezza intermedia. Incrociando tra loro le piante della F1 si ottiene la F2, nella quale non si osserva il solito rapporto 9:3:3:1. Vi è, invece, un fenotipo diverso per ogni genotipo. I genotipi e i fenotipi con le relative frequenze sono mostrati nella Figura 13.A. D13.2 Nella bocca di leone si osserva dominanza incompleta del colore rosso del fiore sul bianco, e quindi l’eterozigote è di colore rosa; si osserva dominanza completa della forma normale dei fiori su quella pelorica e della pianta alta su quella nana. Le tre coppie di alleli segregano indipendentemente. Se una pianta omozigote rossa, alta, con fiori normali viene incrociata con una omozigote bianca, nana, con fiori pelorici, quale proporzione della F2 avrà lo stesso fenotipo della F1? R13.2 Diamo dei simboli: CR = rosso e CW = bianco; N = fiori normali ed n = fiori pelorici; T = alto e t = nano. L’incrocio

di partenza è quindi CR/CR T/T N/N × CW/CW t/t n/n. Da questo incrocio vediamo che tutte le piante della F1 sono tripli eterozigoti con genotipo CR/CW T/t N/n e fenotipo con fiori rosa, pianta alta, fiori normali. L’incrocio tra piante dell’F1 darà 27 genotipi diversi tra le piante della F2; questa risposta deriva dalla regola che il numero di genotipi è 3n, dove n è il numero di coppie di geni in eterozigosi nell’incrocio F1 × F1 (Capitolo 11). Qui si richiede la proporzione di progenie F2 con fenotipo simile alla F1. Possiamo calcolare questa proporzione direttamente, senza scrivere tutti i possibili genotipi e raccogliere la progenie in classi in base al fenotipo. Per prima cosa, calcoliamo la frequenza alla F2 delle piante a fiori rosa; poi, determiniamo la proporzione di queste piante che manifestano le altre due caratteristiche. Da un incrocio CR/CW × CR/CW calcoliamo che metà della progenie sarà eterozigote CR/CW e quindi rosa. Poi, determiniamo la proporzione di piante della F2 fenotipicamente simili alla F1 relativamente all’altezza (alte). Sia le piante T/T sia le T/t sono alte, quindi i 3/4 della F2 saranno piante alte. Analogamente, i 3/4 delle piante F2 saranno a fiori normali come nella F1. Per ottenere la probabilità di comparsa di questi tre fenotipi insieme (rosa, alto, normale) dobbiamo moltiplicare le singole probabilità, dato che le coppie alleliche segregano in modo indipendente. La risposta è 1/2 × 3/4 × 3/4 = 9/32. D13.3 a. Un incrocio F1 × F1 dà in F2 un rapporto fenotipico 9:7. Quale rapporto fenotipico vi aspettate da un reincrocio della F1?

354

Capitolo 13

b. Rispondete alla stessa domanda per un incrocio F1 × F1 che dà un rapporto 9:3:4. c. Rispondete alla stessa domanda per un rapporto 15:1. R13.3 Questa domanda riguarda gli effetti epistatici. Nel rispondere dobbiamo considerare l’interazione tra i diversi genotipi, per procedere con il reincrocio. Definiamo i genotipi con i quali abbiamo a che fare. I più semplici sono le coppie alleliche a+ e a, e b+ e b, per le quali ogni allele selvatico è completamente dominante sull’altro membro della coppia. a. Un rapporto 9:7 alla F2 implica che entrambi i membri della F1 siano doppi eterozigoti e che si tratti di un caso di epistasi. In sostanza, tutti i genotipi nei quali sia presente una condizione omozigote recessiva manifestano lo stesso fenotipo, quindi le componenti 3, 3 e 1 del rapporto 9:3:3:1 sono fenotipicamente raggruppate in una sola classe. In termini di genotipo, i 9/16 sono a+/– b+/– e gli altri 7/16 sono a+/– b/b, a/a b+/– e a/a b/b. (Come sempre, l’uso del trattino dopo un allele selvatico significa che si ha lo stesso fenotipo se l’allele non indicato è selvatico o mutato.) Il reincrocio richiesto è a+/a b+/b × a/a b/b e possiamo prevedere un rapporto di 1:1:1:1 tra a+/a b+/b : a+/a b/b : a/a b+/b : a/a b/b. Il primo genotipo avrà lo stesso fenotipo della classe 9/16 della F2, ma, a causa dell’epistasi, gli altri tre genotipi avranno lo stesso fenotipo della classe 7/16 della F2. In conclusione, la risposta è un rapporto fenotipico 1:3 nella progenie del reincrocio della F1. b. È stato chiesto di rispondere alla stessa domanda per un rapporto 9:3:4 alla F2. Di nuovo, questa domanda implica un rapporto diibrido modificato, dove due classi del rapporto 9:3:3:1 hanno lo stesso fenotipo. Anche in questo caso si verifica dominanza completa per ciascuna delle due coppie alleliche, quindi gli individui della F1 sono a+/a b+/b. Forse sia la classe a+/– b+/b sia la classe a/a b/b in F2 avranno lo stesso fenotipo, mentre le classi a+/– b+/– e a/a b+/– avranno fenotipi distinti l’una dall’altra e dalla classe risultante dall’interazione. Il rapporto genotipico di un reincrocio della F1 è lo stesso della parte a di questa domanda. Considerando le classi nello stesso ordine di prima, troviamo che la seconda e la quarta dovrebbero avere lo stesso fenotipo, a causa dell’epistasi. Dunque, vi sono solo tre possibili classi fenotipiche invece delle quattro osservate nel reincrocio di un diibrido F1, in cui vi sono dominanza completa e assenza d’interazione. Il rapporto fenotipico qui è 1:1:2. c. Questa domanda si riferisce a un altro esempio di epistasi. Dato che 15 + 1 = 16, questo numero dà il risultato di un’autofecondazione della F1 di un diibrido, quando vi siano dominanza completa per entrambe le coppie alleliche e interazione tra gli alleli dominanti. In questo caso, le classi a+/– b+/–, a+/– b/b e a/a b+/– hanno lo stesso fenotipo e rappresentano i 15/16 della progenie F2, e la classe a/a b/b manifesta un fenotipo diverso (1/16 della F2). I risultati genotipici di un reincrocio della F1 sono gli stessi delle parti a e b di questa domanda; vale a dire che la pro-

genie manifesta un rapporto di 1:1:1:1 tra a+/a b+/b : a+/a b/b : a/a b+/b : a/a b/b. Le prime tre classi hanno lo stesso fenotipo, uguale a quello dei 15/16 della F2, e l’ultima classe ha un altro fenotipo. La risposta, quindi, è un rapporto fenotipico 3:1. D13.4 Sono stati isolati quattro ceppi di Neurospora crassa a crescita lenta, indicati come a, b, c e d. Tutti presentano un sistema anormale di enzimi respiratori mitocondriali. Le modalità di trasmissione di questi mutanti sono state saggiate con una serie di incroci controllati con il fenotipo selvatico, con i seguenti risultati: Genitore femminile Selvatico a Selvatico b Selvatico Selvatico

Genitore maschile × × × × × ×

a Selvatico b Selvatico c d

Progenie (ascospore) a crescita selvatico lenta 847 0 1113 0 596 1050

0 659 0 2071 590 1035

Date un’interpretazione genetica a questi risultati. R13.4 La domanda richiede di considerare le modalità di trasmissione attese per geni nucleari e geni extranucleari. I geni nucleari avranno una segregazione di 1:1 nella progenie, perché questo organismo è aploide e pertanto non mostrerà nessuna differenza nei modi di segregazione, indipendentemente dal ceppo usato come genitore femminile. D’altra parte, una caratteristica che distingue i geni extranucleari è la differenza dei risultati nei due incroci reciproci. In Neurospora, questa caratteristica si manifesta generalmente con una progenie che ha tutta il fenotipo materno. Tenendo presente queste considerazioni, possiamo analizzare un mutante alla volta. Il mutante a mostra una chiara differenza nella segregazione dei due incroci reciproci ed è un caso classico di ereditarietà materna. L’interpretazione è che il gene coinvolto sia extranucleare; quindi questo gene deve essere nel mitocondrio. Il mutante [poky] descritto in questo capitolo mostra questo tipo di modalità di trasmissione ereditaria. Con lo stesso ragionamento concludiamo che anche il mutante b è extranucleare. I mutanti c e d segregano 1:1, indicazione che le mutazioni coinvolgono due geni nucleari. In questi casi non abbiamo la necessità di considerare gli incroci reciproci, perché non ci sono indicazioni di ereditarietà materna. In realtà, le vere mutazioni in questione sono femminili e sterili, e quindi l’incrocio reciproco non può essere realizzato. Possiamo confermare che le mutazioni sono nel genoma nucleare attraverso esperimenti di mappatura, utilizzando marcatori nucleari noti (come descritto nel capitolo successivo). Indicazioni di concatenazione con questi marcatori confermerebbero che le mutazioni non sono extranucleari.

14

Mappe genetiche negli eucarioti

Come viene determinata l’associazione tra i geni?

Come vengono realizzate le mappe dei geni e dei marcatori del DNA del genoma umano?

Come vengono realizzate le mappe dei geni e dei marcatori del DNA negli organismi sperimentali?

Attività Il Progetto Genoma Umano è probabilmente il progetto di mappatura più conosciuto al mondo. Il suo scopo è stato quello di determinare la localizzazione di tutti i geni del genoma umano e l’esatta sequenza nucleotidica dei 3 miliardi circa di coppie di basi che lo costituiscono. Molto prima dell’avvento delle tecnologie del DNA ricombinante che hanno permesso l’attuazione del Progetto Genoma Umano, gli scienziati avevano già realizzato le mappe genetiche degli organismi eucarioti. La prima mappa genetica in un organismo eucariote – il moscerino della frutta – fu prodotta nella seconda decade del XX secolo. Da allora sono state realizzate mappe genetiche per molti eucarioti. Che cosa ci dicono queste mappe? Come sono state costruite? Come possiamo utilizzarle? Dopo aver letto e studiato questo capitolo, potrete trovare le risposte a queste e altre domande nella iAttività, mappando i geni dei pomodori.

I geni localizzati su cromosomi non omologhi segregano in modo indipendente durante la meiosi. In molti casi, tuttavia, alcuni geni (e quindi i caratteri fenotipici che essi controllano) vengono ereditati insieme perché sono localizzati sullo stesso cromosoma. Geni posti sullo stesso cromosoma sono detti sintenici. I geni che non segregano indipendentemente perché localizzati sullo stesso cromosoma mostrano associazione (linkage) e sono chiamati geni associati. Essi costituiscono un gruppo di associazione. L’analisi genetica è la comprensione della struttura e della funzione del materiale genetico. L’analisi genetica classica analizza la progenie di incroci tra genitori che differiscono per alcuni caratteri genetici allo scopo di determinare la frequenza con la quale compaiono nuove combinazioni dei caratteri in esame. La progenie che mostra le combinazioni dei caratteri già presenti nei genitori è detta parentale, mentre quella che presenta nuo-

ve combinazioni è detta ricombinante. Il processo attraverso il quale si producono nuove combinazioni è detto ricombinazione genetica. La produzione di progenie ricombinante avviene per assortimento indipendente dei geni su cromosomi diversi o per effetto del crossingover tra geni associati (sullo stesso cromosoma). Mediante il reincrocio (testcross) è possibile determinare quali sono i geni associati e costruire una mappa di associazione o mappa genetica di ogni cromosoma. Le mappe genetiche vengono costruite utilizzando marcatori genetici sia genici sia di DNA, cioè varianti alleliche che danno origine a un fenotipo (visibile o molecolare) distinguibile. (In altre parole, si tratta di un allele che “marca” un cromosoma o un gene.) I marcatori genici sono alleli di geni, mentre i marcatori di DNA sono marcatori molecolari, cioè regioni polimorfiche (che differiscono da un individuo all’altro) di DNA nel genoma e possono essere identificati attraverso un’analisi molecolare del DNA. (I marcatori di DNA sono stati trattati nei Capitoli 8 e 10.) I geni, ovviamente, sono sequenze di DNA che fanno parte della sequenza completa di un cromosoma. Conoscendo oggi, grazie ai progetti genomici, la sequenza completa di un cromosoma o di un genoma, è possibile determinare esattamente la posizione dei geni e la loro distanza. In questo modo vengono realizzate le mappe dei geni nell’attuale era della genomica: tali sono le mappe fisiche (vedi Capitolo 8) che prevedono l’uso di metodi molecolari e non tengono in considerazione lo scambio che avviene durante la meiosi tra parti di cromosomi omologhi attraverso il crossing-over, che invece è alla base della costruzione delle mappe genetiche. L’obiettivo di questo capitolo è studiare l’associazione fra geni e imparare come i geni sono stati mappati nella mappatura genetica classica, e infine come la mappatura di geni e di marcatori di DNA viene condotta oggi. I processi attraverso i quali viene determinata la sequenza

356

Capitolo 14

dei genomi e viene analizzata la sequenza dei geni sono stati descritti nel Capitolo 8.

I primi studi sull’associazione genetica: gli esperimenti di Morgan con Drosophila Le basi della mappatura genetica vennero poste da Thomas Hunt Morgan che, prima del 1911, aveva identificato un certo numero di geni legati al cromosoma X di Drosophila melanogaster, tra i quali il gene w (white: occhio bianco) e m (miniature: ali ridotte). Morgan incrociò una femmina con occhi bianchi e ali ridotte (w m/w m) con un maschio di tipo selvatico (w+ m+/Y; Figura 14.1). Nella descrizione del primo genotipo, la barra rappresenta la coppia di cromosomi omologhi, e i geni indicati su ciascun lato della barra sono associati (sullo stesso cromosoma). Nel secondo genotipo, dato che i due geni sono associati sul cromosoma X, la barra indica il cromosoma X e la Y indica il cromosoma Y. Per indicare geni posti sullo stesso cromosoma usere-mo anche un altro tipo ab di simboli genetici: a b che indica che i geni a e b stan-

zontale. Secondo questa simbologia, i geni associati al cromosoma X in una femmina vengono indicati da simboli separati da una o due linee continue che rappresentano i cromosomi omologhi, cioè wm wm oppure wm wm e i geni associati all’X nel maschio sono, per esempio: wm

G

no sullo stesso cromosoma, rappresentato dalla linea oriz-

dove la linea continua indica il cromosoma X e quella uncinata il cromosoma Y. Questo modo di rappresentare il genotipo equivale a w m/ (dove la linea uncinata indica il cromosoma Y) o a w m/Y. (Nota: se tra le coppie alleliche viene usata una linea tratteggiata, l’estensione di ogni segmento rappresenta un cromosoma.) Nell’incrocio, in F1 tutti i maschi avevano occhi bianchi e ali ridotte (genotipo w m/Y), mentre tutte le femmine erano eterozigoti ma fenotipicamente selvatiche sia per il colore degli occhi, sia per la dimensione delle ali (genotipo w+ m+/w m). I moscerini della F1 furono incrociati fra di loro e furono analizzati 2441 soggetti della F2. Negli incroci riguardanti geni legati al cromosoma X, come quello riportato nella Figura 14.1, l’incrocio F1 × F1 è equivalente a un rein-

Figura 14.1 Gli incroci sperimentali di Morgan di mutanti di Drosophila melanogaster con occhi bianchi e ali ridotte che dimostrano la presenza di associazione e ricombinazione nel cromo-

soma X. (Figura tratta da Genetics, 2a ed. di Ursula W. Goodenough, copyright © 1978 Brooks/Cole, parte di Cengage Learning, Inc. Riproduzione autorizzata.)

×

Fenotipi parentali

( ww mm )

Occhi bianchi, ali ridotte

Selvatico

( w + m +)

Fenotipi F 1

( ww

+ m+ m

)

Selvatico

Occhi bianchi, ali ridotte

(w m )

Fenotipi F 2 Occhi bianchi, ali ridotte 359 Totale: 750

Selvatico 391

439

Occhi bianchi, ali normali (selvatico) 352

Totale: 791

218

237

Occhi rossi (selvatico), ali ridotte 235

Totale: 455

Totale dei genotipi parentali: 1541

Totale: 445 Totale dei genotipi ricombinanti: 900

Progenie totale: 1541 + 900 = 2441 Percentuale dei ricombinanti: 900/2441 × 100 = 36,9

210

Mappe genetiche negli eucarioti

crocio di prova (testcross), dato che i maschi F1 producono gameti che portano il cromosoma X con gli alleli recessivi per entrambi i geni e gameti che portano il cromosoma Y, che non hanno alleli per i geni in esame. Nella F2, le classi fenotipiche più frequenti in entrambi i sessi furono quelle con i fenotipi originari, cioè, con occhi bianchi e ali ridotte oppure occhi rossi e ali normali. Convenzionalmente ci si riferisce ai genotipi originari dei due cromosomi come genotipi parentali, classi parentali o, più semplicemente, parentali. Il termine è utilizzato anche per descrivere i fenotipi e quindi, in questo particolare incrocio, le femmine originarie con occhi bianchi e ali ridotte e i maschi selvatici originari vengono definiti fenotipi parentali. Morgan osservò che 900 dei 2441 moscerini della F2, cioè il 36,9%, presentavano combinazioni fenotipiche non parentali di occhi bianchi con ali normali e occhi rossi con ali ridotte. Le combinazioni non parentali di alleli associati vengono chiamate ricombinanti. La frequenza attesa di fenotipi ricombinanti sulla base dell’assortimento indipendente sarebbe del 50%; quindi, il fatto che si osservi una percentuale più bassa è la prova della presenza di associazione (linkage) tra i due geni. Per spiegare la presenza dei ricombinanti per geni sullo stesso cromosoma, Morgan propose che durante la meiosi potesse avvenire uno scambio tra i due cromosomi X delle femmine della F1. Il gruppo di Morgan analizzò un gran numero di altri incroci di questo genere. In ciascun caso, le classi fenotipiche parentali erano le più frequenti, mentre le classi ricombinanti si manifestavano con una frequenza molto inferiore. Approssimativamente le due classi parentali comparivano in ugual numero, e così avveniva anche per le due classi ricombinanti. La conclusione generale di Morgan fu che durante la meiosi, gli alleli di alcuni geni tendono a segregare insieme perché sono vicini l’uno all’altro sullo stesso cromosoma. In altri termini, quanto più due geni sono vicini sul cromosoma, tanto più tendono a rimanere insieme durante la meiosi; quindi essi non assortiscono indipendentemente. Ciò avviene perché i ricombinanti vengono prodotti per crossingover tra i cromosomi omologhi durante la meiosi, e quanto più due geni sono vicini, tanto meno probabile è che tra di loro avvenga un evento di ricombinazione. È utile ricordare che il crossing-over è il processo di scambio reciproco di segmenti cromatidici in posizioni corrispondenti sui cromosomi omologhi; il processo implica la rottura e la successiva riunione dei due cromatidi. Il crossing-over avviene allo stadio di quattro cromatidi, durante la profase I della meiosi. Ogni crossingover coinvolge due cromatidi su quattro, anche se, lungo il cromosoma, tutti i cromatidi possono essere implicati in eventi di scambio. La Figura 14.2 illustra in modo semplificato il processo di crossing-over e come un singolo scambio tra cromatidi non fratelli dia origine a cromatidi ricombinanti.

357

Nota chiave La produzione di ricombinanti genetici risulta dallo scambio fisico reciproco tra cromosomi omologhi durante la profase I della meiosi, in seguito a rottura e ricongiungimento di due cromatidi (crossing-over). Tanto più vicini sono i geni associati sul cromosoma, tanto minore sarà la probabilità che avvenga un evento di crossing-over tra loro. Tali geni tenderanno quindi a segregare insieme durante la meiosi. Questo porterà alla produzione di un minor numero di progenie ricombinante rispetto al 50% atteso da una segregazione indipendente, come dimostrato dagli esperimenti di Morgan con Drosophila.

La ricombinazione genetica e il ruolo dello scambio cromosomico Due esperimenti chiave realizzati negli anni trenta del secolo scorso, uno utilizzando il mais e l’altro utilizzando Drosophila, hanno portato a stabilire che la comparsa di ricombinanti genetici è associata all’evento di crossing-over e al conseguente scambio di parti di cromosomi omologhi. In entrambi gli esperimenti i ricercatori avevano usato marcatori genetici e marcatori fisici (detti anche marcatori citologici) per analizzare la ricombinazione genetica durante la meiosi. I marcatori fisici sono cambiamenti nei cromosomi visibili citologicamente, che rendono possibile distinguere al microscopio i cromosomi e, quindi, i risultati del crossing-over. L’esperimento con il granoturco (Zea mays) venne condotto da Harriet B. nimazione Creighton e Barbara McClintock. L’esperimento Ricombinazione con Drosophila melanogagenetica e ruolo ster fu realizzato da Kurt dello scambio Stern (Figura 14.3), che stucromosomico diava due geni associati al Cromosomi omologhi

Cromatidi parentali

Cromatidi ricombinanti

Rottura e crossing-over

Riunione: scambio avvenuto

Geni

Cromatidi fratelli

Figura 14.2 Schema semplificato di un crossing-over tra due cromatidi non fratelli.

MyLab

358

Capitolo 14

Figura 14.3 L’esperimento di Stern che dimostra la relazione tra la ricombinazione genetica e lo scambio cromosomico in Drosophila melanogaster.

Fenotipo parentale

Genotipo parentale diploide

Selvatico (rosso), occhi a barra (B)

Frammento distaccato dal cromosoma X

car B X X

Carnicino (car) occhi rotondi (selvatico) car + B+

Parte del cromosoma Y

car B+ X Y

cromosoma X: car (= carnacar car+ car car Gameti tion) e B (occhio a barra). I mucar+ B B+ B+ B+ aploidi B tanti omozigoti car hanno gli occhi di colore carnicino anziParentale Ricombinante X Y ché rosso come nel selvatico. I mutanti B sono dominanti incompleti; gli Gameti del genitore 2 omozigoti e gli eterozigoti presentano occar chi a barra (barra stretta negli omozigoti B+ B/B e barra larga negli eterozigoti B+/B), anziché rotondi come nel selvatico. In Carnicino, Carnicino, questo incrocio Stern usò un maschio car car car car a barra a barra + B B B B car B+/Y che aveva gli occhi carnicino e rotondi. La femmina aveva due marcatori fisici: un cromosoma X, con geParentali Rosso, Rosso, notipo car B, era più corto del norcar + car car + car + rotondo rotondo + + + + B B B B male perché una parte era deleta ed era traslocata sul piccolo cromoGameti del soma 4. L’altro cromosoma X, genitore 1 Carnicino, Carnicino, di genotipo car+ B+, aveva atcar car car car rotondo rotondo taccata una porzione del cromoB+ B+ B+ B+ soma Y. Nelle femmine, la forma dell’occhio si presenta come Ricombinanti Rosso, Rosso, una barra stretta nell’omozigote car car + car + car + a barra a barra + B/B, mentre ha la forma di una B B B B barra larga reniforme nell’eterozigote B/B+. Dunque le femmine parentali car+ B+/car B avevano occhi Fenotipo Genotipo rossi a barra larga reniforme (nella della progenie: car B /car B+; car B/Y della progenie: carnicino, a barra; 1 , 1 , + + + + + selvatico (rosso), rotondo; 1 , 1 , car B /car B ; car B /Y figura, tutte le varianti del fenotipo carnicino, rotondo; 1 , 1 , car B+/car B+; car B+/Y + + + con occhi a barra sono indicati come selvatico (rosso), a barra; 1 , 1 car B/car B ; car B /Y “a barra” per semplicità). Nella progenie, grazie ai marcatori citologici, era del normale nel quale era presente un pezzo dell’Y, possibile evidenziare lo scambio di segmenti cromoso- mentre la parte mancante dell’X era traslocata sul cromici. In altre parole, in assenza di ricombinazione, le mosoma 4. Questo riarrangiamento cromosomico potedue classi fenotipiche della progenie erano: (1) occhi di va essere solo una conseguenza di uno scambio fisico di colore carnicino e a barra (reniforme nelle femmine, parti di cromosomi omologhi. stretta nei maschi), genotipicamente car B/car B+ le femmine e car B/Y i maschi; e (2) occhi rossi e rotondi (cioè Nota chiave selvatici per entrambi i geni), genotipicamente car+ B+/car B+ le femmine e car+ B+/Y i maschi. Tra i non-riLa prova che la ricombinazione genetica avviene combinanti non si osservava alcuno scambio di parti di quando, durante la meiosi, ha luogo il crossing-over cromosomi. Le due classi di ricombinanti erano: (1) ocè stata ottenuta da esperimenti di incrocio nei quachi di colore carnicino e rotondi, genotipicamente car li i cromosomi parentali differivano per marcatori B+/car B+ le femmine e car B+/Y i maschi; e (2) occhi genetici e citologici. Questi esperimenti hanno dirossi e a barra, genotipicamente car+ B/car B+ le femmimostrato che, se si originavano fenotipi ricombine e car+ B/Y i maschi. I moscerini con gli occhi di conanti, i marcatori citologici indicavano che in questi lore carnicino avevano un cromosoma X completo e era avvenuto crossing-over. quelli con gli occhi a barra un cromosoma X più corto

359

Mappe genetiche negli eucarioti

Non c’è dubbio, quindi, che la ricombinazione genetica abbia origine dal crossing-over, che determina uno scambio fisico tra cromosomi.

Costruire le mappe genetiche Abbiamo imparato che il numero dei ricombinanti genetici prodotti dipende dalla posizione e dalla distanza dei due geni associati coinvolti. Esaminiamo ora come gli esperimenti genetici possono essere usati per costruire una mappa genetica (chiamata anche mappa di associazione) delle posizioni relative dei geni su di un cromosoma.

ca recessiva che determina colore nero del corpo, e vg è una mutazione autosomica recessiva che determina ali vestigiali (corte e raggrinzite). I moscerini selvatici hanno il corpo grigio e le ali lunghe, non raggrinzite (normali). Un incrocio tra moscerini di linea pura neri con ali normali (b/b vg+/vg+) e moscerini di linea pura grigi con ali vestigiali (b+/b+ vg/vg) produce una F1 costituita da moscerini tutti fenotipicamente grigi con ali normali (b+/b vg+/vg). Reincrociando le femmine della F1 con maschi neri con ali vestigiali (b/b vg/vg), viene prodotta la seguente progenie (attenzione: in questo reincrocio di prova la femmina è eterozigote, perché in Drosophila non avviene crossing-over nei maschi):

Rilevare l’associazione attraverso i reincroci di prova (testcross)

MyLab

Geni non associati segregano in modo indipendente. Quindi, un modo per verificare la presenza di associazione tra geni è analizzare i risultati degli incroci verificando se deviano in modo significativo da quelli attesi per un assortimento indipendente. Il migliore incrocio da utilizzare in questo caso è il reincrocio di prova, cioè un incrocio tra un individuo con genotipo ignoto e un omozigote recessivo per tutti i geni implicati. Un reincrocio tra a+/a b+/b e a/a b/b, dove i geni a e b non sono associati, dà un rapporto 1:1:1:1 per le quattro possibili classi fenotipiche a+/b+, a+/b, a/b+ e a/b (vedi Capitolo 11). Una deviazione significativa da questo rapporto nella direzione di un maggior numero di tipi parentali e di un numero più basso di tipi ricombinanti suggerisce che i nimazione due geni non segreghino indipendentemente. L’ipotesi alterIl test del nativa più semplice è che i due chi-quadrato geni siano associati. Quanto deve essere grande questa deviazione per poterla considerare significativa? Il test del chi-quadrato può essere utilizzato a tale scopo (vedi Capitolo 11). Consideriamo i dati di un reincrocio tra moscerini della frutta. In Drosophila, b è una mutazione autosomi-

283 1294 1418 241 Totale

grigi, ali normali grigi, ali vestigiali neri, ali normali neri, ali vestigiali

3236 moscerini

Ipotizziamo che i due geni non siano associati (ipotesi nulla) e utilizziamo il test del chi-quadrato per saggiare questa ipotesi, come viene mostrato nella Tabella 14.1. Utilizziamo questa specifica ipotesi nulla perché un’ipotesi deve essere testabile; ovvero, bisogna poter fare previsioni sensate. Un’ipotesi che “i due geni siano associati” non è testabile perché non possiamo predire le frequenze attese nella progenie. Se i due geni sono indipendenti, dal reincrocio dovranno risultare classi parentali e ricombinanti in rapporto 1:1. In colonna 1 sono elencati i fenotipi parentali e ricombinanti attesi nella progenie di questo incrocio, in colonna 2 i numeri osservati (o) e in colonna 3 il numero di individui attesi (a) per le classi parentali e ricombinanti, dato il numero totale della progenie (3236) e l’ipotesi in esame (in questo caso 1:1). In colonna 4 sono indicati i valori di deviazione (d) calcolati sottraendo il numero degli individui attesi (a) dal numero degli individui osservati (o) per ciascuna classe. La somma dei valori d è sempre uguale a zero.

Tabella 14.1 Test del chi-quadrato usato con i dati di reincrocio per verificare l’ipotesi che due geni siano indipendenti (2) Numeri osservati (o)

(3) Numeri attesi (a)

Parentali (neri, ali normali e grigi, ali vestigiali)

2712

1618

1094

1 196 836

739,7

Ricombinanti (neri, ali vestigiali e grigi, ali normali)

524

1618

–1094

1 196 836

739,7

3236

3236

(1) Fenotipi

Totali

(7) χ2 = 1479,4

(4) d (= o – a)

(8) gradi di libertà 1

(5) d2

(6) d2/a

1479,4

360

Capitolo 14

In colonna 5 viene indicata la deviazione al quadrato (d2). In colonna 6 la deviazione al quadrato viene divisa per il numero di individui attesi (d2/a). Il valore del chiquadrato χ2 (punto 7 nella tabella) è dato dalla formula χ2 = e

d2

Σa

, dove d2 = (o – a)2

Σ è “sommatoria di”. 2

Nella tabella, il χ è la somma dei 2 valori di colonna 6. Nel nostro caso il χ2 è 1479,4. L’ultimo valore nella tabella, il punto 8, indica i gradi di libertà per questo gruppo di dati; in questo caso ci sono n – 1 = 1 grado di libertà. Il valore del χ2 e i gradi di libertà vengono poi utilizzati con una tabella (vedi Tabella 11.5) per determinare la probabilità (P) che la deviazione dei valori osservati da quelli attesi sia dovuta al caso. Nel nostro esempio, χ2 = 1479,4 con 1 grado di libertà, il valore di P è molto più basso di 0,001; in effetti non è riportato nella tabella. Questo indica che ripetizioni indipendenti di questo esperimento produrrebbero per caso una deviazione come quella osservata in molto meno di 1 caso su 1000. Ricordiamo che, se la probabilità di ottenere i valori di χ2 osservati è maggiore di 5 su 100 (P > 0,05), la deviazione è considerata non significativa statisticamente e si considera che possa essere avvenuta per effetto del solo caso. Se P ≤ 0,05, si considera che la deviazione dai valori attesi sia statisticamente significativa e non dovuta al solo caso; l’ipotesi quindi può essere non corretta. Se P ≤ 0,01, la deviazione è altamente significativa e i risultati non sono in accordo con l’ipotesi nulla. Quindi, in questo caso dobbiamo considerare che l’ipotesi dell’assortimento indipendente non sia valida. Geneticamente, l’unica alternativa valida possibile è che i geni siano associati. Il concetto di mappa genetica In un individuo doppio eterozigote per gli alleli w e m, per esempio, gli alleli possono essere localizzati in due modi alternativi: w+ m+ w m

oppure

w+ m w m+

Nella disposizione a sinistra, i due alleli selvatici si trovano su un cromosoma omologo e i due alleli mutanti recessivi sull’altro: una disposizione chiamata in accoppiamento (o configurazione in cis). Il crossing-over fra i due loci produce ricombinanti w+ m e w m+. Nella disposizione a destra, ciascun omologo porta l’allele selvatico di un gene e l’allele mutante dell’altro: una disposizione chiamata in repulsione (o configurazione in trans). Un crossing-over tra i due geni produce ricombinanti w+ m+ e w m. I risultati ottenuti da Morgan negli incroci con Drosophila indicarono che la frequenza di crossing-over (e quindi di ricombinazione) per geni associati è caratteristica per ogni coppia di geni: per i geni white (w) e mi-

niature (m), associati sul cromosoma X, la frequenza di ricombinazione è 36,9%. La frequenza di ricombinazione per due geni associati è sempre la stessa, indipendentemente dal fatto che i geni siano in accoppiamento o in repulsione. Benché i fenotipi delle classi ricombinanti siano diversi nelle due situazioni, la frequenza dei ricombinanti sul totale della progenie è la stessa (tenendo conto dell’errore sperimentale). Nel 1913 uno studente di Morgan, Alfred Sturtevant, determinò che le frequenze di ricombinazione potessero essere utilizzate come una misura quantitativa della distanza tra due geni sulla mappa genetica. La distanza viene misurata in unità di mappa (um), dove 1 unità di mappa è definita come l’intervallo nel quale avviene 1% di crossing-over. Le unità di mappa vengono chiamate a volte anche centimorgan (cM), un termine coniato da Sturtevant in onore di Morgan. È importante comprendere che per una coppia di geni associati la frequenza di crossing-over non è lo stesso della frequenza di ricombinazione. La prima si riferisce alla frequenza degli scambi fisici tra cromosomi in meiosi per una data regione tra i geni, mentre la seconda si riferisce alla frequenza di ricombinazione dei marcatori genetici in un incrocio, determinata analizzando i fenotipi della progenie. Mentre le frequenze di ricombinazione tra due geni rimangono le stesse, il numero di crossing-over tra i due geni può essere diverso (per es. due eventi di crossing over nella stessa regione riportano la disposizione degli alleli nella configurazione parentale e quindi non producono ricombinanti; vedi Figura 14.10). I genetisti seguono i marcatori genetici negli incroci e quindi i risultati sono dati sotto forma di frequenze di ricombinazione calcolate analizzando il numero di individui ricombinanti della progenie. Nel testo, quindi, noi useremo il concetto di frequenza di ricombinazione come fanno spesso i genetisti, cioè come stima della distanza tra i geni, dove un’unità di mappa corrisponde a una percentuale di ricombinazione dell’1%. In seguito, vedremo come questi dati corrispondano alle frequenze di crossing-over e quindi alle unità di mappa reali. Quindi, i geni su un cromosoma possono essere rappresentati da una mappa genetica unidimensionale, che mostra l’ordine lineare dei geni che appartengono a quel cromosoma. I crossing-over e le frequenze di ricombinazione indicano l’ordine lineare dei geni su un cromosoma e forniscono informazioni sulla distanza genetica tra due geni qualsiasi. Quanto più elevata è la frequenza di eventi di crossing-over tra due geni, tanto più essi sono distanti tra loro. La prima mappa genetica costruita si basò sulle frequenze di ricombinazione ottenute da incroci in Drosophila che comprendevano i geni w (occhi bianchi), m (ali ridotte) e y (corpo giallo), legati al cromosoma X. Da questi esperimenti di mappatura, le percentuali di ricombinazione per gli incroci w × m, w × y e m × y furo-

361

Mappe genetiche negli eucarioti

no stabilite in 32,7, 1,0 e 33,7%, rispettivamente. (In questo esperimento indipendente, la frequenza di ricombinazione tra w e m è un po’ più bassa di quanto osservato nell’esperimento riportato in precedenza.) Le percentuali sono misure quantitative della distanza tra i geni coinvolti. Possiamo costruire una mappa genetica sulla base dei dati sulle frequenze di ricombinazione. Le frequenze di ricombinazione mostrano che i geni w e y sono strettamente associati e che m è piuttosto distante dagli altri due geni. Dato che la distanza genetica w-m è inferiore alla distanza y-m (come si vede dalla minore percentuale di ricombinazione nell’incrocio w × m), l’ordine dei geni deve essere y w m (o m w y). Quindi i tre geni vengono messi in questo ordine e spaziati con 1 um tra y e w e 32,7 um tra w e m. Possiamo quindi disegnare questa mappa per i tre geni:

Genitori: cromosomi omologhi

a+

32,7 um

Abbiamo visto che la frequenza di ricombinazione può essere utilizzata come misura della distanza genetica tra due geni associati. Mediante reincroci a due punti, come quello illustrato nella Figura 14.4, è possibile determinare il numero relativo di classi parentali e ricombinanti nella progenie. Per geni associati autosomici con alleli mutanti recessivi (come nella figura), un doppio eterozigote viene incrociato con un doppio omozigote recessivo. Quando la progenie F1 doppia eterozigote a+ b+/a b, ottenuta da un incrocio a+ b+/a+ b+ con a b/a b, viene reincrociata con a b/a b, nella progenie F2 vengono trovate quattro classi fenotipiche. Due di queste classi hanno i fenotipi parentali a+ b+ e a b e le altre due hanno fenotipi ricombinanti a+ b e a b+. Per disegnare la mappa si utilizzano reincroci di prova, poiché genitori omozigoti recessivi producono soltanto un tipo di gamete, contenente gli alleli recessivi. Di conseguenza, il fenotipo della progenie dipenderà direttamente dai gameti di tipo parentale e ricombinante generati in meiosi dal genitore eterozigote. Usando due doppi eterozigoti si otterrebbero gameti sia parentali sia ricombinanti da entrambi i genitori, il che renderebbe l’analisi più complessa. Quindi, il principio di realizzazione di un reincrocio di prova è quello di utilizzare un eterozigote per i geni da mappare e un omozigote che abbia gli alleli recessivi per entrambi i geni. Nei reincroci di prova a due punti, per mappare i geni legati all’X bisogna usare una femmina doppia eterozigote da incrociare con un maschio emizigote portatore degli alleli recessivi:

a

b+

b

a b

Fenotipo a, b

Fenotipo selvatico Gameti a+

a

b+

b

Generazione F1 a+ b+

b

Reincrocio

a Fenotipo selvatico

× a+

a

a

b+

a

b

b

b

Progenie parentale non ricombinante a+

m

Mappatura dei geni mediante reincroci di prova a due punti

a+

b+

Analisi della progenie per rilevare i ricombinanti

1,0 um

y w

Geni autosomici associati con gli alleli recessivi mutanti

b

+

a

a b

b

a + b+ (selvatico)

Fenotipi

a b

ab

Progenie ricombinante a+

Fenotipi

a+ b

a

a

a b

b

b+

b a b+

Figura 14.4 Reincrocio per dimostrare che due geni sono associati. I geni a e b sono associati sullo stesso autosoma. Un individuo omozigote a+ b+/a+ b+ viene incrociato con un individuo omozigote recessivo a b/a b e la progenie F1 doppio eterozigote a+ b+/a b è reincrociata con individui omozigoti recessivi a b/a b.

a+ b+ ab ×G ab In tutti i casi, un reincrocio di prova a due punti dovrebbe generare due classi parentali e due classi ricombinanti con uguale frequenza. I fenotipi effettivi dipendono dalla disposizione degli alleli sui cromosomi omologhi, ovvero dal loro stato di accoppiamento (cis) o repulsione (trans). La formula seguente viene utilizzata per calcolare la frequenza di ricombinazione: numero dei ricombinanti × 100 = frequenza di ricombinazione = unità di mappa numero totale della progenie del reincrocio

La frequenza di ricombinazione è utilizzata direttamente per stabilire le unità di mappa. Nella mappatura a due punti, si usa lo stesso principio considerando sia geni sia marcatori di DNA. Il metodo di mappatura a due punti è molto più accurato quando i due geni in esame sono abbastanza vicini;

362

Capitolo 14

quando i geni sono lontani la stima non è precisa, come vedremo in seguito. Inoltre, per ottenere un elevato grado di accuratezza si deve analizzare un gran numero di individui nella progenie. Da esperimenti di mappatura, effettuati in diversi tipi di organismi, sappiamo che i geni sono disposti linearmente in gruppi di associazione. Esiste una corrispondenza unitaria tra i gruppi di associazione e i cromosomi, quindi la sequenza dei geni di un gruppo di associazione riflette la sequenza dei geni sul cromosoma.

Costruzione di una mappa genetica Possiamo ora scoprire come si costruisce una mappa genetica partendo dalla stima del numero di eventi di crossing-over, mediante misura delle frequenze di ricombinazione, in un particolare segmento del cromosoma, in tutte le meiosi esaminate. Le frequenze di ricombinazione osservate tra i geni possono essere utilizzate anche per predire il risultato di incroci genetici. Per esempio, una frequenza di ricombinazione del 20% tra i geni indica che, per un genotipo doppio eterozigote (come a+ b+/a b), mediamente il 20% dei gameti totali prodotti è ricombinante (a+ b e a b+ nel nostro esempio, 10% di ciascun tipo). Per un dato reincrocio di prova, la frequenza di ricombinazione nella progenie non può superare il 50%. Infatti, se i geni segregano in modo indipendente, ci attendiamo nella progenie un numero uguale di ricombinanti e parentali, cosicché la frequenza dei ricombinanti è pari al 50%. Se da un incrocio si ottiene una frequenza di ricombinazione del 50%, si può concludere che i due geni sono indipendenti. A volte, due geni associati possono risultare indipendenti (cioè mostrare il 50% di ricombinazione) quando i geni sono molto lontani sullo stesso cromosoma. La Figura 14.5 mostra le conseguenze di crossingover singoli e doppi sulla produzione di cromosomi parentali e ricombinanti per due loci genici distanti sullo stesso cromosoma (nella realtà, in questa situazione, ci sarebbero in ciascuna meiosi eventi di crossing-over multipli tra i due loci). Singoli crossing-over tra ciascun paio di cromatidi non fratelli danno origine a due cromosomi parentali e due ricombinanti; cioè il 50% di ricombinanti fra i due loci (Figura 14.5a). Doppi crossing-over possono coinvolgere due, tre o tutti i quattro cromatidi (Figura 14.5b). Nel caso di doppi crossing-over che coinvolgano gli stessi due cromatidi non fratelli (chiamati doppi crossing-over a due filamenti), tutti i quattro cromosomi risultanti sono parentali per i due loci di interesse. Per doppi crossing-over a tre filamenti (doppi crossing-over che coinvolgono tre dei quattro cromatidi), si otterranno due cromosomi parentali e due ricombinanti. Nel caso di doppi crossing-over a quattro filamenti, tutti i quattro cromosomi saranno ri-

combinanti. Considerando tutti i possibili siti di doppi crossing-over, il 50% dei prodotti sarà ricombinante per i due loci. Analogamente, per qualsiasi numero di crossing-over multipli tra loci molto lontani, esaminando un gran numero di meiosi si troverà che il 50% dei cromosomi risultanti è ricombinante. Questa è la ragione del limite del 50% della frequenza di ricombinazione mostrata da geni non associati sullo stesso cromosoma. Si noti che, se due geni mostrano il 50% di ricombinazione, essi possono essere localizzati sullo stesso cromosoma o su cromosomi diversi. È necessario un maggior numero di dati per distinguere tra le due situazioni. Un modo per scoprirlo è mappare altri geni dello stesso gruppo di associazione. Per esempio, se i geni a e m mostrano il 50% di ricombinazione, forse troveremo che il gene a presenta il 27% di ricombinazione con il gene e e che il gene e mostra il 36% di ricombinazione con il gene m. Questo risultato ci indicherebbe che i geni a e m fanno parte dello stesso gruppo di associazione, approssimativamente a 63 um di distanza, come mostrato qui sotto: a

e

27

63

m

36

Mappatura dei geni con il reincrocio a tre punti Benché le mappe genetiche possano essere costruite utilizzando una serie di incroci a due punti, i genetisti hanno mappato diversi geni associati con un singolo reincrocio di prova. Qui illustriamo un tipo di analisi più complessa per la mappatura di tre nimazione geni associati, usando il reincrocio di prova a tre punti. Negli Mappatura organismi diploidi, l’incrocio a tre a tre punti punti è un incrocio tra un triplo eterozigote e un triplo omozigote recessivo. Se i geni mutanti nell’incrocio sono tutti recessivi, un tipico incrocio a tre punti sarà a+ b+ c+ × a b c abc a b c Nel caso di geni associati al cromosoma X con alleli mutanti recessivi, la femmina è il ceppo eterozigote (assumendo che la femmina sia il sesso omogametico) e il maschio è emizigote per gli alleli recessivi. Supponiamo di avere un’ipotetica pianta fiorita che abbia tre geni associati che controllano il fenotipo del frutto. Un allele recessivo p del primo gene determina il colore viola del frutto, in alternativa al colore giallo del fenotipo selvatico. Un allele recessivo r del secondo gene determina la forma rotonda del frutto, rispetto alla forma allungata del frutto selvatico. Un allele recessivo j di un terzo gene dà frutto succoso, mentre il frutto sel-

MyLab

Mappe genetiche negli eucarioti

363

Genotipi parentali a+

b+

a) Crossing-over singolo a+ a+ a

b+ b+ b

a

b

Prodotti a+

a+ a

b+

Genotipi risultanti a+ b+ a+ b

Parentale Ricombinante

b+ b

Ricombinante Parentale

b b+ a a

a

b

a

Somma

Ricombinanti = 2 Totali = 4 Quindi, 2/4 ricombinanti

b

b) Crossing-over doppi Crossing-over doppio a due cromatidi a+ a+ b+ a+ a a

b+ b b

a+ a a

Crossing-over doppio a tre cromatidi (bimodale) a+ b+ a+ Modalità a+ uno a

b+ b

a+ a

b+ b+ b

Parentale Parentale

Totali: 0/4 ricombinanti

b+

a+

b+

a+

b

a+ b+ a+ b

Parentale Ricombinante

a a

b b+

Parentale Ricombinante

a+ b a+ b+

Ricombinante Parentale

b+ b

Ricombinante Parentale

Totali: 2/4 ricombinanti

b+ b+

Totali: 2/4 ricombinanti

a a a

b

a

b b

b b

a

a+ a

a a

b+

b

b+ b

Parentale Parentale

b

a

Modalità a+ due a

a+ b+ a+ b+

b

Crossing-over doppio a quattro cromatidi

a+ a+ a

b+ b+ b

a+ a+ a

b

a+ b a+ b

b b+

Totail: 4/4 ricombinanti

a a a

b

a

Ricombinante Ricombinante

b+ b+

b+

Figura 14.5 Dimostrazione che la frequenza di ricombinazione tra due geni che mappano lontano sullo stesso cromosoma non può superare il 50%. (a) Crossing-over singoli producono cromatidi per metà parentali e per metà ricombinanti. (b) Crossing-

vatico è secco. Il compito che ci proponiamo è di determinare l’ordine dei geni sul cromosoma e la distanza di mappa tra i geni. Per farlo dobbiamo pianificare un reincrocio di un triplo eterozigote (p+ r+ j+/p r j) con un triplo omozigote recessivo (p r j/p r j) e poi contare le diverse classi fenotipiche della progenie (Figura 14.6). Per ciascuno dei geni possono trovarsi due diversi fenotipi nella progenie di un reincrocio. Quindi, per i tre geni ci sono (2)3 = 8 classi fenotipiche nella progenie, che rappresentano tutte le possibili combinazioni dei fenotipi. In un esperimento reale è possibile che non vengano generate tutte le classi fenotipiche. Tuttavia l’as-

Ricombinante Ricombinante Somma: Ricombinanti = 0 + 2 + 2 + 4 = 8 Totali = 4 + 4 + 4 + 4 = 16 Quindi, ricombinanti = 50%

over doppi a due, tre e quattro cromatidi producono nell’insieme cromatidi per metà parentali e per metà ricombinanti.

senza di una classe fenotipica è un’informazione importante e il ricercatore userà il numero 0 per segnalare le classi nelle quali non è stata trovata progenie.

Attività Avete scoperto nuovi geni che determinano differenti caratteri nei pomodori. Ora dovete costruire una mappa genetica che mostri la localizzazione di questi geni nella iAttività Crossovers and Tomato Chromosomes (Crossing-over e cromosomi nei pomodori) nel sito web degli studenti.

MyLab

364

Capitolo 14 Genitore 1

Genitore 2

Reincrocio

× p+ r+ j+/p r j

Fenotipo

Figura 14.6 La mappatura a tre punti: reincrocio utilizzato e progenie risultante.

p r j /p r j

Giallo, allungato, secco (selvatico)

Viola, rotondo, succoso

Progenie del reincrocio Classe

Fenotipo

Numero

Genotipo del gamete del genitore eterozigote

1

(selvatico) giallo, allungato, secco

179

p+ r +

j+

2

viola, rotondo, succoso

173

p

r

j

3

giallo, rotondo, succoso

46

p+ r

j

4

viola, allungato, secco

52

p

5

giallo, rotondo, secco

22

p+ r

6

viola, allungato, succoso

22

p

7

giallo, allungato, succoso

8

viola, rotondo, secco

Fenotipi parentali

r+

j+

j+

Fenotipi ricombinanti r+

j

4

p+ r +

j

2

p

j+

r

Totale = 500

Come stabilire l’ordine dei geni Il primo passo per mappare tre geni è determinare l’ordine nel quale i geni sono localizzati sul cromosoma. Un genitore porta gli alleli recessivi per tutti i tre geni; l’altro è eterozigote per tutti. Quindi, il fenotipo degli individui della progenie è determinato dagli alleli del gamete del genitore triplo eterozigote; il gamete dell’altro genitore porta infatti solo alleli recessivi. Sappiamo, dal genotipo della generazione parentale, che tutti i tre geni sono in accoppiamento. Dato che il genitore eterozigote nel reincrocio era p+ r+ j+/p r j, le classi 1 e 2 nella Figura 14.6 sono la progenie parentale: la classe 1 è prodotta dalla fusione di un gamete p+ r+ j+ con un gamete p r j del genitore triplo omozigote recessivo, e la classe 2 è prodotta dalla fusione di un gamete p r j del genitore triplo eterozigote e di un gamete p r j. Queste classi sono le più abbondanti perché i cromatidi parentali possono essere prodotti sia in una meiosi in cui non sia avvenuto crossing-over a livello dei loci considerati, specialmente se molto vicini, sia in una meiosi in cui sia avvenuto uno o più crossing-over negli altri due cromatidi. Le altre sei classi della progenie risultano da eventi di crossing-over nella regione tra i tre geni che ha dato

origine a gameti ricombinanti. Può esserci stato un singolo evento di crossing-over tra una coppia di geni associati o un doppio evento di crossing-over, cioè due crossing-over, ognuno tra ciascuna coppia di geni associati. Statisticamente, la frequenza di doppi crossing-over in questa regione è minore della frequenza di un singolo crossing-over, quindi i gameti generati da doppi crossing-over sono i meno frequenti. Quindi, per identificare la progenie che deriva da un doppio crossing-over, esamineremo la progenie per trovare la coppia di classi che ha il più basso numero di rappresentanti. Queste sono le classi 7 e 8 nella Figura 14.6. I genotipi dei gameti del genitore eterozigote che hanno dato origine a questi fenotipi sono p+ r+ j e p r j+. La Figura 14.7 illustra le conseguenze di un doppio crossing-over in un triplo eterozigote per tre geni associati, a, b e c, dove i tre alleli sono in accoppiamento e il gene c si trova in posizione intermedia. Un doppio crossing-over cambia la posizione della coppia allelica centrale tra i tre geni (c+/c) rispetto ai due fiancheggianti. In altri termini, dopo il doppio crossing-over l’allele c è ora sul cromatide con gli alleli a+ e b+, mentre l’allele c+ è sul cromosoma con gli alleli a e b. Quindi i geni p, r e j

Mappe genetiche negli eucarioti Genitore 1 c+ b+ a+

Gameti c+ a+

b+ Parentale

a+

c+

b+

a+

c

b+

a

c

b

a

c+

b

a

c

b

a

c

b

I gameti sono ricombinanti per la coppia allelica c+/c rispetto alle coppie alleliche a+/a e b+/b Parentale

devono essere ordinati in modo tale che il gene centrale cambi posizione rispetto alle classi parentali per dare le classi 7 e 8. Per determinare l’ordine, dobbiamo prima analizzare l’organizzazione relativa dei geni nel genitore eterozigote in modo da essere sicuri di quali alleli sono in associazione e quali in repulsione. In questo esempio i gameti parentali (senza crossing-over) sono p+ r+ j+ e p r j, quindi tutti si trovano in associazione. I gameti che risultano dal doppio crossing-over sono p+ r+ j e p r j+, così l’unico ordine possibile dei geni compatibile con i risultati è p j r, con il genotipo del genitore eterozigote uguale a p+ j+ r+/p j r. Come calcolare le frequenze di ricombinazione tra i geni La Figura 14.8 mostra l’ordine dei geni ottenuto dall’esame dei risultati dell’incrocio. Per comodità, in questa analisi la regione tra i geni p e j viene chiamata regione I e quella tra i geni j e r viene chiamata regione II.

Genitore 1 p+ j+ r+

Genitore 2 p j

×

Reincrocio

p

j

Regione I

r

p

j

r

Regione II

Progenie del reincrocio

Classi

sco in regione I (p-j) + dco progenie totale (52 + 46) + (4 + 2)

500 98 + 6 × 100 = 500 104 × 100 = 500

× 100 × 100

= 20,8%

Genotipo del gamete del genitore eterozigote

Numero

1

p+

j+

r+

179

2

p

j

r

173

3

p+

j

r

46

4

p

j+

r+

52

5

p+

j+

r

22 22

6

p

j

r+

7

p+

j

r+

4

p

j+

r

2

8

Figura 14.7 Conseguenze di un doppio crossing-over in un triplo eterozigote per tre geni associati. In un doppio crossing-over, la coppia di alleli in posizione centrale cambia il suo orientamento relativamente agli alleli che si trovano all’esterno.

La frequenza di ricombinazione può essere calcolata per due geni alla volta. Per la distanza tra p e j devono essere sommati tutti i ricombinanti in regione I. Quindi si deve considerare la progenie ricombinante che risulta da singoli crossing-over in questa regione (classi 3 e 4) e la progenie ricombinante prodotta da doppi eventi di crossing-over nei quali uno è avvenuto tra p e j e uno tra j e r (classi 7 e 8). I doppi crossing-over devono essere inclusi in quanto comprendono un crossing-over in regione I e quindi implicano un evento di ricombinazione tra i geni p e j. Dalla Figura 14.8, risultano 98 ricombinanti nelle classi 3 e 4, e 6 nelle classi 7 e 8, per un totale di 104 ricombinanti in regione I. Dato che la progenie totale è costituita da 500 individui, la percentuale di individui generati in seguito a ricombinazione in regione I è 20,8%, determinato come segue (sco = singoli crossing-over; dco = doppi crossing-over):

= r

365

Origine Parentali, assenza di crossing-over Ricombinanti, singolo crossing-over in regione I Ricombinanti, singolo crossing-over in regione II Ricombinanti, doppio crossing-over

Totale = 500

Figura 14.8 Risultati del reincrocio della Figura 14.6 riscritti sulla base della determinazione dell’ordine dei geni p j r.

In altre parole, la frequenza di ricombinazione per i geni p e j è di 20,8, che corrisponde a una stima della distanza di mappa di 20,8 um. Questa distanza di mappa, che è piuttosto ampia, è stata scelta solo come esempio. Vedremo in seguito che una frequenza di ricombinazione di 20,8 in un incrocio tende a sottostimare la vera distanza di mappa. Lo stesso metodo viene utilizzato per ottenere la frequenza di ricombinazione per la distanza che intercorre tra i geni j e r. Si calcola quindi la frequenza di crossingover nell’incrocio che dà origine alla progenie ricombinante per i geni j e r e la si correla direttamente alla distanza di mappa. In questo caso, devono essere sommati tutti i crossing-over in regione II (vedi Figura 14.8), ovvero le classi 5, 6, 7 e 8. La percentuale di crossing-over è calcolata come segue:

366

Capitolo 14

sco in regione II (j-r) + dco × 100 progenie totale =

(22 + 22) + (4 + 2)

500 44 + 6 × 100 = 500 50 × 100 = 500

p

× 100

Quindi la frequenza di ricombinazione per i geni j e r è 10, che corrisponde a una distanza di mappa di 10 unità. In conclusione, è stata disegnata la mappa genetica dei tre geni analizzati (Figura 14.9). L’esempio ha illustrato che il reincrocio a tre punti è un modo utile per stabilire l’ordine dei geni e per calcolare le distanze di mappa.

La distanza di mappa tra i geni può essere calcolata attraverso i risultati dei reincroci di prova con individui omozigoti recessivi per quei loci. L’unità della distanza fra i geni si chiama unità di mappa (um), dove 1 um è l’intervallo nel quale avviene crossing-over con una frequenza pari a 1%. Gli incroci per la mappatura producono dati in forma di frequenze di ricombinazione che vengono poi usate come stima della distanza di mappa, dove 1 um corrisponde a una frequenza di ricombinazione dell’1%. Le frequenze di ricombinazione non sono identiche alla frequenza di crossing-over e tipicamente sottostimano le vere distanze di mappa.

Per calcolare la distanza di mappa tra i due geni esterni, semplicemente sommiamo le distanze di mappa. Quindi, in questo esempio, la distanza p-r è 20,8 + 10 = 30,8 um. Questa distanza di mappa può essere calcolata direttamente dai risultati, combinando le due formule descritte in precedenza:

=

(sco in regione I) + (dco) + (sco in regione II) + (dco) progenie totale (sco in regione I) + (sco in regione II) + (2 × dco) progenie totale (52 + 46) + (22 + 22) + 2(4 + 2) 500

=

r

Interferenza e coincidenza Le frequenze di ricombinazione ottenute con la mappatura a tre punti sono importanti per determinare l’organizzazione generale dei geni su un cromosoma e per indicarci qualcosa a proposito dei meccanismi stessi della ricombinazione. Per esempio, nel precedente caso di incrocio a tre punti abbiamo calcolato una frequenza di ricombinazione di 20,8 fra i geni p e j e una frequenza di ricombinazione di 10 tra i geni j e r. Se il crossing-over nella regione I è indipendente dal crossing-over nella regione II, la probabilità di crossing-over contemporanei nelle due regioni è uguale al prodotto delle probabilità dei due eventi singoli. Quindi, frequenza di ricombinazione frequenza di ricombinazione della regione I della regione II × 100 100

Nota chiave

=

10,0 um

Figura 14.9 Mappa genetica della regione cromosomica p-j-r calcolata sulla base dei dati di ricombinazione della Figura 14.8.

= 10,0%

distanza =

j 20,8 um

98 + 44 + 2(6) × 100 500

= 30,8 unità di mappa

× 100

× 100

× 100

= 0,208 × 0,100 = 0,0208

il che significa che sono attesi 2,08% di doppi crossingover. Tuttavia, in questo incrocio si sono verificati solo 6/500 = 1,2% di doppi crossing-over (classi 7 e 8). È caratteristico di questi incroci di mappatura che la progenie dei doppi crossing-over spesso non sia presente secondo quanto atteso sulla base delle distanze di mappa. Quindi, in qualche modo la presenza di un crossing-over interferisce con la formazione di un altro crossing-over nelle vicinanze. Questo fenomeno è chiamato interferenza. L’entità dell’interferenza è espressa come coefficiente di coincidenza; cioè, frequenza di doppi coefficiente crossing-over osservati = di coincidenza frequenza di doppi crossing-over attesi

e interferenza = 1 – coefficiente di coincidenza Per la porzione della mappa del nostro esempio il coefficiente di coincidenza è 0,012/0,0208 = 0,577 Un coefficiente di coincidenza con valore 1 indica che in una data regione sono avvenuti tutti i doppi crossingover attesi sulla base dei due eventi indipendenti: non vi è interferenza e quindi il valore dell’interferenza è zero. Se invece il coefficiente di coincidenza è zero, non avviene nessuno degli eventi di doppio crossing-over atte-

Mappe genetiche negli eucarioti

si. Quindi vi è un’interferenza completa perché il primo crossing-over inibisce completamente il secondo nella regione in esame: il valore dell’interferenza è 1. Questi esempi mostrano la correlazione esistente tra i valori di coincidenza e di interferenza. Nell’esempio, poiché il coefficiente di coincidenza è 0,577, il valore di interferenza sarà 0,423. Solo il 57,7% dei doppi crossing-over attesi è avvenuto in questo incrocio.

Nota chiave Il verificarsi di un crossing-over può interferire con la presenza di un secondo crossing-over nelle vicinanze. L’estensione dell’interferenza viene espressa attraverso il coefficiente di coincidenza, che si calcola dividendo il numero dei doppi crossingover osservati per il numero dei doppi crossingover attesi. Il coefficiente di coincidenza va da 0 a 1, e l’interferenza si calcola sottraendo a 1 il valore del coefficiente di coincidenza.

Calcolo accurato delle distanze di mappa Le unità di mappa tra geni associati vengono definite in senso stretto come frequenza di eventi di crossing-over, mentre nella pratica i genetisti quantificano la frequenza di ricombinanti ottenuti negli incroci. La frequenza di eventi di crossing-over e quella di ricombinazione non sono identiche, quindi la seconda tende a sottostimare la vera distanza di mappa. Come è possibile, quindi, ottenere distanze di mappa accurate? Per rispondere a questa domanda dobbiamo concentrarci sulle conseguenze dei crossing-over tra due geni associati. Consideriamo un’ipotetica coppia di geni (a+/a e b+/b) associati in accoppiamento (cis) e separati da una certa distanza sullo stesso cromosoma. La Figura 14.10a mostra che un singolo crossing-over porta alla ricombinazione di due coppie alleliche, producendo quindi due gameti parentali e due ricombinanti. Lo stesso risultato si otterrà per qualsiasi numero dispari di crossing-over nella regione tra i due geni. La Figura 14.10b mostra che un doppio crossing-over che coinvolga due dei quattro cromatidi non porta alla ricombinazione della coppia allelica, producendo quindi solo gameti di tipo parentale. Lo stesso avviene per un qualsiasi numero pari di crossing-over tra i due geni associati. Tuttavia, la frequenza di crossing-over tra geni è una misura della loro distanza. Quindi, dato che nella Figura 14.10b il doppio crossing-over non ha generato gameti ricombinanti, due eventi di crossing-over non vengono considerati e la distanza di mappa basata sulla frequenza di ricombinazione tra i geni a e b viene sottostimata. Nella mappatura genica, se non avviene più di un crossing-over tra due geni, vi è una correlazione diretta

367

tra la distanza di mappa genetica e la frequenza di ricombinazione osservata poiché la frequenza di ricombinazione è uguale alla frequenza di eventi di crossing-over. In pratica, ciò avviene solo per distanze tra geni molto piccole, cioè quando i geni sono distanti tra 0 e 7 um circa. In altre parole, le distanze di mappa basate su frequenze di ricombinazione pari a 7% o inferiori sono molto accurate. All’aumentare della distanza tra i geni, la probabilità di eventi di doppi crossing-over aumenta, e si perde la linearità tra distanza e frequenza di ricombinazione, poiché alcuni eventi di crossing-over non vengono conteggiati. Di conseguenza, è difficile ottenere una misura accurata della distanza di mappa quando hanno luogo crossing-over multipli. Fortunatamente, sono state derivate formule matematiche, chiamate funzioni di mappa, che possono definire la relazione tra distanza di mappa e frequenza di ricombinazione. Nella Figura 14.11 viene illustrata una funzione di mappa basata sull’assunto che non ci sia interferenza tra crossing-over. Si può osservare che la relazione tra distanza di mappa e frequenza di ricombinazione è diretta fino a 7 um, e che la curva tende lentamente al limite di ricombinazione del 50%. Per fare un esempio con un paio di punti, quando la frequenza di ricombinazione è del 20%, la vera distanza di mappa è di circa 30 um; quando

Nota chiave Con una distanza genetica superiore a 7 um, la presenza di crossing-over multipli causa una sottostima della frequenza di ricombinazione e quindi della distanza di mappa. Per correggere gli effetti dei crossing-over multipli vengono usate funzioni di mappa che garantiscono una valutazione più accurata della distanza di mappa.

a)—Crossing-over singolo a+ b+

Gameti b+ a+ Parentale

a+

b+

a+

b

a

b

a

b+

a

b

a

b

Ricombinante Parentale

b)—Crossing-over doppio (a due cromatidi) a+

b+

a+

b+

a+

b+

a+

b+

a

b

a

b

a

b

a

b

Tutti parentali

Figura 14.10 Progenie ottenuta da singoli e doppi crossing-over.

Percentuale di ricombinazione ( = 100p)

368

Capitolo 14 50 40 30 p= 20

1 2

(1 – e − 2d)

10 0

0

10 20 30 40 50 60 70 80 90 100 110 120 Distanza di mappa ( = 100d)

Figura 14.11 Una funzione di mappa per mettere in relazione distanza di mappa e frequenza di ricombinazione. Questa particolare funzione di mappa è stata sviluppata da J.B.S. Haldane e assume che non ci sia interferenza tra crossing-over. La variabile d è la frequenza di crossing-over mentre la e è la base dei logaritmi naturali.

la frequenza di ricombinazione è del 30%, la distanza è di circa 50 um. In generale, le funzioni di mappa richiedono alcune assunzioni di base riguardo alla frequenza degli eventi di crossing-over rispetto alle distanze tra i geni. Quindi, l’utilità di applicare le funzioni di mappa dipende dalla validità delle assunzioni fatte.

Confronto tra mappe genetiche e mappe fisiche Nella mappa genetica, la distanza di mappa tra due marcatori (genici e/o di DNA) dipende dalla frequenza di crossing-over che avviene tra di essi alla meiosi. La semplificazione assunta da Sturtevant quando costruì la prima mappa genetica, e mantenuta negli esperimenti di mappatura successivi, è che il crossing-over avvenga a caso lungo il cromosoma. Ciò implicherebbe che un crossing-over abbia la stessa probabilità di avvenire in ogni punto del cromosoma. Inoltre, le frequenze di ricombinazione per determinati geni e/o marcatori di DNA sarebbero costanti in tutti i membri di una specie. Questo, tuttavia, non è completamente corretto. Infatti, sappiamo che in alcune regioni cromosomiche (hot spots) il crossing-over avviene con una frequenza superiore alla media, mentre in altre regioni (cold spots) si verifica con una frequenza più bassa. Inoltre, numerosi studi relativi a specie diverse dimostrano che esistono fattori biologici, per esempio età e genere, e fattori ambientali, per esempio la temperatura, in grado di influire sulla frequenza di ricombinazione. In particolare, un esempio di tale influenza nelle specie animali a riproduzione sessuata è determinato dal sesso: quello omogametico, ovvero con due cromosomi sessuali completamente omologhi, mostra una maggiore frequenza di ricombinazione rispetto al sesso eterogametico, ovvero con due cromosomi sessuali differenti. E questo vale per tutto il genoma, non solo per i cromosomi sessuali.

Nel caso del genoma umano, uno studio ha dimostrato che la frequenza di ricombinazione varia considerevolmente lungo ciascun cromosoma con valori che vanno da 0 ad almeno 9 unità di mappa per megabase (106 coppie di basi). Poiché, come abbiamo sottolineato più volte, la frequenza di crossing-over è direttamente utilizzata per determinare la distanza di mappa, la distribuzione non-casuale di crossing-over lungo il genoma porta a mappe genetiche non del tutto accurate. In alternativa, e con un’accuratezza maggiore, seppure a diversi livelli di risoluzione, possono essere realizzate delle mappe di tipo fisico (trattate nel Capitolo 8). Le mappe fisiche sono mappe cromosomiche ottenute da un’analisi diretta della molecola del DNA per mezzo di approcci molecolari, anziché con l’analisi dei risultati di incroci genetici e lo studio del fenotipo. Quindi, in questo tipo di mappe, il crossing-over non rappresenta un aspetto critico. La mappa fisica più accurata possibile è la sequenza di DNA di un cromosoma e di un genoma. Quanto coincide una mappa fisica con una mappa genetica? Nella maggior parte dei casi l’ordine dei geni e dei marcatori di DNA è lo stesso, mentre in altri ci sono delle differenze proprio a causa della variazione della frequenza di crossing-over.

Nota chiave La frequenza di ricombinazione varia notevolmente lungo ciascun cromosoma, tra cromosomi diversi e tra individui della stessa specie per effetto di fattori biologici e ambientali, dando potenzialmente origine a un’ampia variazione di unità di mappa (misurate attraverso la mappatura genetica) rispetto alle posizioni effettive dei geni lungo la sequenza del DNA (misurate attraverso la mappatura fisica).

Costruzione di mappe genetiche di associazione nell’uomo Studi di associazione nell’uomo Come abbiamo imparato in questo capitolo, alcuni organismi sperimentali modello sono stati usati con grande successo per costruire mappe dettagliate di associazione usando incroci genetici che coinvolgevano due o più geni. Per ragioni etiche e pratiche, con gli esseri umani non è possibile procedere a esperimenti di mappatura genetica simili a quelli compiuti con gli organismi sperimentali. Gli esseri umani non possono essere studiati attraverso incroci controllati e producono una progenie limitata di numero rispetto a organismi modello. Inoltre, la frequenza di accoppiamento tra indivi-

369

Mappe genetiche negli eucarioti

dui con differenze alleliche per due geni è piccola. Nonostante queste limitazioni, i genetisti storicamente sono sempre stati molto interessati a mappare i geni sui cromosomi umani, dal momento che molte malattie conosciute hanno basi genetiche. Nei Capitoli 11 e 12 abbiamo visto che l’analisi dei pedigree in alcuni casi può essere utilizzata per determinare il modo nel quale viene ereditato un particolare carattere genetico. Ad esempio, molti geni sono stati localizzati sul cromosoma X, a causa dello specifico modello di trasmissione ereditaria, e sono state calcolate le distanze di mappa tra alcuni di essi. Invece, l’analisi dei pedigree non può mostrare su quale cromosoma è localizzato un particolare gene autosomico (ciò è possibile mediante approcci di mappatura fisica, trattati nel Capitolo 8). Un caso particolare, tuttavia, è stato quello del locus per il gruppo sanguigno Duffy (FY), assegnato nel 1968 al cromosoma 1, grazie alla scoperta di una variante di questo autosoma più lunga della norma, utilizzata come marcatore citologico. Grazie allo studio di alberi genealogici fu quindi possibile associare alleli FY con questo specifico autosoma. In altri casi è stato possibile mappare geni su specifici cromosomi o su specifiche posizioni di un cromosoma grazie agli studi di associazione con un marcatore genetico (genico o di DNA). Uno dei primi studi di associazione nell’uomo, condotto a metà circa del secolo scorso dai ricercatori J.H. Renwick e S.D. Lawler, riguarda il locus genico responsabile dei gruppi sanguigni del sistema AB0 (vedi Capitolo 13) e quello responsabile della sindrome Nail-patella (Onychoosteodysplasia, OMIM 161200). Questo disordine, che causa anomalie delle unghie delle mani e dei piedi e problemi alle articolazioni, è ereditato come autosomico dominante. L’associazione fu studiata in base all’analisi dell’ereditarietà di entrambi i caratteri in diverse famiglie. Una parte di un albero genealogico studiato per stabilire l’associazione tra questi loci genici è mostrato in Figura 14.12. L’individuo I-1, affetto, è di gruppo sanguigno AB. Tutti gli individui nella generazione successiva che hanno ereditato il gene IA dal padre risultano normali, mentre i fratelli che hanno ereditato il gene IB mostrano un fenotipo patologico per difetti alle unghie e alle articolazioni. Presumibilmente, l’individuo I-1 ha un cromosoma con il gene mutato Nail-patella (Np) associato al gene IB in un locus vicino. Sul cromosoma omologo l’individuo I-1 ha il gene IA nel locus AB0 e, dato che la sindrome Nail-patella è molto rara, è molto probabile che abbia nel locus vicino il gene non mutato np. Quindi i figli hanno ereditato uno o l’altro cromosoma parentale. Analogamente, l’individuo III-2 che risulta affetto e con il gruppo sanguigno AB ha ereditato dalla madre, anch’essa affetta, il gene mutato Np associato all’allele IB.

Gli studi su alberi genealogici di varie famiglie hanno permesso a J.H. Renwick e S.D. Lawler di identificare individui ricombinanti e, pertanto, di stimare la frequenza di ricombinazione tra il locus AB0 e Nail-patella (circa il 10%) e dedurre una distanza di mappa (10 cM). Un grandissimo passo avanti nella mappatura dei geni umani risale agli anni ottanta del secolo scorso, con la scoperta dei marcatori di DNA (vedi Capitoli 8 e 10). Oggi sappiamo dal sequenziamento del genoma umano che soltanto il 2% di esso contiene geni, il che significa che questi ultimi sono molto dispersi nel genoma. I marcatori di DNA polimorfici sono molto più frequenti dei geni nel genoma umano e ne può essere seguita l’ereditarietà nelle generazioni successive. Analizzando gli alberi genealogici è quindi possibile seguire la co-ereditarietà tra un gene e un marcatore di DNA strettamente associato a esso, come mostrato per i marcatori genici. (Il Box 14.1 illustra i principi per lo studio dell’associazione tra un locus genico e un marcatore di DNA.) Questo tipo di approccio nell’uomo ha permesso storicamente di mappare numerosi geni patologici, ad esempio quello della fibrosi cistica (CF, OMIM 219700; vedi Capitolo 4). L’associazione marcatore di DNA-gene della malattia può anche essere utile nella diagnosi quando la mutazione responsabile della patologia non è nota (vedi Capitolo 10).

Le mappe genetiche umane Per la costruzione di mappe genetiche umane dettagliate, vengono analizzati numerosi alleli di marcatori di DNA polimorfici in campioni di DNA isolati da soggetti di un gran numero di pedigree. I campioni di DNA vengono chiamati nell’insieme panel di DNA. L’associazione tra i loci dei marcatori di DNA viene tipicamente determinata con metodi statistici (lod score, vedi paragrafo successivo) usando algoritmi digitali. Un esempio di applicazione di questo metodo è illustrato nel Focus sul genoma di questo capitolo, in cui l’uso dei polimorfismi è utilizGenerazione: I 1 AB

2 0

II 1 A

2 A

3 A

4 A

5 A

6 A

7 B

8 A

9 B

10 A

III 1 A

2 AB

Figura 14.12 Esempio di associazione tra i gruppi sanguigni AB0 e la sindrome Nail-patella. I genotipi AB0 sono facilmente deducibili dallo studio del fenotipo di ogni individuo dell’albero genealogico, indicato in figura.

370

Capitolo 14

Box 14.1 Determinazione della frequenza di ricombinazione per geni e marcatori di DNA associati I principi utilizzati per determinare la frequenza di ricombinazione tra geni associati possono essere utilizzati anche per determinare la frequenza di ricombinazione tra un locus genico e quello di un marcatore di DNA, oppure tra loci corrispondenti a diversi marcatori, sempre di DNA. In pratica, come possono essere associati due o più geni, possono esserlo anche marcatori di DNA tra di loro o marcatori di DNA e loci genici sullo stesso cromosoma. I genetisti mettono a punto un reincrocio e determinano la percentuale di ricombinanti nella progenie. Vedremo in questo Box come gli alleli dei marcatori di DNA possono essere utilizzati in questo tipo di analisi genetica. Consideriamo un ipotetico organismo diploide (un MendAlieno). Il colore normale degli occhi è nero, determinato dall'allele autosomico dominante O, mentre un allele recessivo o, quando presente in omozigosi, conferisce una colorazione arancio all’occhio (Figura box 14.1). Associato al locus genico per il colore arancio degli occhi c’è il locus di un marcatore di DNA polimorfico per brevi ripetizioni in tandem o STR (Figura box 14.1b e Capitolo 10). Con la parola polimorfico ci si riferisce a una variazione del DNA in un dato locus. In questo caso la variazione riguarda brevi sequenze di DNA di 2-6 coppie di basi che sono ripetute in tandem fino a un massimo di 100 volte in quella regione del genoma. Quindi in quel locus, alleli differenti presentano un numero variabile di STR che causano una loro differente lunghezza. In una popolazione ci possono essere molti alleli diversi a livello di un locus STR di DNA simile a questo; ovviamente ciascun individuo sarà omozigote o eterozigote per i due alleli. La lunghezza di un STR viene misurata mediante reazione a catena della polimerasi (PCR; vedi Capitolo 9). Con la PCR, come già detto in precedenza, si amplifica uno specifico tratto di DNA nel genoma usando i primer che riconoscono le estremità del tratto. La dimensione del DNA amplificato viene poi analizzata mediante elettroforesi su gel di agarosio (l’analisi del DNA attraverso l’elettroforesi su gel di agarosio è stata trattata nel Capitolo 8). Nell’esempio qui riportato, sono considerati due alleli STR, uno costituito da 6 copie della ripetizione (allele 6) e l’altro da 10 (allele 10). Nell’eterozigote per un marcatore di DNA si possono osservare entrambi gli alleli. In questo senso gli alleli dei marcatori del DNA potrebbero essere considerati “codominanti”. In pratica, sia l’omozigote sia l’eterozigote sono distinguibili attraverso l’analisi del DNA. I tre possibili genotipi e fenotipi sono quindi (6,6), (6,10) e (10,10), dove i numeri separati dalla virgola rappresentano il numero delle ripetizioni nella STR sui due cromosomi omologhi.

Figura box 14.1 Fenotipo degli alleli del gene e del marcatore di DNA associati. (a) Locus genico: occhi normali neri e occhi mutati recessivi arancio osservabili visivamente; (b) locus del marcatore di DNA con gli alleli STR a 10 e 6 ripetizioni analizzabili attraverso amplificazione mediante PCR del locus e analisi dei frammenti di DNA con elettroforesi su gel di agarosio. a) Locus genico MendAlieno (2N)

Occhi neri

Occhi arancio

(O/O o O/o)

(o/o)

b) Locus del marcatore di DNA con gli alleli STR Alleli STR Allele STR con 6 ripetizioni Primer per la PCR sinistro

Una ripetizione

Primer per la PCR destro

Allele STR con 10 ripetizioni Elettroforesi su gel di agarosio Genotipo STR (6,6) (10,10) (6,10)

Fenotipo delle bande di DNA

La Figura box 14.2 mostra come calcolare la distanza di mappa tra i loci per il colore degli occhi e le ripetizioni STR. Prima di tutto un genitore di una linea pura con occhi neri e 10 ripetizioni, di genotipo O (10)/O (10), viene incrociato con un genitore di linea pura con occhi arancio e 6 ripetizioni, di genotipo o (6)/o (6). La progenie in F1 avrà occhi neri ed entrambe le ripetizioni 6 e 10, avendo il genotipo O (10)/o (6). I doppi eterozigoti della F1 vengono quindi reincrociati. Dal momento che gli alleli STR sono “codominanti”, possono essere usati entrambi i genitori

Mappe genetiche negli eucarioti omozigoti o (10)/o (10) oppure o (6)/o (6), cioè individui con occhi arancio e omozigoti per l’allele con (10) oppure con (6) ripetizioni. Usando lo o (6)/o (6) avremo nella progenie individui parentali con occhi neri, e 10 e 6 ripetizioni (con genotipo O (10)/o (6)), e individui con occhi arancio e 6 ripetizioni (con genotipo o (6)/o (6)). La progenie ricombinante avrà occhi neri e 6 ripetizioni (genotipo O (6)/o (6)), e oc-

371

chi arancio e 10 e 6 ripetizioni (genotipo o (10)/o (6)). Il fenotipo dell’occhio si individua visivamente, mentre gli alleli STR devono essere analizzati tramite PCR. La frequenza di ricombinazione viene poi calcolata usando le formule standard. Lo stesso tipo di approccio può essere utilizzato per lo studio dell’associazione di geni di interesse con altri tipi di marcatori di DNA.

Figura box 14.2 Incroci usati per calcolare la distanza di mappa tra il locus genico del colore degli occhi e quello del marcatore di DNA STR. Loci associati per il colore degli occhi ed STR

Genitori: cromosomi omologhi

Fenotipi

(10) O

(6) o

(10) O

(6) o

Occhi neri, (10,10)

Occhi arancio, (6,6)

Generazione F1 (6)

(10) O Fenotipo

Occhi neri, (10,6)

Reincrocio

× (6)

(10) O

o

Progenie analizzata per la valutazione dei ricombinanti

(6) o

o

(6)

(6) o

o

Parentali

(6)

(10) O Fenotipi

o

o

(6)

Occhi neri, (10,6)

Occhi arancio, (6,6)

Ricombinanti

(6) O Fenotipi

Occhi neri, (6,6)

zato per identificare gli alleli che predispongono un individuo a sviluppare la sclerosi multipla. La prima mappa genetica dettagliata di marcatori di DNA umani è stata pubblicata nel 1987. Essa contiene 403 loci polimorfici in un panel di DNA da tre generazioni di 21 famiglie. 393 di questi loci erano RFLP, a significare che la sostituzione di singole coppie di basi aveva creato o soppresso specifici siti di restrizione. La distanza tra i marcatori sulla mappa era mediamente di

(6) o

(6)

(10) o

o Occhi arancio, (10,6)

circa 10 um. Mappe genetiche umane ad alta risoluzione sono state realizzate in seguito analizzando gli STR, chiamati anche microsatelliti. Gli STR sono sequenze di 2-6 coppie di basi ripetute in tandem; i loci STR polimorfici variano nel numero delle ripetizioni. Per caratterizzarli viene usata la PCR. I loci STR sono molto più frequenti nel genoma rispetto ai loci RFLP. La realizzazione di mappe genetiche di un numero elevato di marcatori di DNA è un obiettivo superiore alle risorse di un

372

Capitolo 14

singolo laboratorio, a causa della complessità del gran numero di esperimenti richiesti. Per esempio, la caratterizzazione di 5000 marcatori di DNA in 500 individui, richiederebbe di sviluppare 2 500 000 test molecolari e quindi di immettere 2 500 000 risultati in un database. Quindi i genetisti di molti laboratori collaborano in un consorzio per svolgere questo lavoro sugli stessi campioni di DNA prelevati dagli stessi individui. Per generare una mappa di STR ad alta risoluzione è stato usato un panel di DNA da una collezione di DNA umani conservati presso il Centre d’Étude du Polymorphisme Umain (CEPH) di Parigi. Questa collezione è costituita da 517

individui che rappresentano 3 generazioni di 40 famiglie. Grazie a questo lavoro è stata pubblicata nel 1992 una mappa genetica di 814 loci STR con una risoluzione media di circa 5 um. In seguito, una mappa genetica umana complessiva di 5840 loci – che comprendeva 3617 loci STR e 427 geni – con una risoluzione di 0,7 um è stata pubblicata nel 1994. La mappa genetica umana complessiva è stata una risorsa importantissima per il successivo sviluppo di mappe fisiche ad alta risoluzione, che sono state le basi per il sequenziamento del genoma umano nel Progetto Genoma Umano (HGP) (vedi Capitolo 8). Il sequenzia-

Focus sul genoma Analisi del genoma per la ricerca di geni coinvolti nella sclerosi multipla La sclerosi multipla (SM) è una malattia autoimmune, ovvero una patologia nella quale il sistema immunitario attacca erroneamente normali tessuti dello stesso organismo. Molte malattie autoimmuni dipendono da mutazioni che distruggono la comunicazione normale tra le cellule durante la risposta immunitaria. Nella SM il sistema immunitario attacca gli oligodendrociti, le cellule che producono la guaina mielinica dei neuroni nel sistema nervoso centrale. In una persona con SM, la funzione della guaina mielinica è compromessa, con conseguenti danni all’attività neuronale. La SM non è trasmessa come un carattere mendeliano semplice, poiché fattori genetici e ambientali contribuiscono allo sviluppo della malattia. La SM si manifesta durante la vita adulta. Gli scienziati pensano che lo sviluppo della malattia sia favorito dalla combinazione di un agente infettivo ancora sconosciuto e di una predisposizione genetica. Indagini genetiche tradizionali e molecolari per alleli specifici che predispongano un individuo a sviluppare SM hanno identificato alcuni alleli del complesso maggiore di istocompatibilità (MHC), un cluster di diversi geni che codificano per proteine coinvolte in funzioni immunitarie. I ricercatori hanno concluso che ci sono anche alleli rari di altri geni che contribuiscono allo sviluppo della SM, ma i metodi tradizionali non riescono a identificarli. Essi hanno quindi utilizzato il genome-wide screen, un metodo efficace e sensibile per identificare alleli che contribuiscono alla malattia, dal momento che esso prevede l’analisi dell’eredità di decine o centinaia di migliaia di marcatori di DNA in migliaia di individui – invece che le poche dozzine di marcatori e le poche centinaia di soggetti analizzati con i metodi tradizionali. I ricercatori hanno sviluppato un genome-wide screen per alleli rari che aumentano i rischi di sviluppare la SM. Essi hanno analizzato 330 000 SNP

(vedi Capitolo 10) in 12 000 soggetti – migliaia di pazienti con SM e loro parenti, pazienti senza legami di parentela, controlli sani – per cercare gli alleli SNP che fossero più comuni nei pazienti con SM. Il concetto alla base dell’indagine è che, se un particolare allele SNP è più comune nei pazienti con SM rispetto alla popolazione generale, allora esso dovrà alternativamente aumentare il rischio di sviluppare SM per chi lo possiede, ovvero sarà molto vicino a un’alterazione cromosomica o comunque a una mutazione nella sequenza del DNA, da verificare, che pone a rischio di SM. Sono stati rilevati numerosi SNP candidati più comuni nei pazienti con SM. L’associazione più forte coinvolge gli alleli MHC precedentemente identificati, ma altri due geni risultano importanti candidati come responsabili dello sviluppo della SM. Anche essi codificano per proteine coinvolte nel sistema immunitario, quindi è comprensibile che certi loro alleli potrebbero aumentare il rischio di sviluppare SM. Uno dei geni, IL2RA, codifica per il recettore α dell’interleuchina-2 (chiamato anche CD25). Le interleuchine e i loro recettori sono importanti molecole di comunicazione cellulare, usate dalle cellule del sistema immunitario. CD25 è critico nel regolare la risposta immunitaria, e mutazioni in questo gene sono state associate ad altre malattie autoimmuni. La possibilità, quindi, che mutazioni in questo gene possano predisporre un individuo alla SM è in accordo sia con la natura autoimmune della malattia sia con la funzione del prodotto genico. Farmaci che interessano la funzione di questa proteina si sono già dimostrati promettenti in studi clinici. Nel tempo potremo trovare fattori genetici che predispongono un individuo a una specifica malattia, indipendentemente dal fatto che il fattore stesso dia un contributo grande o piccolo al rischio complessivo.

Mappe genetiche negli eucarioti

mento è stato realizzato grazie a due diversi approcci in cui la mappatura genetica ha rappresentato un importante punto di partenza. Il primo approccio, quello di mappatura, ha richiesto tre passaggi: (1) la realizzazione di mappe genetiche dettagliate per fornire una serie di punti sparsi di riferimento; (2) la costruzione di mappe fisiche ad alta risoluzione per fornire una serie di riferimenti dettagliati; (3) la mappatura mediante sequenziamento del genoma. L’ultimo passaggio si è potuto realizzare perché si conosceva di ciascun segmento sequenziato del genoma la localizzazione sulle mappe, che erano state costruite precedentemente. Si è trattato di un procedimento analogo a un iniziale rilevamento dei capoversi in un libro per poi ordinare le parole intermedie. L’altro approccio utilizzato è stato il whole-genome shotgun, in cui l’intero genoma viene tagliato in frammenti casuali sovrapposti che poi vengono sequenziati (vedi Capitolo 8). La sequenza del genoma viene quindi assemblata sulla base delle sequenze che si sovrappongono tra i frammenti. In questo caso è come aver tagliato via casualmente piccoli fascicoli da 10 copie dello stesso libro il cui ordine viene ricostituito sovrapponendo le pagine corrispondenti. Oggi il whole-genome shotgun è la tecnica standard per i sequenziamenti genomici.

Il metodo del lod score per analizzare i rapporti di associazione tra i geni umani Poiché i pedigree adatti per la mappatura genetica convenzionale sono rari, per analizzare pedigree riguardanti due loci possibilmente associati viene usato un test statistico noto come metodo del lod score (logaritmo delle probabilità). Il lod score, inventato nel 1955 dal genetista matematico Newton Morton, viene di solito sviluppato da un programma informstico che usa dati raccolti da un gran numero di pedigree. Una tratta-

373

zione completa del metodo va oltre lo scopo di questo testo, cosicché qui ne viene data soltanto una breve presentazione. Il metodo del lod score mette a confronto: (1) la probabilità di ottenere risultati da un pedigree, se due marcatori (genici o di DNA) sono associati con una determinata frequenza di ricombinazione, con (2) la probabilità di ottenere gli stessi risultati se i due marcatori non fossero associati (cioè con il 50% di ricombinazione). I risultati vengono espressi come log10 del rapporto delle due probabilità. Per convenzione, l’ipotesi di associazione tra due geni viene accettata se il lod score per una data frequenza di ricombinazione è pari a +3 o superiore, dal momento che un lod score di +3 significa che le probabilità sono 103 a 1 (1000:1) in favore dell’associazione tra due geni o marcatori (il log10 di 1000 è +3). Ugualmente, un’ipotesi di associazione tra due geni è rifiutata quando il lod score raggiunge –2 o meno, perché un valore di –2 significa che le probabilità sono 10–2 a 1 (100:1) contro la possibilità che i due geni e/o marcatori siano associati. Una volta che sia stata stabilita un’associazione tra due marcatori genetici, la distanza di mappa viene calcolata dalla frequenza di ricombinazione considerando il lod score più alto per più valori di unità di mappa proposti (più alto è il lod score, più vicini sono i due geni).

Nota chiave Le mappe genetiche sono costruite utilizzando i dati di ricombinazione degli incroci genetici oppure, nel caso degli esseri umani, l’analisi degli alberi genealogici. Negli studi di mappatura genetica vengono usati marcatori genici e di DNA. Anche il Progetto Genoma Umano ha previsto, come punto di partenza per il sequenziamento, la realizzazione di mappe genetiche dettagliate.

Sommario l I ricombinanti genetici si originano da scambi fisici tra cromosomi omologhi durante la meiosi. Il crossing-over consiste nello scambio reciproco di parti di cromosoma in posizioni corrispondenti lungo i cromosomi omologhi attraverso un meccanismo di rottura e riunione. l Il crossing-over è un evento reciproco che, negli eucarioti, avviene allo stadio di quattro cromatidi nella profase I della meiosi. l La mappatura genetica è il processo di localizzazione della posizione sui cromosomi dei geni e/o dei marcatori di DNA. In prima istanza si deve verificare che i geni o i marcatori di DNA siano associati (cioè localizzati sullo stesso cromosoma), il che viene dimostrato dal fatto che

non segregano indipendentemente negli incroci. Quindi si realizzano incroci per determinare la distanza di mappa tra i geni associati. l La distanza di mappa tra i geni viene espressa in unità di mappa (um) o centimorgan (cM); 1 um è definita come l’intervallo nel quale avviene 1% di crossing-over. Tuttavia, gli incroci per la mappatura genica producono dati in forma di frequenze di ricombinazione, che vengono quindi usati per stimare la distanza di mappa; in questo tipo di analisi, 1 um equivale a una frequenza di ricombinazione dell’1%. l All’aumentare della distanza tra i geni, la presenza di crossing-over multipli determina che la frequenza di ricombi-

374

Capitolo 14

nazione sia una sottostima della reale frequenza di crossing-over e quindi della reale distanza di mappa. Per correggere questo problema e arrivare a una stima più accurata della distanza di mappa, possono essere usate funzioni di mappa. l Per ragioni etiche e pratiche, i geni umani non possono essere mappati facendo incroci e analizzando la progenie.

Diversi approcci sono stati usati per realizzare mappe genetiche umane di geni e di marcatori di DNA, inclusa l’analisi di dati di pedigree usando algoritmi computerizzati accoppiati ad analisi molecolari per individuare polimorfismi del DNA.

Approccio analitico alla soluzione di problemi di genetica D14.1 Nel granoturco l’allele per semi colorati (C) è completamente dominante sull’allele per semi incolori (c). Analogamente, una singola coppia allelica controlla se l’endosperma (la parte del seme che contiene il nutrimento immagazzinato per l’embrione) è pieno o raggrinzito. Pieno (S) è dominante su raggrinzito (s). Una pianta di linea pura con semi colorati e pieni è stata incrociata con una a semi incolori e raggrinziti. Le piante della F1 colorate e piene sono state reincrociate con un doppio recessivo, cioè incolore e raggrinzito. I risultati sono stati i seguenti: colorati, pieni colorati, raggrinziti incolori, pieni incolori, raggrinziti

4032 149 152 4035

Totale

8368

C’è evidenza che il gene per il colore e il gene per la forma dell’endosperma siano associati? Se sì, qual è la distanza di mappa tra i due loci? R14.1 L’approccio migliore consiste nell’iniziare a schematizzare l’incrocio utilizzando i simboli dei geni: P: colorati, pieni × incolori, raggrinziti CC SS cc ss ↓ F1: colorati, pieni Cc Ss Reincrocio di prova: colorati, pieni × incolori, raggrinziti Cc Ss cc ss Se i geni fossero indipendenti, nella progenie del reincrocio sarebbero attese frequenze 1:1:1:1 di colorati pieni, colorati raggrinziti, incolori pieni e incolori raggrinziti. Analizzando i risultati reali, possiamo vedere che la progenie osservata si discosta molto dalla proporzione attesa, mostrando un rapporto di 27:1:1:27. Il test del chi-quadrato (utilizzando i numeri reali e non le percentuali o proporzioni), dimostra immediatamente che l’ipotesi che i due geni siano indipendenti non è valida e che dobbiamo considerare che i due geni siano associati in accoppiamento (cis). Più specificamente, le combinazioni parentali (colorati pieni e incolori raggrinziti) sono più numerose di quanto atteso, mentre i tipi ricombinanti (incolori pieni e colorati raggrinziti) sono corrispondentemente meno numerose di quanto atteso. Questo risultato deriva direttamente dalla produzione ineguale dei quattro tipi di gameti durante la meiosi del genitore della F1 colorato e pieno. Dato che i due geni sono associati, l’incrocio può essere schematizzato come segue, per riflettere la loro associazione:

P:

CS — CS

cs — cs

↓ CS — cs

F1: Reincrocio:

×

CS — cs

×

cs — cs

Per calcolare la distanza di mappa tra i due geni, dobbiamo calcolare la frequenza di crossing-over in questa regione del cromosoma durante la meiosi. Non lo possiamo fare direttamente, ma possiamo calcolare la percentuale della progenie ricombinante: Tipi parentali:

colorati, pieni incolori, raggrinziti

4032 4035 8067

Tipi ricombinanti:

colorati, raggrinziti incolori, pieni

149 152 301

La percentuale di ricombinanti calcolata su questi dati è 3,6 (301/8368 × 100) e i tipi parentali sono 96,4% (8067/8368 × 100). Dato che la frequenza di ricombinazione può essere utilizzata direttamente per indicare la distanza di mappa, specialmente se la distanza è piccola, possiamo concludere che la distanza tra i due geni è 3,6 um (3,6 cM). Avremmo ottenuto approssimativamente lo stesso risultato se i due geni fossero stati in repulsione piuttosto che in accoppiamento. Infatti i crossing-over avvengono tra i cromosomi omologhi, senza badare al fatto che ci siano differenze nei due omologhi che noi sperimentatori utilizziamo come marcatori negli incroci genetici. Questo stesso incrocio in repulsione risulterebbe come segue: P:

F1:

incolori, pieni × colorati, raggrinziti cS Cs ––– ––– cS Cs ↓ colorati, pieni Cs –––– cS

I dati dell’effettivo reincrocio della F1 con una pianta incolore e raggrinzita (cc ss) riportano 638 colorati e pieni (ricombinanti), 21 379 colorati e raggrinziti (parentali), 21 906 incolori e pieni (parentali), 672 incolori e raggrinziti (ricombinanti), per un totale di 44 595 piante nella progenie. Quindi la percentuale di ricombinanti è 2,94%, che corrisponde a una distanza di mappa tra i due geni di 2,94 um, un valore ragionevolmente simile al risultato ottenuto nell’incrocio in accoppiamento.

375

Mappe genetiche negli eucarioti D14.2 Nella primula cinese, il fiore color ardesia (s) è recessivo rispetto al fiore blu (S); lo stimma rosso (r) è recessivo rispetto allo stimma verde (R) e lo stelo lungo (l) è recessivo rispetto allo stelo corto (L). Tutti i tre geni sono sullo stesso cromosoma. Il reincrocio della F1 di un incrocio tra linee pure ha dato la seguente progenie: Fenotipo

Numero

fiore ardesia, stimma verde, stelo corto fiore ardesia, stimma rosso, stelo corto fiore blu, stimma rosso, stelo corto fiore ardesia, stimma rosso, stelo lungo fiore ardesia, stimma verde, stelo lungo fiore blu, stimma verde, stelo lungo fiore blu, stimma verde, stelo corto fiore blu, stimma rosso, stelo lungo Totale

27 85 402 977 427 95 960 27 3000

a. Quali erano i genotipi dei genitori di linea pura incrociati? b. Disegnate la mappa di questi geni, indicando il loro ordine e la distanza tra di essi. c. Calcolate il coefficiente di coincidenza e l’interferenza tra questi geni. R14.2 a. Con tre coppie di geni sono attese otto classi fenotipiche e otto sono quelle osservate. Le coppie di classi con il maggior numero di rappresentanti sono quelle che non risultano da crossing-over e ci indicano i genotipi dei genitori originali. Le due classi sono ardesia, rosso, lungo, e blu, verde, corto. Quindi il triplo eterozigote della F1 doveva essere S R L/s r l, e i due genitori di linea pura erano S R L/S R L (blu, verde, corto) e s r l/s r l (ardesia, rosso, lungo). b. L’ordine dei geni può essere determinato esaminando le coppie di classi fenotipiche che originano da doppi crossing-over. Queste classi hanno il numero di rappresentanti più basso e sono ardesia, verde, corto (s R L) e blu, rosso, lungo (S r l). La coppia allelica che ha cambiato la sua posizione rispetto alle altre due è quella centrale, in questo caso S/s. Quindi l’ordine dei geni è r s l (o l s r). Possiamo schematizzare il reincrocio della F1 come segue: RSL rsl ––––– × –––– rsl rsl

Un singolo crossing-over tra i geni R e S dà le classi verde, ardesia, lungo (R s l) e rosso, blu, corto (r S L) che hanno 427 e 402 individui rispettivamente, per un totale di 829. Le classi con doppi crossing-over sono già state definite e sono rappresentate da 54 individui della progenie. La distanza di mappa tra r e s è data dalla frequenza di ricombinazione in questa regione, che è uguale alla somma dei singoli e dei doppi crossing-over, divisa per il numero totale della progenie che, moltiplicato per 100, dà la percentuale. Quindi, 829 + 54 883 ——–— × 100% = —— × 100% 3000 3000 = 29,43% o 29,43 unità di mappa Con una logica simile, la distanza fra s e l è data dalla frequenza di crossing-over in questa regione, che è uguale alla somma della progenie delle classi con singolo e doppio crossing-over diviso il numero totale. Le classi con singolo crossing-over sono verde, blu, lungo (R S l) e rosso, ardesia, corto (r s L), che hanno 95 e 85 individui ciascuna, per un totale di 180. La distanza di mappa è data da 180 + 54 234 ——–— × 100% = —— × 100% 3000 3000 = 7,8% o 7,8 unità di mappa I dati che abbiamo ottenuto indicano la seguente mappa: r

s

29,4

l

7,8

c. Il coefficiente di coincidenza è dato da frequenza dei doppi crossing-over osservati ––––––––––––––––––––––––––––––––––––– frequenza dei doppi crossing-over attesi La frequenza dei doppi crossing-over osservati è (54/3000) = 0,018. La frequenza dei doppi crossing-over attesi è data dal prodotto della distanza di mappa fra r e s e quella fra s e l, cioè 0,294 × 0,078 = 0,023. Il coefficiente di coincidenza è quindi 0,018/0,023 = 0,78. In altre parole, è stato effettivamente osservato il 78% dei doppi ricombinanti attesi; vi è quindi solo il 22% di interferenza.

15

La genetica dei batteri e dei batteriofagi

Come vengono mappati i geni nei batteri?

Come si assegnano a geni differenti le mutazioni che danno lo stesso fenotipo?

Come vengono mappati i geni nei batteriofagi?

Attività I batteri e i batteriofagi hanno per lungo tempo svolto un ruolo chiave nella genetica. Gli esperimenti di Griffith e Avery con lo Streptococcus furono determinanti per la scoperta del DNA come materiale genetico. Herbert Boyer e Stanley Cohen usarono batteri per la prima molecola di DNA ricombinante. Alfred Hershey e Martha Chase usarono il batteriofago T2 nei loro esperimenti per dimostrare che il DNA è il materiale genetico. In questo capitolo conoscerete la genetica dei batteri e dei batteriofagi, come si riproducono, come si producono nuovi ceppi, e inoltre le tecniche sperimentali che i genetisti usano per mappare i geni dei batteri e dei virus. Dopo che avrete letto e studiato questo capitolo, potrete applicare nella iAttività quello che avrete imparato, creando una mappa genetica del cromosoma di E. coli.

Nel Capitolo 14 abbiamo preso in considerazione i principi usati per mappare i geni negli organismi eucarioti. Per compiere la stessa operazione nei batteri e nei batteriofagi, i genetisti utilizzano essenzialmente le stesse strategie sperimentali. Si realizzano incroci tra ceppi che differiscono per alcuni marcatori genetici e vengono identificati e contati i ricombinanti – ossia i prodotti dello scambio del materiale genetico. La maggiore differenza riguarda le tecniche sperimentali adottate. Recentemente, nella ricerca genetica l’interesse principale si è spostato dalla localizzazione, mediante gli incroci dei singoli geni sui cromosomi, alla determinazione della sequenza completa dei nucleotidi del genoma. Conoscendo la sequenza del DNA, gli scienziati possono identificare direttamente i geni e localizzarli con precisione nella sequenza genomica in modo da costruire la mappa più accurata del genoma di una specie (mappatura fisica). Una volta identificati tutti i geni di un organismo, almeno a livello nucleotidico, si

può studiare la funzione di ciascun gene. Nel caso di organismi patogeni, la sequenza genomica è di incomparabile importanza per l’identificazione dei geni responsabili della patogenicità. La sequenza completa del genoma è stata determinata per molti batteriofagi e per molte specie di batteri e di Archaea (Capitolo 8). I genomi dei batteri includono i 4,6 milioni di coppie di basi (4,6 Mb) del genoma di E. coli, le 1,44 Mb di Borrelia burgdorferi, l’agente della malattia di Lyme, le 1,66 Mb di Helicobacter pylori, l’agente dell’ulcera gastrica, e le 1,14 Mb del genoma di Treponema pallidum, il batterio della sifilide. I genomi degli Archaea sequenziati includono le 1,66 Mb del genoma di Methanococcus jannaschii, un ipertermofilo metanogeno che cresce a temperature di 85 °C e a pressioni superiori alle 200 atmosfere. In questo capitolo, studierete gli esperimenti di genetica classica su batteri e batteriofagi che hanno fornito ai ricercatori le prime conoscenze sulle posizioni dei geni sui cromosomi. Imparerete anche con quali esperimenti di genetica classica è stata analizzata la struttura fine del gene – cioè la precisa organizzazione molecolare del gene in relazione agli eventi mutazionali, ricombinazionali e funzionali in cui il gene è coinvolto. Un gene del batteriofago è stato l’oggetto di tali studi.

Analisi genetica nei batteri Il materiale genetico può essere trasferito tra batteri attraverso tre processi principali: la trasformazione, la coniugazione e la trasduzione. È possibile mappare i geni batterici utilizzando uno qualsiasi di questi metodi. In tutti i casi: (1) il trasferimento è unidirezionale e (2) non si forma un completo stadio diploide (al contrario di quanto avviene negli eucarioti). Tuttavia, non tutti i metodi di analisi genetica possono essere utilizzati per tutte le specie batteriche, e la dimensione della regione mappata varia a seconda del metodo usato.

378

Capitolo 15

Tra i batteri, E. coli è stato molto usato per l’analisi genetica. Questo batterio è un buon oggetto di studio perché può essere coltivato in un terreno semplice e definito e può essere manipolato con semplici tecniche microbiologiche. E. coli è un organismo di forma cilindrica di circa 1-3 μm di lunghezza e 0,5 μm di diametro. E. coli ha un singolo DNA cromosomico circolare. Analogamente ad altri batteri, E. coli può crescere sia in terreno liquido sia sulla superficie di un terreno solidificato con agar. L’analisi genetica dei batteri viene appunto fatta seminando (piastrando) i batteri sulla superficie di un terreno agarizzato. Quando un singolo batterio viene deposto sulla superficie del terreno solido, inizia a crescere e a dividersi ripetutamente. Ciò porterà alla formazione di un gruppo visibile di cellule geneticamente identiche, chiamato colonia (Figura 15.1). Ogni colonia consiste di un clone della cellula originaria, cioè contiene copie geneticamente identiche della cellula che ha dato origine alla colonia. La concentrazione delle cellule batteriche in una coltura liquida – il titolo – può essere determinata piastrando volumi noti di una coltura o una sua diluizione nota sulla superficie di una piastra, incubando le piastre a 37 °C e contando poi il numero delle colonie che si formano. Il numero delle colonie ottenute viene convertito in unità formanti colonia (cfu) per millilitro (ml). Per esempio, se 100 μl di una diluizione di 1000 volte di una coltura sono stati piastrati e sono state prodotte 165 colonie, ciò significa che vi erano 165 batteri in 100 μl della diluizione per 1000. Quindi, nella coltura originaria vi erano 165 (colonie) × 1000 (fattore di diluizione) × 10 (perché sono stati piastrati 0,1 ml) = 1 650 000 cfu/ml = 1,65 × 106 cfu/ml. La composizione del terreno di coltura utilizzato dipende dall’esperimento e dal genotipo dei ceppi usati. Ogni specie batterica (o ogni altro microrganismo, come,

Figura 15.1 Colonie batteriche cresciute in terreno minimo in una capsula di Petri.

per esempio, il lievito) ha un caratteristico terreno minimo sul quale è capace di crescere. Un terreno minimo contiene solo i più semplici nutrienti che il microrganismo selvatico può utilizzare per la crescita. Il terreno minimo del ceppo selvatico di E. coli, per esempio, è costituito da uno zucchero (come fonte di carbonio), da alcuni sali e da elementi in tracce. Dagli elementi presenti nel terreno minimo l’organismo può sintetizzare tutti gli altri componenti richiesti per la crescita e la riproduzione, inclusi gli amminoacidi, le vitamine e i precursori del DNA e dell’RNA. Il terreno completo, invece, contiene vitamine, amminoacidi e tutte le sostanze che potrebbero essere metaboliti essenziali e la cui biosintesi potrebbe essere stata bloccata da una mutazione. Storicamente, l’analisi genetica dei batteri (e di altri microrganismi) si basa spesso sullo studio di mutanti difettivi nella capacità di sintetizzare una o più molecole essenziali per la crescita, e magari difettivi anche per altri processi metabolici. Ceppi incapaci di sintetizzare molecole essenziali vengono chiamati auxotrofi (o anche mutanti auxotrofi o mutanti nutrizionali). Un ceppo selvatico, che è capace di sintetizzare tutte le molecole essenziali, è chiamato prototrofo. I prototrofi (chiamati anche ceppi prototrofi) non necessitano di aggiunte nutrizionali al terreno di crescita minimo. Per definizione, un ceppo selvatico o prototrofo cresce sul terreno minimo specifico per quel dato organismo, mentre un auxotrofo cresce solo su terreno completo o su terreno minimo addizionato di una o più specifiche sostanze nutrizionali che è incapace di sintetizzare. Per esempio, un ceppo di E. coli con genotipo trp ade thi+ non potrà crescere in un terreno minimo perché ha mutazioni nella biosintesi del triptofano e dell’adenina. Potrà quindi crescere in un terreno completo o in un terreno minimo addizionato di triptofano (a causa della mutazione trp) e della purina adenina (a causa della mutazione ade). Non avrà invece bisogno dell’aggiunta della vitamina tiamina, dato che porta l’allele thi selvatico, come indicato dal + posto all’apice. Alcuni geni non sono implicati in catene biosintetiche, ma in catene di utilizzazione. Per esempio, ci sono numerosi geni per l’utilizzo di fonti di carbonio alternative, come il lattosio, l’arabinosio e il maltosio. In questi casi, il segno + apposto al simbolo del gene indica che il gene è selvatico e quindi che il batterio è in grado di metabolizzare la sostanza in questione. Per esempio, un ceppo lac+ può metabolizzare il lattosio, mentre un mutante lac ne è incapace. In esperimenti genetici con microrganismi come E. coli, vengono realizzati incroci tra ceppi con genotipo (e di conseguenza fenotipo) diverso, e la progenie viene analizzata relativamente al fenotipo parentale o ricombinante. Quando sono utilizzate mutazioni per auxotrofia, la determinazione del fenotipo (e di conseguenza del genotipo, dato che i batteri sono aploidi) parentale o ricom-

La genetica dei batteri e dei batteriofagi

binante della progenie viene effettuata analizzando le esigenze nutrizionali delle colonie. Una comoda tecnica per questo tipo di analisi è quella chiamata replica plating, ideata da Joshua ed Esther Lederberg (vedi Figura 7.15). In questa tecnica, alcuni batteri di una colonia cresciuta su terreno completo (la piastra madre) vengono trasferiti per stampo su un velluto sterile. Successivamente vengono fatte repliche delle colonie originali, premendo delicatamente il velluto su una serie di nuove piastre. Se le nuove piastre contengono terreno minimo, solo le colonie prototrofe potranno crescere. I ricercatori potranno quindi identificare facilmente le colonie auxotrofe che sono presenti sulla piastra madre ma non sulle repliche in terreno minimo. Utilizzando altre piastre contenenti terreno minimo addizionato di differenti fattori nutrizionali appropriati per il ceppo, o i ceppi, coinvolto/i, è possibile determinare il fenotipo e il genotipo delle colonie auxotrofe.

Mappatura dei geni nei batteri mediante coniugazione Scoperta della coniugazione in E. coli La coniugazione è un processo nel quale avviene il trasferimento unidirezionale di informazione genetica attraverso il contatto diretto tra una cellula batterica donatrice A met bio thr+ leu+ thi+

Lavaggio e semina di 108 cellule in terreno minimo

Miscela di A e B

Lavaggio e semina di 108 cellule in terreno minimo

B met+ bio+ thr leu thi

Lavaggio e semina di 108 cellule in terreno minimo

e una ricevente. Il contatto è nimazione seguito dalla formazione di un Mappatura dei ponte citoplasmatico che congeni batterici nette fisicamente le cellule. mediante In seguito, un segmento coniugazione del DNA del donatore (raramente tutto) può essere trasferito nel ricevente e può andare incontro a ricombinazione con la regione omologa del cromosoma del ricevente. I riceventi che hanno incorporato un pezzo del DNA del donatore nel loro cromosoma sono chiamati transconiuganti. La coniugazione fu scoperta nel 1946 da Joshua Lederberg ed Edward Tatum. Essi studiarono due ceppi di E. coli che differivano per le richieste nutrizionali. Il ceppo A aveva genotipo met bio thr+ leu+ thi+, quindi poteva crescere solo in un terreno addizionato con l’amminoacido metionina (met) e la vitamina biotina (bio), ma non necessitava degli amminoacidi treonina (thr) e leucina (leu) né della vitamina tiamina (thi). Il ceppo B aveva il genotipo met+ bio+ thr leu thi, quindi poteva crescere solo in un terreno addizionato con treonina, leucina e tiamina, ma non richiedeva metionina né biotina. Lederberg e Tatum mescolarono i ceppi A e B e li seminarono su piastre di terreno minimo (Figura 15.2). Le colture miste diedero origine ad alcune colonie prototrofe (met+ bio+ thr+ leu+ thi+) con una frequenza di 1 su 10 milioni di cellule. Dato che nessuna colonia era comparsa quando ciascun ceppo era stato piastrato singolarmente su terreno minimo, fu escluso che l’origine delle colonie prototrofe fosse dovuta a mutazione. Il mescolamento dei due ceppi favoriva quindi un incrocio genetico capace di dare origine ai ricombinanti. In un diverso esperimento, Bernard Davis pose i ceppi A e B in terreno liquido ai due lati di un tubo a U (Figura 15.3), separati da un filtro poroso i cui pori erano troppo piccoli per permettere il passaggio dei batteTappo poroso di cotone

Ceppo A Assenza di colonie (cellule auxotrofe)

met+ bio+ thr+ leu+ thi+ Colonie prototrofe

379

Pressione o suzione

Ceppo B

Assenza di colonie (cellule auxotrofe)

Figura 15.2 Esperimento di Lederberg e Tatum che dimostra la ricombinazione genetica tra cellule di E. coli. Dopo aver mescolato e piastrato cellule di ceppo A e B, alcune colonie crescono in terreno minimo, a indicare che ora esse possono produrre i costituenti essenziali. Queste colonie sono ricombinanti prodotti da uno scambio di materiale genetico tra i ceppi.

Filtro poroso

Figura 15.3 Esperimento con il tubo a U, che dimostra la necessità del contatto fisico tra i due ceppi batterici dell’esperimento di Lederberg e Tatum, per far avvenire lo scambio genetico.

MyLab

380

Capitolo 15

ri. Il terreno veniva mosso tra i due scomparti alternando suzione e pressione. Infine, le cellule vennero piastrate su terreno minimo per verificare la comparsa di colonie prototrofe. Non comparve alcuna colonia prototrofa, suggerendo che il contatto cellula-cellula era necessario perché potesse avvenire lo scambio genetico. Questi esperimenti dimostrarono che E. coli possiede un sistema di scambio genetico, o parasessualità, chiamato coniugazione.

a) Due cellule batteriche connesse da un lungo pilo F tubolare

Il fattore sessuale F Nel 1953 William Hayes dimostrò che lo scambio genetico in E. coli è unidirezionale, con una cellula che agisce come donatore e l’altra cellula che agisce da ricevente. Hayes propose che il trasferimento del materiale genetico tra i ceppi fosse mediato da un fattore sessuale, chiamato fattore F, che la cellula donatrice possiede (F+) e del quale la cellula ricevente è priva (F–). Il fattore F trovato in E. coli è un episoma, cioè un frammento di DNA circolare, capace di replicazione autonoma, indipendente dal cromosoma batterico ma in grado di integrarsi in esso (vedi Capitolo 8). Il fattore F ha una lunghezza pari a circa 1/40 del cromosoma batterico e contiene una regione di DNA, chiamata origine (O), che è il punto dal quale ha inizio il trasferimento del DNA al ricevente. Esso contiene inoltre alcuni altri geni, inclusi quelli che determinano la formazione di specifiche strutture filiformi, chiamate pili F o pili sessuali, sulla superficie cellulare, per permettere l’unione fisica tra cellule F+ e F–. Quando cellule F+ e F– vengono messe a contatto, esse possono coniugare (vedi Figure 15.4 e 15.5a, fase 1). La coniugazione non avviene se le due cellule sono dello stesso “sesso” (entrambe F+ o entrambe F–). Durante la coniugazione, una cellula F+ contatta una cellula F– connettendovisi attraverso un lungo pilo F tubolare (Figura 15.4a). Quindi le due cellule si avvicinano e si forma un ponte citoplasmatico che le mette in contatto diretto (Figura 15.4b). Durante la coniugazione, il materiale genetico viene trasferito dal donatore al ricevente dopo che un filamento del DNA del fattore F, è stato tagliato all’origine. La replicazione del DNA circolare procede da quel punto (Figura 15.5a, fase 2). Cominciando dall’origine, un singolo filamento di DNA viene trasferito alla cellula F–, mentre la replicazione mantiene il fattore F in forma circolare a doppio filamento (Figura 15.5a, fase 3; vedi anche Figura 3.11 e Capitolo 3). Immaginate il processo come un rotolo di carta che si svolge. Una volta che il DNA a singolo filamento del fattore F entra nella cellula ricevente F–, la DNA polimerasi sintetizza nel ricevente quello complementare (Figura 15.5a, fase 4). Quando tutto il fattore F è trasferito e circolarizzato, come comunemente avviene negli incroci F+ × F–, la cellula F– diventa F+ (Figura 15.5a, fase 5). È importante sottolineare che ne-

Cellula F +

Cellula F −

b) Coniugazione di cellule di E. coli unite da un ponte citoplasmatico

Figura 15.4 Coniugazione tra una cellula donatrice F + e una ricevente F – di E. coli.

Nota chiave Alcuni batteri E. coli possiedono un episoma, chiamato fattore F, che è richiesto per l’incrocio. Cellule di E. coli che contengono il fattore F sono dette F + e quelle che ne sono prive sono dette F –. I batteri F + (donatori) possono incrociarsi con batteri F – (riceventi) in un processo chiamato coniugazione, che comporta il trasferimento unidirezionale di una copia del fattore F dal donatore al ricevente, durante un processo di replicazione del fattore F stesso. Al termine, sia il donatore sia il ricevente sono F +. Durante la coniugazione F + × F – non avviene alcun tipo di trasferimento del cromosoma batterico.

gli incroci F+ × F– non viene trasferito il cromosoma batterico.

Ceppi di E. coli ad alta frequenza di ricombinazione Per ottenere ricombinazione di geni cromosomici attraverso la coniugazione, sono necessari particolari ceppi derivati dai ceppi F+, chiamati Hfr (High frequency of

La genetica dei batteri e dei batteriofagi a) Trasferimento del fattore F

381

b) Trasferimento di geni batterici 1 Cellula F +

1 Coniugazione di F + con F – Cromosoma batterico

Cromosoma batterico

Fattore F

Fattore F

F+

F–

2 Filamento del fattore F tagliato

2 Integrazione di F per ricombinazione

Cellula Hfr 3 Trasferimento del filamento interrotto nella cellula ricevente

Cellula F – 3 Coniugazione di Hfr con F – Cromosoma batterico

4 Il filamento trasferito e quello rimasto vengono copiati

4 Il fattore F integrato viene tagliato, e il filamento tagliato viene trasferito alla cellula ricevente, portando in alcuni casi geni batterici con sé

5 Completamento del trasferimento e della sintesi del DNA

5 Il filamento trasferito viene copiato e i geni batterici del donatore compaiono nel ricevente

Cromosoma Hfr (parte del fattore F seguita da geni batterici) F+

F+ Ricombinazione tra il cromosoma trasferito dal donatore e quello del ricevente

Figura 15.5 Trasferimento di materiale genetico durante la coniugazione in E. coli. (a) Trasferimento del fattore F da una cellula donatrice a una ricevente durante gli incroci F + μ F –. (b) Produzione di un ceppo Hfr per integrazione del fattore F e trasferimento di geni batterici da una cellula donatrice a una ricevente durante gli incroci Hfr μ F –.

recombination, ad alta frequenza di ricombinazione). Scoperti in modo indipendente da William Hayes e Luca Cavalli-Sforza, i ceppi Hfr hanno origine per un raro evento di ricombinazione mediante il quale il fat-

tore F si integra nel cromosoma batterico (Figura 15.5b, fasi 1-2). Quando il fattore F è integrato, non replica più in modo indipendente, ma viene replicato come parte del cromosoma ospite.

382

Capitolo 15

A causa dei geni del fattore F, le cellule Hfr sono capaci di coniugarsi con cellule F– (Figura 15.5b, fase 3). Durante l’incrocio, avvengono eventi simili a quelli che avvengono durante l’incrocio F+ × F–. Il fattore F integrato viene tagliato in corrispondenza dell’origine e la replicazione inizia (Figura 15.5b, fase 4). Durante la replicazione una parte del fattore F, che inizia con l’origine di replicazione, si trasferisce all’interno della cellula ricevente, dove il filamento trasferito viene copiato. In breve il cromosoma del donatore inizia a essere trasferito nel ricevente. Se ci sono differenze alleliche tra i geni del donatore e quelli del ricevente, è possibile isolare dei ricombinanti (Figura 15.5b, fase 5). Il processo di ricombinazione avviene attraverso una doppia ricombinazione tra il DNA lineare del donatore e quello circolare del ricevente. Un segmento del DNA donatore viene scambiato con l’omologo segmento di DNA ricevente. Negli incroci Hfr × F–, la cellula F– non acquisisce quasi mai il fenotipo Hfr. Infatti, perché la cellula ricevente diventi Hfr, deve ricevere una copia completa del fattore F. Tuttavia, solo parte del fattore F viene trasferita all’inizio della coniugazione; il resto del fattore F si trova alla fine del cromosoma del donatore. Quindi, perché si possa trovare nel ricevente un fattore F completo e funzionale, dovrebbe essere trasferito tutto il cromosoma del donatore, e ciò richiederebbe circa 100 minuti a 37 °C. Questo è un evento estremamente raro, dato che gli appaiamenti si interrompono ben prima che la seconda parte del fattore F venga trasferita. La bassa frequenza di ricombinazione dei marcatori genetici cromosomici negli incroci F+ × F– è spiegabile se consideriamo che solo circa 1 su 10 000 cellule F+ della popolazione diventa Hfr per integrazione del fattore F. Il processo inverso, di escissione del fattore F, avviene anch’esso spontaneamente con bassa frequenza, producendo cellule F+ a partire da cellule Hfr. Durante l’escissione, il fattore F si ripiega all’esterno del cromosoma del ceppo Hfr e, con un singolo evento di ricombinazione (proprio come nell’evento di integrazione), vengono generati un cromosoma circolare dell’ospite e un fattore F circolare extracromosomico.

Fattori F’ Occasionalmente, l’escissione del fattore F dal cromosoma di una cellula Hfr avviene in modo impreciso e viene prodotto un fattore F che contiene una piccola porzione del cromosoma dell’ospite che si trovava adiacente al fattore F quando questo era integrato. Dato che il fattore F si può integrare in molti punti del cromosoma, diversi segmenti del cromosoma batterico possono essere portati via in questo modo. Consideriamo un ceppo di E. coli nel quale il fattore F si sia integrato vicino alla regione lac+, una serie di geni richiesti per il catabolismo del lattosio (vedi Figura 15.6a). Se l’escissione non avviene in modo

preciso, i geni lac+ dell’ospite possono trovarsi inclusi nell’ansa di DNA ripiegato (Figura 15.6b). Quando, con un singolo evento di crossing-over, il DNA che ha formato l’ansa verrà separato dal cromosoma dell’ospite (Figura 15.6c), il nuovo plasmide generato conterrà, oltre al fattore F, anche i geni lac+ del cromosoma dell’ospite. I fattori F che contengono geni batterici sono chiamati F′ (F primo) e prendono il nome dai geni che hanno prelevato. Un F′ con i geni lac viene chiamato F′ (lac). Le cellule che contengono un fattore F′ possono coniugarsi con cellule F–. Come nella coniugazione F+ × F–, una copia del fattore F′ viene trasferita alla cellula F–, che diventa F′. Il ricevente riceve anche una copia del gene batterico (o dei geni) presente nel fattore F′ (lac, nel nostro esempio). Dato che il ricevente ha la propria copia di quel gene, la linea cellulare che ne risulta sarà un diploide parziale (merodiploide), poiché ha due copie di uno o pochi geni e una sola copia di tutti gli altri. Questo particolare tipo di coniugazione viene chiamato F-dua) Fattore F integrato nel cromosoma batterico (qui adiacente alla regione lac+) Origine del trasferimento

Fattore F lac+

Cromosoma batterico b) Il fattore F si ripiega in modo impreciso, così da includere un pezzo del cromosoma batterico (qui contenente la regione lac+)

c)—Una singola ricombinazione genera F’ (lac), un fattore F che include la regione batterica lac+

Escissione aberrante

lac+

F’ (lac) lac+

Figura 15.6 Produzione di un fattore F„, qui F„ (lac), che include la regione lac+ del cromosoma batterico.

La genetica dei batteri e dei batteriofagi

zione o sexduzione, e viene utilizzato per studiare i geni di E. coli allo stato diploide.

Uso della coniugazione per mappare i geni batterici Alla fine degli anni cinquanta del secolo scorso, François Jacob ed Elie Wollman hanno studiato il trasferimento di geni cromosomici da ceppi Hfr a cellule F–, che differivano per diversi marcatori. L’esperimento consisteva nel realizzare un incrocio Hfr × F– e nel separare, agitando le cellule con un frullino a vari intervalli di tempo dall’inizio della coniugazione, i batteri coniuganti per analizzare i transconiuganti e determinare quali geni del donatore erano stati acquisiti dal ricevente. Questo esperimento viene chiamato coniugazione interrotta. L’uso dell’interruzione dell’incrocio per mappare geni batterici può essere illustrato dal seguente incrocio (vedi Figura 15.7a): Donatore: HfrH Ricevente: F–

thr+ leu+ aziR tonR lac+ gal+ strS thr leu aziS tonS lac gal strR

(L’apice S significa “sensibile” e la R indica “resistente”). Il ceppo HfrH è prototrofo, resistente all’inibizione della crescita provocata dalla sodio azide (aziR) e all’infezione con il batteriofago T1 (tonR); è invece sensibile all’inibizione dell’antibiotico streptomicina (strS). Il ceppo F– è auxotrofo per treonina (thr) e leucina (leu), sensibile alla sodio azide (aziS) e all’infezione con il batteriofago T1 (tonS), incapace di fermentare il lattosio (lac) o il galattosio (gal) e resistente all’inibizione della crescita provocata dalla streptomicina (strR). In questo esperimento di coniugazione, i due tipi di cellule vengono mescolati in un terreno liquido a 37 °C. A vari tempi, vengono prelevati campioni dei batteri coniuganti che vengono agitati per interrompere gli accoppiamenti. Piastrando su terreni selettivi, vengono cercati i ricombinanti (transconiuganti) e viene stabilito il tempo di ingresso nella cellula dei primi geni del donatore che hanno prodotto ricombinanti. In questo particolare incrocio, il terreno contiene streptomicina per uccidere il ceppo HfrH e manca di treonina e leucina, cosicché il parentale F– non può crescere. I geni treonina (thr+) e leucina (leu+) sono i primi geni del donatore trasferiti alla cellula F–, producendo un merodiploide, quindi i ricombinanti che si formeranno per scambio tra questi geni e i geni thr e leu della cellula ricevente F– potranno crescere sul terreno selettivo. Opportuni terreni di crescita possono essere utilizzati per analizzare la comparsa di altri geni del donatore (aziR, tonR, lac+ e gal+) tra i transconiuganti thr+ leu+ strR selezionati. Per esempio, un terreno con sodio azide può identificare la presenza del marcatore aziR.

383

La Figura 15.7b mostra i risultati. I geni per la treonina (thr+) e la leucina (leu+) sono i primi geni del donatore trasferiti alla cellula F–, dopo 8 minuti. (In un esperimento di coniugazione non si riesce a separare in termini temporali i due geni, perché la loro distanza fisica sul cromosoma è molto piccola). Il successivo gene trasferito è aziR e i ricombinanti per questo gene vengono osservati dopo circa 9 minuti, cioè circa un minuto dopo che sono entrati thr+ e leu+. I ricombinanti tonR compaiono dopo 10 minuti, seguiti da quelli lac+ dopo circa 16 minuti e da quelli gal+ dopo circa 25 minuti. La massima frequenza di ricombinanti si abbassa man mano che i geni entrano nel ricevente; questo perché, col passare del tempo, un certo numero di coniugazioni si interrompe spontaneamente. In questo esperimento ciascun gene del ceppo Hfr compare nei ricombinanti a un tempo diverso, ma riproducibile, dopo l’inizio della coniugazione. In questo modo, sulla base degli intervalli di tempo dell’esperimento, può essere costruita la mappa della Figura 15.7c, dove le unità di mappa sono espresse in minuti; l’intero cromosoma di E. coli richiede circa 100 minuti per il suo trasferimento. Si noti che qui abbiamo analizzato i risultati della coniugazione conoscendo l’ordine dei geni, in modo da chiarire i principi dell’analisi. In un esperimento reale l’ordine potrebbe essere sconosciuto. In questo caso, esso viene determinato analizzando tutti i possibili ricombinanti e il tempo della loro formazione. Così vengono definiti l’ordine e la distanza, in unità di tempo, tra i geni.

Circolarità della mappa di E. coli Un solo fattore F è integrato in ciascun ceppo Hfr. Diversi ceppi Hfr hanno un fattore F integrato nel cromosoma in posizioni diverse e in orientamenti diversi. Quindi, i ceppi Hfr differiscono l’uno dall’altro riguardo al punto dal quale ha inizio il trasferimento e all’ordine dei geni trasferiti. La Figura 15.8a illustra l’ordine di trasferimento dei geni cromosomici per quattro diversi ceppi Hfr: H, 1, 2 e 3. In ciascun caso, un solo ceppo Hfr è stato incrociato con un ricevente e sono stati determinati l’ordine dei geni trasferiti e il tempo di comparsa nella cellula ricevente. La distanza genetica in unità di tempo tra una particolare coppia di geni è costante, qualunque sia il ceppo Hfr utilizzato come donatore; per esempio, la distanza genetica tra thr e pro è la stessa in H, 1, 2 e 3. Ciò convalida l’uso delle unità di tempo come misura della distanza in E. coli. In base a questo tipo di dati viene costruita una mappa genetica del cromosoma allineando i geni trasferiti da ciascun ceppo Hfr, come indicato nella Figura 15.8b. Data la sovrapposizione dei geni nei diversi incroci, la mappa più semplice che si possa costruire è una mappa circolare, come viene mostrato

384

Capitolo 15 a) Trasferimento progressivo dei geni del donatore al ricevente durante la coniugazione Hfr µ F– F–

Hfr

tonS lac–

100

aziS

gal–

thr– leu– thr+ leu+

tonR lac+

aziR

gal+

Frequenza (%) di marcatori genetici del ceppo Hfr tra i ricombinanti strR, thr+, leu+

Minuti dopo l’inizio

8

b) Comparsa dei marcatori genetici del donatore nella cellula ricevente in funzione del tempo

Separazione

thr+ leu+

thr+ leu+

aziR

80 60

aziS

gal–

thr– leu–

lac+

40 gal+

20

tonS lac–

tonR

10

20

30

40

50

60

Tempo (minuti) gal+

9

lac+ tonR

thr+ leu+

thr+ leu+

thr+ leu+

aziR

Separazione

tonR

c) Mappa dei geni

aziR

Minuti

aziR

0

5

10

15

20

25

tonS

thr+ leu+

10

aziR

lac–

aziS

gal–

thr– leu–

tonR gal+ + lac

Origine

aziR thr+ leu+ Separazione

thr+ tonR leu+

thr, azi leu

ton

lac

gal

aziR

lac+

tonR

tonS lac– gal–

thr+ leu+

16

aziS thr– leu– tonR

gal+

aziR

lac+ thr+ leu+

lac+

tonR

thr+ tonR leu+

aziR

Separazione

lac+

aziR

tonS

thr+ leu+

25

lac–

aziS

gal–

thr– leu–

gal+

aziR tonR

lac+ tonR

gal+ lac+

thr+ leu+

thr+ tonR leu+

gal+

Separazione

lac+

aziR

aziR

Figura 15.7 Esperimento di coniugazione interrotta nell’incrocio HfrH thr+ leu+ aziR tonR lac+ gal+ strS μ F– thr leu aziS tonS lac gal strR. È illustrato il trasferimento progressivo di geni dal donatore al ricevente. (a) La coniugazione viene interrotta a vari tempi dal suo inizio e le cellule transconiuganti vengono piastrate in agar su terreno

selettivo per determinare quali geni si sono trasferiti da Hfr a F–. (b) Il grafico mostra la frequenza (percentuale) di marcatori genetici Hfr tra i ricombinanti thr+, leu+ e il loro tempo di comparsa nel ricevente. (c) Mappa dei geni basata sul tempo di entrata dei geni del donatore nel ricevente durante l’esperimento.

nella Figura 15.8c. La mappa è quindi composta sulla base dei risultati di diversi incroci singoli. La circolarità della mappa è stata di per sé un risultato interessante, in quanto tutte le precedenti mappe di cromosomi eucarioti erano lineari.

Usando esperimenti di coniugazione, è stata costruita una mappa genetica completa del cromosoma di E. coli; essa è lunga 100 minuti. Come la mappa genetica di altri organismi, questa mappa dà informazioni sulla posizione relativa dei geni di E. coli sul cromosoma circolare. Nel 1997

La genetica dei batteri e dei batteriofagi a) Ordine di trasferimento dei geni

Attività

Ceppi Hfr: H 1 2 3

origine–thr–pro–lac–pur–gal origine–thr–thi–gly–his origine–his–gly–thi–thr–pro–lac origine–gly–his–gal–pur–lac–pro

b) Allineamento dei geni trasferiti dai diversi ceppi Hfr H 1 2 3

thr–pro–lac–pur–gal his–gly–thi–thr his–gly–thi–thr–pro–lac pro–lac–pur–gal–his–gly

c) Mappa circolare del cromosoma di E. coli derivata dai risultati del trasferimento genico thr

Fattore F

pro lac

thi HfrH

pur

Hfr1

gal

Hfr2

Hfr3

gly

his

385

Visione ingrandita del fattore F

Origine del trasferimento di Hfr2

Termine del trasferimento di Hfr2

Figura 15.8 Esperimenti di coniugazione interrotta con differenti ceppi Hfr che dimostrano che la mappa di associazione di E. coli è circolare. (a) Ordine di trasferimento genico nei ceppi HfrH, 1, 2 e 3. (b) Allineamento dei geni per i ceppi Hfr. (c) Mappa cromosomica circolare di E. coli derivata dai dati di trasferimento genico di Hfr. La mappa è una composizione che mostra le diverse localizzazioni dei fattori F integrati. Ogni ceppo Hfr ha un solo fattore F integrato.

è stata completata la sequenza dell’intero genoma di E. coli, cioè delle 4,6 × 106 coppie di basi (4,6 Mb); pertanto, oggi è nota la mappa fisica del genoma batterico.

Nota chiave Il fattore circolare F può integrarsi nel cromosoma batterico, anch’esso circolare, con un singolo evento di ricombinazione. Ceppi nei quali è avvenuta questa integrazione possono coniugare con ceppi F– e trasferire parte del cromosoma batterico. I ceppi che portano il fattore F integrato sono chiamati Hfr (ad alta frequenza di ricombinazione). Negli incroci Hfr × F– il cromosoma viene trasferito unidirezionalmente dal ceppo Hfr a quello F– cominciando da uno specifico sito chiamato origine (O). Quanto più un gene è lontano dall’origine, tanto più tardi verrà trasferito alla cellula F–; ciò costituisce la base della mappatura dei geni a seconda del loro tempo di entrata nella cellula F–. La coniugazione interrotta permette di mappare il cromosoma.

Con la iAttività Conjugation in E. coli (Coniugazione in E. coli) nel sito dedicato agli studenti, state aiutando Elie Wollman e François Jacob nella costruzione della mappa di E. coli, utilizzando la nuova scoperta della coniugazione interrotta.

Mappatura dei geni nei batteri per trasformazione La trasformazione è il trasferimento unidirezionale di DNA extracellulare all’interno delle cellule, che porta a un cambiamento fenotipico del ricevente. In questo processo non c’è un contatto fisico diretto tra cellule batteriche ma il batterio ricevente assume il DNA presente nell’ambiente esterno. La trasformazione batterica è stata osservata per la prima volta da Frederick Griffith nel 1928, e nel 1944 Oswald Avery e i suoi colleghi dimostrarono che il DNA era responsabile del cambiamento genetico osservato (Capitolo 2). La trasformazione batterica è stata usata per mappare i geni in certe specie batteriche, nelle quali la mappatura con altri metodi (per esempio mediante coniugazione o trasduzione, descritta più avanti) non era possibile. In esperimenti di mappatura mediante trasformazione si estrae e si purifica il DNA, spezzettato in piccoli frammenti, del ceppo donatore. Questo DNA viene quindi aggiunto a una sospensione di batteri riceventi con genotipo differente. Il DNA del donatore che viene assunto dalla cellula ricevente può ricombinare con la regione omologa del cromosoma del ricevente dando luogo a un cromosoma ricombinante. I riceventi che in seguito alla trasformazione presentano un nuovo fenotipo vengono detti trasformanti. Le specie batteriche variano nella loro capacità di assumere il DNA dall’esterno. Per aumentare l’efficienza di trasformazione, le cellule in laboratorio vengono trattate chimicamente o sono esposte a un forte campo elettrico in un processo chiamato elettroporazione, che rende le membrane cellulari più permeabili al DNA. Le cellule preparate per assumere il DNA con la trasformazione sono dette cellule competenti. Vi sono due tipi di trasformazione batterica: la trasformazione naturale, nella quale i batteri sono naturalmente in grado di assumere il DNA e di essere trasformati; la trasformazione ingegnerizzata, nella quale i batteri sono stati modificati per permettere l’assunzione del DNA extracellulare e la successiva trasformazione genetica. Bacillus subtilis, un batterio cilindrico, sporigeno, lungo circa 3-8 μm e largo 1-1,5 μm, è un esempio di batterio nel quale la trasformazione avviene naturalmente. E. coli è un rappresentante dei batteri nei quali la trasformazione è provocata. Nel Focus sul genoma di questo capitolo vengono descritte la trasformazione di un genoma completo in una cellula e la sintesi di un intero cromosoma.

MyLab

386

Capitolo 15

In un esperimento di trasformazione, solo una piccola parte delle cellule assumeranno effettivamente il DNA. Consideriamo un esempio di trasformazione in Bacillus subtilis (vedi Figura 15.9). (Altri sistemi possono differire nei dettagli del processo.) Il frammento di DNA a doppio filamento del donatore è selvatico (a+), mentre la cellula ricevente porta l’allele mutato a (Figura 15.9a). I due filamenti di DNA vengono mostrati nella figura e, poiché gli stadi della trasformazione coinvolgono un appaiamento inusuale, ciascun filamento è marcato con un allele. Durante l’assunzione del DNA, uno dei due filamenti viene degradato, cosicché nella cellula se ne ritrova

solo uno intatto (Figura 15.9b). Questo singolo filamento lineare si appaia con il DNA omologo presente sul cromosoma circolare della cellula ricevente, formando una regione a tripla elica (Figura 15.9c). A questo punto può avvenire ricombinazione, mediante due eventi di ricombinazione tra il singolo filamento e il DNA a doppia elica del ricevente (Figura 15.9d). Il risultato è un cromosoma ricevente ricombinante: nella regione compresa tra i due eventi di scambio, un’elica del DNA porta il segmento a+ del DNA donatore e l’altra porta il segmento a del ricevente. In altre parole, in questa regione le due eliche del DNA portano l’una l’informazione genetica del donatore, l’altra quella del ricevente.

Focus sul genoma Vita artificiale: i genomi artificiali e il trasferimento di genomi È verosimile che presto gli scienziati riusciranno a ingegnerizzare cellule con genomi controllati. Questi genomi attiveranno nelle cellule nuove e utili vie biochimiche, come, per esempio, la capacità di sintetizzare metano o etanolo dalla cellulosa. Due ostacoli principali sono già stati superati dagli scienziati: un gruppo ha sintetizzato un intero genoma e l’altro ha trasferito il genoma batterico di una specie a un’altra specie. La sintesi chimica di piccoli pezzi di DNA è semplice, ma la sintesi di un intero genoma è praticamente impossibile. Tuttavia, un esperimento con Mycoplasma genitalium, che possiede il più piccolo tra i genomi noti di un organismo vivente, può dare anticipazioni sulle possibilità future. Per prima cosa i ricercatori hanno sintetizzato 101 piccole “cassette” costituite da 5000-7000 bp ciascuna. La maggior parte di esse era identica a regioni genomiche corrispondenti di M. genitalium, ma qualcuna presentava delle piccole variazioni. I ricercatori hanno deleto un gene che codificava per una proteina necessaria all’interazione parassitaria e hanno inserito poche piccole sequenze non codificanti per “etichettare” il genoma artificiale. Alle estremità le cassette avevano delle sovrapposizioni di 80-360 bp. Sfruttando queste sovrapposizioni, i ricercatori hanno unito le cassette per creare quattro “quarti di genoma” assemblati, ognuno in un cromosoma artificiale di lievito. Questi quattro elementi sono quindi stati introdotti in una singola cellula ospite di lievito che li ha ricombinati mediante le loro sovrapposizioni, per formare un nuovo genoma circolare di M. genitalium. L’analisi di questo genoma ha mostrato che esso era completo e conteneva le modifiche introdotte. I ricercatori speravano di poter trasferire questo genoma in una cellula batterica ospite, ma il vettore mancava di un gene necessario alla vitali-

tà e quindi il genoma così riassemblato non poteva essere trasferito. Altri ricercatori hanno trasferito un genoma da una specie a un’altra. L’organismo donatore era Mycoplasma mycoides, un batterio che forma grandi colonie su piastra e possiede il gene tetM, che codifica per una proteina che conferisce resistenza alla tetraciclina. Un ceppo ospite sensibile alla tetraciclina, Mycoplasma capricolum, forma piccole colonie e manca del gene tetM. I ricercatori hanno isolato genomi intatti, privi di proteine, da M. mycoides e hanno trasformato questo DNA genomico in cellule di M. capricolum. Dopo la trasformazione, alcune cellule avevano entrambi i genomi e altre avevano soltanto il genoma ospite. Le cellule trasformate sono state fatte crescere in presenza di tetraciclina, che ha ucciso tutte le cellule di M. capricolum non trasformate. In queste condizioni di crescita selettive, le cellule che crescono più velocemente avranno un singolo genoma (due genomi impiegano più tempo per la loro replicazione) e dovranno avere il gene tetM: questa è la condizione ottimale per selezionare in base alla perdita del genoma ospite e alla ritenzione di quello del donatore. Alcune cellule crescevano molto rapidamente, formando colonie resistenti alla tetraciclina. Per dimostrare che esse contenevano soltanto il genoma di M. mycoides e che quello di M. capricolum non era più presente, furono clonati e sequenziati diversi geni che differivano tra le due specie. I geni trovati erano sempre quelli di M. mycoides. Anche l’analisi delle proteine su gel confermò che esse erano identiche a quelle di M. mycoides e differenti da quelle di M. capricolum. Anche se non si poteva escludere che piccoli frammenti del genoma ospite fossero ancora presenti, si poteva però dimostrare che era presente e funzionante il genoma donatore e che le cellule erano diventate fenotipicamente simili a quelle del donatore.

La genetica dei batteri e dei batteriofagi a) Il frammento di DNA batterico lineare a doppio filamento porta l’allele a+, il batterio ricevente l’allele a DNA ricevente DNA donatore a doppio filamento a+

a a

a+

b) Un filamento del DNA del donatore entra nella cellula mentre l’altro viene degradato

a a a+

c) Il singolo filamento lineare si appaia con la regione omologa del cromosoma del ricevente formando una struttura a tre filamenti

a a

a+

d) Un doppio evento di ricombinazione porta alla formazione di un cromosoma ricevente ricombinante con un allele a+ su un filamento e uno a sull’altro. L’altro prodotto della ricombinazione è un filamento di DNA lineare che porta l’allele a

a a

a

a+

a+ Degradato a

Ricombinazione per un doppio scambio

Cromosoma con un segmento di DNA eteroduplex a+/a e filamento lineare degradato

387

matosi porterà l’informazione genetica del ricevente su entrambi i filamenti e sarà non-trasformante a. Vengono prodotti numeri equivalenti di trasformanti a+ e di nontrasformanti a. Con cellule riceventi altamente competenti, si può ottenere trasformazione per la maggior parte dei geni con una frequenza di circa 1 su 103 cellule. Usando la trasformazione è possibile determinare se due geni sono associati (in questo caso, ciò significa che i due geni sono vicini l’uno all’altro sul cromosoma), l’ordine dei geni nella mappa genetica e la loro distanza. Il principio per determinare se due geni sono associati è il seguente: una trasformazione efficiente coinvolge frammenti con una dimensione sufficiente a includere soltanto pochi geni. Se due geni, x+ e y+, sono molto lontani sul cromosoma del donatore, li troveremo sempre su frammenti diversi di DNA. Quindi, dato un certo donatore x+ y+ e un ricevente x y, la probabilità di trasformazione simultanea (cotrasformazione) del ricevente in x+ y+ sarà data dal prodotto delle probabilità di trasformazione per ciascun gene preso singolarmente (secondo la regola del prodotto). Se la trasformazione avviene con una frequenza di 1 su 103 cellule per gene, i trasformanti x+ y+ saranno attesi con una frequenza di 1 su 106 cellule riceventi (10–3 × 10–3). Invece, se due geni sono sufficientemente vicini da potersi trovare frequentemente su uno stesso frammento di DNA, la frequenza di cotrasformazione sarà simile alla frequenza di trasformazione per un singolo marcatore. In pratica, basandosi sui risultati sperimentali, se la frequenza di cotrasformazione tra due geni avviene con frequenza sostanzialmente più elevata rispetto al prodotto delle frequenze di trasformazione dei due geni presi singolarmente, allora essi devono essere vicini. I risultati di cotrasformazione permettono anche di determinare l’ordine dei geni (Figura 15.10). Se i geni p DNA donatore

e) Replicazione del cromosoma ricevente Batterio donatore p+

a+ a+

1/ a+/a+ 2 trasformante

a a

1/ a/a 2 non trasformante

o+

DNA estratto da una popolazione di batteri donatori; il DNA si frammenta

Figura 15.9 Trasformazione naturale in Bacillus subtilis.

Una regione di DNA che porta una diversa informazione nella sequenza dei due filamenti si definisce un eteroduplex di DNA. L’altro prodotto del doppio evento di ricombinazione è un frammento di DNA a singolo filamento che porta l’allele a e che viene degradato. Dopo la replicazione del cromosoma del ricevente, un cromosoma della progenie porterà l’informazione genetica del donatore su entrambi i filamenti del DNA e sarà un trasformante a+ (Figura 15.9e). L’altro cromosoma for-

q+

p+ p+ q+ o+

q+ o+

Genotipi dei trasformanti p+ q

o

p+

q+

o

p

q+ o+

Frammenti di DNA usati per trasformare batteri riceventi p q o p

q

o+

Figura 15.10 Dimostrazione della determinazione dell’ordine dei geni per cotrasformazione.

388

Capitolo 15

e q sono trasmessi frequentemente insieme, dovranno essere abbastanza strettamente associati. Analogamente, se i geni q e o vengono cotrasmessi con alta frequenza, devono trovarsi vicini. Per determinare l’ordine dei geni abbiamo bisogno di informazioni riguardo a p e o. In teoria, vi sono due possibili ordini: p-o-q e p-q-o. Se l’ordine corretto è p-o-q, allora p e o devono essere trasmessi insieme perché sono più strettamente associati di p e q; se invece l’ordine è p-q-o, allora p e o potrebbero essere trasmessi insieme raramente o mai, perché potrebbero trovarsi relativamente distanti. I risultati indicano che non ci sono cotrasformanti per p e o, quindi l’ordine dei geni deve essere p-q-o.

Nota chiave La trasformazione è il processo di trasferimento di piccoli frammenti di DNA extracellulare dall’ambiente esterno ad un batterio ricevente senza la necessità di un contatto fisico diretto tra cellule batteriche. Nella trasformazione in laboratorio, il DNA viene estratto da cellule donatrici e reso disponibile a cellule riceventi. Un frammento lineare di DNA assunto da una cellula ricevente può appaiarsi con la regione omologa presente sul suo cromosoma. Parte della molecola del DNA trasformante può scambiarsi con parte del DNA cromosomico della cellula ricevente. Un’alta frequenza di cotrasformazione di geni del donatore indica che questi sono fisicamente vicini. L’analisi dei cotrasformanti può essere utilizzata per determinare l’ordine dei geni. La trasformazione è stata utilizzata per costruire mappe genetiche di specie batteriche nelle quali non è possibile un’analisi per coniugazione o per trasduzione.

Batteriofagi La maggior parte dei ceppi batterici può essere infettata da fagi specifici. Un fago ha una struttura relativamente semplice, che consiste in un singolo cromosoma di DNA o RNA circondato da un involucro proteico. Il numero e l’organizzazione delle proteine conferiscono al fago la sua caratteristica morfologia. I fagi T2 e T4 sono stati descritti nel Capitolo 2 e il fago λ (lambda) nel Capitolo 3. I fagi T2 (vedi Figura 2.4) e T4 sono fagi virulenti, intendendo con ciò che alla loro infezione in E. coli segue un ciclo litico (vedi Figura 2.5). Questo significa che il fago inietta il proprio cromosoma nella cellula e i geni virali dirigono le funzioni cellulari per produrre una progenie di particelle fagiche che verranno rilasciate dal batterio in seguito alla sua lisi. Questa sospensione viene detta lisato fagico. Possiamo seguire visivamente il ciclo litico. Una miscela di fagi e batteri viene piastrata su un terreno solido. La concentrazione dei batteri viene scelta in modo da dare origine a uno strato continuo. I fagi sono presenti in concentrazione molto inferiore. Ogni fago infetta un batterio sulla superficie della piastra. La progenie fagica, rilasciata dal primo batterio infettato, infetta i batteri limitrofi e il ciclo litico si ripete. Il risultato è una zona della piastra che è “libera” da batteri e che viene detta placca. Ogni placca deriva da uno dei fagi infettanti originari (vedi Figura 15.11). Il ciclo vitale del fago λ (Figura 15.12) è più complesso di quello del fago T2. Quando il DNA del fago λ viene iniettato in E. coli, possono verificarsi due cicli alternativi. Uno è il ciclo litico, simile a quello dei fagi T; l’altro è il ciclo lisogeno. Nel ciclo lisogeno, il cromosoma di λ non si replica, e viene invece inserito (integrato) in una specifica regione del cromosoma della cellula ospite, in modo simile a quanto avviene nell’integrazione del fattore F. In questo stato integrato, il genoma del fago viene chiamato profago. Ogni volta che il cromosoma della cellula ospite replica, il cromosoma di λ inte-

Mappatura dei geni nei batteri mediante trasduzione La trasduzione (letteralmente “condurre attraverso”) è un processo nel quale batteriofagi (virus batterici, chiamati per brevità fagi) trasferiscono geni da un batterio (donatore) a un altro (ricevente); questi fagi sono chiamati vettori fagici. Dato che la quantità di DNA che un fago può assemblare e trasportare nel suo capside è limitata, la quantità di materiale genetico che può essere trasferita è di solito meno dell’1% dell’intero cromosoma batterico. Una volta introdotto nella cellula ricevente, il materiale genetico può andare incontro a ricombinazione con la regione omologa del cromosoma del ricevente. I riceventi ricombinanti sono chiamati trasduttanti.

Figura 15.11 Placche di batteriofago T2 di E. coli.

La genetica dei batteri e dei batteriofagi

grato replica con esso. Il batterio che contiene un fago allo stato di profago viene chiamato lisogeno per questo fago; il fenomeno dell’inserzione del cromosoma del fago nel cromosoma batterico viene chiamato lisogenia. I fagi che possono scegliere tra il ciclo litico e il ciclo lisogeno vengono chiamati fagi temperati. Lo stato di profago è mantenuto dall’azione di uno specifico prodotto genico (una proteina repressore) che impedisce l’espressione dei geni di λ essenziali per il ciclo litico. Quando il repressore che mantiene lo stato di profago viene distrutto – per esempio, per effetto di fattori ambientali quali i raggi ultravioletti –, viene indotto il ciclo litico. In seguito all’induzione, il cromosoma integrato di λ viene escisso dal cromosoma batterico e inizia il ciclo litico, che porta alla produzione e al rilascio di una progenie di fagi λ.

Mappatura del cromosoma batterico mediante trasduzione La trasduzione può essere usata per mappare i geni batterici. Possono avvenire due diversi tipi di trasduzione: nella trasduzione generalizzata, qualsiasi gene può essere trasferito da un batterio all’altro; nella trasduzione specializzata vengono trasferiti solo determinati geni.

8 Un enzima codificato dal fago digerisce la parete della cellula batterica e così viene rilasciata la progenie fagica

Trasduzione generalizzata La trasduzione generalizzata fu scoperta da Joshua Lederberg e Norton Zinder nel 1952. Questi ricercatori verificavano se la coniugazione potesse avvenire anche nella specie batterica Salmonella typhimurium. I loro esperimenti erano essenzialmente simili a quello che aveva portato a dimostrare la presenza di coniugazione in E. coli. Essi mescolarono due ceppi auxotrofi multipli, phe+ trp+ tyr+ met his (richiedente metionina e istidina) e phe trp tyr met+ his+ (richiedente fenilalanina, triptofano e tirosina), e trovarono con bassa frequenza alcuni ricombinanti prototrofi phe+ trp+ tyr+ met+ his+. Tuttavia, al contrario di quanto avveniva con la coniugazione, quando essi usarono il sistema del tubo a U (Figura 15.3), trovarono ancora prototrofi. Questo dimostrò che i ricombinanti venivano prodotti da un meccanismo che non richiedeva il contatto cellula-cellula. Essi interpretarono questo risultato supponendo che l’agente responsabile della formazione dei ricombinanti fosse un agente filtrabile, dato che poteva passare attraverso un filtro con pori sufficientemente piccoli da bloccare il movimento dei batteri. In questo particolare caso, l’agente filtrabile fu identificato nel fago temperato P22. Come esempio, nella Figura 15.13 viene mostrato il meccanismo di trasduzione generalizzata operata dal fago temperato P1 in E. coli. Normalmente il fago P1 entra

2 Il cromosoma del fago l circolarizza. A questo punto il fago può andare incontro sia al ciclo litico sia al ciclo lisogeno Cromosoma batterico DNA del fago

1 Il fago l si lega alla parete batterica e introduce il suo cromosoma lineare nella cellula

DNA dell’ospite

389

3 Per iniziare il ciclo lisogeno, il DNA del fago l si integra nel cromosoma batterico. In questo stadio il cromosoma fagico si chiama profago. Quando il batterio cresce e si divide, il suo cromosoma, con il profago, si replica

DNA del fago

Ciclo litico

Ciclo lisogeno

Cromosomi replicati di l

7 Le particelle del fago l si assemblano nella cellula; ciascuna contiene una copia del cromosoma fagico lineare 6 Durante il ciclo litico, gli enzimi codificati dal fago demoliscono il cromosoma batterico e i geni fagici codificano per le proteine della particella fagica, mentre vengono prodotte copie del cromosoma del fago l

5 Nel momento in cui si creano le condizioni per l’escissione del cromosoma del fago l da quello batterico, il fago l entra nel ciclo litico

4 Dopo una divisione cellulare, ciascuna cellula prodotta avrà un cromosoma che contiene il profago

Figura 15.12 Ciclo vitale del fago temperato l. Quando un fago temperato infetta una cellula, esso può andare incontro a ciclo litico o lisogeno.

390

Capitolo 15 Cromosoma batterico

Fago P1

Cromosoma di P1

a+

Batterio donatore (selvatico)

b+

Produzione di fagi mediante ciclo litico, con frammentazione del cromosoma batterico

c+

1 Cellula donatrice infettata dal batteriofago temperato P1

Frammenti di cromosoma batterico a+

c+

b+

a

7 Batterio stabilmente trasdotto (trasduttante a+) prodotto per ricombinazione. Frammenti lineari degradati dalle nucleasi cellulari

a+

2 Riproduzione del fago

Fagi normali

Fagi trasducenti

6 Un doppio evento di ricombinazione porta allo scambio del gene a+ del donatore con il gene a del ricevente

a+

a

3 Assemblaggio di fagi selvatici e trasducenti. Geni batterici vengono incorporati in alcune teste fagiche

5 Infezione di un batterio ricevente (a) con un fago trasducente (a+) a+

a

Cromosoma batterico (auxotrofo per a)

b+

a+ c+

4 Rilascio della progenie fagica per lisi cellulare. Lisi Alcuni fagi sono trasducenti poiché veicolano un frammento di DNA del batterio c+ donatore a+ b+ Fago trasducente Fago non trasducente Lisato fagico

Figura 15.13 Trasduzione generalizzata tra ceppi di E. coli.

nello stato lisogeno dopo aver infettato il batterio E. coli (Figura 15.13, parte 1). Se lo stato lisogeno non viene mantenuto, il fago entra nel ciclo litico e produce una progenie fagica (Figura 15.13, parte 2). Durante il ciclo litico, il DNA batterico viene degradato e, in rare occasioni, frammenti di DNA batterico possono essere impacchettati nella testa del fago al posto del DNA del fago (Figura 15.13, parte 3). Questi fagi sono chiamati fagi trasducenti, dato che essi fungono da veicoli per il trasporto di materiale genetico da un batterio all’altro. Nell’esempio mostrato nella figura, i fagi trasducenti sono quelli che portano i geni batterici a+, b+ e c+ del donatore batterico. La popolazione di fagi presente nel lisato (Figura 15.13, parte 4) consiste per la maggior parte di fagi normali, ma tra questi è presente circa 1 particella fagica trasducente ogni 105 elementi normali. Questo lisato può essere usato per infettare una nuova popolazione di batteri (Figura 15.13, parte 5). I batteri riceventi hanno genotipo a. Se un fago trasducente che porta l’allele a+ infetta il batterio, può avvenire scambio genetico

tra il gene a+ del donatore e il gene a del ricevente mediante un doppio evento di ricombinazione (Figura 15.13, parte 6). Il risultato è un batterio trasdotto stabile, detto trasduttante – in questo caso un trasduttante a+. In un esperimento di questo genere, di solito, la cellula donatrice e la cellula ricevente differiscono per alcuni marcatori genetici, così da poter osservare eventi di trasduzione. Per esempio, se la cellula donatrice è thr+ e la cellula ricevente è thr, i trasduttanti prototrofi possono essere identificati perché le cellule non richiedono più treonina per crescere. In questo modo i ricercatori possono scoprire i trasduttanti, presenti con frequenza estremamente bassa, semplicemente cercando quelle cellule che sono capaci di fare qualche cosa che le cellule non trasdotte non sanno fare, e cioè crescere in un terreno minimo. In questo caso, thr+ è chiamato marcatore selettivo. Gli altri marcatori nell’esperimento sono detti marcatori non selettivi. Il processo appena descritto viene chiamato trasduzione generalizzata perché il pezzo di DNA batterico,

La genetica dei batteri e dei batteriofagi

che il fago assume erroneamente e trasporta nel batterio ricevente, è un pezzo casuale del cromosoma batterico frammentato. Quindi, qualsiasi gene può essere trasdotto: tutto quello che è necessario è un fago appropriato e ceppi batterici che portino marcatori genetici differenti. Attraverso la trasduzione generalizzata è possibile stabilire l’ordine e la distanza di mappa tra geni che vengono cotrasdotti, e con questa procedura sono state costruite mappe di associazione dettagliate di cromosomi batterici. La logica è identica a quella utilizzata per mappare i geni con la trasformazione. Per esempio, consideriamo di voler mappare mediante trasduzione col fago temperato P1 alcuni geni di E. coli. Il ceppo di E. coli donatore è leu+ thr+ aziR (capace di crescere in terreno minimo e resistente al veleno metabolico sodio azide). La cellula ricevente è leu thr aziS (necessita dell’aggiunta di leucina e treonina al terreno di coltura ed è sensibile alla sodio azide). I fagi P1 vengono fatti crescere su cellule donatrici e il lisato fagico viene utilizzato per infettare le cellule batteriche riceventi. I trasduttanti sono selezionati per uno dei marcatori del donatore e quindi analizzati per la presenza dei marcatori non selezionati (in questo caso, due). I dati ottenibili da un esperimento di questo genere sono mostrati nella Tabella 15.1. Consideriamo i trasduttanti leu+. Vediamo se sono presenti anche altri marcatori del donatore – cioè se sono stati cotrasdotti con il marcatore selezionato. Questi cotrasduttanti possono aver avuto origine in uno dei due modi seguenti: (1) se i due geni sono sufficientemente vicini da poter essere impacchettati in una singola testa fagica e quindi iniettati nella cellula da un singolo fago; oppure (2) se i due geni non sono vicini e sono stati introdotti nello stesso batterio dall’infezione simultanea di due fagi distinti. La trasduzione di due geni nello stesso batterio per opera di due fagi diversi è un evento raro. Quindi, se i due geni sono sufficientemente vicini, possono essere stati impacchettati nella testa di un fago in una stessa molecola di DNA e la frequenza di cotrasduzione è simile a quella della trasduzione di un singolo gene. La cotrasduzione di due o più geni è pertanto una buona indicazione che essi sono vicini. Il 50% dei trasduttanti leu+ è aziR e il 2% è thr+. Ciò significa che i geni leu e azi vengono spesso cotrasdotti in una stessa molecola di DNA. Molto meno frequente-

Tabella 15.1 Dati di un esperimento di trasduzione per decidere l’ordine dei geni Marcatore selezionato

Marcatori non selezionati

leu+

50% = aziR 2% = thr+

thr+

3% = leu+ 0% = aziR

391

mente viene cotrasdotto il gene thr. Per i trasduttanti thr+, il 3% è anche leu+ e lo 0% è aziR. Questa distribuzione conferma che i geni thr e leu possono essere cotrasdotti e indica anche che il gene azi è troppo distante e non viene mai incluso nella stessa molecola di DNA. Nell’insieme, questi risultati ci dicono che il gene leu è più vicino a thr rispetto ad azi e che il gene leu e il gene azi sono più vicini tra di loro di quanto lo siano leu e thr. L’ordine dei geni deve essere, quindi, come indicato dalla seguente mappa grezza: thr

leu azi

I trasduttanti sono prodotti per ricombinazione fra il pezzo di cromosoma del donatore, portato all’interno della cellula ricevente dal fago infettante, e la regione omologa del cromosoma del batterio ricevente. Il DNA del donatore trova la regione omologa nel cromosoma del ricevente e attraverso un doppio evento di ricombinazione (o un numero pari di eventi) avviene lo scambio delle parti (Figura 15.13). La distanza di mappa può essere ottenuta con esperimenti di trasduzione che coinvolgano due o più marcatori. Come si è visto prima, si selezionano i trasduttanti per uno o più marcatori del donatore e questi trasduttanti vengono analizzati per la presenza o assenza di altri marcatori del donatore. Per esempio, la trasduzione da un donatore a+ b+ a un ricevente a b determina la formazione di diversi trasduttanti per a+ e b+, e precisamente a+ b, a b+ e a+ b+. Se si seleziona per l’uno o per l’altro marcatore del donatore, è possibile determinare l’associazione tra i due geni (espressa come frequenza di cotrasduzione). Selezionando per trasduttanti a+, la distanza di mappa tra i geni a e b è data da: numero di trasduttanti per un singolo marcatore –––––––––––––––––––––––––––––––––––––– × 100% numero di trasduttanti totali (a+ b) = –––––––––––––– × 100% (a+ b) + (a+ b+) Selezionando per i trasduttanti b+, la distanza di mappa tra a e b è data da: (a b+) –––––––––––––– × 100% + (a b ) + (a+ b+) Questo metodo di mappatura può essere utilizzato solo per geni che si trovano sufficientemente vicini sul cromosoma da poter essere cotrasdotti, poiché, per esserlo, devono entrambi trovarsi in un frammento di DNA che abbia circa la stessa dimensione del genoma fagico. Trasduzione specializzata Alcuni batteriofagi temperati possono trasdurre solo determinate parti del cromosoma batterico, al contrario dei fagi che operano la trasduzione generalizzata, i quali possono trasportare qualsiasi

392

Capitolo 15

a) Produzione di un lisogeno per ricombinazione tra il cromosoma batterico circolare e il cromosoma del fago circolarizzato Regione di omologia tra cromosomi

Cromosoma fagico circolarizzato (λ)

gal+

att

att l

Cromosoma batterico

gal+

bio+

b) Produzione del lisato iniziale a bassa frequenza di trasduzione (LFT) quando l’induzione del batterio lisogeno causa la formazione di un’ansa

Cromosoma del fago λ integrato

gal+

Cromosoma λ

bio+

1) Un’ansa normale produce fagi l normali Cromosoma del fago λ normale

bio+

gal+ gal+

bio+

bio+

2) Raramente, un’escissione anomala produce fagi trasducenti ld gal+ gal+

Cromosoma del fago λd gal+

gal+

bio+

c) Trasduzione di batteri gal con il lisato iniziale, contenente fagi l e ld gal+ 1) Se sia l sia ld gal+ si integrano, ha origine un trasduttante instabile – un doppio lisogeno

gal+

Cromosoma Cromosoma del fago λd gal+ del fago λ bio+

gal

L’induzione produce circa lo stesso numero di fagi λd gal+ e fagi λ normali – un lisato ad alta frequenza di trasduzione (HFT)

Doppio lisogeno gal+

att l

bio+

2) Trasduttanti stabili prodotti per ricombinazione

Cromosoma del fago λd gal+ gal+

gal

gal

Cromosoma fagico λd gal+ (incapace di replicare perché non tutti i geni sono presenti)

e

bio+

Cromosoma batterico

Figura 15.14 Trasduzione specializzata con il batteriofago l.

parte del cromosoma batterico. Un esempio di fago che opera la trasduzione specializzata è λ, che infetta E. coli. Il ciclo di crescita di λ è stato descritto precedentemente (vedi Figura 15.12). Nel ciclo lisogeno, il genoma di λ si integra nel cromosoma batterico in un sito specifico tra le regioni gal e bio, producendo quello che viene chiamato un lisogeno (vedi Figura 15.14a). Questo sito sul cromosoma di E. coli viene chiamato att λ (sito di attacco per lambda) ed è l’omologo di un sito nel DNA di

gal+

bio+

Trasduttante stabile gal+

λ chiamato att. Il cromosoma di λ si integra con un singolo evento di ricombinazione. Il fago, che viene ora chiamato profago, si mantiene allo stato integrato per l’azione di una proteina repressore codificata dal fago stesso. Un ceppo di E. coli che può lisogenizzare λ è E. coli K12, e quando questo batterio contiene il profago λ, viene indicato come E. coli K12(λ). Focalizziamo l’attenzione sul gene gal e assumiamo che il particolare ceppo K12 che lisogenizza sia gal+, il che vuol dire che esso è capace di utilizzare il galattosio come fonte di carbonio.

La genetica dei batteri e dei batteriofagi

Questo fenotipo può essere identificato facilmente piastrando le cellule su un terreno solido che contiene galattosio come fonte di carbonio, in presenza di un colorante che cambia colore in risposta ai prodotti di fermentazione del galattosio. Su questo terreno, le colonie gal+ sono rosa, mentre le colonie gal sono bianche. Se noi induciamo il profago – cioè eliminiamo la repressione delle funzioni litiche –, il ciclo litico ha inizio. Una volta che il ciclo litico è iniziato, il cromosoma del fago si ripiega ad ansa e, con un singolo evento di ricombinazione in corrispondenza dei siti att λ/att, viene generato un cromosoma di λ circolare, separato dal cromosoma batterico (Figura 15.14b). Normalmente l’escissione del cromosoma del fago è precisa, così da produrre un cromosoma λ completo (Figura 15.14b, parte 1). In alcuni rari casi, la ricombinazione tra il cromosoma del fago e il cromosoma batterico avviene in siti diversi da quelli omologhi, e ciò porta alla produzione di molecole circolari di DNA anormali (Figura 15.14b, parte 2). Nel caso illustrato, un pezzo del cromosoma λ è stato lasciato sul cromosoma batterico, mentre un pezzo del cromosoma batterico, che include il gene gal+, è stato aggiunto al cromosoma di λ. Dato che un gene batterico (o più geni batterici) è stato incluso in un fago della progenie, si è venuto a creare un fago trasducente, che in questo caso chiamiamo λd gal+. La d sta per “difettivo”, dato che non tutti i geni del fago sono presenti, e gal+ indica che è stato assunto il gene batterico gal. Questo evento di trasduzione è simile alla produzione del fattore F′ per escissione anomala di F. Il fago λd gal+ può replicare e lisare la cellula batterica nella quale è stato prodotto; comunque, tutti i geni di λ sono ancora presenti: alcuni sul cromosoma fagico, altri sul cromosoma batterico. Dato che l’escissione anomala è un fenomeno raro, il lisato fagico prodotto dall’induzione iniziale contiene soprattutto fagi selvatici e relativamente pochi fagi trasducenti gal+ (1/105). Data la bassa frequenza di fagi trasducenti, il lisato viene chiamato lisato a bassa frequenza di trasduzione (LFT, Low-Frequency Transducing lysate). L’infezione di cellule batteriche gal con il lisato LFT produce due tipi di trasduttanti (Figura 15.14c). Nel primo tipo il fago λ si integra nel normale sito att λ e successivamente il fago λd gal+ si integra per ricombinazione all’interno del DNA del λ integrato, dando origine a un doppio lisogeno (Figura 15.14c1). In questo caso entrambi i tipi di fago sono integrati nel cromosoma batterico e il batterio è eterozigote gal+/gal e quindi capace di fermentare il galattosio. Questo tipo di trasduttante è instabile perché per induzione può avere inizio la crescita litica. Il λ selvatico possiede una serie completa di geni per la replicazione fagica e può controllare l’escissione e la replicazione di se stesso e del fago trasducente λd gal+. Il fago λ selvatico agisce come fago helper (adiuvante). Poiché metà della progenie fagica sarà λd gal+ questo lisato è chiama-

393

to ad alta frequenza di trasduzione (HFT, High-Frequency Transducing lysate). Il secondo tipo di trasduttanti prodotti dal lisato iniziale è stabile: questi trasduttanti vengono prodotti quando solo il fago λd gal+ infetta una cellula (Figura 15.14c2). Il gene gal+ portato dal fago può ricombinare con il gene gal del batterio mediante un doppio evento di ricombinazione. Tale trasduttante è stabile perché il cromosoma batterico contiene solo un tipo di gene gal e non sono presenti geni del fago. Dato il tipo di meccanismo coinvolto, con la trasduzione specializzata è possibile trasdurre solo piccoli segmenti del cromosoma batterico che sono contigui all’una o all’altra estremità del profago. La trasduzione specializzata è utilizzata per spostare specifici geni da un batterio all’altro, per esempio, per costruire ceppi con particolari genotipi. (La discussione specifica va al di là degli scopi di questo testo.)

Nota chiave La trasduzione è il processo attraverso il quale i batteriofagi mediano il trasferimento dell’informazione genetica da un batterio (donatore) a un altro (ricevente). La capacità della particella fagica è limitata, quindi la quantità di DNA che può essere trasferita è normalmente inferiore all’1% dell’intero cromosoma batterico. Nella trasduzione generalizzata, qualsiasi gene batterico può essere incorporato accidentalmente all’interno del fago trasducente durante il ciclo litico e successivamente trasferito al batterio ricevente. La trasduzione specializzata è operata da fagi temperati (come λ) che, allo stato di profago, si integrano in uno specifico sito del cromosoma batterico. In questo caso il fago trasducente è generato per escissione anomala del profago dal cromosoma batterico, cosicché il DNA del profago comprende sia i geni del fago sia alcuni geni batterici. La trasduzione permette una mappatura fine di piccoli segmenti del cromosoma.

Mappatura dei geni nei batteriofagi Gli stessi principi utilizzati per mappare i geni negli eucarioti vengono utilizzati per mappare i geni nel fago. Vengono realizzati incroci tra ceppi di fago che differiscono per marcatori genetici e viene determinata la frequenza di ricombinanti nella progenie. Fondamentalmente, quindi, il procedimento per mappare i geni consiste in incroci a due, tre o quattro fattori, che vengono effettuati attraverso infezione mista dei batteri con fagi a diverso genotipo e analizzando la progenie, cioè le placche.

394

Capitolo 15

Per fare un’analisi genetica dei batteriofagi, dobbiamo avere fenotipi fagici da studiare. Numerose mutazioni alterano il ciclo di crescita del fago, dando origine a placche con un aspetto diverso. Per esempio, ci sono ceppi di T2 che differiscono per la morfologia di placca (le dimensioni e i margini della placca) e lo spettro d’ospite (cioè il tipo di ceppo batterico che il fago è capace di lisare). Consideriamo due ceppi fagici. Uno ha genotipo h+ r, cioè selvatico per lo spettro d’ospite (h+, capace di lisare il ceppo B, ma non il ceppo B/2, di E. coli; in questo caso il ceppo B è chiamato ospite permissivo e il ceppo B/2 è l’ospite non permissivo per il fago) e mutante per la morfologia di placca (r, produzione di placche grandi con margini netti). L’altro ceppo fagico ha genotipo h r+, cioè mutante per lo spettro d’ospite (capace di lisare sia ceppi B sia ceppi B/2 di E. coli) e selvatico per la morfologia di placca (r+, produzione di placche piccole con margini indistinti). Quando vengono piastrati su uno strato misto di cellule B e B/2, tutti i fagi che portano la mutazione h per lo spettro d’ospite (che possono infettare sia B sia B/2) danno origine a placche chiare, mentre i fagi che portano l’allele h+ selvatico formano placche torbide. Quest’ultima caratteristica è dovuta al fatto che la presenza dell’allele h+ permette al faa) Infezione dei batteri con i due fagi parentali, h+ r e h r+

go di infettare solo i batteri B, lasciando intatti i batteri B/2, i quali, crescendo all’interno della placca, provocano torbidità. Per mappare questi due geni realizziamo un incrocio genetico, infettando un ceppo di E. coli B con i due tipi di fagi (parentali) h+ r e h r+ (vedi Figura 15.15a). Una volta che i due genomi si trovano all’interno della stessa cellula batterica, ciascuno inizierà a replicarsi (Figura 15.15b). Se un cromosoma h+ r e uno h r+ si incontrano, la ricombinazione tra i due geni può produrre cromosomi ricombinanti h+ r+ e h r (Figura 15.15c), che saranno incorporati nella progenie fagica. Quando il batterio viene lisato, la progenie ricombinante viene rilasciata nel terreno insieme ai fagi non ricombinanti (parentali; Figura 15.15d). Dopo aver completato il ciclo litico, i fagi della progenie vengono piastrati su uno strato di batteri che contiene una miscela di ceppi B e B/2 di E. coli. In questo esperimento si potranno trovare quattro diversi tipi di placche: due tipi parentali e due tipi ricombinanti. Il tipo parentale h r+ dà luogo a placche piccole e chiare con il margine indistinto, l’altro parentale h+ r produce placche grandi e torbide con margine netto (Figura 15.16). I ricombinanti reciproci danno luogo a fenotipi ricombinan-

h r+

h+ r

hr h r+

b) Replicazione dei cromosomi fagici nella cellula

h+ r

h

r+

h+ r

h

r+

h+ r

h

r+

h+ r +

h+ r

c) Ricombinazione tra alcuni cromosomi parentali e formazione di ricombinanti h+ r+ e h r

h+ r

h+ r

h+ r

h

r+

h

r+

h

r+

Ricombinazione

d) Assemblaggio dei fagi, lisi batterica e rilascio di progenie fagica parentale e ricombinante

Parentali h+ r

+ h r

h r+

h+ r+

h

r+ h

r

Ricombinanti

Figura 15.15 I principi di realizzazione di un incrocio con batteriofagi.

Figura 15.16 Placche prodotte dalla progenie di un incrocio tra ceppi T2 h r+ μ h+ r. Possono essere distinte quattro diverse morfologie di placca, due di tipo parentale e due di tipo ricombinante. Il fago parentale h r+ produce placche piccole, chiare e con margini indistinti; l’altro parentale h+ r produce placche grandi, torbide con margini netti. Il ricombinante h+ r+ produce placche piccole, torbide con margini indistinti e il ricombinante h r produce placche grandi, chiare con margini netti.

La genetica dei batteri e dei batteriofagi

ti: le placche h+ r+ sono torbide e piccole con margine indistinto e le placche h r sono chiare e grandi con margine netto (Figura 15.16). Dopo aver contato le placche, è possibile calcolare la frequenza di ricombinazione tra h e r, data da placche (h+ r+) + (h r) ––––––––––––––––––– × 100 placche totali Come per gli eucarioti, la frequenza di ricombinazione riflette la distanza relativa tra i geni fagici. Quando due geni sono vicini a sufficienza, in modo che sia improbabile che avvengano numerosi eventi di ricombinazione, la frequenza di ricombinazione corrisponde alla frequenza di scambio e, in questo caso, la frequenza di ricombinazione può essere convertita in unità di mappa.

Nota chiave Gli stessi principi utilizzati per mappare i geni eucarioti vengono utilizzati per mappare i geni fagici. Il materiale genetico viene scambiato, durante una coinfezione di cellule batteriche, tra ceppi di fagi che differiscono nei marcatori genetici e i ricombinanti vengono individuati e contati.

Analisi della struttura fine di un gene di batteriofago La mappatura per ricombinazione, utilizzata per stabilire la distanza tra i geni, è chiamata mappatura intergenica e può essere utilizzata per costruire mappe cromosomiche di organismi procarioti ed eucarioti. Storicamente, la prima interpretazione della natura di un gene lo descriveva come unità di mutazione e di ricombinazione. Attualmente sappiamo che il gene è suddivisibile per mutazione e ricombinazione e che alcuni principi generali della mappatura per ricombinazione possono essere applicati per mappare distanze tra i siti mutati all’interno dello stesso gene, un processo chiamato mappatura intragenica. La prima evidenza che il gene fosse suddivisibile per mutazione e ricombinazione venne dal lavoro di C.P. Oliver nel 1940. Oliver studiava due mutazioni che erano considerate alleli del gene lozenge (lz), legato al cromosoma X in Drosophila; infatti le femmine eterozigoti per le due mutazioni avevano un fenotipo mutante con occhio a losanga. Quando femmine eterozigoti per questi due alleli venivano incrociate con maschi emizigoti per l’uno o per l’altro allele, nella progenie si trovavano moscerini selvatici con una frequenza di circa 0,2%. Oliver dimostrò che questa progenie selvatica aveva avuto origine per

395

ricombinazione tra gli alleli. In altre parole, dimostrò che il gene era suddivisibile per ricombinazione e non era un’unità indivisibile. Usando simboli genetici, l’incrocio può essere descritto come lzA + lzA + × ——– G + lzB dove lzA e lzB sono i due alleli lozenge. Nella femmina, la ricombinazione tra i due alleli può generare un gamete + + e quindi una progenie selvatica. La scoperta di Oliver stimolò ulteriori esperimenti per capire l’organizzazione dettagliata degli alleli all’interno di un gene. Come sappiamo oggi, la ricombinazione intragenica è possibile perché ciascun gene consiste in molte coppie di nucleotidi disposti in modo lineare nel cromosoma. L’impulso ad analizzare la struttura fine del gene venne dall’elegante e dettagliato lavoro con il fago T4 condotto da Seymour Benzer negli anni cinquanta e sessanta del secolo scorso. I suoi esperimenti rivelarono molto sulla relazione esistente tra mappatura e struttura del gene. I primi esperimenti di Benzer definirono la mappatura della struttura fine del gene, cioè la mappa genetica dettagliata di siti all’interno di un gene. Benzer utilizzò ceppi di fago T4 che portavano mutazioni nella regione rII. I mutanti rII si distinguono dal selvatico sia per la morfologia di placca sia per lo spettro d’ospite. In particolare, quando cellule di E. coli che crescono su un terreno solido vengono infettate con T4 selvatico (r+), vengono prodotte placche piccole con margini indistinti, mentre le placche prodotte da un mutante rII sono grandi e chiare (Figura 15.17). Per quanto riguarda lo spettro d’ospite, il fago T4 selvatico è capace di crescere e di lisare sia il ceppo B sia il ceppo K12(λ) di E. coli, mentre i mutanti rII possono crescere in cellule B, ma sono incapaci di crescere su K12(λ). Il ceppo B viene definito un ospite permissivo per i mutanti rII, mentre il ceppo K12(λ) è un ospite non permissivo.

Figura 15.17 Placche prodotte in uno strato di E. coli B da fagi r+ e mutanti rII. Le placche r+ sono torbide, con margini sfumati; la placca rII è più grande e ha margini netti.

396

Capitolo 15

Analisi per ricombinazione dei mutanti rII

mente associati. La frequenza di ricombinazione dei due alleli viene calcolata secondo la formula:

Benzer capì che il difetto di crescita dei mutanti rII su E. coli K12(λ) poteva essere utilizzato come metodo selettivo molto potente per scoprire la presenza di una piccola frazione di fagi r+ in una grande quantità di mutanti rII. Inizialmente egli costruì una mappa genetica della struttura fine della regione rII. Utilizzando E. coli B come ospite permissivo, egli incrociò 60 mutanti di T4 rII isolati indipendentemente in tutte le possibili combinazioni e, alla lisi delle cellule, raccolse la progenie fagica. Per ciascun incrocio, rIIx × rIIy, dove x e y sono mutazioni differenti, possono esistere quattro tipi di progenie: due classi parentali – rIIx e rIIy – e due classi ricombinanti – il doppio mutante rIIx, y e il selvatico r+. Le due classi parentali sono prodotte in circa ugual numero, come pure le due classi ricombinanti. Le frequenze relative di parentali e ricombinanti dipendono da quanto sono lontani i due alleli. Per la sua analisi, Benzer piastrò un campione della progenie fagica su E. coli B, l’ospite permissivo. Quindi, in base al numero delle placche ottenute, calcolò il numero di particelle fagiche per millilitro. Piastrando un altro campione della progenie su E. coli K12(λ), l’ospite non permissivo, egli determinò la frequenza dei rari ricombinanti r+. In questo modo, Benzer calcolò la percentuale dei rari ricombinanti r+ prodotti dalla ricombinazione tra alleli stretta-

2 × numero di ricombinanti r+ –––––––––––––––––––––––––– × 100% numero totale della progenie Il numero dei ricombinanti r+ viene moltiplicato per 2 per tener conto dell’altra classe di ricombinanti che non sono distinguibili fenotipicamente, cioè i doppi mutanti. Per ciascun incrocio fu fatto un importante controllo. Ogni parentale rII fu usato da solo per infettare l’ospite permissivo E. coli B, e la progenie prodotta fu analizzata su E. coli B e K12(λ). Come da un selvatico r+ può avere origine per mutazione un mutante rII, così una mutazione in un mutante rII può farlo revertire a r+. Quindi, è estremamente importante calcolare la frequenza di reversione delle mutazioni rII utilizzate in un incrocio e sottrarre questo valore dalla frequenza di ricombinazione calcolata. Fortunatamente, nel caso dei mutanti rII la frequenza di reversione era più bassa della frequenza minima di ricombinazione di almeno un ordine di grandezza. Dai risultati di ricombinazione ottenuti da tutti i possibili incroci a 2 a 2 in tutti i modi possibili dei 60 mutanti rII, Benzer costruì una mappa genetica lineare (Figura 15.18). Alcune delle coppie di mutanti incrociate non produssero ricombinanti r+, suggerendo che la mutazione interessasse esattamente la stessa coppia di basi nel

h42 r47 r51

c

10 unità di mappa

Regione rII Mutanti rII: Sottoregione della regione rII

Mutanti rII:

47 312 295 168 145 282

0,10 0,10 0,08 0,16

Frequenze di ricombinanti r+ ottenuti da incroci di due mutanti rII

r

r

r

r

r

104 101 103 105 106

a

r

r

51

102

b

164

c

d

196

1 unità di mappa 187 102

228

201

155 274

271 279

0,0000 0,013 0,017

0,0000 0,013 0,037

240

114

0,055 0,12 0,15 0,12 0,10 0,12 0,12 0,10 0,15 0,18 0,15 0,17

0,14 0,29

0,0000 0,0000 0,0000 0,0000

r 47

0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Figura 15.18 Forma preliminare della mappa dettagliata della regione rII del fago T4 ottenuta da Benzer incrociando un gruppo iniziale di 60 mutanti rII. I livelli inferiori di questa figura corrispondono a una rappresentazione via via più dettagliata della mappa. Nel livello più basso, le linee verticali numerate

0,10 0,10 0,12 0,15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

237 292

151 280 217 150

287 332

0,12 0,11

0,0000 0,0000 0,0000

0,0000 0,23 0,23 0,26 0,23

0,0000 0,0000 0,0000 0,0000 0,0000

rappresentano mutanti puntiformi rII individuali; i rettangoli blu indicano le singole delezioni dei mutanti 47, 312, 295, 164, 196, 187 e 102; i numeri decimali indicano la percentuale di ricombinanti r+ ottenuti incrociando i due mutanti rII uniti dalla freccia.

La genetica dei batteri e dei batteriofagi

DNA. Mutazioni che cambiano la stessa coppia di nucleotidi all’interno di un gene vengono chiamate omoalleliche. Tuttavia la maggior parte dei mutanti rII produceva ricombinanti r+ quando incrociata, indicando che le mutazioni alteravano coppie di nucleotidi diverse nel DNA. Mutazioni che cambiano coppie di nucleotidi differenti vengono chiamate eteroalleliche. La mappa mostrò che la frequenza minima di ricombinanti r+ ottenuta in incroci tra mutanti rII che portavano mutazioni eteroalleliche era uguale a 0,01%. Il valore minimo di distanza di mappa di 0,01% può essere utilizzato per calcolare in modo approssimativo la distanza molecolare – distanza in coppie di basi – tra due marcatori. La mappa genetica circolare del fago T4 è lunga circa 1500 unità di mappa. Se due mutanti rII producono ricombinanti r+ con una frequenza dello 0,01%, le mutazioni saranno separate da 0,02 unità di mappa o da circa 0,02/1500 = 1,3 × 10–5 del genoma totale di T4. Dato che il genoma totale di T4 contiene circa 2 × 105 bp, la distanza minima di ricombinazione è (1,3 × 10–5) × (2 × 105), pari a circa 3 bp. Questo significa che i risultati di Benzer hanno mostrato che la ricombinazione genetica può avvenire all’interno di una distanza di 3 bp. Esperimenti successivi, condotti da altri, hanno dimostrato che la ricombinazione può avvenire tra mutazioni che alterano coppie di basi adiacenti nel DNA. Quindi, gli esperimenti genetici hanno dimostrato che la singola coppia di nucleotidi è l’unità di mutazione e anche l’unità di ricombinazione. Queste definizioni rimpiazzano quelle classiche che descrivevano il gene come l’unità di mutazione e di ricombinazione, cioè consideravano il gene come indivisibile per mutazione e per ricombinazione.

Nota chiave Gli stessi principi generali utilizzati per la mappatura ricombinazionale possono essere utilizzati per mappare la distanza tra siti mutazionali in geni differenti (mappatura intergenica) e per mappare siti mutazionali all’interno dello stesso gene (mappatura intragenica). Attraverso l’analisi della struttura fine della regione rII del batteriofago T4, e con altri esperimenti, è stato dimostrato che una coppia di basi del DNA è l’unità di mutazione e di ricombinazione.

Mappatura per delezione Dopo la serie iniziale di esperimenti di incrocio, Benzer continuò a mappare oltre 3000 mutanti rII in modo da poter completare la sua mappa della struttura fine del gene. Per mappare questo alto numero di mutanti sarebbero stati necessari circa 5 milioni di incroci, un’impresa impos-

397

sibile anche con i fagi, con i quali si possono allestire fino a 50 incroci ogni giorno. Quindi Benzer sviluppò alcuni eleganti sistemi per semplificare i suoi studi di mappatura. Queste procedure prevedevano l’uso della mappatura per delezione per localizzare mutazioni ignote. La maggior parte dei mutanti rII isolati da Benzer era costituita da mutanti puntiformi; il loro fenotipo risultava dall’alterazione di una singola coppia di nucleotidi. Una mutazione puntiforme può revertire allo stato selvatico spontaneamente o in seguito a trattamento con un mutageno appropriato. Tuttavia, alcuni dei mutanti rII di Benzer non revertivano, né producevano ricombinanti r+ in incroci con un certo numero di mutanti puntiformi rII che erano stati localizzati in punti diversi della mappa. Questi mutanti erano mutanti per delezione, cioè mutanti nei quali è stato perduto un pezzo di DNA. Benzer trovò una grande varietà nell’estensione e nella localizzazione del materiale genetico deleto nei suoi mutanti per delezione rII. Alcuni mutanti per delezione sono mostrati nella Figura 15.19. In pratica, un mutante rII puntiforme ignoto veniva incrociato dapprima con ognuno dei sette mutanti per delezione di riferimento, che definivano sette segmenti principali della regione rII (segmenti A1-A6 e B nella Figura 15.19). Per esempio, se un mutante puntiforme rII dava ricombinanti r+ quando veniva incrociato con i mutanti per delezione rA105 (difettivo in A6 e B) e r638 (difettivo in B), ma non produceva ricombinanti r+ se incrociato con i mutanti per delezione r1272 (difettivo in tutti i segmenti), r1241 (difettivo in A2-A6 e B), rJ3 (difettivo in A3-A6 e B), rPT1 (difettivo in A4-A6 e B) e rPB242 (difettivo in A5-A6 e B), la mutazione doveva trovarsi nel segmento di DNA mancante nei cinque mutanti per delezione che non davano ricombinanti. I ricombinanti r+ non possono essere prodotti in incroci con mutanti per delezione nei quali il segmento deleto contenga la regione del DNA con la mutazione puntiforme. Nell’esperimento di Benzer, tutti i cinque mutanti per delezione che non davano ricombinanti mancavano del frammento A5, mentre entrambi i mutanti che davano ricombinanti contenevano questo segmento; quindi la mutazione puntiforme doveva trovarsi all’interno della regione A5. Una volta identificato il segmento principale nel quale era localizzata la mutazione, il mutante puntiforme veniva incrociato con un secondo gruppo di mutanti con rilevanti delezioni di riferimento: r1605, r1589 e rPB230 (Figura 15.19). Per esempio, tre delezioni dividono il segmento A5 nei quattro sottosegmenti da A5a ad A5d. La presenza o l’assenza di ricombinanti r+ nella progenie degli incroci del mutante A5rII con la seconda serie di delezioni permise a Benzer di localizzare la mutazione più precisamente all’interno di una regione più piccola del DNA. Per esempio, se la mutazione fosse nel segmento A5c, sarebbero stati prodotti ricombinanti r+ con la delezione rPB230, ma non con le altre due delezioni.

h m ht ht tu tu ht

rl

tu

rII

h r m

Capitolo 15 ht c ht

398 Livello I

Tipi di fago Selvatico (r+) r1272 r1241 Ceppi di rJ3 riferimento con rPT1 rPB242 delezioni in rII rA105

Livello II

A1 Segmento

A2

A3

A4

A5

A6

B

Livello III

r638 Estensione delle delezioni in ciascun ceppo di riferimento r1605 r1589 rPB230

A5a Segmento

A5b

A5c

A5d

Livello IV

r1993 r1695 r1168 A5c1 Segmento

A5c2a1

A5c2a2

A5c2b

rF27

rI1235

r795

r960

rEM50

r548

Livello V rJ148

Delezioni rII

di 3000 mutanti rII per dimostrare che la regione rII è suddivisibile in più di 300 siti mutabili che possono essere separati per ricombinazione (Figura 15.20). La distribuzione dei mutanti non è casuale: alcuni siti, chiamati punti caldi, sono rappresentati da un gran numero di mutanti puntiformi isolati indipendentemente. La mappatura per delezione rappresenta un esempio di mappatura fisica (vedi Capitoli 8 e 16), in quanto permette di attribuire a una particolare sequenza del DNA una localizzazione fisica nel genoma.

Siti delle mutazioni rII puntiformi

Nota chiave Delezioni rII

Usando delezioni con terminazioni note, Benzer sviluppò uno schema di analisi genetica che gli permise di localizzare ciascuna delle mutazioni puntiformi della regione rII. Benzer sviluppò una mappa dettagliata della regione rII del batteriofago T4 utilizzando più di 3000 mutanti.

Livello VI

Definizione dei geni mediante test di complementazione (cis-trans) Figura 15.19 Suddivisione in segmenti della regione rII del fago T4 per mezzo di delezioni. Il I livello mostra l’intera mappa di T4. Nel II livello sette delezioni definiscono altrettanti segmenti della regione rII. Nel III livello tre delezioni definiscono quattro porzioni del segmento A5. Nel IV livello tre delezioni dividono in quattro parti il sottosegmento A5c. Il V livello mostra l’ordine e la distanza tra i siti delle mutazioni rII nel sottosegmento A5c2a2, determinato incrociando coppie di sette mutanti puntiformi. Il VI livello rappresenta un modello della doppia elica di DNA, con un’indicazione approssimativa della scala della mappa del V livello.

Altri mutanti per delezione definivano regioni più piccole di ciascuno dei quattro sottosegmenti da A5a fino ad A5d; per esempio, A5c era diviso in A5c1, A5c2a1, A5c2a2 e A5c2b dalle delezioni r1993, r1695 e r1168. Complessivamente, le delezioni dividevano la regione rII in 47 segmenti. Qualunque mutazione puntiforme rII può essere localizzata in uno di questi segmenti con una serie di tre incroci con mutanti per delezione. Quindi, tutte le mutazioni puntiformi che cadono all’interno di una certa regione possono essere incrociate in tutti i modi possibili tra di loro per costruire una mappa genetica dettagliata. In questo modo Benzer utilizzò più

Dal punto di vista classico, il gene è un’unità di funzione, cioè ogni gene specifica una funzione. Benzer ideò degli esperimenti genetici per determinare se questa visione classica fosse vera per la regione rII. Per scoprire se due diversi mutanti rII appartenenimazione vano allo stesso gene (unità di funzione), Benzer adattò il Definizione test cis-trans o test di comdei geni meplementazione sviluppato da diante test Edward Lewis per studiare la di complemennatura dell’unità funzionale tazione del gene in Drosophila. Il test di complementazione è stato presentato nel Capitolo 13. Per capire meglio quanto segue, sarà utile sapere che i test di complementazione indicarono che la regione rII consiste in realtà di due geni (unità di funzione), rIIA e rIIB (cioè le regioni A e B nelle Figure 15.19 e 15.20). Una mutazione in qualsiasi punto di uno dei due geni produrrà la morfologia di placca e lo spettro d’ospite tipico di rII. In altre parole, i geni rIIA e rIIB specificano ciascuno per un prodotto differente necessario per la crescita in E. coli K12(λ). Il test di complementazione viene usato per stabilire quante unità di funzione (geni) vengono definite da un

MyLab

La genetica dei batteri e dei batteriofagi Gene A

Gene B

B10 B9b

B9a

B8

Punto caldo Punto caldo

A6d

B1

B2

399

B4

B3

B7

B5 B6

A6c A6b

A6a2

A6a1

A5d

A5c2

A5c1

A5b A5a A4g A4f

A2h3

A3a–d

A3e A3f A3g A3h A3i A4a

A4b A4c

A4d

A4e

A2h2 A2h1

A2g

A2f

A2e

A2c

A2d

A2a

A1b2

A1b1

A1a

A2b

Figura 15.20 Mappa della struttura fine della regione rII basata sugli esperimenti di Benzer. Il numero di mutazioni isolate indipendentemente che mappano in un dato sito è indicato dal numero di quadratini. I punti caldi sono indicati da un gran numero di quadratini.

certo numero di mutazioni che manifestano lo stesso fenotipo mutato. Nel lavoro di Benzer con i mutanti rII, il ceppo non permissivo K12(λ) fu infettato con una coppia di mutanti rII per vedere se i due mutanti, ciascuno dei quali singolarmente era incapace di crescere su K12(λ), fossero capaci di collaborare per produrre una progenie fagica. Se i fagi producono progenie, si dice che le due mutazioni si complementano, intendendo che le due mutazioni devono essere in geni diversi (unità di funzione) che codificano diversi prodotti funzionali. I due prodotti lavorano insieme all’interno della cellula per dare progenie. Se non viene prodotta progenie fagica, i mutanti non sono complementari, indicando che le mutazioni sono nella stessa unità funzionale. In questo caso, entrambi i mutanti producono lo stesso prodotto difettivo, il ciclo vitale del fago non può procedere e non si forma progenie fagica. (Si noti che la ricombinazione genetica non è necessaria perché avvenga complementazione; nel caso avvenga ricombinazione intragenica, qualche placca potrebbe comparire sulla piastra, ma se avviene complementazione tutti i batteri in piastra saranno lisati.) Queste due situazioni sono illustrate nella Figura 15.21. Nel primo caso il batterio è infettato con due fagi, uno che porta una mutazione nel gene rIIA e l’altro con una mutazione nel gene rIIB (Figura 15.21a). Il mutante rIIA sintetizza un prodotto A non funzionale e un prodotto B funzionale, mentre il mutante rIIB sintetizza un prodotto A funzionale e un prodotto B non funzionale. In questo caso avviene complementazione perché il mutan-

te rIIA fornisce un prodotto B funzionale e il mutante rIIB fornisce un prodotto A funzionale, cosicché la propagazione fagica può avvenire in E. coli K12(λ). Nel secondo caso, il batterio è infettato con due fagi che portano ciascuno una differente mutazione nello stesso gene rIIA (vedi Figura 15.21b). In questo caso la complementazione non avviene perché entrambi i fagi producono un prodotto B funzionale, ma mancano della funzione A. Di conseguenza, la riproduzione fagica in E. coli K12(λ) non può avvenire. Sulla base dei risultati di questi test di complementazione, Benzer trovò che i mutanti rII ricadono all’interno di due unità di funzione, rIIA e rIIB (chiamate anche gruppi di complementazione, che in questo caso corrispondono esattamente ai geni), cioè tutti i mutanti rIIA complementano tutti i mutanti rIIB. I mutanti rIIA, invece, non complementano altri mutanti rIIA e i mutanti rIIB non complementano altri mutanti rIIB. La linea di divisione tra le unità di funzione rIIA e rIIB è indicata nella mappa fine riportata nella Figura 15.20. I mutanti puntiformi e i mutanti per delezione nella regione rII obbediscono alle stesse regole nel test di complementazione. Le sole eccezioni sono delezioni che si estendono parzialmente sia nell’unità funzionale A sia nella B. Questi mutanti per delezione non complementano né con i mutanti A né con i B. Negli esempi di test di complementazione riportati nella Figura 15.21, ciascuno dei due fagi che coinfetta l’ospite non permissivo E. coli K12(λ) porta una mutazione rII che è in effetti una configurazione di mutazio-

400

Capitolo 15

a) Complementazione: le due mutazioni si trovano in geni differenti Fago con mutazione in rIIA

Prodotto B funzionale

Fago con mutazione in rIIB

E. coli K12(λ)

rIIA Prodotto A difettivo (non funzionale)

rIIA

b) Assenza di complementazione: le due mutazioni si trovano nello stesso gene Fago con mutazione in rIIA

rIIA

rIIB rIIB

Prodotto B difettivo (non funzionale)

Prodotto A difettivo (non funzionale)

Prodotto A funzionale

Prodotto B funzionale

Produzione di progenie fagica (lisi dell’ospite)

Fago con mutazione in rIIA

E. coli K12(λ)

rIIA

rIIB rIIB

Prodotto A difettivo (non funzionale) Prodotto B funzionale

Assenza di produzione di progenie fagica (nessuna lisi dell’ospite)

Assenza di placche su E. coli B

Formazione di placche su E. coli B

Figura 15.21 Test di complementazione per determinare le unità di funzione nella regione rII del fago T4; l’ospite non permissivo E. coli K12(l) viene infettato con due diversi mutanti rII.

ni chiamata trans. In questa configurazione le due mutazioni sono portate da due fagi differenti. Come controllo, di norma, si coinfetta E. coli K12(λ) con un fago r+ (selvatico) e un fago mutante rII che porta entrambe le mutazioni, per vedere se ne risulta la funzione selvatica attesa. Quando le due mutazioni in esame sono portate dallo stesso cromosoma, la configurazione viene chiamata cis. (Il test di complementazione viene anche chiamato test cis-trans proprio per via dell’uso delle mutazioni in configurazione cis e trans.) Nel test cis, ci si attende che r+ sia dominante sulle due mutazioni portate dal fago rII, quindi verrà prodotta una progenie fagica. Comunque, se la progenie non viene prodotta, questo non prova che le mutazioni si trovino in geni funzionalmente differenti. Benzer chiamò cistrone l’unità di funzione identificata con il test cis-trans. Il cistrone può essere considerato il più piccolo segmento di DNA che codifica per un RNA. Attualmente, il termine gene ha sostituito il termine cistrone. Geneticamente, il cistrone rIIA è costituito da circa 6 unità di mappa e 800 bp, e il cistrone rIIB da circa 4 unità di mappa e 500 bp. Presumibilmente, vi sono due prodotti genici necessari nel processo di propagazione di T4 nel ceppo E. coli K12(λ). I principi per allestire un test di complementazione sono sempre gli stessi da un organismo all’altro; solo i dettagli pratici relativamente al modo di effettuare il test sono specifici per ciascun organismo. Per esempio,

nel lievito si possono selezionare due cellule aploidi che differiscono per il tipo sessuale (MATa e MATα) e che portano mutazioni diverse che conferiscono lo stesso fenotipo mutante. Dall’incrocio di questi due ceppi viene prodotto un diploide che può quindi essere analizzato per la complementazione delle due mutazioni. Nelle cellule animali, due cellule che hanno lo stesso fenotipo mutante possono essere fuse e analizzate; un fenotipo selvatico indicherà la presenza di complementazione. Di nuovo, in nessuno di questi casi è necessario che avvenga ricombinazione perché possa avvenire complementazione.

Nota chiave Il test di complementazione, o test cis-trans, è utilizzato per determinare quante unità funzionali (geni) vengono definite da una data serie di mutazioni che esprimono lo stesso fenotipo mutante. Se due mutanti, ciascuno con una mutazione in un gene diverso, vengono messi insieme, le mutazioni complementeranno e ne risulterà la funzione selvatica. Se i due mutanti, ciascuno dei quali porta una mutazione nello stesso gene, vengono messi insieme, le mutazioni non complementeranno e il fenotipo rimarrà mutante.

La genetica dei batteri e dei batteriofagi

401

Sommario l La stessa strategia sperimentale viene seguita per tutti i tipi di mappatura genica: il materiale genetico viene scambiato fra ceppi che differiscono per marcatori genetici e i ricombinanti vengono identificati e contati. Nei batteri, il meccanismo del trasferimento genico può essere la trasformazione, la coniugazione o la trasduzione. In ciascuno di questi processi vi è un ceppo donatore e uno ricevente. l La coniugazione è un processo nel quale avviene un trasferimento unidirezionale dell’informazione genetica, attraverso il diretto contatto tra una cellula batterica donatrice e una ricevente. La condizione di donatrice dipende dalla presenza nella cellula di un plasmide chiamato fattore F. La coniugazione determina il passaggio unidirezionale di una copia del fattore F dal donatore al ricevente. l Il fattore F può integrarsi nel cromosoma batterico. I ceppi nei quali ciò avviene – gli Hfr – possono coniugare con ceppi riceventi e trasferire parte del cromosoma batterico. La sequenza e la distanza tra geni può essere determinata attraverso l’ordine e il tempo di trasferimento dei geni dal donatore al ricevente durante la coniugazione. l La trasformazione è il processo di trasferimento di frammenti di DNA extracellulare tra organismi. Attraverso la ricombinazione genetica, parti del DNA trasformante possono ricombinare con una porzione del cromosoma del ricevente. La trasformazione può essere usata sperimentalmente per determinare l’ordine e le distanze di mappa tra geni.

l La trasduzione è un processo nel quale i batteriofagi (fagi) mediano il trasferimento di DNA batterico da un batterio donatore a uno ricevente. La trasduzione può essere usata sperimentalmente per mappare geni batterici. l Gli stessi principi usati per mappare i geni eucarioti sono usati per mappare i geni dei fagi. Si può infettare un batterio ospite simultaneamente con due ceppi di fagi che differiscono per uno o più loci genici. Le percentuali di ricombinanti vengono calcolate e si deducono la sequenza e le distanze di mappa tra i geni. l Gli stessi principi della mappatura per ricombinazione negli eucarioti possono essere usati per mappare la distanza tra siti mutazionali in geni differenti (mappatura intergenica) e all’interno dello stesso gene (mappatura intragenica). l Dall’analisi della struttura dettagliata della regione rII del batteriofago T4 è stato dedotto che l’unità di mutazione e di ricombinazione è la coppia di basi del DNA. l Il numero di geni che causa un particolare fenotipo mutante è determinato attraverso il test di complementazione, o test cis-trans. Se due mutanti virali, ciascuno con una mutazione in un gene diverso, vengono combinati in una cellula ospite, le mutazioni complementano i loro difetti dando origine a un fenotipo selvatico. Se due mutanti, ciascuno con una mutazione nello stesso gene, vengono combinati, le mutazioni non complementano e il fenotipo mutante continua a essere espresso.

Approccio analitico alla soluzione di problemi di genetica D15.1 In E. coli i seguenti ceppi Hfr donano i geni indicati nell’ordine dato: Ceppo Hfr 1 2 3 4

E Y T E

B L J G

D G F L

N E P Y

A B Y P

Tutti i ceppi Hfr sono derivati dallo stesso ceppo F+. Qual è l’ordine dei geni nel cromosoma del ceppo F+ originario? R15.1 Questo problema è un esercizio per mettere insieme i diversi segmenti di una circonferenza. Il migliore approccio è disegnare un cerchio, indicare i geni trasferiti da un ceppo Hfr e poi vedere quali altri ceppi Hfr trasferiscono un corredo sovrapponibile. Per esempio, Hfr 1 trasferisce E, poi B, poi D, e così via; e Hfr 4 trasferisce B, poi E, e così via. Ora è possibile giustapporre le due serie di geni trasferiti dai due ceppi Hfr e dedurre che le loro polarità di trasferimento sono opposte: Hfr 1 Hfr 4

B

Ordine di trasferimento dei geni G P X B

G P

E Y

B L

D G

N E

A B

Estendendo questo ragionamento agli altri ceppi Hfr, è possibile disegnare una mappa non ambigua (vedi figura di seguito), dove le frecce indicano l’ordine di trasferimento.

N

D

A 3

4

X

E

G

T J

1 2

L Y

F

P

La stessa logica potrebbe essere utilizzata se nel problema fossero date le unità di tempo relative di entrata per ciascun gene. In questo caso ci si aspetta che la distanza temporale tra due geni qualsiasi sia approssimativamente la stessa, quale che sia l’ordine di trasferimento e qualunque distanza abbiano i geni dall’origine. D15.2 In un esperimento di trasformazione, il DNA donatore di un ceppo a+ b+ è stato utilizzato per trasformare un ceppo ricevente di genotipo a b. Sono state isolate le classi trasformanti ed è stata determinata la loro frequenza: a+ b+ a+ b a b+

307 215 278

402

Capitolo 15

Il numero totale di trasformanti era 800. Qual è la frequenza con cui il locus b è cotrasformato con il locus a? R15.2 La frequenza con la quale b+ è cotrasformato con il gene a+ viene calcolata sulla base del numero totale dei trasformanti a+ e dei trasformanti a+ e b+. La formula è: numero di cotrasformanti a+ b+ ––––––––––––––––––––––––––––– × 100% numero totale di trasformanti a+ Il numero di cotrasformanti a+ b+ è 307. I trasformanti a+ sono rappresentati da due classi: a+ b+ (307) e a+ b (215), per un totale di 522. La classe a b+ è irrilevante in questo caso, dato che non si tratta di trasformanti per a+. Quindi la frequenza di cotrasformazione per a+ e b+ è 307/522 × 100 = 58,8%. D15.3 In un esperimento di trasduzione, il donatore era c+ d+ e+ e il ricevente era c d e. La selezione è stata fatta per c+. Le quattro classi di trasduttanti ottenute in questo esperimento sono indicate nella tabella che segue: Classe

Composizione genetica

1 2 3 4

c+ d+ e+ c+ d+ e c+ d e c+ d e+

Numero di individui 57 76 365 2 Totale 500

a. Determinate la frequenza di cotrasduzione per c+ e d+. b. Determinate la frequenza di cotrasduzione per c+ ed e+. c. Quale delle frequenze di cotrasduzione calcolate in a e b rappresenta la distanza maggiore tra i geni e perché? R15.3 a. L’analisi è simile all’analisi della frequenza di cotrasformazione descritta in D15.2. La formula per la frequenza di cotrasduzione per c+ e d+ è: numero di cotrasduttanti c+ d+ ––––––––––––––––––––––––––––– × 100% numero totale di trasduttanti c+ Nei dati presentati, i cotrasduttanti c+ d+ sono presenti nelle classi 1 e 2, e il numero totale di trasduttanti c+ è dato dalla somma di tutte le classi da 1 fino a 4. Quindi il numero di trasduttanti c+ e d+ è dato da 57 + 76 = 133, e la frequenza dei cotrasduttanti è 133/500 × 100 = 26,6%. b. L’analisi è identica a quella usata in a. La formula per la frequenza di cotrasduzione per c+ ed e+ è: numero di cotrasduttanti c+ e+ ––––––––––––––––––––––––––––– × 100% numero totale di trasduttanti c+ Dai dati presentati, i cotrasduttanti c+ e+ sono le classi 1 e 4, e il numero totale di trasduttanti c+ è la somma delle classi da 1 a 4. Quindi il numero dei trasduttanti c+ ed e+ è 57 + 2 = 59, e la frequenza dei cotrasduttanti è 59/500 × 100 = 11,8%. c. La distanza maggiore è quella tra i geni c+ ed e+. Il principio è il seguente: quanto più vicini sono due geni sul cromosoma, tanto maggiore sarà la probabilità che siano co-

trasdotti. Quindi, quando la distanza tra due geni aumenta, contemporaneamente diminuisce la frequenza di cotrasduzione. Dato che la frequenza di cotrasduzione di c+ ed e+ è 11,8% e la frequenza di cotrasduzione c+ e d+ è 26,6%, i geni c+ ed e+ sono più lontani di quanto lo siano i geni c+ e d+. D15.4 Cinque diversi ceppi del fago T4 con delezioni in rII sono stati analizzati per ricombinazione incrociandoli a coppie in E. coli B. Sono stati ottenuti i seguenti risultati, dove: + = produzione di ricombinanti r+; 0 = assenza di ricombinanti r+. E D C B A

A 0 0 0 + 0

B + 0 0 0

C 0 0 0

D 0 0

E 0

Disegnate una mappa per delezione compatibile con questi risultati. R15.4 La logica è che, se due mutazioni per delezione si sovrappongono, non potranno essere prodotti ricombinanti r+. Al contrario, se due mutazioni per delezione non si sovrappongono, allora possono essere prodotti ricombinanti r+. Per risolvere questo problema si devono disegnare delle linee che si sovrappongono, o non si sovrappongono, sulla base dei risultati ottenuti. Partendo con A e B, queste delezioni non si sovrappongono, dato che vengono prodotti ricombinanti r+. Quindi queste due mutazioni possono essere rappresentate nel modo seguente: A ———————

B ———————

La delezione seguente, C, non dà ricombinanti r+ con nessuna delle quattro delezioni. Si deve concludere quindi che C è una delezione estesa che va a sovrapporsi a tutte le altre quattro, con gli estremi che non possono essere determinati in base a questi dati. Una possibilità è la seguente: C ——————————————— A B ——————— ——————— La delezione D non produce ricombinanti r+ con A, B e C, ma li dà con E. A sua volta, E dà ricombinanti r+ con B e D, ma non con A e C. Quindi D deve sovrapporsi sia ad A sia a B ma non ad E, ed E deve sovrapporsi ad A e a C ma non a B. Una mappa compatibile con questa situazione è la seguente: C ——————————————— A B ——————— ——————— E D —————— —————— Altre mappe possono essere disegnate con estremità delle delezioni diverse. D15.5 Sette diversi mutanti puntiformi rII (da 1 a 7) del fago T4 sono stati analizzati in incroci di ricombinazione in E. coli B con i cinque ceppi mutanti per delezione descritti in D15.4. Sono stati ottenuti i seguenti risultati, dove: + = produzione di ricombinanti r+; 0 = assenza di produzione di ricombinanti r+:

La genetica dei batteri e dei batteriofagi

1 2 3 4 5 6 7

A 0 + 0 + + 0 +

B + 0 + + 0 + +

C 0 0 0 0 0 0 0

D + + + + 0 0 0

E + + 0 0 + + +

In quale regione della mappa possono essere localizzate le sette mutazioni puntiformi? R15.5 Se vengono prodotti ricombinanti r+, la mutazione puntiforme rII non può sovrapporsi alla regione che manca nel mutante per delezione con il quale viene incrociata. Quindi i risultati riportati nella matrice localizzano le mutazioni puntiformi nelle regioni definite dalle delezioni. Potenzialmente i risultati definiscono l’estensione delle sovrapposizioni delle delezioni. Per esempio, la mutazione puntiforme 7 dà ricombinanti r+ con A, B ed E, ma non con

403

D. Quindi 7 è localizzata nella regione definita dalla parte della delezione D che non è sovrapposta ad A e B. Similmente, la mutazione puntiforme 4 forma ricombinanti r+ con A, B e D, ma non con E. Quindi 4 deve essere localizzata nella regione definita dal segmento di delezione E che non si sovrappone alla delezione A. Inoltre, dato che 4 non dà ricombinanti r+ con C, la delezione C deve sovrapporsi al sito definito dalla mutazione puntiforme 4. Questo risultato, quindi, rende più precisa la mappatura per delezione riguardo alle estremità di E, C e A. È possibile disegnare la seguente mappa sulla base dei risultati ottenuti: C A

B

E 4

D 3

1

6

7

5

2

16

Variazioni della struttura e del numero dei cromosomi

Quali cambiamenti avvengono nella struttura dei cromosomi negli eucarioti?

Quali sono le conseguenze dei cambiamenti nella struttura e nel numero dei cromosomi sul fenotipo?

Quali cambiamenti avvengono nel numero dei cromosomi negli eucarioti?

Attività La maggior parte delle analisi prenatali a scopo diagnostico sono basate sulla ricerca di anomalie cromosomiche, mediante analisi del cariotipo. Un esempio di alterazione del normale assetto cromosomico nell’uomo è la trisomia 21, responsabile della sindrome di Down. In questo capitolo saranno discusse le cause e gli effetti di diverse mutazioni cromosomiche. Dopo aver letto e studiato il capitolo, sarete in grado di esercitarvi nella iAttività, nella quale potrete utilizzare le vostre conoscenze sulle mutazioni cromosomiche per aiutare una coppia che vuole concepire un figlio.

Nei capitoli precedenti sono stati enunciati molti dei principi fondamentali della trasmissione dei caratteri negli eucarioti e nei batteri. Avendo compreso la relazione tra geni e cromosomi, consideriamo ora le mutazioni cromosomiche – cambiamenti rispetto alla normale struttura o al numero dei cromosomi. Questi cambiamenti coinvolgono perdita, aggiunta, riarrangiamenti di geni nel genoma. Le mutazioni cromosomiche interessano procarioti, eucarioti e virus. L’associazione di difetti genetici con variazioni nella struttura o nel numero dei cromosomi dimostra che non tutti i difetti genetici derivano da mutazioni di singoli geni. Lo studio dei cromosomi normali e mutati e del loro comportamento è definito citogenetica. Lo scopo di questo capitolo è illustrare i vari tipi di mutazioni cromosomiche negli eucarioti e alcune delle sindromi causate da mutazioni cromosomiche dell’uomo.

Tipi di mutazioni cromosomiche Le mutazioni cromosomiche (o aberrazioni cromosomiche) sono variazioni rispetto alla situazione normale (wild-type) della struttura o del numero dei cromosomi.

Nei batteri, negli Archaea e negli eucarioti le mutazioni cromosomiche possono verificarsi spontaneamente o essere indotte sperimentalmente da alcuni agenti mutageni chimici o da radiazioni. In molti eucarioti le mutazioni cromosomiche possono essere visualizzate al microscopio durante la mitosi e la meiosi, anche mediante analisi del cariotipo. Dove non siano visibili macroscopicamente, possono essere rilevate mediante l’analisi genetica – vale a dire mediante rilevazione di cambiamenti nella associazione dei geni sui cromosomi. Attualmente è possibile una descrizione più precisa delle mutazioni cromosomiche nei casi in cui le sequenze genomiche possano essere confrontate. Abbiamo spesso l’impressione che la riproduzione nell’uomo avvenga senza problemi rilevanti a carico della struttura o del numero dei cromosomi. Del resto, la grande maggioranza dei bambini appare normale, come anche la maggioranza della popolazione adulta. Tuttavia, le mutazioni cromosomiche sono più frequenti di quanto si pensi e contribuiscono in modo significativo agli aborti spontanei e alle morti neonatali, come anche ad alcune forme di tumori. Per esempio, le principali mutazioni cromosomiche sono presenti approssimativamente nella metà degli aborti spontanei e una mutazione cromosomica visibile è presente in circa 6 su 1000 nati vivi. Altri studi hanno dimostrato che circa l’11% dei maschi con gravi problemi di fertilità e circa il 6% degli individui ricoverati con problemi mentali sono portatori

Nota chiave Le mutazioni cromosomiche sono variazioni rispetto alla condizione normale (wild-type) relativamente al numero o alla struttura dei cromosomi. Le mutazioni cromosomiche possono verificarsi spontaneamente o essere indotte da agenti chimici o da radiazioni.

406

Capitolo 16

di mutazioni cromosomiche. Infine, le mutazioni cromosomiche possono essere cause significative di malattie dello sviluppo.

mosoma è “appiccicosa” e può attaccarsi ad altre estremità cromosomiche rotte. Questa caratteristica permette di capire la formazione dei tipi di mutazioni cromosomiche strutturali che saranno discusse. Molte informazioni sui cambiamenti di struttura dei Variazioni della struttura cromosomi sono state ottenute dallo studio dei cromodei cromosomi somi politenici (Figura 16.1) – cromosomi particolari Esistono quattro tipi principali di mutazioni cromoso- presenti in alcuni tessuti (come le ghiandole salivari demiche che implicano cambiamenti nella struttura del gli stadi larvali) di insetti dell’ordine dei ditteri (per cromosoma: le delezioni e le duplicazioni (entrambe esempio, Drosophila). I cromosomi politenici sono cocomportano un cambiamento nella quantità di DNA di stituiti da un fascio di cromatidi che derivano da cicli un cromosoma), le inversioni (che comportano un cam- ripetuti di duplicazione dei cromosomi, senza divisione biamento nell’orientamento di un tratto cromosomico) e nucleare o cellulare, processo definito endoreduplicale traslocazioni (che implicano un cambiamento nella zione. I cromosomi politenici possono avere una dimensione migliaia di volte superiore a quella dei corrilocalizzazione di un segmento cromosomico). Tutti i quattro tipi di mutazioni cromosomiche strut- spondenti cromosomi visibili alla meiosi o nei nuclei turali hanno origine da una o più rotture nel cromosoma. delle cellule somatiche normali e sono facilmente ricoSe una rottura si verifica all’interno di un gene, allora la noscibili al microscopio. In ogni cromosoma politenifunzione del gene può andare perduta. Qualsiasi sia il co, i due cromosomi omologhi sono strettamente appunto in cui avviene una rottura, le estremità tronche ri- paiati; perciò il numero dei cromosomi politenici ossermangono prive delle sequenze specializzate alle estre- vati per cellula è ridotto alla metà del numero diploide mità dei cromosomi (i telomeri), che li proteggono dal- di cromosomi. I cromosomi politenici sono uniti a lila degradazione. La porzione terminale rotta di un cro- vello dei centromeri da una struttura chiamata cromocentro. Come conseguenza di questo stretto appaiamento delle copie multiple di cromatidi, quando i cromosomi Cromosoma 3, braccio destro vengono colorati, è facilmente osservabiCromosoma X le un bandeggio caratteristico, che permette ai citogenetisti di identificare Cromosomi ogni segmento di un cromosoma mitotici normali, politenico. In Drosophila melanoraffigurati allo stesso ingrandimento gaster, per esempio, possono essere contate nei 4 cromosomi politenici più di 5000 bande e interCromosoma 4 bande. Ogni banda contiene in meRegione in cui due cromosomi dia 30 000 bp (30 kb) di DNA, sufCromocentro omologhi sono separati ficienti a codificare per parecchie proteine di media lunghezza. Il clonaggio e il sequenziamento del DNA hanno dimostrato che molte bande contengono fino a Cromosoma 3, sette geni. Si trovano geni anche nelle interbraccio sinistro bande. In questo capitolo si parlerà spesso di cromosomi politenici, in quanto è facile osservare i diversi tipi di mutazioni cromosomiche nei cromosomi giganti delle ghiandole saCromosoma 2, livari di Drosophila. braccio sinistro Cromosoma 2, braccio destro

20 μm

Figura 16.1 Schema dell’assetto completo dei cromosomi politenici di Drosophila in una cellula di una ghiandola salivare. Vi sono quattro paia di cromosomi, ma ciascuno è strettamente appaiato, per cui è visibile un singolo cromosoma per ciascun paio. Le quattro paia di cromosomi sono unite insieme da regioni vicine ai loro centromeri con formazione di un grande cromocentro.

Variazioni della struttura e del numero dei cromosomi

Delezione Una delezione è una mutazione cromosomica in cui un tratto di un cromosoma è mancante (Figura 16.2). Una delezione è prodotta da rotture nei cromosomi. Le rotture possono essere indotte da agenti come temperatura, radiazioni (in particolare radiazioni ionizzanti; Capitolo 7), virus, sostanze chimiche, elementi trasponibili (Capitolo 7) o da errori nella ricombinazione. Dato che un segmento cromosomico è mancante, le delezioni non possono revertire allo stato selvatico. Le conseguenze di una delezione dipendono dai geni o dalle regioni di geni che vengono rimossi. Negli organismi diploidi, un individuo eterozigote per una delezione può essere normale. Tuttavia, se l’omologo contiene alleli recessivi con effetti dannosi, le conseguenze possono essere gravi. Se la delezione implica la perdita del centromero, il risultato è un cromosoma acentrico, che viene generalmente perso durante la meiosi. La perdita di un intero cromosoma dal genoma può avere conseguenze molto gravi o letali, a seconda del particolare cromosoma andato perso o dell’organismo. Per esempio, nell’uomo non sono noti casi di situazioni vitali in cui vi sia stata perdita di un intero cromosoma autosomico. (Bisogna ricordare dal Capitolo 12 che, nell’uomo, femmine X0 sono vitali, nonostante la perdita di un cromosoma associato al sesso. In questo caso la sopravvivenza è la conseguenza del meccanismo di compensazione della dose per i cromosomi del sesso.) Negli organismi in cui è possibile effettuare un’analisi del cariotipo (analisi dell’assetto cromosomico; Capitolo 12), le delezioni possono essere riconosciute mediante tale procedura, purché i tratti perduti siano abbastanza estesi. In tal caso, si osservano coppie di cromosomi omologhi appaiati in modo sbagliato, con un cromosoma più corto dell’altro. In individui eterozigoti per una delezione, sono visibili anse non appaiate quando i due omologhi si appaiano in meiosi. Le delezioni possono essere utilizzate per determinare la localizzazione fisica di un gene su un cromosoma e, pertanto, rappresentano una metodica di mappatura fisica (vedi Capitoli 8 e 15). In Drosophila, per esempio, i bandeggi dei cromosomi politenici sono dei punti di riferimento visibili molto utili per una mappatura genica per delezione. Il principio su cui si basa il metodo trae origine dal meccanismo per cui la delezione dell’allele dominante in un eterozigote ha come conseguenza la manifestazione a livello fenotipico dell’allele recessivo. Questa manifestazione inattesa di un carattere recessivo, determinata dall’assenza dell’allele dominante, è definita pseudodominanza. La Figura 16.3 mostra come Demerec e Hoover, nel 1936, utilizzarono la mappatura per delezione nell’assegnazione di geni a siti specifici sui cromosomi politenici di Drosophila. Il ceppo studiato era eterozigote per tre mutazioni recessive osservate sul cro-

407

A A B

B C D

Delezione del segmento D

C E

E F F

G

G

H

H

Figura 16.2 Delezione di un segmento cromosomico (in questo caso, D).

mosoma X, y, ac e sc. L’analisi genetica aveva dimostrato che i tre loci erano associati all’estremità sinistra del cromosoma X, il cui bandeggio viene mostrato nella Figura 16.3a. Le regioni indicate con A, B, e C sono le principali suddivisioni citologiche del cromosoma X e i numeri entro ogni regione si riferiscono alle bande cromosomiche. È opportuno ricordare che un singolo cromosoma politenico è in realtà costituito da un paio di cromosomi omologhi strettamente appaiati. Furono utilizzate delezioni di questa regione del cromosoma per localizzare i loci genici. Nel ceppo 260-1, sono delete le bande A1-7 e B1-4, per cui si osserva pseudodominanza relativamente a y, ac e sc. L’estensione della delezione è rappresentata nella Figura 16.3a, e nella Figura 16.3b viene mostrato il cromosoma politenico come appare nella delezione eterozigote. Nel ceppo 260-2 sono delete le bande A1-7 e B1 dal cromosoma che porta gli alleli selvatici, per cui si osserva pseudodominanza per y e ac. Anche l’estensione di questa delezione è rappresentata nella Figura 16.3a, e l’aspetto del cromosoma politenico nella delezione eterozigote è mostrato nella Figura 16.3c. Dato che il locus selvatico sc è mancante nel ceppo con la delezione 260-1, ma non è andato perduto nel ceppo con la delezione 260-2, sc deve essere localizzato nella regione del cromosoma X che differenzia le due delezioni, precisamente, nelle bande B2-B4 (Figura 16.3a). Questo metodo di analisi è stato applicato per costruire la mappa fisica dettagliata dei cromosomi politenici di Drosophila, storicamente di grandissima utilità per i genetisti. Un certo numero di malattie dell’uomo è causato da delezioni di tratti cromosomici. In molti casi le anomalie sono presenti in individui eterozigoti; se la delezione è estesa, gli omozigoti per delezione generalmente muoiono. Questa distinzione ci fa capire che, almeno nell’uomo, il numero di copie dei geni è importante per lo sviluppo e le funzioni normali. Generalmente, molti geni vanno perduti in una delezione, per cui la sindrome che ne deriva è causata dalla perdita della funzionalità combinata di quei geni, piuttosto che dalla perdita di un solo gene.

408

Capitolo 16 a) Selvatico

b) Cromosoma X politenico c) Cromosoma X politenico in moscerini dell’aceto in moscerini eterozigoti eterozigoti per la delezione 260-1 per la delezione 260-2

260-1 (y ac sc)– 260-2 (y ac)–

2 4 6 2 4 6 8 1 3 5 71 3 5 7 9 A B

260-2

260-1

C

Selvatico

A5,6

B1 2,3,4 5,6

Pseudodominanza per y, ac, e sc

A5,6

B1

2,3

Pseudodominanza per y e ac

Figura 16.3 Uso delle delezioni per determinare la localizzazione fisica dei geni sui cromosomi politenici di Drosophila. (a) Aspetto citologico dell’estremità sinistra del cromosoma X eterozigote per le mutazioni recessive y, ac e sc, con evidenziate le regioni A, B e C e le bande cromosomiche in esse contenute. La regione 260-1 mostra l’estensione di una delezione che determina pseudodominanza per y, ac e sc e la regione 260-2

mostra l’estensione di una delezione che determina pseudodominanza per y e ac. (b) Aspetto citologico del cromosoma X politenico in Drosophila eterozigote per la delezione 2601. Questi moscerini mostrano pseudodominanza per y, ac e sc. (c) Aspetto citologico del cromosoma politenico X in Drosophila eterozigote per la delezione 260-2. Questi moscerini mostrano pseudodominanza per y e ac.

Una malattia umana determinata da una delezione eterozigote è la sindrome del cri-du-chat (OMIM 123450 al sito http://www.ncbi.nlm.nih.gov/OMIM), dovuta a una delezione visibile di una parte del braccio corto del cromosoma 5, uno dei cromosomi umani più grandi (vedi Figura 16.4). I bambini affetti dalla sindrome del cri-duchat hanno un forte ritardo mentale, una serie di anomalie fisiche e piangono emettendo un suono simile al miagolio di un gatto (da cui la denominazione in francese che significa appunto “miagolio del gatto”). Circa 1 bambino su 50 000 nati vivi ha la sindrome del cri-du-chat. Un altro esempio è la sindrome di Prader-Willi (OMIM 176270), causata da una delezione eterozigote di una parte del braccio lungo del cromosoma 15. Molti casi di individui affetti da questa sindrome non vengono

diagnosticati, per cui la sua incidenza non è nota con precisione, benché si stimi colpisca da 1 su 10 000 a 1 su 25 000 individui, prevalentemente maschi. I bambini affetti da questa sindrome sono deboli perché la loro capacità di succhiare è scarsa, il che rende difficile la nutrizione. Ne consegue una crescita ridotta. All’età di 5 o 6 anni, per ragioni non ancora chiarite, i bambini con la Prader-Willi diventano dei mangiatori voraci e ciò determina obesità e problemi di salute correlati. Se non curati, gli individui affetti possono nutrirsi fino a morire. Altri caratteri fenotipici associati alla sindrome sono relativi a uno sviluppo sessuale ridotto nei maschi, problemi di comportamento e ritardo mentale. (Ulteriori informazioni a livello molecolare sulla sindrome di PraderWilli sono presentate nel Capitolo 18.)

a) Cariotipo (bandeggio G)

Figura 16.4 La sindrome del cri-du-chat è la conseguenza della delezione di parte di una delle due copie del cromosoma umano 5.

b) Bambino con la sindrome del cri-du-chat

409

Variazioni della struttura e del numero dei cromosomi a) Cromosoma normale

Genotipo

A

A

A

A

B

B

B

B

C

C

C

A

D

B

B

E

C

B

Una duplicazione è una mutazione cromosomica che consiste nel raddoppiamento di un tratto di un cromosoma. La dimensione del tratto duplicato può variare ampiamente e segmenti duplicati possono trovarsi in punti diversi del genoma oppure essere adiacenti. Consideriamo un cromosoma normale come quello mostrato in Figura 16.5a. Quando la mutazione genera segmenti duplicati adiacenti l’un l’altro e viene conservato l’ordine dei geni, la duplicazione è detta in tandem (vedi Figura 16.5b, a sinistra). Quando l’ordine dei geni nel segmento duplicato è il contrario dell’ordine originale, si tratta di una duplicazione in tandem invertita (Figura 16.5b, al centro); quando i segmenti duplicati sono disposti in tandem all’estremità di un cromosoma, si tratta di una duplicazione in tandem terminale (Figura 16.5b, a destra). Le duplicazioni eterozigoti danno origine ad anse non appaiate simili a quelle descritte per le delezioni e possono essere riconosciute citologicamente. Le duplicazioni di determinate regioni geniche possono avere effetti fenotipici ben precisi, come avviene nella mutazione Bar sul cromosoma X di Drosophila melanogaster, studiata per la prima volta da Alfred Sturtevant e Thomas H. Morgan negli anni venti del secolo scorso. Nei ceppi omozigoti per la mutazione Bar (da non confondersi con il corpo di Barr), il numero degli ommatidi dell’occhio composto è inferiore a quello dell’occhio normale (mostrato nella Figura 16.6a), il che conferisce all’occhio una forma a barra (simile a una fenditura) invece di una forma ovale (vedi Figura 16.6b). Bar si comporta come una mutazione a dominanza incompleta (vedi Capitolo 13), dato che le femmine eterozigoti per Bar hanno un numero maggiore di ommatidi e quindi un occhio a barra leggermente più largo di quello delle femmine omozigoti per Bar. I maschi emizigoti per Bar hanno occhi molto piccoli simili a quelli delle femmine omozigoti per Bar. Il carattere Bar è il risultato di una duplicazione di un piccolo tratto (16A) del cromosoma X (vedi Figura 16.6b).

b) Duplicazioni

C

Duplicazione

C

F

D

D

D

E

E

E

G H

F

F

F

G

G

G

H

H

H

In tandem

In tandem invertita

In tandem terminale

Figura 16.5 Duplicazioni cromosomiche. (a) Cromosoma normale. (b) Duplicazioni.

Le duplicazioni hanno svolto un ruolo importante nell’evoluzione di geni multipli con funzioni correlate (una famiglia multigenica). Per esempio, le molecole di emoglobina contengono due copie ciascuna di due diverse subunità: il polipeptide α-globina e il polipeptide β-globina. Nei diversi stadi dello sviluppo, dall’embrione all’adulto, l’uomo ha molecole diverse di emoglobina risultanti dall’unione di diversi tipi di polipeptidi di tipo αglobina e di tipo β-globina. I geni per ciascuno dei polipeptidi di tipo α-globina sono raggruppati insieme su un cromosoma, mentre i geni per ciascuno dei polipeptidi di tipo β-globina sono raggruppati su un altro cromosoma. Le sequenze dei geni dell’α-globina sono tutte simili, come lo sono le sequenze dei geni della β-globina. Si ritiene che ogni insieme di geni sia evoluto da un diverso gene ancestrale mediante duplicazioni e successiva divergenza della sequenza dei geni duplicati (Capitolo 23). Il Focus sul genoma di questo capitolo descrive le duplicazioni dei geni della famiglia di proteine che legano gli androgeni (ABP, Androgen-Binding Protein), che si sono originate durante l’evoluzione in alcune specie di mammiferi.

Bande dei cromosomi politenici

Fenotipo

E F 15 16

a) Selvatico 16A

A B

16A Cromosomi X b) Omozigote per mutazione Bar 16A

16A

16A

16A

16 A 16 A

Figura 16.6 Cromosomi di ceppi di Drosophila, che illustrano la relazione tra le duplicazioni della regione 16A del cromosoma X e la produzione di fenotipi con occhi di dimensioni ridotte.

410

Capitolo 16

Focus sul genoma Le duplicazioni e le delezioni geniche nella famiglia dell’Androgen-Binding Protein (ABP)

a) Inversione paracentrica (non comprende il centromero)

b) Inversione pericentrica (comprende il centromero)

A

A

A

A

B

D

B

B

C

C

C

B

E

E

E

D

D

E D

E

B

D

F

C

F

Un’inversione è una mutazione cromosomica che si verifica quando un segmento cromosomico viene escisso e poi reintegrato nel cromosoma dopo rotazione di 180 gradi rispetto all’orientamento originale (vedi Figura 16.7). Vi sono due tipi di inversione: l’inversione paracentrica, che non comprende il centromero (Figura 16.7a), e l’inversione pericentrica, che comprende il centromero (Figura 16.7b). In generale, quando si verifica un’inversione non viene perduto materiale genetico, benché possano esservi delle conseguenze fenotipiche quando i punti di rottura (estremità dell’inversione) sono all’interno di un gene o entro regioni che controllano l’espressione di un gene. Le inversioni omozigoti possono essere identificate attraverso relazioni di associazione (linkage) diverse rispetto alla situazione normale, tra i geni situati entro il segmento in-

vertito e i geni adiacenti. Per esempio, se l’ordine dei geni sul cromosoma normale è ABCDEFGH e il tratto

C

Inversione

to una divergenza tra ratti e topi. Alcune specie di topo, infatti, compreso Mus pahari, hanno ancora un solo Abpa e un solo Abpbg. Mus pahari e Mus musculus si sono separati circa 7 milioni di anni fa e quindi le duplicazioni in M. musculus sono avvenute molto rapidamente. Gli scienziati che studiavano questa famiglia genica nel topo hanno rivolto poi la loro attenzione ad altri genomi di mammifero, facendo interessanti osservazioni. Le duplicazioni nei geni Abpa e Abpbg non sono limitate al topo. Duplicazioni in larga scala di questi geni sono avvenute in almeno tre differenti rami evolutivi. Oltre ai topi, i geni si sono duplicati nel ramo evolutivo che porta al coniglio e in quello che porta ai bovini. Il confronto tra i geni di conigli, topi e bovini suggerisce che le duplicazioni siano avvenute indipendentemente in ogni specie. Altri genomi di mammifero – compresi pipistrelli, gatti, cani, scoiattoli e toporagni – non mostrano segni di duplicazioni dei geni Abpa e Abpbg. Alcuni mammiferi, compresi uomo e scimpanzé, hanno un solo pseudogene Abpa e un solo pseudogene Abpbg. Altri animali – compresi ricci, elefanti e armadilli – mancano del tutto di questi geni. Questa è chiaramente una famiglia genica andata incontro a duplicazioni e delezioni molto rapide, anche se la ragione di questi cambiamenti così repentini è ancora sconosciuta. Gli organismi che usano i membri della famiglia ABP per la selezione sessuale possono avere più copie di questi geni ma questa correlazione non è stata verificata in conigli e bovini.

D

Nei topi, un complesso proteico chiamato ABP (Androgen-Binding Protein) è coinvolto nelle scelte sessuali. Le femmine preferiscono maschi che hanno nella saliva una ABP simile alla ABP da esse prodotta e rifiutano i maschi che hanno ABP varianti. Una ABP è costituita da tre subunità: α, β e γ. Il genoma del topo (Mus musculus) ha una grande quantità di geni simili a quelli per ABP, che codificano per proteine simili, e formano la famiglia ABP, costituita da 14 geni codificanti per proteine simili ad α, 16 pseudogeni α non funzionanti (nell’insieme detti geni Abpa), 13 geni che codificano per proteine simili a β o γ e 21 geni non funzionanti per β o γ (nell’insieme detti geni Abpbg). Uno pseudogene è molto simile nella sequenza del DNA a un gene funzionante, ma a causa di una o più mutazioni esso non può più codificare per un prodotto funzionale. La maggior parte degli pseudogeni deriva da geni codificanti per proteine; alcuni di essi mancano di sequenze regolatrici come i promotori, altri hanno mutazioni frameshift o nonsenso che ne impediscono il funzionamento. Le funzioni biochimiche delle proteine ABP sono ancora sconosciute. La maggior parte dei mammiferi ha un gene Abpa e uno Abpbg. I ratti e i topi circa 12 milioni di anni fa condividevano un progenitore comune e il confronto del genoma del ratto con quello del topo suggerisce che questo antenato comune avesse un gene Abpa e uno Abpbg che sarebbero poi andati incontro a ripetute duplicazioni, nel corso dell’evoluzione, che avrebbero determina-

F

F

F

G

G

G

G

H

H

H

H

Figura 16.7 Inversioni.

411

Variazioni della struttura e del numero dei cromosomi

BCD è invertito (qui di seguito sarà rappresentato in grassetto), la sequenza dei geni sarà ADCBEFGH con D più strettamente associato ad A che non a E, e B più strettamente associato a E che non ad A (Figura 16.7a). Le conseguenze meiotiche di un’inversione cromosomica sono diverse se l’inversione avviene in omozigosi o in eterozigosi. Se l’inversione è in omozigosi, allora la meiosi è normale e non vi sono problemi di duplicazioni o delezioni di geni. Invece, per un’inversione eterozigote non vi sono problemi in meiosi se il crossing-over non avviene all’interno dell’inversione, mentre si verificano gravi conseguenze genetiche se il crossing-over avviene entro l’inversione. Consideriamo un’inversione paracentrica eterozigote, di genotipo °ABCDEFGH/°ADCBEFGH, con il centromero (°) a sinistra del gene A. In meiosi, i cromosomi omologhi tentano di appaiarsi in modo da raggiungere l’appaiamento tra le basi nel modo più preciso possibile. Data la presenza di un tratto invertito su un omologo, l’appaiamento dei cromosomi omologhi richiede la formazione di anse che comprendono i tratti invertiti, chiamate anelli o anse di inversione. Le inversioni eterozigoti, quindi, possono essere identificate osservando le anse. Se non avvengono crossing-over entro l’ansa di inversione di un’inversione paracentrica eterozigote, tutti i gameti risultanti ricevono un corredo completo di geni (due gameti con un ordine di geni normale, °ABCDEFGH, e due gameti con il segmento invertito, °ADCBEFGH), e sono tutti vitali. La Figura 16.8 mostra gli effetti di un crossing-over singolo entro l’ansa d’inversione, tra i geni B e C. Durante la prima anafase meiotica, i due centromeri migrano ai poli opposti della cellula e, a causa del crossing-over, un cromatidio ricombinante migra attraverso la cellula con formazione di un ponte dicentrico – vale a dire un cromosoma con due centromeri (cromosoma dicentrico). Mentre la migrazione prosegue, il ponte dicentrico, a causa della tensione, si rompe. L’altro prodotto ricombinante dell’evento di crossing-over è un cromosoma senza centromero (un frammento acentrico). Questo frammento acentrico è incapace di proseguire la meiosi e viene generalmente perduto (non si ritrova nei gameti). Nella seconda divisione meiotica, ogni cellula figlia riceve una copia di ciascun cromosoma. Due gameti – il gamete con la sequenza di geni normale (°ABCDEFGH) e il gamete con il segmento invertito (°ADCBEFGH) – possiedono una serie completa di geni e sono vitali. Gli altri due gameti non sono vitali, perché so-

Figura 16.8 Conseguenze di un’inversione paracentrica. Prodotti meiotici derivanti da un singolo crossing-over entro l’ansa di inversione eterozigote paracentrica. Il crossingover avviene allo stadio di quattro filamenti tra due cromatidi omologhi non fratelli.

no sbilanciati: molti geni sono deleti. Perciò i soli gameti che possono dare origine a una progenie vitale sono quelli che contengono i cromatidi non coinvolti nell’evento di crossing-over. Tuttavia sovente, in animali di sesso femminile, i cromosomi dicentrici o i frammenti acentrici che si formano in conseguenza di un’inversione possono segregare nei globuli polari, per cui la riduzione di fertilità può non essere così elevata. In breve, per le inversioni paracentriche eterozigoti, i ricombinanti vitali sono ridotti in modo significativo o del tutto assenti. I gameti o gli zigoti risultanti dai cromatidi ricombinanti non sono vitali. Le conseguenze di un singolo crossing-over entro l’ansa d’inversione in condizioni di eterozigosi per un’inversione pericentrica sono illustrate nella Figura 16.9. Il cromosoma normale è ABC°DEFGH e il cromosoma con l’inversione è AD°CBEFGH; il centrome-

Cromosoma normale A

B

C

D

E

F

G

H

A

D

C

B

E

F

G

H

Cromosoma con inversione

Profase I della meiosi C C

Crossing-over

C B 1

A

2

A

3

A

4

D D

C

B

D D

B B



F G H



E

F

E

A

1

A

B

2

Rottura casuale nel ponte dicentrico 4

A

B

3

A

C

C A

E F G H E

D

F

G H



G H



H



G

H 2¢ D F G E Frammento acentrico perduto H 4¢ B E F G

C

D D

E

F

C

B

E

F

G

H



H



H



H



H



Segregazione all’anafase I 1

A

B

2

A

B

4

A

3

A

C

D

E

F

G

C 4¢

D D

C

B

E

F

G

Segregazione alla II divisione meiotica Prodotto normale

1

A

B

C

D

2

A

B

C

D



4

A

Prodotto con inversione (tutti 3 i geni presenti)

A

D

C

B

E

Prodotti con delezioni

E

F

F

G

G

412

MyLab

Capitolo 16

ro si trova tra C e D. I risultati dell’evento di crossingover e delle successive divisioni meiotiche sono due gameti vitali, con i cromosomi non ricombinanti ABC°DEFGH (normale) e nimazione AD°CBEFGH (con inversioCrossing-over ne), e due gameti ricombinanti non vitali, ciascuno con delezioin una ne di alcuni geni e duplicazione inversione di altri. eterozigote Alcuni eventi di crossingover entro un’ansa d’inversione non influenzano la vitalità dei gameti. Per esempio, due crossing-over, l’uno vicino all’altro, con coinvolgimento degli stessi due cromatidi (un crossing-over doppio a due filamenti; Capitolo 14) producono quattro gameti vitali. Una seconda eccezione si verifica quando i tratti duplicati e deleti dei cromatidi ricombinanti non influenzano geni essenziali – e quindi la vitalità – in modo significativo, come nel caso in cui i tratti cromosomici coinvolti siano molto piccoli. Inoltre, studi recenti sui mammiferi dimostrano che segmenti invertiti possono rimanere non appaiati. Dato che il crossing-over non può verificarsi tra segmenti non appaiati, non vengono prodotti gameti non vitali.

Traslocazione

Una traslocazione è una mutazione cromosomica in conseguenza della quale vi è un cambiamento nella posizione, e quindi una diversa localizzazione nel genoma, di segmenti cromosomici e delle sequenze geniche in essi contenute (Figura 16.10). In una traslocazione non vi sono aumento né perdita di materiale genetico. Se un segmento cromosomico cambia di posizione entro lo stesso cromosoma, la traslocazione è una traslocazione intracromosomica non-reciproca (Figura 16.10a). Quando un segmento cromosomico viene trasferito da un cromosoma a un altro, la traslocazione è una traslocazione non-reciproca, se è implicato un trasferimento in una sola direzione (Figura 16.10b), oppure una traslocazione reciproca intercromosomica, se è implicato uno scambio di segmenti tra i due cromosomi (Figura 16.10c). Negli organismi omozigoti per le traslocazioni (vale a dire, in cui entrambe le copie del cromosoma nel genoma diploide presentano la traslocazione), la conseguenza genetica di queste è un cambiamento della relazione di associazione (linkage) tra i geni. Per esempio, nella traslocazione non reciproca intracromosomica mostrata nella Figura 16.10a, il segmento BC si è spostato sull’altro braccio cromosomico e si è A B C D E F G H Cromosoma normale inserito tra i segmenti F e G. Ne consegue Cromosoma con inversione A D C B E F G H che i geni nei segmenti F e G sono ora più lontani di quanto lo siano nel cromosoma Profase I della meiosi normale e che i geni nei segmenti A e D sono ora più strettamente associati. AnaC logamente, nuove relazioni di associazioC Crossing-over ne vengono prodotte nelle traslocazioni C D reciproche. D C B B Le traslocazioni influenzano i prodotti B B D D E F G H 1¢ 1 A della meiosi. In molti casi, alcuni dei gaE F G H 2¢ 2 A meti prodotti sono sbilanciati, in quanto Cromosomi omologhi hanno duplicazioni o delezioni e possono E 3 A F G H 3¢ E essere non vitali. In altri casi, come nella 4 A F G H 4¢ sindrome di Down familiare, che deriva Prodotti di un singolo da una traslocazione reciproca bilanciata, i crossing-over tra B e C entro l’ansa di inversione gameti sono vitali (si veda più oltre nel capitolo). Prodotto normale B D H 1¢ Vitale 1 A C E F G Nei ceppi omo(tutti i geni presenti) nimazione zigoti per una trasProdotto con delezione/ Non locazione reciproMeiosi in una 2 A duplicazione (EFGH B D A 4 C vitale deleto; A duplicato) ca, infatti, la meiotraslocazione si avviene normalProdotto con inversione eterozigote 3 A D C B E F G H 3¢ Vitale (tutti i geni presenti) mente, dato che Prodotto con delezione/ tutte le coppie di cromosomi Non duplicazione (A deleto; 4¢ H B D H 2¢ vitale G F E C E F G possono appaiarsi correttaEFGH duplicato) mente e il crossing-over non Figura 16.9 produce nessun cromatidio Prodotti meiotici derivanti da un singolo crossing-over entro un’ansa anormale. Nei ceppi eterozidi inversione pericentrica eterozigote. Il crossing-over avviene allo stadio di quattro filamenti tra due cromatidi omologhi non fratelli. goti per una traslocazione re-

MyLab

Variazioni della struttura e del numero dei cromosomi a)—Traslocazione intracromosomica non reciproca

b)—Traslocazione intercromosomica non reciproca

c)— Traslocazione intercromosomica reciproca

A

A

A

M

A

M

A

M

M

B

D

B

N

D

N

B

N

N

B

C

E

C

O

E

B

C

O

O

P

D

F

D

P

F

C

D

P

C

Q

E

B

E

Q

G

O

E

Q

D

R

F

C

F

R

H

P

F

R

E

G

G

G

Q

G

F

H

H

H

R

H

G

A

Figura 16.10 Traslocazioni.

H

ciproca, invece, le diverse parti dei cromosomi omologhi si appaiano come meglio possono. Dato che sono implicati un assetto di cromosomi normali (N) e un assetto di cromosomi traslocati (T), il risultato è una configurazio-

Box 16.1

413

ne a croce nella profase della meiosi I (vedi Figura 16.11). Queste figure a croce sono costituite da quattro cromosomi associati, ciascuno parzialmente omologo ad altri due cromosomi del gruppo.

Crossing-over ineguale e sindrome di Williams-Beuren

Non tutti gli eventi di ricombinazione tra cromosomi omologhi sono reciproci; è possibile, infatti, anche se raramente, che si verifichi un crossing-over ineguale. Questo fenomeno di ricombinazione dipende da un allineamento errato dei cromosomi omologhi durante la meiosi, a sua volta facilitato dalla presenza di sequenze ripetute: la presenza di ripetizioni causa, infatti, “ambiguità” su quali di queste si debbano correttamente appaiare. Se si appaiano sequenze che mostrano omologia ma non sono alleliche, il risultato è un crossing-over ineguale che determina sui due cromosomi ricombinanti rispettivamente la duplicazione parziale e la delezione parziale di materiale genetico. Per esempio, la sindrome di Williams-Beuren origina nell’uomo a causa della delezione di una piccola porzione del cromosoma 7 in seguito a crossing-over ineguale: come mostrato in Figura box 16.1, sul cromosoma 7 normale ci sono due copie del gene PMS, denominate PMSA e PMSB, separate da 17 altri geni. Se nel corso della meiosi le copie duplicate del gene PMS si appaiano in modo errato, il risultato del crossingover sarà un cromosoma ricombinante con un gene ibrido PMSA/PMSB non funzionale e la perdita dei geni interposti (responsabile della sindrome di Williams-Beuren) e un altro con una duplicazione estesa che riguarda sia i geni interposti sia il gene PMS stesso (non responsabile di anomalie fenotipiche). Nell’uomo questa sindrome ha una frequenza di 1:10 000. I soggetti affetti sono caratterizzati da sviluppo anomalo del sistema nervoso e da uno spiccato talento per la musica e il canto. Il crossing-over ineguale è molto importante per l’acquisizione di nuove copie di geni nelle famiglie multigeniche (vedi Capitolo 23).

a) Cromosoma 7 normale Centromero

Marcatori laterali

17 geni

Marcatori laterali

b) Allineamento errato dei cromosomi omologhi e crossing-over ineguale Ansa di DNA

c) Delezione e duplicazione dei cromosomi ricombinanti

Gene ibrido Sindrome WBS

Assenza di anomalie fenotipiche

Gene ibrido 17 geni

17 geni

Figura box 16.1 Crossing-over ineguale responsabile della sindrome di Williams-Beuren.

414

Capitolo 16

Figura 16.11 Meiosi in una traslocazione eterozigote in cui non avviene il crossing-over. Cromosomi normali (N) non omologhi

Cellula 2N eterozigote per una traslocazione reciproca

N1 N2

T1 T2

A B C D E F

A B C J K L

G H I J K L

G H I D E F

Cromosomi dopo una traslocazione reciproca (T)

N1 A B C D E F

G H I D E F

T1 A B C J K L

G H I J K L N2

T2

Profase I della meiosi F F E E N1 D D A B C A B C

F F E E T D D 2 I H G I H G

A B C A B C T1 J J K K L L

I H G I H G J J N 2 K K L L Tre possibili vie verso l'anafase I della meiosi

N1

Piastra metafasica

N1 C D B C D E B E F A A F A

A

L B

B

C J C J

K K

L

N2 I J K J I H H G K L L G F

F

G E

E

D D

T1

H H

I

G

D E F D E F

T1

C B A C B A

N1

A B C A B C

C C

I I

J J

D D

B B

H H

K K

E E

A A

G G

L L

F F

A A

G G

L L

F F

B B

H H

K K

E E

I I

J J

C C

I

T2

F E D F E D

T2 T1

J K L J K L

L K J L K J

N2

N2

D D I H G I H G

G H I G H I

Segregazione alternata: centromeri alternati allo stesso polo (avviene circa nel 50% dei casi)

Segregazione adiacente-1: centromeri adiacenti non omologhi allo stesso polo (avviene circa nel 50% dei casi)

N1 A B C D E F

N1 A B C D E F

T1 A B C J K L

N2 L K J I H G

T2 F E D I H G

N1 A B C D E F

Segregazione adiacente-2: centromeri adiacenti omologhi allo stesso polo (avviene raramente)

T1 A B C J K L

T1 A B C J K L

N2 L K J I H G

T2 F E D I H G

N2 L K J I H G

T2 F E D I H G

Ciascuno contiene una serie completa di geni; vitale

Avviene frequentemente; ciascuno contiene duplicazioni e delezioni; generalmente non vitale

Avviene raramente; ciascuno contiene duplicazioni e delezioni; non vitale

La segregazione all’anafase I può avvenire in tre modi diversi. (In questa discussione, ignoriamo la complicazione del crossing-over.) In un modo, definito segregazione alternata, i centromeri migrano allo stesso polo in modo alternato (vedi Figura 16.11, a sinistra: N1 e N2 migrano a un polo, T1 e T2 all’altro polo). Questo processo genera due gameti, entrambi vitali, perché conten-

T2

gono una serie completa di geni – né in più né in meno. Uno di questi gameti ha due cromosomi normali e l’altro ha due cromosomi con la traslocazione. Nel secondo modo, definito segregazione adiacente-1, centromeri adiacenti non omologhi migrano allo stesso polo (vedi Figura 16.11, al centro: N1 e T2 migrano a un polo, N2 e T1 all’altro polo). Entrambi i gameti prodotti con-

Variazioni della struttura e del numero dei cromosomi

tengono delezioni e duplicazioni geniche e sono spesso non vitali. La segregazione adiacente-1 si verifica circa con la stessa frequenza della segregazione alternata. Nel terzo modo, definito segregazione adiacente-2, coppie diverse di centromeri adiacenti omologhi migrano allo stesso polo (vedi Figura 16.11, a destra: N1 e T1 migrano a un polo, N2 e T2 all’altro polo). Entrambi i prodotti hanno duplicazioni e delezioni di geni e sono non vitali. La segregazione adiacente-2 si verifica raramente. In sintesi, dei sei gameti teoricamente possibili, i due derivati dalla segregazione alternata sono funzionali, i due derivati dalla segregazione adiacente-1 sono generalmente non vitali (a causa di duplicazioni e deficienze di geni), e i due della segregazione adiacente-2 vengono prodotti raramente e comunque non sono vitali. Inoltre, dato che la segregazione alternata e la segregazione adiacente-1 si verificano circa con la stessa frequenza, a questa situazione viene dato il termine di semisterilità. (Questo termine viene anche usato per le inversioni eterozigoti.) In pratica, negli animali, i gameti che portano grandi segmenti cromosomici duplicati o deleti possono funzionare, ma gli zigoti originati da tali gameti generalmente muoiono. Al contrario, se i tratti cromosomici duplicati o deleti sono piccoli, i gameti possono funzionare normalmente e può originarsi una progenie vitale. Nelle piante, granuli pollinici con segmenti cromosomici duplicati o deleti generalmente non si sviluppano completamente e quindi non sono funzionanti.

Mutazioni cromosomiche e tumori nell’uomo Finora abbiamo analizzato come le variazioni di struttura dei cromosomi possano dare origine a malattie genetiche ereditabili come conseguenza, fondamentalmente, della produzione di gameti con corredi cromosomici alterati. A livello delle cellule somatiche le mutazioni, e in particolare quelle cromosomiche, possono dare origine a tumori (vedi Capitolo 20). La maggior parte dei tumori nell’uomo presenta mutazioni cromosomiche. L’esatta anomalia cromosomica, in realtà, varia da tumore a tumore, andando da riarrangiamenti semplici a cambiamenti complessi sia del numero sia della struttura dei cromosomi. In molti tumori, non si riscontra una specifica mutazione cromosomica associata. Piuttosto, si osserva una varietà di diverse mutazioni cromosomiche, come nel caso della maggior parte dei tumori solidi, che manifestano un quadro complesso di mutazioni cromosomiche. Esempi sono i tumori epiteliali dell’ovaio, del polmone e del pancreas e molti sarcomi (tumori del tessuto connettivo), come l’osteosarcoma. Al contrario, alcuni tumori sono associati ad anomalie cromosomiche specifiche. Per esempio, la leucemia mieloide cronica (CML; OMIM 151410; coinvolge i cromo-

415

somi 9 e 22) e il linfoma di Burkitt (BL; OMIM 113970; coinvolge i cromosomi 8 e 14) sono associati a traslocazioni reciproche. Se non trattata, la CML è sempre un tumore mortale che implica una crescita incontrollata dei mieloblasti (cellule progenitrici della serie bianca del sangue). Un nuovo farmaco mirato, messo a punto recentemente, Glivec®, si è rivelato promettente nella cura della malattia. Il 90% dei pazienti con leucemia mieloide cronica presenta una mutazione cromosomica nelle cellule leucemiche, chiamata cromosoma Philadelphia (Ph1), così denominata perché la sua scoperta avvenne a Philadelphia. Il cromosoma Philadelphia deriva da una traslocazione reciproca, che comporta lo spostamento di una parte del braccio lungo del cromosoma 22 (il secondo cromosoma più piccolo dell’uomo) sul cromosoma 9, e lo spostamento di una piccola parte proveniente dall’estremità del cromosoma 9 sul cromosoma 22 (Figura 16.12). Questa traslocazione reciproca sembra trasformare un proto-oncogene – un gene che, nelle cellule normali, controlla la normale proliferazione cellulare – in un oncogene (Capitolo 20) – un gene che codifica per una proteina che svolge un ruolo nella transizione di una cellula a cellula tumorale con una modalità di crescita incontrollata. Precisamente, il proto-oncogene ABL (da Abelson), normalmente localizzato sul cromosoma 9, viene traslocato sul cromosoma 22 nei pazienti con CML (Figura 16.12). L’evento di traslocazione posiziona il gene ABL entro il gene BCR (Breakpoint Cluster Region). Questo gene ibrido BCR-ABL è l’oncogene responsabile della CML, poiché il gene ibrido esprime una tirosina chinasi costitutivamente attiva (che significa sempre attiva). La tirosina chinasi attiva contribuisce a stimolare le cellule a crescere e a dividersi, causando, in questo caso, un eccesso di leucociti. Il farmaco Glivec® agisce bloccando la tirosina chinasi in modo da fermare (o almeno ridurre) la produzione di leucociti. Il linfoma di Burkitt, una malattia particolarmente frequente in Africa, è un tumore di origine virale che colpisce le cellule del sistema immunitario chiamate cellule B. Normalmente le cellule B producono anticorpi (immunoglobuline). Il 90% dei tumori nei pazienti affetti da linfoma di Burkitt è associato a una traslocazione reciproca che coinvolge i cromosomi 8 e 14. Come nella CML, un proto-oncogene diventa attivo in conseguenza dell’evento di traslocazione. L’estremità distale del cromosoma 8, a partire dal proto-oncogene MYC, si scambia con l’estremità distale del cromosoma 14. Il gene MYC viene a posizionarsi vicino al gene delle immunoglobuline trascrizionalmente attivo nelle cellule B (vedi Capitolo 19), con conseguente sovraespressione del gene MYC. Il gene MYC sovraespresso è l’oncogene implicato nella crescita e nella divisione cellulare incontrollata che porta allo sviluppo del linfoma di Burkitt.

416

Capitolo 16

genetico, cioè di un cambiamento nell’espressione genica ereditabile meioticamente o mitoticamente che non implica un cambiamento nella sequenza del DNA del gene interessato. Per esempio, può verificarsi un effetto di posizione se un gene, che è normalmente localizzato nell’eucromatina (regioni cromosomiche, che costituiscono la maggior parte del genoma, condensate durante la divisione, ma decondensate durante l’interfase), viene spostato in seguito a un riarrangiamento cromosomico vicino all’eterocromatina (regioni cromosomiche che rimangono condensate durante l’intero ciclo cellulare e che sono povere di geni e trascrizionalmente inattive). (Eucromatina ed eterocromatina sono descritte nel Capitolo 2.) Si noti che la trascrizione dei geni avviene nell’eucromatina, ma non nell’eterocromatina; ciò dipende dalla differenza di condensazione del cromosoma (vedi Capitolo 18). Un esempio di questo tipo di effetto di posizione riguarda il locus sul cromosoma X che determina l’occhio bianco (w) in Drosophila. Un’inversione sposta il gene w+ da una regione eucromatica vicina all’estremità del cromosoma X a una posizione in prossimità dell’eterocromatina del centromero dell’X. In un maschio w+, o in una femmina w+/w in cui w+ sia coinvolto nell’inversione, l’occhio mostra un aspetto variegato rosso e bianco anziché completamente rosso, come atteso. La spiegazione del fenomeno è che, nei moscerini con l’inversione, alcune cellule dell’occhio hanno l’allele w+ inattivato in seguito all’in-

Attività MyLab

Nell’iAttività Deciphering Karyotypes (Decifrare il cariotipo), nel sito dedicato agli studenti, siete un consulente genetico che deve determinare se vi sono delle anomalie cromosomiche che potrebbero influenzare la possibilità di una coppia di avere figli.

Nota chiave Le mutazioni cromosomiche possono interessare parti di singoli cromosomi oppure interi cromosomi o assetti cromosomici. I quattro tipi principali di alterazioni strutturali sono le delezioni e le duplicazioni (entrambe implicano un cambiamento della quantità di DNA in un cromosoma), le inversioni (non comportano cambiamenti nella quantità di DNA in un cromosoma, ma piuttosto un cambiamento nella disposizione di un segmento di un cromosoma) e le traslocazioni (anch’esse non implicano un cambiamento nella quantità di DNA, bensì un cambiamento nella localizzazione di uno o più segmenti di DNA). Spesso i problemi associati con inversioni e traslocazioni si manifestano solo durante il crossing-over meiotico.

9

Effetto di posizione Le inversioni e le traslocazioni, a meno che non implichino rotture all’interno di un gene, non determinano fenotipi mutanti. Come si è visto, esse hanno piuttosto conseguenze significative alla meiosi quando avvengono in condizioni di eterozigosi con sequenze normali. D’altra parte, in alcuni casi si verificano effetti fenotipici determinati da inversioni o traslocazioni, a causa di un fenomeno diverso definito effetto di posizione – un cambiamento nell’espressione fenotipica di uno o più geni in conseguenza di un cambiamento della loro posizione nel genoma. Questo è un altro esempio di fenomeno epi-

4 2

3 2

p 1 3 12 1 1

.3 .2 .1 .3 .2 .1 .3 .2 .1 .3 .2 .1 .3 .2 .1

3 p 1 2 1

12

2 q

.11 .12 .13 1 .2 .32 .31 .33 .1 .2

2

1

.2 .1 .1

1

3

q 1

.31 .32 .33

2

3

.1 .2 .3

.21 .22 .23 .1 .2 .3

bcr

Traslocazione reciproca bcr abl

.1 .2 .31 .32 .33

Difettoso (cromosoma Philadelphia)

Normale

2 33

.1 .2 .3 .1

Figura 16.12 Origine del cromosoma Philadelphia nella leucemia mieloide cronica (CML) in seguito a una traslocazione reciproca tra i cromosomi 9 e 22. Le frecce indicano i punti di rottura.

22

.2 .1

4

.2

abl

.3

Normale

Difettoso

Variazioni della struttura e del numero dei cromosomi

versione, a causa dell’effetto di posizione di w+ vicino all’eterocromatina (la cromatina con il gene spostato diventa più condensata inibendo così la trascrizione di quel gene). Il prodotto di queste cellule determina le macchie bianche nell’occhio. Le cellule in cui l’allele w+ non è inattivato determinano nell’occhio le macchie rosse. Dato che l’evento di mutazione è casuale, l’occhio si mostra variegato con macchie rosse e bianche. Alcune malattie genetiche dell’uomo sono associate a effetti di posizione. Un esempio è l’aniridia (letteralmente “senza iride”; OMIM 106210), una condizione congenita dell’occhio caratterizzata da una severa ipoplasia (sottosviluppo) dell’iride, associata con la cataratta e con un appannamento della cornea. L’aniridia è causata da una perdita di funzione del gene PAX6, implicato nello sviluppo dell’occhio. Negli individui con il gene PAX6 non funzionale, lo sviluppo dell’occhio si blocca troppo precocemente e, al momento della nascita, la maggior parte dell’occhio è sottosviluppata. La perdita di funzione può essere dovuta a una delezione del gene o a mutazioni all’interno del gene. Alcuni individui affetti hanno traslocazioni con punti di rottura sul cromosoma alquanto distanti dal gene PAX6. Sembra che, in questo caso, l’espressione di PAX6 sia soppressa da un effetto di posizione indotto dal nuovo “ambiente cromosomico” in cui viene a trovarsi il gene traslocato.

Siti fragili e rotture cromosomiche Nel cariotipo di cellule umane coltivate in vitro in assenza di folati, alcuni cromosomi mostrano delle anomalie citologiche che consistono in strozzature o regioni non colorabili, definite siti fragili. In corrispondenza di tali siti il cromosoma presenta una particolare fragilità spontanea e indotta, che ne aumenta la suscettibilità a “rotture”. La causa di fragilità di questi siti in vivo non è stata del tutto compresa. È possibile ipotizzare che queste siano regioni in cui la cromatina non è fortemente condensata e quindi è più soggetta a rotture. Studi recenti suggeriscono che queste regioni siano il risultato di una replicazione incompleta del DNA; infatti in queste regioni la sintesi di DNA è fortemente ritardata rispetto ad altre per lo stallo delle forche di replicazione. Recentemente, è stato proposto che anche la trascrizione possa contribuire alla fragilità dei siti. Infatti, alcuni di essi mappano in regioni codificanti di geni umani di grandi dimensioni: la trascrizione di tali geni richiede molto tempo per essere completata; pertanto la trascrizione e la replicazione avvengono contemporaneamente. In questo caso, i meccanismi di trascrizione e la formazione della forca di replicazione possono collidere, causando formazione di loop di RNA che bloccano l’RNA polimerasi. (Solo alcuni siti fragili però sono in corrispondenza di geni particolarmente lunghi, quindi questo meccanismo probabilmente non è generalizzabile.)

417

Il posizionamento di geni in corrispondenza di siti fragili ne aumenta la suscettibilità a mutazioni e delezioni. Da quando è stato scoperto il primo sito fragile nel 1965, ne sono stati identificati più di 80. Per la maggior parte i siti fragili non sembrano associati a sindromi cliniche. Tuttavia, alcuni di essi sono stati correlati a forme di ritardo mentale e a tumori. Un particolare sito fragile (l’unico per cui è nota un’associazione con un fenotipo) è quello correlato alla sindrome dell’X fragile. Tale patologia, causata da espansioni di triplette ripetute nella regione regolativa del gene FMR-1 che ne causano una mancata espressione (come abbiamo visto nel Capitolo 7) è la causa più frequente di ritardo mentale ereditario, dopo la sindrome di Down, con un’incidenza di circa 1 su 4000 maschi e di 1 su 6000 femmine (Figura 16.13). Tale gene mappa in corrispondenza di un sito fragile del cromosoma X, situato sul braccio lungo in posizione Xq27.3, evidenziabile citogeneticamente (vedi Figura 16.14). Nel 1996 Heuberg e Croce hanno dimostrato per la prima volta l’associazione tra un sito fragile e i tumori. In corrispondenza del sito fragile localizzato sul braccio corto del cromosoma 3 (regione 3p14.2) è stato infatti individuato il gene FHIT (Fragile Hystidine Triad), alterato o assente in cellule tumorali derivate da pazienti con diversi tipi di tumore, tra cui quello polmonare, dove il gene risulta mutato nel 99% di individui fumatori. In questo tipo di tumore è stata infatti dimostrata una forte correlazione tra il fumo di sigaretta e la mutazione nel gene FHIT. La perdita del gene fa acquisire alla cellula tumorale una resistenza alla morte cellulare indotta da un danno al DNA.

Figura 16.13 Individuo affetto da sindrome dell’X fragile.

418

Capitolo 16

a) Microfotografia al microscopio a scansione di un cromosoma X fragile

b) Schema di un cromosoma X fragile

2 p braccio corto 1

1

q braccio lungo 2

Sito fragile (q27.3) X

Figura 16.14 Sito fragile sul cromosoma X. Nel riquadro in (a), in alto a destra, è mostrato lo stesso cromosoma al microscopio ottico.

Variazioni nel numero dei cromosomi Quando un organismo, o una cellula, ha un assetto aploide completo o un multiplo esatto di assetti completi di cromosomi, tale organismo o cellula viene definito euploide. Perciò, organismi eucarioti che sono normalmente diploidi (come l’uomo e i moscerini della frutta) e organismi eucarioti che sono normalmente aploidi (come i lieviti) sono euploidi. In natura avvengono mutazioni cromosomiche che portano a variazioni nel numero di interi assetti cromosomici (monoploidie o poliploidie), e danno origine a cellule o organismi che sono ancora considerati euploidi. Mutazioni cromosomiche che portano a variazioni nel numero di singoli cromosomi sono dette aneuploidie, in quanto il numero di cromosomi non è un multiplo esatto dell’assetto cromosomico aploide.

Cambiamenti di uno o pochi cromosomi Origine dell’aneuploidia I cambiamenti nel numero di cromosomi possono avvenire sia negli organismi diploidi sia in quelli aploidi. La causa principale delle aneuploidie degli organismi diploidi è la non-disgiunzione di uno o più cromosomi omologhi durante la meiosi I o dei cromatidi fratelli durante la meiosi II. La non-disgiunzione è stata discussa nel Capitolo 12 nell’ambito degli assetti anomali di cromosomi X e la Figura 12.18 illustra le conseguenze di una non-disgiunzione nella prima e nella seconda divisione meiotica. Generalizzando, una non-disgiunzione in meiosi I produce quattro gameti anomali:

due con un cromosoma duplicato e due privi di quel cromosoma. Una fusione del primo tipo di gamete (con il cromosoma duplicato) con un gamete normale produce uno zigote con tre copie di quel cromosoma, invece delle due normali (dando origine a una trisomia), e, a meno che una non-disgiunzione non abbia anche interessato altri cromosomi, due copie di tutti gli altri cromosomi. L’altro tipo di gamete (privo del cromosoma) potrebbe essere non vitale. Se è vitale, una fusione con un gamete normale produrrà uno zigote con una sola copia di quel particolare cromosoma, invece delle due normali (dando origine a una monosomia), e due copie di tutti gli altri cromosomi. Una non-disgiunzione in meiosi II (vedi Figura 12.18) ha conseguenze meno gravi dal momento che vengono prodotti alcuni gameti normali. Come mostra la Figura 12.19, una non-disgiunzione in meiosi II produce due gameti normali e due anomali – vale a dire, un gamete con due cromosomi e un gamete mancante di quello stesso cromosoma. Fusioni di questi gameti con gameti normali producono tipi di zigoti come quelli appena discussi. Una non-disgiunzione può avvenire anche in mitosi, dando origine a cellule somatiche con assetti cromosomici anomali. Quando questo avviene in cellule somatiche adulte può portare a morte cellulare o dare origine a tumori; se invece è un evento post-zigotico, l’individuo che risulta sarà un mosaico, con cellule geneticamente diverse, alcune normali e altre mutate. (Tanto più precocemente nello sviluppo si avrà la mutazione, tante più cellule presenteranno il fenotipo mutato corrispondente.) In seguito a eventi di non-disgiunzione che portano a trisomie incompatibili con la sopravvivenza, uno dei cromosomi soprannumerari durante le prime mitosi che seguono la fecondazione può casualmente essere eliminato. Se la cellula mantiene due copie di un cromosoma di stessa origine parentale (materna o paterna) si parla di disomia uniparentale, in quanto consiste nell’ereditarietà di due cromosomi omologhi da un solo genitore. (Più raramente si può avere disomia uniparentale in seguito a errori di non-disgiunzione nella gametogenesi di entrambi i genitori a carico dello stesso cromosoma, per cui un gamete fornisce due copie di un cromosoma e l’altro nessuna.) Gli zigoti disomici in realtà mostrano un normale assetto cromosomico. Tuttavia, la distribuzione degli alleli sui cromosomi (in particolare quelli recessivi) può essere responsabile della comparsa “imprevista” di alcune patologie genetiche; inoltre, la presenza di geni imprinted (vedi Capitolo 18) sui cromosomi di stessa origine parentale può causare la comparsa di patologie a carico di questi geni. Non a caso, il fenomeno della disomia uniparentale è stata messa in evidenza per la prima volta in pazienti con sindrome di Angelman e di Prader-Willi (disomia del cromosoma 15, rispettivamente paterno e materno; vedi Capitolo 18).

Variazioni della struttura e del numero dei cromosomi

Tipi di aneuploidia Nell’aneuploidia uno o più cromosomi vengono persi o aggiunti rispetto all’assetto cromosomico normale (Figura 16.15). L’aneuploidia può verificarsi, per esempio, in seguito a perdita per non-disgiunzione di singoli cromosomi in meiosi o (raramente) in mitosi. Negli animali, l’aneuploidia degli autosomi è quasi sempre letale, per cui nei mammiferi viene riscontrata principalmente in feti abortiti. L’aneuploidia è più tollerata dalle piante, soprattutto nelle specie poliploidi (che hanno più di due set completi di cromosomi). Negli organismi diploidi, vi sono quattro categorie principali di aneuploidia (Figura 16.15). 1. La nullisomia implica la perdita di una coppia di cromosomi omologhi – la cellula è 2N – 2. (La nullisomia può verificarsi, per esempio, se una non-disgiunzione avviene per lo stesso cromosoma durante la meiosi in entrambi i genitori, con produzione di gameti privi di copie di quel cromosoma e con una copia di tutti gli altri cromosomi dell’assetto.) 2. La monosomia consiste nella perdita di un singolo cromosoma – la cellula è 2N – 1. (La monosomia può verificarsi, per esempio, se una non-disgiunzione durante la meiosi in un genitore produce un gamete privo di copie di un determinato cromosoma e con una copia di tutti gli altri cromosomi dell’assetto.) 3. La trisomia (una cellula trisomica) implica un singolo cromosoma in più – la cellula ha tre copie di un particolare cromosoma e due copie degli altri cromosomi. Una cellula trisomica è 2N + 1. (La trisomia può verificarsi, per esempio, se una non-disgiunzione durante la meiosi in un genitore produce un gamete con due copie di un dato cromosoma e una copia di tutti gli altri cromosomi dell’assetto.) 4. La tetrasomia (una cellula tetrasomica) comporta una coppia cromosomica in più; vale a dire, sono presenti quattro copie di un certo cromosoma e due copie degli altri cromosomi – la cellula è 2N + 2. (La tetrasomia può verificarsi, per esempio, se una nondisgiunzione avviene per lo stesso cromosoma durante la meiosi in entrambi i genitori, dando origine in ciascuno a un gamete con due copie di quel cromosoma e una copia di tutti gli altri cromosomi dell’assetto.) L’aneuploidia può comportare la perdita o l’aggiunta di più di uno specifico cromosoma o di una coppia di cromosomi. Per esempio, in un doppio monosomico sono presenti due cromosomi distinti ciascuno in una sola copia; vale a dire, la cellula è 2N – 1 – 1. In un doppio tetrasomico sono presenti due cromosomi ciascuno in quattro copie; vale a dire, la cellula è 2N + 2 + 2. In entrambi questi casi, la non-disgiunzione meiotica ha interessato due diversi cromosomi nella produzione di un gamete in un genitore.

419

Assetto cromosomico normale 1

2

3

4

Diploide (2N)

Aneuploidia Nullisomico (2N – 2)

Monosomico (2N – 1) Doppio monosomico (2N – 1 – 1) Trisomico (2N + 1)

Tetrasomico (2N + 2) Doppio tetrasomico (2N + 2 + 2)

Figura 16.15 Assetto normale (teorico) di cromosomi metafasici in un organismo diploide (2N) (in alto) ed esempi di aneuploidia (in basso).

La maggior parte delle forme di aneuploidia ha delle conseguenze gravi alla meiosi. I monosomici, per esempio, producono due tipi di gameti aploidi, N e N – 1. In alternativa, il cromosoma dispari, spaiato nella cellula 2N – 1, può andare perduto durante l’anafase meiotica e non venire incluso in nessuno dei nuclei figli, con produzione di due gameti privi di quel tipo di cromosoma. Per i trisomici, vi sono più possibilità di segregazione alla meiosi. Si consideri un trisomico di genotipo +/+/a in un organismo che può tollerare la trisomia e si ipotizzi che non avvenga crossing-over tra il locus a e il suo centromero. Allora, come illustrato nella Figura 16.16, una segregazione casuale dei tre tipi di cromosomi produce quattro classi genotipiche di gameti: 2(+ a) : 2(+) : 1(+ +) : 1(a). In un incrocio tra un trisomico +/+/a e un individuo a/a, il rapporto fenotipico atteso nella progenie è 5 selvatici (+) : 1 mutante (a). Questo rapporto si osserva in molti incroci di questo tipo. In seguito, esamineremo alcuni esempi di aneuploidia osservati nella popolazione umana. La Tabella 16.1 presenta una sintesi di varie anomalie aneuploidi relative agli autosomi e ai cromosomi sessuali nella popolazione umana. Esempi di aneuploidia dei cromosomi X e Y sono stati discussi nel Capitolo 12. Si ricordi che, nei mammiferi, l’aneuploidia relativa ai cromosomi sessuali si osserva negli adulti più frequentemente dell’aneuploidia

420

Capitolo 16 +2

+1

a

Tabella 16.1 Anomalie aneuploidi nella popolazione umana Cromosomi

I

II

+1 +2

o a

III

+2 +1

o a

a

+1 +2

Gameti prodotti dopo la II divisione meiotica aploide

disomico

+2/a +1/a III a +1/+2 In totale: 2 +/a : 2 + : 1 +/+ : 1 a I

II

+1 +2

Figura 16.16 Possibili segregazioni meiotiche in un individuo trisomico. È rappresentata la segregazione in un individuo con genotipo +/+/a, quando due cromosomi migrano a un polo e uno va all’altro polo, assumendo che non avvenga crossing-over tra il locus a e il suo centromero. I due alleli + sono indicati come +1 e +2 per distinguerli tra loro.

degli autosomi poiché, per effetto del meccanismo di compensazione di dose (lyonizzazione), mediante il quale i cromosomi X in eccesso vengono inattivati, le cellule possono tollerare cromosomi X in eccesso. Nell’uomo, una monosomia per un autosoma è rara e comunque non vitale. Presumibilmente embrioni monosomici non possono svilupparsi e vengono perduti precoFigura 16.17 Trisomia 21 (sindrome di Down). a) Cariotipo (bandeggio G)

Autosomi Trisomia 21 Trisomia 13 Trisomia 18 Cromosomi sessuali (individui femmine) X0, monosomia XXX, trisomia XXXX, tetrasomia XXXXX, pentasomia Cromosomi sessuali (individui maschi) XYY, trisomia XXY, trisomia XXYY, tetrasomia XXXY, tetrasomia

Sindrome

Down Patau Edwards

Frequenza alla nascita 1 su 1500 1 su 15 000 1 su 8000

Turner Tripla X

1 su 5000 1 su 1000

Jacob Klinefelter

1 su 1000 1 su 1000

cemente durante la gravidanza. Al contrario, trisomie degli autosomi sono responsabili di circa metà delle anomalie cromosomiche che causano morte fetale. Infatti, solo poche trisomie degli autosomi sono presenti in bambini nati vivi. La maggior parte di esse (trisomia 8, 13 e 18) determina una morte precoce. Solo nel caso della trisomia 21 (sindrome di Down) si ha sopravvivenza fino alla vita adulta. Trisomia 21 Una trisomia 21 (OMIM 190685) si verifica quando vi sono tre copie del cromosoma 21 (Figura 16.17a) con una incidenza di circa 3510 su un milione di concepimenti e di circa 1430 su 1 milione di nati vivi. Gli individui con la trisomia 21 hanno la sindrome di Down (Figura 16.17b) e manifestano una serie di anomalie, come un basso IQ (quoziente di intelligenza), pieghe cutanee all’angolo interno degli occhi (epicanti), b) Individuo con trisomia 21 (sindrome di Down)

Variazioni della struttura e del numero dei cromosomi

mani corte e tozze e statura al di sotto della media. La sindrome di Down prende il nome dal medico inglese della fine del diciannovesimo secolo, John Langdon Down, che per primo pubblicò, nel 1866, una descrizione accurata di un paziente affetto. La principale causa della sindrome di Down (detta in questo caso trisomia 21 libera) è una non-disgiunzione nella meiosi I nella madre (circa nel 75% dei casi) o nella meiosi II (circa nel 25% dei casi). Esiste una relazione diretta tra l’età della madre e la probabilità di avere un figlio affetto da trisomia 21 (Tabella 16.2). Durante lo sviluppo di un feto femminile prima della nascita, gli oociti primari nell’ovaio entrano in meiosi, ma si arrestano in profase I. In una femmina fertile ogni mese, durante l’ovulazione, il nucleo di un oocita secondario (Capitolo 12) inizia la seconda divisione meiotica, ma procede solo fino alla metafase, quando la divisione si arresta di nuovo. Se uno spermatozoo penetra nell’oocita secondario, la seconda divisione meiotica viene completata. La probabilità di non-disgiunzione aumenta con l’aumentare del tempo in cui l’oocita primario è rimasto nell’ovaio. Per questo è consigliato a future madri in età avanzata di sottoporsi a esami diagnostici prenatali, quali per esempio l’amniocentesi o il prelievo di villi coriali (descritti nel Capitolo 4), per verificare che il feto abbia un assetto cromosomico normale. (Si noti che con l’avanzare dell’età materna aumenta l’incidenza anche di altre malattie cromosomiche). Anche se meno frequenti (meno del 5% delle trisomie libere), si osservano casi di trisomia 21 causata da nondisgiunzione nei padri durante la spermatogenesi. La correlazione con l’età del padre è però meno stringente. Esistono altri fattori di rischio riguardo alla sindrome di Down? È stata osservata una maggiore incidenza della sindrome in madri con meno di 35 anni e fumatrici, che aumenta ulteriormente se fanno anche uso di contraccettivi orali. Il solo uso di contraccettivi orali non influenza l’incidenza della sindrome di Down. La sindrome di Down può anche derivare da un tipo diverso di mutazione cromosomica, definita fusione centrica o traslocazione robertsoniana, che porta alla presenza di tre copie del braccio lungo del cromosoma 21. (La traslocazione è chiamata così dal nome del genetista Tabella 16.2 Relazione tra età della madre e rischio

421

W.R.B. Robertson che per nimazione primo descrisse questo tiSindrome di Down po di mutazione cromosocausata da una mica.) Questa forma di traslocazione sindrome di Down, defirobertsoniana nita sindrome di Down familiare, è responsabile del 5% di casi. Una traslocazione robertsoniana è un tipo di traslocazione reciproca, in cui due cromosomi acrocentrici (cromosomi con i centromeri vicini alle estremità) non omologhi si rompono a livello dei centromeri e i bracci lunghi si ritrovano attaccati a un unico centromero (Figura 16.18). I bracci corti si uniscono a loro volta a formare il prodotto reciproco, che generalmente contiene geni non essenziali e ridondanti nel genoma e viene abitualmente perduto entro poche divisioni cellulari senza conseguenze per la cellula. Nell’uomo, quando una traslocazione robertsoniana unisce il braccio lungo del cromosoma 21 al braccio lungo del cromosoma 14 (o 15), il portatore eterozigote è fenotipicamente normale, in quanto possiede due copie di tutti i bracci lunghi dei cromosomi e quindi due copie di tutti i geni essenziali. Vi è un rischio elevato di sindrome di Down nei figli di portatori eterozigoti (Figura 16.19). Il genitore portatore eterozigote può produrre infatti tre coppie reciproche di gameti, dove ogni coppia è il risultato di una diversa segregazione dei tre cromosomi coinvolti: (1) 14/21 (14 e 21 traslocati) + 21 e 14; (2) 14/21 + 14 e 21; (3) 14/21 e 14 + 21. Gli zigoti sono prodotti dalla fusione di questi gameti con i gameti normali 14 e 21 prodotti dall’altro genitore. La Figura 16.19 mostra i risultati di questa fusione. In un solo caso viene prodotto uno zigote normale con due cromosomi 14 e due cromosomi 21. Un altro zigote con fenotipo normale è un portatore, con tre cromosomi: 14, 21 e 14/21. Viene prodotto inoltre un altro zigote vitale con i cromosomi 14, 14/21, 21 e 21 che presenta però la trisomia 21 (sindrome di

Rottura e riunione +

+

di trisomia 21 Età materna 16-26 27-34 35-39 40-44 45-47 Indipendentemente dall’età

Frammento (generalmente perduto)

Rischio di trisomia 21 nel figlio da 1:1500 a 1:1200 da 1:1000 a 1:500 da 1:400 a 1:150 da 1:100 a 1:40 da 1:30 a 1:10 1:1500

Cromosomi acrocentrici normali, non-omologhi

Traslocazione robertsoniana

Figura 16.18 Traslocazione robertsoniana. Produzione di una traslocazione robertsoniana (fusione centrica) mediante rottura di due cromosomi acrocentrici a livello dei centromeri (indicati dalle frecce) e fusione dei due bracci lunghi e dei due bracci corti.

MyLab

422

Capitolo 16 Genitore portatore

Genitore normale

14 14

21

14



21

21

14

21

Gamete del genitore normale 14 Gamete del genitore portatore 14

21

21 14

21

21

14

21

21

Zigote con trisomia 21: sindrome di Down 14

14

14 21

Zigote con monosomia 21: non vitale

14

21

14

14

21

14 21

14 Zigote con trisomia 14: non vitale 21

21

14 21

Zigote con monosomia 14: non vitale

14

21

14

21

Una piccola percentuale di individui Down (circa 2-3%) presenta una trisomia “parziale” e quindi manifestazioni cliniche più lievi. Ciò può essere dovuto a duplicazioni (che interessano la banda q21-q22 del cromosoma 21) o a non-disgiunzione mitotica del cromosoma 21 durante lo sviluppo embrionale. In quest’ultimo caso, l’individuo manifesterà un mosaicismo genetico. Come già accennato in questo capitolo, tanto più tardiva sarà la mutazione, tanto minore sarà la progenie cellulare mutata (e i sintomi presentati saranno più lievi). Trisomia 13 La trisomia 13 determina la sindrome di Patau (Figura 16.20). Circa 2 su 10 000 nati vivi presentano trisomia 13. I tratti caratteristici degli individui con trisomia 13 sono, tra gli altri, labioschisi e palatoschisi, occhi piccoli, polidattilia (dita soprannumerarie delle mani e dei piedi), ritardo mentale e dello sviluppo e anomalie cardiache. La maggior parte dei neonati muore prima dei 3 mesi di vita. Trisomia 18 La trisomia 18 causa la sindrome di Edwards (Figura 16.21), che si verifica in circa 2,5 su 10 000 nati vivi. Per ragioni ancora sconosciute, circa l’80% dei neonati con sindrome di Edwards è femmina. Gli individui con trisomia 18 sono piccoli alla nascita e hanno malformazioni congenite multiple che interessano quasi tutti gli organi del corpo. Dita flesse, cranio allungato, orecchie con impianto basso, ritardo mentale e di sviluppo, e molte altre anomalie associate alla sindrome. Il 90% dei bambini con trisomia 18 muore entro i 6 mesi, spesso per problemi cardiaci.

14

Cambiamenti di interi assetti cromosomici

21

La monoploidia e la poliploidia implicano variazioni, rispetto alla condizione normale, del numero di interi assetti cromosomici. Dato che, in entrambi i casi, è interessato il numero di assetti cromosomici completi, monoploidi e poliploidi sono entrambi euploidi. La monoploidia e la poliploidia sono letali per la maggior parte delle specie animali, ma hanno minori conseguenze nelle piante dove entrambe hanno addirittura svolto un ruolo rilevante nella loro speciazione e diversificazione. Cambiamenti relativi ad assetti cromosomici completi possono derivare, per esempio, quando la prima o la seconda divisione meiotica è abortiva (assenza di citocinesi) o quando avviene una non-disgiunzione meiotica che coinvolge tutti i cromosomi. Se tale non-disgiunzione avviene in meiosi I, metà dei gameti non ha alcun assetto cromosomico e l’altra metà ha due assetti cromosomici (Figura 12.18b). Se tale non-disgiunzione avviene in meiosi II, metà dei gameti ha un unico assetto normale di cromosomi, un quarto ha due assetti cromosomici e un quarto non ha alcun assetto cromosomico (Figura 12.18c). La fusione di un gamete con due assetti cromo-

Zigote portatore: fenotipo normale 14

14

14

21

21

21

Zigote normale: individuo normale

Figura 16.19 Le tre possibili segregazioni di una traslocazione robertsoniana eterozigote tra i cromosomi 14 e 21 nell’uomo. La fusione dei gameti risultanti con i gameti di un genitore normale produce degli zigoti con diverse combinazioni di cromosomi normali e traslocati.

Down). Infine, possono essere prodotti tre zigoti non vitali, uno con monosomia 21, uno con trisomia 14 e uno con monosomia 14. Riassumendo, solo metà degli zigoti prodotti sono vitali; tra questi, 1/3 è normale, 1/3 è portatore della traslocazione e 1/3 è affetto da sindrome di Down.

Variazioni della struttura e del numero dei cromosomi a) Cariotipo (bandeggio G)

b) Individuo con trisomia 13 (sindrome di Patau)

Figura 16.20 Trisomia 13 (sindrome di Patau).

somici con un gamete normale darà origine a uno zigote poliploide – in questo caso, a uno con tre assetti cromosomici, un triploide (3N). Analogamente, la fusione di due gameti, ciascuno con due assetti cromosomici, produce uno zigote tetraploide (4N). Può verificarsi poliploidia anche in cellule somatiche in seguito a non-disgiunzione mitotica di assetti cromosomici completi. Individui monoploidi (aploidi), al contrario, si sviluppano generalmente da uova non fecondate. Monoploidia Un individuo monoploide ha un solo assetto di cromosomi invece dei due assetti normali (Figura 16.22a). La monoploidia si osserva solo raramente in organismi adulti diploidi. A causa della presenza nei cromosomi di molti organismi eucarioti diploidi di mutazioni letali recessive (che sono normalmente neutralizzate da alleli dominanti wild-type in individui eterozigoti), molti organismi monoploidi probabilmente non sopravvivono. Alcune specie presentano organismi monoploidi che costituiscono una fase normale del loro ciclo vitale. Alcune formiche, api e vespe maschi, per esempio, sono

usualmente monoploidi, perché si sviluppano da uova non fecondate. Le cellule di un individuo monoploide sono molto utili per l’ottenimento di mutanti, dato che vi è una sola dose di ciascun gene. Di conseguenza, i mutanti possono essere isolati direttamente senza complicazioni dovute alla dominanza o alla recessività. Poliploidia La poliploidia è la conformazione cromosomica di una cellula, o di un organismo, che possiede più di due assetti normali di cromosomi omologhi (Figura 16.22b). La poliploidia può insorgere spontaneamente o essere indotta sperimentalmente. Spesso deriva da un’alterazione dell’apparato del fuso in una o più divisioni meiotiche o in divisioni mitotiche. Quasi tutte le piante e gli animali hanno probabilmente alcuni tessuti poliploidi. Per esempio, l’endosperma delle piante è triploide, il fegato dei mammiferi e forse di altri vertebrati è poliploide e il neurone addominale gigante della lepre di mare Aplysia possiede circa 75 000 copie del genoma. Le piante interamente poliploidi comprendono il frumento, esaploide (6N), e la fragola, ottoploide (8N). Alcune specie animali come un pesce d’acqua dolce del Nordamerica, il salmone e alcune salamandre sono poliploidi.

Figura 16.21 Trisomia 18 (sindrome di Edwards). a) Cariotipo (bandeggio G)

423

b) Individuo con trisomia 18 (sindrome di Edwards)

424

Capitolo 16 Assetto cromosomico normale 2 1

3

Diploide (2N)

a) Monoploidia (un solo assetto cromosomico)

Monoploide (N)

b) Poliploidia (più del numero normale di assetti cromosomici) Triploide (3N)

Tetraploide (4N)

Figura 16.22 Variazioni nel numero di interi assetti cromosomici.

Esistono due classi di poliploidi: quelli che hanno un numero pari di assetti cromosomici e quelli che ne hanno un numero dispari. I poliploidi con un numero pari di assetti cromosomici hanno una maggiore probabilità di essere almeno parzialmente fertili, dato che esiste la possibilità per i cromosomi omologhi di segregare correttamente durante la meiosi. I poliploidi con un numero dispari di assetti hanno sempre un cromosoma spaiato di ogni paio, per cui la probabilità di produrre un gamete bilanciato è estremamente bassa; questi organismi sono generalmente sterili o hanno un’aumentata probabilità di abortire lo zigote. Nei triploidi, il nucleo di una cellula possiede tre assetti di cromosomi. Di conseguenza, i triploidi sono molto instabili durante la meiosi dato che, come nei trisomici, due dei tre cromosomi omologhi migrano a un polo e l’altro va all’altro polo. Nei triploidi la segregazione di ciascun cromosoma dal suo omologo avviene a caso, per cui la probabilità di produrre gameti bilanciati contenenti o un assetto cromosomico aploide o uno diploide è molto bassa; molti gameti saranno sbilanciati, in quanto avranno una copia di un cromosoma, due copie di un altro, e così via. In generale, la probabilità che un triploide produca un gamete aploide è (1/2)n, dove n è il numero dei cromosomi. Nell’uomo, il tipo di poliploidia più comune è la triploidia, che è sempre letale. Si osserva triploidia nel 1520% di aborti spontanei e in circa 1 caso su 10 000 nati vivi, ma la maggior parte dei bambini affetti muore entro un mese. I neonati triploidi manifestano molte anomalie, compresa una caratteristica testa allargata. Anche la te-

traploidia nell’uomo è sempre letale, generalmente prima della nascita. Si osserva in circa il 5% degli aborti spontanei. Molto raramente nascono neonati tetraploidi che, in seguito, non sopravvivono a lungo. La poliploidia ha meno conseguenze per le piante. Una ragione del fenomeno è che molte piante vanno incontro ad autofecondazione, per cui, se viene prodotta una pianta con un numero di assetti cromosomici poliploide pari (per esempio, 4N), essa può ancora produrre gameti funzionali e riprodursi. Nelle piante si riscontrano due tipi di poliploidia. Nell’autopoliploidia, tutti gli assetti cromosomici derivano dalla stessa specie. Questa condizione probabilmente si origina da un difetto durante la meiosi, che produce gameti diploidi o triploidi. Se un gamete diploide si fonde con un gamete normale aploide, lo zigote, e l’organismo che ne deriva, avrà tre corredi cromosomici: in altri termini, sarà triploide. La banana coltivata è un esempio di pianta autopoliploide triploide. Dato che possiede un numero dispari di assetti cromosomici, i gameti hanno un numero variabile di cromosomi e vengono prodotti pochi semi fertili, il che rende la maggior parte dei frutti senza semi e altamente appetitosa. Data la condizione triploide, le banane coltivate vengono riprodotte per via vegetativa (per talea). In generale, la possibilità di sviluppare frutti senza semi, come la vite e l’anguria, dipende da una poliploidia di numero dispari. È stata osservata triploidia anche in piante erbacee, ornamentali, in cereali e in piante forestali. Nell’allopoliploidia, gli assetti cromosomici implicati derivano da specie diverse, anche se generalmente correlate. Questa situazione può originarsi se due specie diverse s’incrociano producendo un organismo con due assetti cromosomici aploidi provenienti uno da ciascun genitore (un assetto di ciascuna specie) e poi entrambi gli assetti cromosomici vengono raddoppiati. Per esempio, la fusione di gameti aploidi di due piante diploidi che sono in grado di incrociarsi può produrre una pianta ibrida N1 + N2, che ha un assetto cromosomico aploide proveniente dalla pianta della specie 1 e un assetto aploide derivante dalla pianta della specie 2. D’altra parte, a causa delle differenze tra i due assetti cromosomici, in meiosi non avviene l’appaiamento dei cromosomi e non vengono prodotti gameti vitali. Come conseguenza, le piante ibride sono sterili. Raramente, a causa di un errore nella divisione, i due assetti cromosomici raddoppiano, producendo tessuti di genotipo 2N1 + 2N2 (vale a dire, le cellule nel tessuto hanno un assetto cromosomico diploide derivato dalla pianta della specie 1 e un assetto diploide proveniente dalla pianta della specie 2). Ogni assetto diploide può funzionare normalmente durante la meiosi, per cui i gameti prodotti dalla pianta 2N1 + 2N2 sono N1 + N2. La fusione dei due gameti può produrre piante del tutto fertili, allotetraploidi, 2N1 + 2N2.

Variazioni della struttura e del numero dei cromosomi

Un esempio classico di allopoliploidia è quello derivato da incroci tra cavolo (Brassica oleracea) e rafano (Raphanus sativus) effettuati da Karpechenko nel 1928. Entrambe le piante genitrici hanno un numero cromosomico di 18 e anche gli ibridi della F1 hanno 18 cromosomi, 9 provenienti da un genitore e 9 dall’altro. Gli ibridi prodotti sono morfologicamente intermedi tra il cavolo e il rafano. Le piante della F1 sono per la maggior parte sterili, data l’incapacità dei cromosomi di appaiarsi in meiosi. Tuttavia, accade che vengano prodotti pochi semi a causa di errori durante la meiosi e alcuni di questi semi sono fertili. Le cellule somatiche delle piante prodotte da questi semi hanno 36 cromosomi – vale a dire, assetti cromosomici diploidi completi sia del cavolo sia del rafano. Queste piante sono del tutto fertili e appartengono a una specie denominata Raphanobrassica, una fusione dei nomi dei generi parentali. Morfologicamente, queste piante assomigliano agli ibridi della F1. Infine, molti semi commerciali, la maggior parte dei cereali e molti fiori commerciali comuni sono poliploidi. Infatti, in agricoltura e in orticoltura la poliploidia è la regola e non l’eccezione. Per esempio, il frumento, Tri-

425

ticum aestivum, è un alloesaploide con 42 cromosomi. Questa pianta è derivata da tre specie diverse, e il contributo di ciascuna di esse è un assetto diploide di 14 cromosomi. La meiosi è normale, dato che si appaiano solo cromosomi omologhi, per cui la pianta è fertile.

Nota chiave Variazioni nel numero cromosomico di una cellula o di un organismo danno origine ad aneuploidia, monoploidia e poliploidia. Nell’aneuploidia una cellula, o un organismo, ha uno o due o alcuni cromosomi interi in più o in meno, rispetto al numero base della specie in questione. Nella monoploidia un organismo, normalmente diploide, ha un solo assetto di cromosomi. Nella poliploidia un organismo ha un numero di assetti cromosomici superiore al normale. Alcune di queste condizioni anomale possono avere delle gravi conseguenze per l’organismo.

Sommario l Le mutazioni cromosomiche sono variazioni, rispetto alla condizione normale, del numero o della struttura dei cromosomi. Le mutazioni cromosomiche possono avvenire spontaneamente o essere indotte da agenti chimici o da radiazioni. l La delezione è la perdita di un segmento di DNA, la duplicazione è l’aggiunta di una o più copie extra di un segmento di DNA, l’inversione è il cambiamento di orientamento di un segmento di DNA in un cromosoma e la traslocazione è lo spostamento di un segmento di cromosoma in un’altra localizzazione del genoma. l In determinate condizioni di coltura in vitro, alcuni cromosomi sviluppano delle strozzature o regioni non colorate definite siti fragili. Questi sono loci ereditabili, distribuiti non casualmente sui cromosomi umani, che presentano un’aumentata frequenza di rotture cromosomiche in condizioni di stress replicativo. In corrispondenza di alcuni di essi sono stati ritrovati geni responsabili di patologie genetiche, come la sindrome dell’X-fragile, e tumori.

l Le variazioni nel numero dei cromosomi di una cellula o di un organismo consistono in aneuploidia, monoploidia e poliploidia. Nell’aneuploidia vi sono uno, due o più cromosomi interi in più o in meno del normale numero diploide. Nella monoploidia ciascuna cellula dell’organismo ha un solo assetto di cromosomi e nella poliploidia ve ne sono più di due. l Un cambiamento nel numero o nella struttura dei cromosomi può avere conseguenze serie o addirittura letali per l’organismo. Negli eucarioti, fenotipi anomali possono derivare da una anormale segregazione cromosomica durante la meiosi, dalla distruzione di geni per rottura cromosomica, o da livelli alterati di espressione genica quando il numero di copie di uno o più geni (dosaggio genico) è modificato oppure quando il riarrangiamento separa un gene dalla sua sequenza regolatrice. Variazioni nel numero e alterazioni della struttura dei cromosomi nelle cellule somatiche sono responsabili dello sviluppo di molti tumori umani.

Approccio analitico alla soluzione di problemi di genetica D16.1 Disegnate la conformazione, durante l’appaiamento meiotico, dei quattro cromatidi in un’inversione eterozigote a b c d e f g / a′ b′ f′e′d′c′g′. Supponete che il centromero sia alla sinistra del gene a. Successivamente, disegnate la configurazione che si avrebbe in anafase I se fosse avvenuto un crossingover tra i geni d ed e.

R16.1 Questa domanda richiede una conoscenza della meiosi (Figura 12.9) e la capacità di disegnare e maneggiare correttamente un anello d’inversione. La parte a della figura riportata a pagina seguente schematizza l’appaiamento meiotico: Si noti che il paio di cromatidi in basso (a′, b′ ecc.) deve formare un’ansa affinché tutti i geni si appaino; questo anello è tipi-

426

Capitolo 16

a)—Appaiamento meiotico

Crossing-over

d

e e

d d„ c

c

d„ e„

c„ c„

e„

f„ f„

f

f

1 2

a a

b b

g g

3

a„

b„

4

a„

b„

g„ g„

b)—Anafase I 1 2

a a

b b

c c

a„

b„

f„

a„

b„

f„

e e

d

Ponte dicentrico 4 3

d

f

g

f

g

Frammento acentrico perduto

e„ e„

d„

c„

g„

d„

c„

g„

co del meccanismo di appaiamento atteso per un’inversione eterozigote. Dopo avere disegnato il primo schema, la risposta alla seconda parte della domanda è immediata. Disegniamo il crossing-over, poi seguiamo ogni cromatidio a partire dall’estremità con il centromero fino all’altra estremità. È utile distinguere i geni paterni e materni, a′ rispetto ad a e così via, come è stato fatto nella parte a della figura. Il risultato del crossing-over tra d ed e è mostrato nella parte b. In anafase I della meiosi, i due centromeri, ciascuno con due cromatidi attaccati, migrano verso i poli opposti della cellula. In anafase i cromatidi non ricombinanti (i cromatidi in alto e in basso nella figura) segregano normalmente ai poli. Tuttavia, come risultato di un crossing-over singolo tra gli altri due cromatidi vengono prodotte delle configurazioni di cromatidi insolite, che si ricostruiscono seguendo i cromatidi da sinistra a destra. Se iniziamo a seguire il secondo cromatidio a partire dall’alto, abbiamo:

spesso non sono vitali. Tuttavia, vengono prodotti gameti vitali dai cromatidi non-ricombinanti. Uno di questi cromatidi (1 nella parte b della figura) ha la sequenza di geni normale, l’altro (3 nella parte b della figura) presenta la sequenza genica invertita. D16.2 Eyeless è un gene recessivo (ey) sul cromosoma 4 di Drosophila melanogaster. I moscerini omozigoti per ey hanno occhi piccoli o non li hanno del tutto. Un maschio trisomico per il cromosoma 4 con genotipo +/+/ey viene incrociato con una femmina eyeless diploide normale, di genotipo ey/ey. Quali rapporti genotipici e fenotipici sono attesi in base all’assortimento casuale dei cromosomi nei gameti? R16.2 Per rispondere a questa domanda, dobbiamo applicare le nostre conoscenze sulla meiosi alla situazione insolita di una cellula trisomica. Relativamente alla femmina ey/ey, può essere prodotta solo una classe di gameti, e precisamente cellule uovo di genotipo ey. La produzione di gameti, relativamente alla trisomia del cromosoma 4, avviene mediante una segregazione casuale per la quale, alla meiosi I, due cromosomi migrano a un polo e l’altro cromosoma migra all’altro polo. (Questa modalità è simile alla segregazione meiotica mostrata per la non-disgiunzione secondaria delle cellule XXY; si veda il Capitolo 12.) Sono possibili tre tipi di segregazione nella formazione dei gameti nella trisomia, come illustrato nella parte a della figura a fianco. L’unione casuale di questi spermatozoi con le cellule uovo di genotipo ey avviene come mostrato nella parte b e i rapporti genotipici e fenotipici risultanti sono illustrati nella parte c. a) Segregazione +1 +2 /ey +2 +1 /ey

+1 /+2 ey

a b c d e f′ b′ a′ °

°

cioè un cromatidio dicentrico (dove ° è un centromero); in altre parole, abbiamo un singolo cromatidio attaccato a due centromeri. Questo cromatidio, inoltre, presenta duplicazioni e delezioni di alcuni geni. Perciò, in anafase questo cromosoma cosiddetto dicentrico viene stirato tra i due poli della cellula mentre i centromeri si separano, e può rompersi in un punto a caso. L’altro prodotto dell’evento singolo di crossing-over è un frammento acentrico (un frammento senza centromero) che può essere individuato seguendo, a partire da destra, il secondo cromatidio dall’alto. Questo cromatidio:

1/ 1/ 6 6

1/ 6

1/

1/ 6

6

1/

6

b) Unione

Spermatozoi

Cellule uovo ey

Fenotipi

+/+

+/+/ey

+

ey

ey/ey

ey

+ +/ey + +/ey

+/ey +/ey/ey +/ey +/ey/ey

+ + + +

g f e d′ c′ g′ non contiene né una serie completa di geni né un centromero; è un frammento acentrico che andrà perduto mentre la meiosi procede. Quindi, la conseguenza di un evento di crossing-over entro l’anello d’inversione in un’inversione eterozigote è la produzione di gameti con geni duplicati o deleti. Questi gameti

c) Schema dei genotipi e fenotipi Rapporti:

Genotipi 6 +/+/ey

1/

1/

+/ey/ey 3 +/ey

1/

6

1/

3

ey/ey

Fenotipi wild-type

5/ 6 1/ 6

eyeless

17

Regolazione dell’espressione genica nei batteri e nei batteriofagi

Come è regolata l’espressione genica nei batteri?

Attività Una delle migliori strategie per la sopravvivenza di un organismo è la capacità di adattarsi velocemente ai cambiamenti ambientali. Questo si realizza grazie alla capacità delle cellule viventi di attivare o disattivare l’espressione dei geni in risposta a stimoli extracellulari. In questo modo le cellule possono produrre specifiche proteine dove e quando sono richieste. In questo capitolo imparerete alcuni dei modi in cui è regolata l’espressione genica nei microrganismi. Poi, nella iAttività, potrete scoprire come le mutazioni alterano il processo di regolazione in E. coli.

I batteri sono organismi unicellulari autonomi che crescono aumentando di massa e poi si dividono per scissione binaria. La crescita e la divisione sono controllate da geni, la cui espressione deve essere regolata in modo appropriato. In generale, i geni la cui attività è controllata in risposta alle necessità della cellula o dell’organismo vengono chiamati geni regolati. Tutti gli organismi posseggono anche un gran numero di geni i cui prodotti sono essenziali per il normale funzionamento della cellula che cresce e si divide, quali che siano le condizioni in cui si trova. Questi geni sono sempre attivi nelle cellule in crescita e sono chiamati geni costitutivi o geni housekeeping. Tra di essi vi sono i geni che codificano per enzimi necessari per la sintesi proteica e per il metabolismo del glucosio. Si tenga presente, però, che tutti i geni sono regolati a qualche livello. Se, per qualche ragione, le funzioni cellulari sono danneggiate, l’espressione di tutti i geni, compresi i costitutivi, viene regolata negativamente. Quindi, la distinzione tra geni regolati e costitutivi è, in qualche misura, arbitraria. L’obiettivo di questo capitolo è illustrare i meccanismi attraverso i quali l’espressione genica viene regolata nei batteri e nei batteriofagi. È importante notare che i geni che codificano per proteine coinvolte nello stesso processo metabolico o in funzioni strettamente correlate

Come è regolata l’espressione genica nei batteriofagi?

di solito sono disposti uno adiacente all’altro e vengono trascritti insieme in un mRNA policistronico (poligenico), chiamato così perché contiene l’informazione per più geni (il termine cistrone è usato come sinonimo di gene). La regolazione della sintesi di questo mRNA dipende dall’interazione tra proteine regolatrici e sequenze regolatrici che si trovano adiacenti alla sequenza dei geni. I geni trascritti insieme e le relative sequenze regolatrici costituiscono l’operone. Gli studi sulla regolazione genica nei batteri e nei batteriofagi hanno fornito rilevanti informazioni sui meccanismi di regolazione anche negli organismi superiori, uomo incluso, anche se non si è ancora giunti a spiegarli in maniera esaustiva. Le 4,6 Mb (4,6 × 106 bp) del genoma di E. coli, per esempio, contengono, in base alla sequenza del genoma, 4288 geni che codificano per proteine. I ricercatori sono in grado di indicare le possibili funzioni di circa l’80% di questi geni, ma rimane ancora molto da capire riguardo alle loro funzioni complete e alla loro regolazione. Restano comunque sconosciute le funzioni del rimanente 20%. Il Focus sul genoma di questo capitolo descrive un modello bioinformatico della regolazione dell’espressione genica in un procariote, l’Halobacterium salinum.

L’operone lac di E. coli L’aggiunta di una molecola (per esempio il lattosio) al terreno di crescita di un batterio attiva l’espressione di specifici geni, chiamati geni inducibili. La molecola che determina l’attivazione genica è chiamata induttore e il fenomeno per cui si ha l’espressione di un gene in risposta a un induttore è definito induzione. L’induttore è un esempio di una classe di piccole molecole chiamate effettori o molecole effettrici, che partecipano al controllo dell’espressione di molti geni regolati. La trascrizione di un gene inducibile avviene in risposta a un evento di regolazione che ha luogo in corrispondenza di una specifica sequenza regolatrice di DNA, adiacente o vicina al-

428

Capitolo 17

Focus sul genoma Modelli di espressione genica La combinazione di metodi di indagine genomica, trascrittomica, proteomica e di microarray a DNA (Capitolo 9) ha consentito agli scienziati di cominciare a costruire modelli bioinformatici per prevedere come una cellula risponda ai cambiamenti ambientali. Questi modelli possono aiutare a capire quali geni saranno espressi in determinate condizioni e quali proteine che legano il DNA regoleranno l’espressione di tali geni. In uno studio del genere, la bioinformatica è stata utilizzata per fornire previsioni sulle possibili funzioni di ciascuna delle 2400 proteine codificate nella sequenza genomica completa di un Archaea, l’Halobacterium salinum. Gli studiosi hanno quindi messo a punto una serie di esperimenti con microarray a DNA per esaminare l’espressione di tutti i 2400 geni in specifiche condizioni ambientali. Per esempio, hanno confrontato l’espressione genica in cellule cresciute in presenza di alti livelli di nichel con quella di cellule cresciute in ambiente privo di nichel. I microarray sono stati utilizzati anche per testare le funzioni di specifici geni. Per esempio, gli studiosi hanno confrontato l’espressione genica in cellule wild-type (selvatiche) con quella di cellule che presentavano una mutazione che impediva la produzione del fattore di trascrizione TFBf. Usando questo genere di dati, i ricercatori hanno potuto costruire un modello bioinformatico in grado di predire con accuratezza la risposta trascrizionale della cellula a condi-

la sequenza che codifica per la proteina (Figura 17.1). L’evento regolativo di solito coinvolge un induttore e una proteina regolatrice. Quando ciò avviene, l’RNA polimerasi inizia la trascrizione dal promotore (di solito a monte della sequenza regolatrice). Il gene quindi è attivato, viene prodotto l’mRNA e sintetizzata la proteina codificata dal gene. La sequenza regolatrice di per sé non codifica per alcun prodotto. Come esempio di questo tipo di regolazione genica, verrà esposta la regolazione dei geni dell’operone lac in E. coli, un operone inducibile.

Il lattosio come fonte di carbonio per E. coli E. coli può crescere in un terreno minimo che contiene sali (inclusa una fonte di azoto) e una fonte di carbonio, come il glucosio. L’energia per le reazioni biochimiche nella cellula deriva dal metabolismo del glucosio. Gli enzimi richiesti per il metabolismo del glucosio sono codificati da geni costitutivi. Se a E. coli viene fornito come fonte di carbonio il lattosio, invece del glucosio, viene immediatamente sintetizzato un certo numero di

zioni ambientali o genetiche nuove. Quando hanno testato il loro modello rispetto a esperimenti concreti, in cui si usavano nuove combinazioni di cambiamenti ambientali o genetici, hanno trovato che esso poteva prevedere accuratamente la risposta dell’80% dei geni espressi nella cellula. Essi hanno quindi potuto raggruppare i geni in bicluster, cioè gruppi di geni che rispondono nello stesso modo a una serie di cambiamenti ambientali e/o genetici, la cui espressione è regolata verosimilmente dalle stesse proteine cellulari. Per esempio, la trascrizione dei 34 geni del bicluster 66 è regolata da fattori ambientali come ossigeno e luce, e dai fattori di trascrizione TFBf e Cspdl. A che cosa possono servirci questi modelli? Possiamo estrapolare le possibili funzioni per quei geni di cui non si hanno dati bioinformatici. Per esempio, la bioinformatica non ha fornito informazioni ai ricercatori sulle funzioni della proteina codificata dal gene VNG1459H. Questo gene è stato localizzato in un bicluster con geni che codificano per proteine che aiutano la cellula a rispondere alla luce. Ciò suggerisce un ruolo per VNG1459H nella risposta alla luce e i ricercatori sono stati in grado di trovare la proteina localizzata in una regione cellulare coinvolta nella rilevazione della luce. Geni identificati mediante questo approccio possono essere utilizzati per ingegnerizzare microorganismi per applicazioni in campo chimico e ambientale.

enzimi necessari per metabolizzare questo zucchero. (Una simile serie di eventi, ciascuno dei quali coinvolge enzimi specifici per il tipo di zucchero, viene parimenti indotta da altri tipi di zuccheri.) Gli enzimi vengono sintetizzati perché i geni che codificano per essi cominciano a essere trascritti attivamente in presenza dello zucchero; questi stessi geni sono inattivi se lo zucchero è assente. In altre parole, questi sono geni regolati, i cui Gene Sito Terminatore Promotore di controllo Sequenza codificante DNA Induzione Trascrizione e traduzione avvengono solo dopo induzione Prodotto genico

Proteina

I geni inducibili sono espressi solo in assenza di un repressore e/o in presenza di una molecola effettrice/induttrice.

Figura 17.1 Organizzazione generale di un gene inducibile.

Regolazione dell’espressione genica nei batteri e nei batteriofagi

rone del lattosio è minima e inefficiente. Pertanto vengono prodotte solo poche molecole di ciascuna di queste tre proteine. Per esempio, in queste condizioni nella cellula vi sono in media solo tre molecole di β-galattosidasi. Se invece nel terreno di coltura è presente il lattosio, ma non il glucosio, il numero di molecole di ciascuna delle tre proteine aumenta in modo coordinato (simultaneamente) di circa mille volte (cioè, le molecole di β-galattosidasi per cellula diventano circa 3000) perché i tre geni che erano praticamente inattivi sono ora attivamente trascritti. Questo processo è chiamato induzione coordinata. La molecola induttore, direttamente responsabile dell’aumento di produzione delle tre proteine, è l’allolattosio, non il lattosio (vedi Figura 17.2). Inoltre, l’mRNA che codifica per questi enzimi ha vita media breve, cosicché i trascritti devono essere continuamente prodotti perché gli enzimi vengano sintetizzati. Quando il lattosio non è più presente, la trascrizione dei tre geni si interrompe e tutti gli mRNA presenti vengono degradati, di modo che le proteine non vengano più prodotte. Le proteine esistenti vengono degradate e diluite man mano che la cellula cresce e si divide.

prodotti sono necessari solo in determinati momenti, ovvero quando è presente lattosio come unica fonte di carbonio disponibile nel terreno. Il lattosio è un disaccaride composto da due monosaccaridi, il D-glucosio e il D-galattosio. Quando il lattosio deve essere metabolizzato, vengono sintetizzate tre proteine: 1. la b-galattosidasi, enzima che catalizza la scissione del lattosio in glucosio e galattosio e l’isomerizzazione (conversione a un diverso isomero) del lattosio ad allolattosio, un composto importante nella regolazione dell’espressione dei geni dell’operone lac (Figura 17.2). (Nella cellula, il galattosio è convertito in glucosio dall’azione di enzimi codificati da un sistema di geni specifico per il catabolismo del galattosio. Il glucosio viene poi utilizzato tramite gli enzimi prodotti costitutivamente); 2. la lattosio permeasi (chiamata anche proteina M) si trova nella membrana citoplasmatica di E. coli ed è necessaria per il trasporto attivo del lattosio all’interno della cellula; 3. la b-galattoside transacetilasi è un enzima che trasferisce un gruppo acetilico dall’acetil-CoA ai β-galattosidi. La funzione di questa proteina nell’operone lac è poco chiara.

Prove sperimentali della regolazione dei geni lac La nostra comprensione dell’organizzazione dei geni, delle sequenze di regolazione coinvolte nell’utilizzo del lattosio e del controllo dell’espressione dei geni lac in E.

In un ceppo di E. coli selvatico che cresce in un terreno che contiene glucosio, la trascrizione dei geni dell’ope-

Membrana di E. coli

CH2OH HO

Lattosio HO

O

H

(β)

H

H OH

O

OH

H

H

OH

H

OH

β-galattosidasi

H H

OH

OH

CH2OH

H2O

O

H

OH

H OH

H

H

OH

Proteine permeasi (trasportano il lattosio dal terreno all’interno di E. coli)

Lattosio CH2OH O

HO H OH

H

H

(β)

O

CH2OH O H OH H

H

H

CH2OH OH

H

β-galattosidasi

O

OH H OH

OH

H

H

(β)

O

Allolattosio (induce la sintesi della β-galattosidasi in cellule di E. coli che crescono in presenza di lattosio) CH2

H

H H

H

Glucosio (metabolizzato nella via glicolitica)

H

HO

Terreno di coltura con lattosio

Galattosio (convertito in glucosio, che è metabolizzato per via glicolitica)

+

H

H H

O H OH

H CH2OH

CH2OH O H OH H

OH

O

H

OH

H OH

H

H

OH

OH H

HO

Figura 17.2 Reazioni catalizzate dall’enzima b-galattosidasi. Il lattosio, portato all’interno della cellula dalla permeasi, è convertito

429

a glucosio e galattosio (in alto) o ad allolattosio (in basso), che è il reale induttore dell’operone lattosio di E. coli.

430

Capitolo 17

Traduzione dell’mRNA policistronico lac lacZ+ mRNA

lacY+

lacA+



Traduzione:

3¢ Stop Inizio

Inizio

Stop Inizio

Viene prodotta β-galattosidasi I ribosomi si legano all’mRNA e iniziano la traduzione da questo punto

Le subunità ribosomali si dissociano

Stop

Viene prodotta permeasi

Viene prodotta transacetilasi Il ribosoma inizia la traduzione di lacA+

Il ribosoma inizia la traduzione di lacY+

Figura 17.3 Struttura dell’mRNA policistronico codificato dai tre geni lac associati in E. coli e sua traduzione per produrre b-galattosidasi, permeasi e transacetilasi.

MyLab

coli è dovuta essenzialmente agli esperimenti genetici di François Jacob e Jacques Monod, per i quali essi condivisero (insieme ad André Lwoff per il suo lavoro sul controllo genetico della sintesi virale), nel 1965, il Premio Nobel per la Fisiologia o Medicina. Di seguito è riportato un riassunto dei loro esperimenti.

nimazione Regolazione dell’espressione dei geni dell’operone lac

Mutazioni nei geni che codificano per proteine Trattando le cellule con sostanze chimiche mutagene, furono ottenute mutazioni nei geni strutturali (i geni che codificano per le proteine). Tali mutazioni furono caratterizzate per determinare quale attività enzimatica venisse influenzata. Il gene per la β-galattosidasi venne chiamato lacZ, il gene per la permeasi lacY e il gene per la transacetilasi lacA. Mutazioni lacZ–, lacY– e lacA– furono utilizzate per mappare, con tecniche di mappatura classica, la posizione dei tre geni (Capitolo 15). Gli esperimenti dimostrarono che i tre geni erano strettamente associati nell’ordine lacZ-lacY-lacA. I tre geni contigui sul DNA erano trascritti in una singola molecola di mRNA, chiamata mRNA policistronico, invece che in tre mRNA separati (Figura 17.3). Ciò significa che l’RNA polimerasi inizia la trascrizione da un singolo promotore e che l’mRNA policistronico viene sintetizzato con i geni trascritti nell’ordine 5′-lacZ+-lacY+-lacA+-3′. Durante la traduzione, un ribosoma si lega all’estremità 5′ dell’mRNA policistronico e sintetizza la β-galattosidasi, poi ricomincia la traduzione della sequenza per la permeasi e sintetizza la permeasi, ricomincia ancora con la sequenza per la transacetilasi e sintetizza la transacetilasi, infine il ribosoma si dissocia dall’mRNA.

Mutazioni che alterano la regolazione dell’espressione genica In E. coli selvatico, i prodotti dei tre geni vengono indotti in modo coordinato quando è presente il lattosio. Jacob e Monod isolarono mutanti nei quali tutti i prodotti genici dell’operone venivano sintetizzati costitutivamente, cioè venivano sintetizzati sia in presenza, sia in assenza dell’induttore. Jacob e Monod ipotizzarono che queste mutazioni fossero mutazioni regolative, che influenzavano i normali meccanismi che controllano l’espressione dei geni strutturali che codificano per gli enzimi. Essi trovarono due classi di mutazioni costitutive: una classe mappava in una regione relativamente piccola di DNA, a monte del gene lacZ, che essi chiamarono operatore (lacO). L’altra classe mappava a monte dell’operatore, e la chiamarono gene lacI o gene per il repressore Lac. La Figura 17.4 illustra l’organizzazione del gruppo (cluster) di geni strutturali lac e delle sequenze di regolazione associate. Il promotore, l’operatore e i tre geni strutturali costituiscono l’operone lac. L’ordine degli elementi di controllo e dei geni nell’operone lac è: promotore-operatore-lacZ-lacY-lacA, mentre il gene regolatore lacI è localizzato vicino ai geni strutturali, proprio a monte del promotore (vedi Figura 17.4). Il gene lacI ha un proprio promotore e un proprio terminatore, e codifica per il repressore Lac. Mutazioni nell’operatore Le mutazioni nell’operatore furono chiamate mutazioni costitutive dell’operatore o lacOc. Mediante l’uso di ceppi parzialmente diploidi (ceppi F′ nei quali pochi geni cromosomici portati da un elemento genetico extracromosomico, chiamato fattore F, sono introdotti nella cellula batterica; vedi Figura 15.6), Jacob e Monod poterono definire meglio il ruolo dell’operatore nella regolazione dell’espressio-

Operone lac

Gene regolatore lacI Promotore Promotore (Plac+) Operatore

Gene per la β-galattosidasi Permeasi

Segmento del cromosoma di E. coli

lacI+ PlacI+

Coppie di basi

lacO+

lacZ+

Terminatore 1040

lacY+ Geni strutturali

3075

1254

Transacetilasi lacA+ Terminatore 612

Figura 17.4 Organizzazione dei geni lac di E. coli e degli elementi regolatori associati: l’operatore, il promotore e il gene regolatore. Il promotore, l’operatore e i tre geni lac adiacenti costituiscono l’operone lac.

Regolazione dell’espressione genica nei batteri e nei batteriofagi

ne dei geni lac. Uno di questi diploidi parziali era F′ lacO+ lacZ– lacY+ (entrambe le serie di geni hanno un lacOc lacZ+ lacY– promotore normale e il gene lacA è stato omesso perché non è rilevante nella nostra discussione). Una delle regioni lac nel diploide parziale ha un operatore normale (lacO+), un gene per la β-galattosidasi mutato (lacZ–) e un gene per la permeasi normale (lacY+). L’altra regione lac ha un operatore con mutazione costitutiva (lacOc), un normale gene per la β-galattosidasi (lacZ+) e un gene per la permeasi mutato (lacY–). Fu analizzata la produzione di β-galattosidasi (da parte del gene lacZ+) e di permeasi (da parte del gene lacY+) in questo diploide parziale sia in presenza sia in assenza di induttore. Jacob e Monod trovarono che in assenza dell’induttore veniva sintetizzata la β-galattosidasi attiva, e che veniva sintetizzata una permeasi che però era inattiva a causa della mutazione. Solo quando veniva aggiunto il lattosio alla coltura e veniva prodotto l’induttore allolattosio avveniva la sintesi di una permeasi attiva. In altre parole, il gene lacZ+ (che si trova sulla stessa molecola di DNA di lacOc) è espresso in modo costitutivo (cioè il gene è attivo sia in presenza sia in assenza di induttore), mentre il gene lacY+ è soggetto a un normale controllo inducibile, cioè non è trascritto in assenza di induttore ed è trascritto in presenza di induttore. Quindi una mutazione lacOc altera solo i geni a valle sulla stessa molecola di DNA. Analogamente, la regione lacO+ controlla solo i geni strutturali adiacenti a essa e non ha effetto sui geni che stanno sull’altra molecola di DNA. Questo fenomeno relativo a un gene o a una sequenza di DNA che controlla solo i geni che stanno sullo stesso segmento di DNA contiguo viene chiamato cis-dominanza. La mutazione lacOc è cis-dominante, perché agisce solo sui geni adiacenti e non può essere dominata da una regione lacO+ normale situata in un’altra parte della cellula. In altre parole, l’operatore non codifica per un prodotto diffusibile. Infatti, se così fosse, nello stato diploide lacO+/lacOc, uno dei due alleli controllerebbe tutti i geni per l’utilizzo del lattosio, ovunque essi fossero localizzati. Mutazioni nel gene regolatore lacI La seconda classe di mutanti costitutivi lac identificò il gene lacI. I mutanti lacI– in una cellula aploide hanno un fenotipo costitutivo. Anche in questo caso, l’uso di ceppi diploidi parziali fu importante per la comprensione della normale funzione del gene lacI. Il diploide parziale era

lacI+ lacO+ lacZ– lacY+ ; lacI– lacO+ lacZ+ lacY–

entrambe le serie di geni hanno operatori normali e promotori normali. In assenza dell’induttore, non venivano prodotte né β-galattosidasi né permeasi, ma entrambe venivano sintetizzate in presenza di induttore. In altre

431

parole, l’espressione di entrambi gli operoni era inducibile. Questo significa che il gene lacI+ nella cellula può dominare il difetto dovuto alla mutazione lacI–. Dato che i due geni lacI sono localizzati su molecole di DNA diverse (sono cioè in una configurazione trans), il gene lacI+ viene denominato trans-dominante su lacI–. Dato che il gene lacI+ controllava i geni posti sull’altra molecola di DNA, Jacob e Monod proposero che il gene lacI+ fosse un gene repressore che codificava per una molecola repressore, il repressore Lac. Nei mutanti lacI– non vengono prodotte molecole di repressori funzionali. Quindi, in un ceppo batterico aploide che ha una mutazione lacI–, l’operone lac è costitutivo. In un diploide parziale che presenta sia lacI+ sia lacI–, tuttavia, le molecole di repressore Lac funzionali prodotte dal gene lacI+ controllano l’espressione di entrambi gli operoni lac presenti nella cellula, rendendo inducibili ambedue gli operoni. Mutazioni nel promotore Anche il promotore per i geni strutturali (localizzato prima del gene lacZ nell’operone lac; vedi Figura 17.4) può subire mutazioni. I promotori mutanti (Plac–) alterano l’espressione di tutti e tre i geni strutturali. Anche in presenza dell’induttore, gli enzimi per l’utilizzo del lattosio non vengono sintetizzati o vengono prodotti solo in quantità molto ridotta. Dato che il promotore è la sequenza riconosciuta dall’RNA polimerasi e non codifica per alcun prodotto, l’effetto di una mutazione P è limitato ai geni che esso controlla sullo stesso filamento di DNA. Le mutazioni Plac– sono un ulteriore esempio di mutazioni cis-dominanti.

Modello dell’operone di Jacob e Monod per la regolazione dei geni lac Sulla base dei loro studi, Jacob e Monod proposero il loro ormai classico modello di operone. Per definizione, un operone è costituito da un gruppo di geni, la cui espressione è coregolata dalle interazioni tra operatore e proteina repressore, dalla regione stessa dell’operatore e dal promotore. Il promotore non faceva parte del modello originale proposto da Jacob e Monod; la sua esistenza fu dimostrata da studi successivi. La descrizione, di seguito riportata, del modello di Jacob e Monod per la regolazione dell’operone lac è stata ampliata con informazioni a livello molecolare ottenute successivamente. La Figura 17.5 illustra l’operone lac nel ceppo selvatico di E. coli, cresciuto in assenza di lattosio. Il gene per il repressore (lacI+) è trascritto in modo costitutivo e la traduzione del suo mRNA porta alla sintesi di un polipeptide di 360 amminoacidi. Quattro di questi polipeptidi si associano a formare un tetramero, che costituisce la proteina repressore Lac funzionale (Figura 17.6). Il promotore del gene lacI è debole e, quindi, sono poche le molecole repressore nella cellula.

432

Capitolo 17 Gene regolatore lacI Promotore

Segmento del cromosoma di E. coli

Operone lac

Terminatore Operatore Gene per la Gene per la Promotore Gene per la β-galattosidasi permeasi transacetilasi

lacI +

lacO +

PlacI+ Plac+ Trascrizione costitutiva

mRNA per il repressore Lac Ribosomi Traduzione

lacZ +

lacY + Geni strutturali non espressi

Le proteine repressore Lac si attaccano all’operatore e impediscono la trascrizione dell’mRNA. L’RNA polimerasi non può legarsi al promotore, quando il repressore è legato all’operatore.

Proteine repressore Lac

Figura 17.6 Modello molecolare del tetramero del repressore Lac. I quattro monomeri sono colorati in verde, viola, rosso e giallo.

Il repressore Lac si lega all’operatore (lacO+). La sequenza di DNA coperta dalla proteina repressore si sovrappone alla sequenza di DNA riconosciuta dall’RNA polimerasi. Quindi, quando il repressore è legato all’operatore, l’RNA polimerasi non può legarsi al promotore dell’operone e la trascrizione non può avere inizio. Per questo motivo, si dice che l’operone lac è sotto controllo negaOperone lac

tivo. Un basso livello di trascrizione dei geni determina la presenza di alcune molecole dei tre enzimi anche in assenza di induttore; ciò avviene perché i repressori non si legano in modo stabile: essi si legano e si distaccano. Nel breve istante in cui un repressore si stacca e prima che un altro si leghi, l’RNA polimerasi può iniziare la trascrizione dell’operone anche in assenza dell’induttore. Questa “debole” espressione genera poche molecole dei tre enzimi codificati dall’operone lac, necessarie, quando il lattosio viene aggiunto, per permettere l’iniziale trasporto di lattosio all’interno della cellula e l’iniziale conversione del lattosio in allolattosio. Quando E. coli selvatico cresce in presenza di lattosio come unica fonte di carbonio (Figura 17.7), parte del lattosio viene convertita dalla β-galattosidasi in allolattosio (vedi Figura 17.2). L’allolattosio si lega al repressore Lac e ne modifica la conformazione; tale cambiamento di conformazione viene definito variazione allosterica. Di conseguenza, il repressore perde la sua affinità per l’operatore lac e si dissocia dal sito. Le proteine repressore libere vengono anch’esse alterate dal legame con l’allolattosio, così che non possano legarsi al sito operatore. In questo modo, l’allolattosio induce la produzione degli enzimi codificati dall’operone lac. In assenza del repressore Lac legato all’operatore, l’RNA polimerasi inizia la sintesi di una singola molecola di mRNA policistronico per i geni lacZ+, lacY+ e lacA+. L’mRNA policistronico dell’operone lac è tradotto da una serie di ribosomi per produrre i tre enzimi specificati dall’operone. Questo efficiente meccanismo assicura la produzione coordinata delle proteine la cui funzione è correlata.

Se non c’è un repressore sull’operatore, l’RNA polimerasi può trascrivere i geni PlacI+ Plac+

Trascrizione e traduzione

lacZ+

lacY+

Trascrizione e inizio della traduzione

lacA+ A+

lacO+

RNA polimerasi

lac

lacI+

lacA+

Y+

Proteine repressore

Repressori inattivati; non possono legarsi all’operatore

lac

Molecole di induttore (allolattosio) mRNA poligenico

Figura 17.5 Stato funzionale dell’operone lac in E. coli selvatico cresciuto in assenza di lattosio.

Effetto delle mutazioni lacOc Le mutazioni lacOc determinano l’espressione costitutiva dei geni dell’operone lac e sono cis-dominanti su lacO+ (Figura 17.8). Le mutazioni lacOc alterano delle coppie di basi nella sequenza di DNA dell’operatore e lo rendono irriconoscibile da parte della proteina repressore. Dato che il repressore non può

lacZ+

β-galattosidasi

Permeasi

Transacetilasi

Figura 17.7 Stato funzionale dell’operone lac in E. coli selvatico in presenza di lattosio come unica fonte di carbonio.

Regolazione dell’espressione genica nei batteri e nei batteriofagi

433

a) Diploide parziale in assenza di induttore. L’operone lacO+ viene represso, mentre l’operone lacOc produce b-galattosidasi funzionale dal gene lacZ+ e molecole di permeasi non funzionali dal gene lacY– che ha una mutazione missenso. Operone lac PlacI+

Plac+ lacI+

Mutante

Normale

lacZ–

lacY+

lacO+

lacA+

Nessuna trascrizione

Trascrizione e traduzione

Il repressore Lac si lega

Repressore Lac

Segmento del cromosoma Nessuna di E. coli espressione in assenza di induttore

Il repressore Lac non può legarsi

Trascrizione e traduzione

Normale lacZ+

lacI+ Plac+ lacOc

PlacI+

Mutante lacY–

lacA+

Segmento di F„

Trascrizione e traduzione Sintesi costitutiva

β-galattosidasi costitutiva

Permeasi costitutiva non funzionale

Transacetilasi costitutiva

b) Diploide parziale in presenza di induttore. L’operone lacO+ è attivo e produce b-galattosidasi non funzionale dal gene lacZ– e permeasi funzionale dal gene lacY+. L’operone costitutivo lacOc produce b-galattosidasi funzionale dal gene lacZ+ e permeasi non funzionale dal gene lacY–. Complessivamente sui due operoni vengono prodotte sia b-galattosidasi sia permeasi funzionali. PlacI+

Plac+ lacI

+

lacO+

Mutante

Normale

lacZ–

lacY+ Trascrizione e traduzione

Trascrizione e traduzione

Segmento del cromosoma di E. coli

Sintesi inducibile

Il repressore Lac inattivo non può legarsi

Repressore Lac

β-galattosidasi non funzionale Il repressore Lac inattivo non può legarsi

Induttore (allolattosio) Repressore Lac Trascrizione e traduzione lacI+ PlacI+

lacA+

Normale

Mutante

lacZ+

lacY–

Plac+ lacOc

Figura 17.8 Effetto cis-dominante della mutazione lacOc in un ceppo di E. coli diploide parziale lacI+ lacO+ lacZ– lacY+/lacI+ lacOc lacZ+ lacY–. (Le mutazioni lacZ– e lacY– sono missenso.)

Permeasi

Transacetilasi

lacA+

Segmento di F„

Trascrizione e traduzione Sintesi costitutiva

β-galattosidasi costitutiva

legarsi, i geni strutturali fisicamente associati alla mutazione lacOc sulla stessa molecola di DNA vengono espressi costitutivamente. Effetti delle mutazioni nel gene lacI Le mutazioni lacI mappano all’interno della regione codificante del gene per il repressore e causano cambiamenti degli amminoacidi nella catena polipeptidica del repressore. La

Permeasi costitutiva non funzionale

Transacetilasi costitutiva

conformazione del repressore Lac, dunque, viene cambiata o la traduzione viene terminata prematuramente, ed esso non può né riconoscere l’operatore, né legarsi a esso. Di conseguenza, in un ceppo aploide, l’RNA polimerasi non viene bloccata nel suo legame al promotore e la trascrizione non viene impedita, anche in assenza di lattosio. Quindi si verifica l’espressione costitutiva dell’operone lac (Figura 17.9a).

434

Capitolo 17

a) Ceppo aploide (in presenza o assenza di induttore). Il repressore mutante Lac non può legarsi all’operatore lacO+; di conseguenza si ha sintesi costitutiva degli enzimi dell’operone lac. Operone lac PlacI+

Mutante

Plac+

lacI–

lacO+

Normale

Normale

lacZ+

lacY+

Segmento del cromosoma di E. coli

lacA+

Trascrizione e traduzione

Trascrizione e traduzione

Sintesi costitutiva Il repressore Lac mutante (inattivo) non può legarsi all’operatore β-galattosidasi costitutiva

Permeasi costitutiva

Transacetilasi costitutiva

b) Diploide parziale in assenza di induttore. L’operone lacI+ produce molecole di repressori Lac selvatiche, mentre l’operone lacI– produce molecole di repressori Lac inattive. Il repressore mutante Lac non può legarsi agli operatori lacO+ ma il repressore Lac selvatico può farlo, cosicché non avviene trascrizione da parte di entrambi gli operoni. PlacI+ Normale Plac+ lacI+

lacO+

Mutante

Normale

lacZ–

lacY+

lacA+

Segmento del cromosoma di E. coli

lacA+

Segmento di F„

Nessuna trascrizione

Trascrizione e traduzione

I repressori Lac selvatici si legano ai siti lacO+ di entrambi i cromosomi

Repressore Lac selvatico Repressore Lac mutante (inattivo)

I repressori Lac mutanti non possono legarsi agli operatori

Trascrizione e traduzione Mutante lacI–

lacO+

PlacI+

Normale

Mutante

lacZ+

lacY–

Nessuna trascrizione

Plac+

c) Diploide parziale in presenza di induttore. L’induttore inattiva il repressore Lac selvatico impedendogli di legarsi agli operatori lacO+. Il repressore Lac mutante è incapace di legarsi a questi operatori. Il risultato è la trascrizione di entrambi gli operoni: vengono prodotte b-galattosidasi non funzionale e permeasi funzionale dall’operone lacI+, e b-galattosidasi funzionale e permeasi non funzionale dall’operone lacI–. Operone lac PlacI+

Normale

Plac+

lacI+

lacO+

Mutante

Normale

lacZ–

lacY+

Trascrizione e traduzione

lacA+

Segmento del cromosoma di E. coli

Trascrizione Sintesi inducibile

Repressore Lac selvatico

Molecole di induttore inattivano il repressore

Né i repressori inattivati né quelli mutanti possono legarsi β-galattosidasi all’operatore non funzionale

Repressore Lac mutante (inattivo) Trascrizione e traduzione Mutante lacI– PlacI+

lacO+

Normale

Mutante

lacZ+

lacY–

Plac+

Figura 17.9 Effetti di una mutazione lacI– in una cellula aploide lacI– lacO+ lacZ+ lacY+ e in un ceppo di E. coli diploide parziale lacI+ lacO+ lacZ– lacY+/lacI– lacO+ lacZ+ lacY–. (Le mutazioni lacZ– e lacY– sono missenso.)

Permeasi

Transacetilasi

lacA+

Segmento di F„

Trascrizione Sintesi inducibile

β-galattosidasi

Permeasi non funzionale

Transacetilasi

Regolazione dell’espressione genica nei batteri e nei batteriofagi

435

La dominanza del gene lacI+ (selvatico) sui mutanti lacI– viene illustrata per il diploide parziale descritto

cellule con una mutazione lacIS non possono utilizzare il lattosio come fonte di carbonio. Un terzo tipo di mutazione del gene per il repressore lacI+ lacO+ lacZ– lacY+ prima: . è la classe lacI–d (dominanza). Nelle cellule aploidi, i lacI– lacO+ lacZ+ lacY– mutanti lacI–d hanno un fenotipo costitutivo, come gli alIn assenza dell’induttore (Figura 17.9b), il repressore tri mutanti lacI–; gli enzimi lac vengono prodotti sia in difettivo lacI– è incapace di legarsi a entrambi i normali presenza sia in assenza di lattosio. Diversamente dalle operatori (lacO+) nella cellula. Dal gene lacI+, però, vie- mutazioni lacI–, le mutazioni lacI–d sono trans-dominanne prodotta una quantità sufficiente di repressori Lac ti su lacI+ nei diploidi parziali lacI–d/lacI+; infatti gli ennormali che possono legarsi a entrambi gli operatori e zimi lac vengono prodotti costitutivamente anche in prequindi bloccare la trascrizione di entrambi gli operoni. senza di un repressore normale. La dominanza dei mutanti lacI–d si spiega in questo In presenza dell’induttore (Figura 17.9c) i repressori selvatici diventano inattivi, così entrambi gli operoni modo: la proteina repressore Lac è un tetramero, formavengono trascritti. Uno produce una β-galattosidasi di- to da quattro polipeptidi identici. Nei mutanti lacI–d, le fettiva e una permeasi normale, l’altro produce una β- subunità di repressore non si combinano normalmente, galattosidasi normale e una permeasi difettiva; tra tutti e così non si forma un tetrametro repressore funzionale e due vengono prodotte sia una β-galattosidasi sia una non è possibile alcun legame specifico con l’operatore. permeasi funzionali. Quindi, nei diploidi parziali Nei diploidi lacI–d/lacI+ vi è una miscela di polipeptidi lacI+/lacI– entrambi gli operoni presenti nella cellula so- normali e mutanti che si possono combinare casualmenno sotto controllo inducibile. te a formare i tetrameri di repressore. In ogni cellula si Sono state identificate altre classi di mutanti nel gene trova solo una dozzina di molecole di repressore, e la lacI dopo che Jacob e Monod avevano studiato i mutan- presenza di una o più subunità di polipeptidi difettive nel ti lacI–. Una di queste classi, i mutanti lacIS (super-re- tetrametro del repressore è sufficiente per bloccare il pressore), non mostra produzione di enzimi lac né in normale legame con l’operatore. Vi è così una buona presenza né in assenza di lattosio. Nei diploidi parziali probabilità che non vengano prodotte proteine repressocon genotipo lacI+/lacIS, l’allele lacIS è trans-dominante, re normali, dato che le molecole per cellula sono così poavendo effetto su entrambe le copie di operoni (Figura che. Come conseguenza dell’assenza o quasi assenza di 17.10). In questo caso, il gene mutante codifica per una repressori completi e funzionali, la sintesi degli enzimi è proteina super-repressore che può legarsi all’operatore, costitutiva. Quindi la mutazione lacI–d, pur generando ma non è in grado di riconoscere l’induttore allolattosio. catene polipetidiche non funzionali (mutazione loss-ofQuindi i super-repressori mutanti si legano agli operato- function), produce un fenotipo dominante (evidente anri anche in presenza di induttore e la trascrizione degli che in presenza di prodotto proteico selvatico); questo tioperoni non può avvenire. La presenza di repressori nor- po di mutanti sono definiti dominanti negativi. mali nella cellula non ha alcun effetto, dato che, una volInfine, alcune mutazioni nel promotore del gene per il ta che un repressore lacIS è posizionato sull’operatore, repressore alterano l’espressione del gene stesso. Abnon può essere indotto a staccarsi. Di conseguenza, le biamo affermato in precedenza che l’entità della trascrizione di un gene è in Operone lac funzione dell’affinità delle molecole PlacI+ Plac+ Normale Normale Normale dell’RNA polimeraNon lacZ+ lacI+ lacO+ lacY+ lacA+ inducibile si per il promotore di Nessuna trascrizione Trascrizione quel gene. Dato che e traduzione sono poche le molecole di repressore sintetizzate nelle cellule di E. coli selvaInduttore (allolattosio) Repressore inattivo, non può legarsi all’operatore L’induttore non può inattivare i super-repressori mutanti Trascrizione e traduzione Mutante lacIs PlacI+

Super-repressori mutanti si legano agli operatori

lacO+ Plac+

Normale lacZ+

Normale lacY+

Nessuna trascrizione

lacA+

Non inducibile

Figura 17.10 Effetto dominante della mutazione lacIS sul selvatico lacI+ in cellule diploidi parziali lacI+ lacO+ lacZ+ lacY+ lacA+/lacIS lacO+ lacZ+ lacY+ lacA+ che crescono in presenza di lattosio.

436

Capitolo 17

tico, il promotore del gene per il repressore deve avere una bassa affinità (cioè è un promotore debole). Sono state trovate mutazioni di coppie di basi che aumentano o diminuiscono il tasso di trascrizione. Per esempio, i mutanti lacIQ e lacISQ (dove Q indica “quantità” e SQ “superquantità”) incrementano il tasso di trascrizione del gene per il repressore, con i mutanti lacISQ che determinano l’aumento maggiore. Questi mutanti sono stati utili storicamente perché, producendo un gran numero di molecole di repressore, hanno permesso di isolare e purificare e, di conseguenza, determinare la sequenza amminoacidica del polipeptide repressore. Dato che i mutanti lacIQ e lacISQ producono più molecole di repressore Lac rispetto al selvatico, questi mutanti riducono l’efficienza di induzione dell’operone lac. I mutanti del gene lacI mettono in luce le tre diverse interazioni del repressore Lac: (1) il legame del repressore con la regione dell’operatore; (2) il legame dell’induttore con il repressore; (3) il legame dei singoli polipeptidi del repressore l’uno con l’altro a formare il tetramero di repressore attivo. L’induttore non può inattivare i super-repressori mutanti.

Controllo positivo dell’operone lac

MyLab

nimazione Controllo positivo dell’operone lac

La proteina repressore Lac esercita un effetto negativo sull’espressione dell’operone lac, bloccando il legame dell’RNA polimerasi al promotore quando l’induttore è

+ CAP (proteina 4 cAMP attivatrice del catabolismo) inattiva

lacI+

Sito CAP

CAP-cAMP (attiva)

Operone lac

Promotore lacO+

lacZ+

CAP-cAMP si lega al sito CAP adiacente al promotore lac, favorendo il legame dell’RNA polimerasi al promotore Oloenzima dell’RNA polimerasi lacI+

Sito CAP

Promotore lacO+

lacZ+

Fattore σ

assente. Parecchi anni dopo che Jacob e Monod avevano proposto il loro modello di operone, altri ricercatori scoprirono un sistema di controllo positivo che regola l’operone lac, un sistema che funziona attivando l’espressione dell’operone. Questo sistema assicura che l’operone lac sia espresso ad alti livelli solo se il lattosio è l’unica fonte di carbonio e se non è presente anche il glucosio. Il glucosio è la fonte di carbonio preferita perché può essere utilizzata direttamente attraverso la glicolisi per produrre energia per la cellula. Gli altri zuccheri, come il lattosio, sono convertiti in glucosio in una reazione che consuma energia. Quindi, la cellula può ottenere più energia dal glucosio rispetto ad altri zuccheri. La Figura 17.11 mostra la regolazione positiva dell’operone lac quando è presente il lattosio e il glucosio è assente. Prima di tutto, una proteina chiamata CAP (Catabolite Activator Protein, ossia proteina attivatrice del catabolismo, o anche CRP, proteina recettrice di cAMP) si lega al cAMP (AMP ciclico o adenosina 3′,5′-monofosfato ciclico; vedi Figura 17.12) a formare un complesso CAP-cAMP. Questo complesso è una molecola regolatrice positiva. La proteina CAP è un dimero formato da due polipeptidi identici. Successivamente, il complesso CAPcAMP si lega a un sito specifico nel DNA, chiamato sito CAP, posto a monte del sito promotore a cui si lega l’RNA polimerasi. CAP, poi, recluta l’RNA polimerasi sul promotore e la trascrizione ha inizio. Quando è presente il glucosio, oltre al lattosio, nel terreno di coltura, esso viene utilizzato preferenzialmente per un fenomeno definito repressione da cataboliti (anche denominato effetto glucosio). Nella repressione da cataboliti, l’operone lac è espresso a livelli molto bassi, anche se il lattosio è presente nel terreno. Ciò avviene perché la presenza del glucosio riduce notevolmente il livello cellulare di cAMP. Quindi, il complesso CAP-cAMP è in quantità insufficiente per permettere all’RNA polimerasi di legarsi al promotore dell’operone lac e la trascrizione è significativamente diminuita, anche se il repressore viene rimosso dall’operatore lacY+ dalla presenza dell’allolattosio. In altre parole, l’RNA polimerasi non può legarsi in modo efficiente al promotore senza l’aiuto del complesso CAP-cAMP. L’importante ruolo svolto dal cAMP nella repressione da + cataboliti fu dimostrato da numerosi esperilacY menti, incluso uno in cui la trascrizione del-

La trascrizione ha inizio

lacI+

Sito CAP

Promotore lacO+

lacZ+

5'

lacY+

Trascrizione e traduzione dell’mRNA

Figura 17.11 Ruolo dell’AMP ciclico (cAMP) nel funzionamento di operoni sensibili al glucosio, come l’operone lac di E. coli. È illustrata la condizione in cui il glucosio è assente e il lattosio è presente.

Regolazione dell’espressione genica nei batteri e nei batteriofagi NH2

ATP N

P

P

P

O

N

5¢ CH2 O 4¢

sterasi, riduce il livello di cAMP nella cellula. Per questo cAMP può essere considerato un indicatore dei livelli di glucosio: quando essi sono alti, la concentrazione di cAMP è bassa, e quando i livelli di glucosio sono bassi, la concentrazione di cAMP è alta. La repressione da cataboliti avviene nello stesso modo in altri operoni batterici coinvolti nel catabolismo di zuccheri diversi dal glucosio. Questi operoni hanno in comune la presenza di un sito CAP nei loro promotori, al quale si lega il complesso CAP-cAMP, favorendo il legame dell’RNA polimerasi.

N N

1¢ 3¢



OH OH

Adenilato ciclasi NH2

cAMP N

O

N

5¢ CH2 O 4¢

–O

P

O

N N Non prodotto quando è presente il glucosio

1¢ 3¢



OH

O Fosfodiesterasi NH2

5¢-AMP N

P

O

N

5¢ CH2 O 4¢

N N

1¢ 3¢



OH OH

Figura 17.12 Struttura, sintesi e degradazione dell’AMP ciclico (cAMP o adenosina 3„,5„-monofosfato ciclico).

l’operone lac veniva indotta, anche in presenza di glucosio, aggiungendo cAMP alle cellule. Il modello prevede che la repressione da cataboliti agisca sull’adenilato ciclasi, un enzima che catalizza la formazione di cAMP nella cellula (vedi Figura 17.12). In E. coli, l’adenilato ciclasi viene attivata da un enzima chiamato IIIGlc. Quando il glucosio è trasportato attraverso la membrana cellulare all’interno della cellula, scatena una serie di eventi che portano all’inattivazione di IIIGlc. Di conseguenza, l’adenilato ciclasi viene inattivata e non viene prodotto nuovo cAMP. Ciò, in aggiunta alla degradazione del cAMP a opera della fosfodie–50

–40

–30

437

–20

–10

Dettagli molecolari della regolazione dell’operone lac Dal sequenziamento del DNA e dell’RNA siamo arrivati a individuare le regioni regolatrici significative dell’operone lac. Un approccio generale per ottenere queste informazioni consiste nel purificare la proteina che si lega a una data sequenza di regolazione e fare in modo che si leghi in vitro al DNA dell’operone lac isolato. Per esempio, se il repressore è legato al sito operatore lac, proteggerà tale regione dell’operone dalla digestione con desossiribonucleasi (DNasi). Se si digerisce il resto del DNA con la DNasi, è possibile isolare la sequenza dell’operatore che è rimasta intatta, clonarla, utilizzando la tecnologia del DNA ricombinante, e sequenziarla. Regione promotore del gene lac per il repressore (lacI) La Figura 17.13 mostra la sequenza delle coppie di nucleotidi della regione promotore del gene lacI, la sequenza dell’estremità 5′ dell’mRNA per il repressore e i primi amminoacidi della proteina repressore stessa. La sequenza nucleotidica dell’mRNA per il repressore può essere allineata alla sequenza del promotore, con inizio approssimativamente a metà. Come avviene con tutti i trascritti, la traduzione non comincia proprio all’estremità della molecola di mRNA. Il sito di legame dei ribosomi è una sequenza di Shine-Dalgarno (AGGG) localizzata da 12 a 9 basi a monte del codone di inizio della traduzione (Capitolo 6). In questo caso raro il codone d’inizio è GUG invece del più comune AUG, localizzato a 27-29 nucleotidi dall’estremità 5′ del messaggero. La fi+1

10

20

30

40

G A C A C C A T C G A A T GGC G C A A A A C C T T T C G C G G T A T GGC A T G A T A G C G C C C GG A A G A G A G T C A A T T C A GGG T GG T G A A T G T G A A A C C A G TA A C G C T G T GG T A G C T T A C CG C G T T T T GG A A A G C G C C A T A C CG T A C T A T C G C GGG C C T T C T C T C A G T T A A G T C C C A C C A C T T A C A C T T T GG T C AT T G C

Sito della mutazione lacI Q

Estremità 5¢ p p p GG A A G A G A GU C A A U U C A GGGU GGU G A A U G U G A A A C C A GUAACG della sequenza Met Lys Pro Val Thr dell’mRNA +1 per il repressore Lac Inizio della Sequenza amminoacidica traduzione

Figura 17.13 Sequenza delle coppie di basi del promotore (Plac+) del gene lacI+ dell’operone lac e dell’estremità 5„ dell’mRNA per il repressore. È anche mostrata la sequenza amminoacidica

del repressore Lac

della prima parte della proteina repressore stessa. Si noti che GUG è il codone d’inizio che in questo caso codifica per la metionina.

438

Capitolo 17 Operatore

Promotore Sito di legame dell’RNA polimerasi

Sito CAP

lacI +

lacZ +

Sequenza di Shine-Dalgarno Sequenze consenso del sito di legame CAP

Protetto dal repressore Protetto dall’RNA polimerasi

Inizio dell’mRNA

Codone d’inizio per la β-galattosidasi

5¢ ... GCGC A ACGC A A T T A A T GT GA GT T A GC T C AC T C A T T A GGC ACCCC A GGC T T T AC AC T T T A T GC T T CCGGC T CGT A T GT T GT GT GGA A T TG T GA GCGGA T A AC A A T T T C AC AC A GGA A AC A GC T A T GACC A A 3¢ ... CGCG T TGCG T T A A T T A CA C T CA A T CGA G TGA G T A A T C CG TGGGG T C CGA A A TG TGA A A T A CGA A GGC CGA GCA T A CA A CA CA C C T T A AC A C T CGC C T A T TG T T A A AG TG TG T C C T T TG T CGA T A C TGG T T

Sequenza –84 –80 di DNA

–70

–60

Figura 17.14 Sequenza di coppie di basi del promotore e dell’operatore dell’operone lac di E. coli.

–50

–40

–30

–20

–10

Sequenze consenso del promotore

gura mostra anche il sito della singola sostituzione di coppia di basi trovata per un particolare mutante lacIQ: questo cambiamento da C-G a T-A comporta un incremento di circa dieci volte della produzione di repressore. Sequenze di regolazione dell’operone lac La Figura 17.14 mostra le coppie di nucleotidi delle sequenze di regolazione dell’operone lac. Questa sequenza è stata ottenuta mettendo insieme diverse informazioni. In primo luogo, le sequenze amminoacidiche della proteina repressore e della β-galattosidasi erano completamente note e questa informazione ci ha permesso di identificare le regioni codificanti del gene lacI e del gene lacZ+. Inoltre, le altre regioni sono state identificate sulla base di esperimenti di “protezione” del tipo descritto prima. Il complesso CAP-cAMP, l’RNA polimerasi e la proteina repressore sono stati usati separatamente per legare il DNA e in seguito sono state sequenziate le regioni resistenti alla DNasi. L’inizio della regione del promotore è definito dalla posizione –84 nella figura (cioè 84 coppie di basi a monte del sito di inizio dell’mRNA), immediatamente dopo il codone di stop del gene lacI. Le sequenze consenso del sito di legame CAP-cAMP si estendono da –54 a –58 e da –65 a –69, e il DNA coperto dall’RNA polimerasi si estende da –44 a –8, includendo le sequenze consenso –10 e –35 (vedi Figura 17.14). Nel complesso, la regione che si estende da –84 a –8 e che include i siti di interazione della proteina CAP e dell’RNA polimerasi (compresa la Pribnow box) definisce precisamente la regione del promotore dell’operone lac. Immediatamente vicino alla regione del promotore vi è l’operatore. La regione protetta dalla proteina repressore Lac comprende le coppie di nucleotidi da –3 a +21. Quando il repressore Lac è legato all’operatore, l’RNA polimerasi non può legarsi al promotore. L’mRNA per la β-galattosidasi ha una regione leader prima del codone di inizio. Il reale inizio dell’mRNA

+1

+10

+20

+30

+40

Localizzazioni di alcune mutazioni lacO c

è la coppia di nucleotidi +1 in Figura 17.14, che è molto vicina all’inizio del sito di legame del repressore. La trascrizione dell’operone lac include una buona porzione della regione dell’operatore, oltre ai geni stessi che codificano per le proteine. Il codone di inizio AUG per la βgalattosidasi, che definisce l’inizio della sequenza codificante del gene lacZ, corrisponde alle coppie di nucleotidi da +39 a +41, quindi le prime 38 basi dell’mRNA lac non vengono tradotte. La Figura 17.14 mostra anche i siti delle sostituzioni di coppie di basi che sono state identificate per alcune mutazioni lacOc. In ciascun caso, una singola sostituzio-

Nota chiave Lo studio della sintesi degli enzimi per l’utilizzo del lattosio in E. coli ha portato alla formulazione di un modello che costituisce la base per la regolazione dell’espressione dei geni in numerosi sistemi di batteri e batteriofagi. Nel sistema del lattosio, l’aggiunta di questo zucchero alle cellule porta rapidamente alla sintesi dei tre enzimi. I geni per questi enzimi sono contigui sul cromosoma di E. coli e sono adiacenti a due sequenze regolatrici: un promotore e un operatore. I geni, l’operatore e il promotore costituiscono un operone, che viene trascritto come una singola unità. In assenza di lattosio, l’operone è represso da una proteina repressore. L’operone lac è anche regolato da un sistema di controllo positivo. Infatti, il complesso CAP-cAMP si lega al promotore facilitando il legame dell’RNA polimerasi al promotore. Se è presente il glucosio, tuttavia, non si forma il complesso CAP-cAMP e, di conseguenza, l’RNA polimerasi non può legarsi in modo efficiente al promotore e non si ha trascrizione dei geni lac.

Regolazione dell’espressione genica nei batteri e nei batteriofagi

ne di coppia di basi è responsabile dell’alterazione nel controllo della regolazione dell’operone lac. In conclusione, l’operone lac ha dimostrato di essere un sistema modello per la comprensione della regolazione genica negli organismi procarioti. Il lavoro originale di Jacob e Monod su questo sistema ebbe una grande importanza per gli studi successivi. Essendo il primo modello molecolare di regolazione dell’espressione genica in un organismo, esso diede inizio a numerosi studi nei procarioti e negli eucarioti tesi a verificare se l’operone fosse un modello generale. Oggi sappiamo che gli operoni sono comuni nei batteri e nei batteriofagi, ma si trovano raramente negli eucarioti.

Attività MyLab

Il vostro compito è determinare la posizione e l’effetto di una mutazione in ceppi di E. coli nella iAttività Mutations and Lactose Metabolism (Mutazioni e metabolismo del lattosio) nel sito dedicato.

L’operone trp di E. coli E. coli ha specifici operoni e altri sistemi genici che permettono di sintetizzare gli amminoacidi che mancano nel terreno, così da poter crescere e riprodursi. Quando un

<150 bp

Sito di pausa della trascrizione Sito di terminazione della trascrizione 162 bp

Ptrp+ O trpL

trpE

Promotore

amminoacido è presente nel terreno di crescita, i geni che codificano per gli enzimi per la sua biosintesi non sono espressi. A differenza dell’operone lac, in cui l’attività dei geni è indotta dalla sostanza (lattosio) aggiunta al terreno, in questo caso vi è una repressione dell’attività genica quando la sostanza (un amminoacido) viene aggiunta. Gli operoni per la biosintesi degli amminoacidi controllati in questo modo sono definiti operoni reprimibili. In generale, gli operoni per le vie anaboliche (biosintetiche) sono sempre repressi (spenti), quando il prodotto finale è disponibile. Un operone reprimibile, che è stato molto studiato in E. coli, è l’operone per la biosintesi dell’amminoacido triptofano (Trp).

Organizzazione dei geni per la biosintesi del triptofano La Figura 17.15 mostra l’organizzazione delle sequenze di regolazione e dei geni che codificano per gli enzimi per la biosintesi del triptofano e il loro ruolo nei vari passaggi biosintetici. Gran parte del lavoro di cui tratteremo è dovuta a Charles Yanofsky e ai suoi collaboratori. Nell’operone trp vi sono cinque geni strutturali (A-E). Il promotore e l’operatore sono a monte del gene trpE. Tra la regione promotore-operatore e trpE vi è una corta regione, chiamata trpL o regione leader. All’interno di trpL,

6800 bp

trpD

trpC

trpB

trpA

Attenuatore Trascrizione

Operatore Regione leader Leader trp mRNA 5¢



Traduzione Polipeptidi

Antranilato sintetasi, componente I

Complessi enzimatici

Antranilato sintetasi, componente II (PRA sintetasi)

PRA isomerasi-InGP sintetasi

Triptofano sintetasi β

Triptofano sintetasi α

α2β2

I2II2

H3N+

Reazioni Corismato Antranilato PRA catalizzate + glutammina + PRPP dai prodotti genici PRPP PRA CdRP InGP

= = = =

CdRP

InGP

+ serina

fosforibosil-1-pirofosfato fosforibosil antranilato 1-(o-carbossifenilammino)-1-desossiribulosio-5-fosfato indolo-3-glicerol fosfato

Figura 17.15 Sequenze regolatrici e geni strutturali dell’operone trp di E. coli e funzioni dei prodotti dei geni strutturali.

439

H C

–OOC

CH2 C HC N H

L-triptofano

440

Capitolo 17

canza di triptofano i geni dell’operone trp sono espressi al massimo grado, mentre quando è presente una quantità limitata di triptofano i geni trp sono espressi a un livello inferiore. Ciò è possibile grazie a un meccanismo che controlla l’entità dei trascritti completi, che includono i cinque geni strutturali trp, rispetto ai trascritti di 140 bp che terminano in corrispondenza del sito attenuatore nella regione trpL (Figura 17.15). I trascritti brevi vengono terminati da un processo che prende il nome di attenuazione. La quantità di trascritti completi, che includono i geni strutturali, è inversamente correlata alla quantità di triptofano presente nella cellula: quanto più triptofano è presente, tanto minore è la quantità di trascritti completi (e maggiore quella di trascritti brevi). L’attenuazione può ridurre il livello di trascrizione dell’operone trp da 8 a 10 volte. Quindi, la repressione e l’attenuazione insieme possono far variare la trascrizione dell’operone trp dalle 560 alle 700 volte.

vicino a trpE, vi è un sito attenuatore (att) che svolge un ruolo importante nella regolazione dell’operone trp. L’intero operone trp è lungo circa 7000 coppie di basi. La trascrizione dell’operone porta alla sintesi di un mRNA policistronico che contiene le regioni codificanti per i cinque geni strutturali.

Regolazione dell’operone trp Due meccanismi regolativi sono coinvolti nell’espressione dell’operone trp. Un primo meccanismo è basato sull’interazione tra repressore e operatore; l’altro agisce a trascrizione già iniziata, stabilendo se la trascrizione debba proseguire verso i geni strutturali o debba essere interrotta prematuramente. Espressione dell’operone trp in presenza di triptofano Il gene regolatore dell’operone trp è trpR, localizzato a una certa distanza dall’operone (per questa ragione non compare nella Figura 17.15). Il prodotto di trpR è una proteina aporepressore, che è sostanzialmente un repressore inattivo incapace da solo di legarsi all’operatore. Quando il triptofano è abbondante nella cellula, interagisce con la proteina aporepressore e la converte in un repressore Trp attivo. (Il triptofano è un esempio di molecola effettore, proprio come l’allolattosio per il repressore Lac.) Il repressore Trp attivo si lega all’operatore e impedisce l’inizio della trascrizione dei geni che codificano per le proteine dell’operone trp da parte dell’RNA polimerasi. Di conseguenza non vengono prodotti gli enzimi per la biosintesi del triptofano e, per effetto di questa repressione, la trascrizione dell’operone trp può essere ridotta di circa 70 volte.

Modello molecolare dell’attenuazione Il trascritto dell’mRNA della regione leader include una sequenza che può essere tradotta per produrre un corto polipeptide. Subito prima del codone di stop di tale sequenza vi sono due codoni adiacenti per il triptofano, che svolgono un ruolo centrale nell’attenuazione. Nell’mRNA del peptide leader vi sono quattro regioni che possono ripiegarsi e formare strutture secondarie per appaiamento di basi comnimazione plementari (Figura 17.16). L’appaiamento delle regioni Attenuazione 1 e 2 dà luogo a un segnale di nell’operone trp pausa nella trascrizione, di E. coli l’appaiamento delle regioni 3 e 4 è un segnale di terminazione della trascrizione e l’apEspressione dell’operone trp in presenza di basse paiamento delle regioni 2 e 3 è un segnale di antiterminaconcentrazioni di triptofano Il secondo meccanismo zione che permette il proseguimento della trascrizione. Un aspetto cruciale del meccanismo di attenuazione di regolazione agisce quando il triptofano manca o è presente in scarsa quantità. In condizioni di completa man- è il fatto che nei procarioti la trascrizione e la traduzione sono strettamente accoppiate. Ciò è possibile perché Organizzazione della regione: Terminazione non esiste alcuna membrana Pausa della trascrizione nucleare e le molecole di 3 4 1 2 mRNA nei batteri non vanno AUG UGGUGG UGA AUG incontro a processi di matuCodone di inizio Codone Codoni Codone Antiterminazione razione. Nel sistema di regoper l’mRNA trp Trp di stop della trascrizione di inizio lazione dell’operone trp, una pausa dell’RNA polimerasi Regione codificante per il peptide leader è causata dall’appaiamento Strutture alternative dell’RNA: delle regioni 1 e 2 dell’RNA

1

2

Pausa

2

3

Antiterminazione

3

4

Terminazione

Figura 17.16 Le quattro regioni dell’mRNA leader dell’operone trp e le strutture secondarie alternative che esse possono formare per appaiamento tra basi complementari.

MyLab

Regolazione dell’espressione genica nei batteri e nei batteriofagi

subito dopo la loro sintesi (vedi Figura 17.16). La pausa dura a sufficienza da permettere ai ribosomi di legarsi all’mRNA e iniziare la traduzione del peptide leader, in modo che essa proceda subito dietro la trascrizione da parte dell’RNA polimerasi. L’accoppiamento tra trascrizione e traduzione continua e la posizione del ribosoma sul trascritto leader svolge un ruolo fondamentale nel determinare la terminazione della trascrizione in corrispondenza del sito dell’attenuatore. Se le cellule si trovano in carenza di triptofano, la quantità di molecole di Trp-tRNA (cioè di triptofaniltRNA carico) è molto bassa perché pochissime molecole di triptofano sono disponibili per l’amminoacilazione del tRNA. Quindi, il ribosoma che sta traducendo il trascritto della regione leader si arresterà in corrispondenza della coppia di codoni per il triptofano, localizzati nella regione 1, perché l’amminoacido successivo da inserire a) In assenza di triptofano: antiterminazione In assenza o a basse concentrazioni di triptofano, il ribosoma che traduce il trascritto leader si ferma sui codoni Trp

90

G U A C C A C

nel peptide è carente; per cui la sintesi del peptide leader non può essere completata (Figura 17.17a). Dato che il ribosoma “copre” la regione 1 dell’attenuatore, non può avvenire l’appaiamento 1:2, perché la regione 1 non è disponibile. Tuttavia, la regione 2 dell’mRNA potrà appaiarsi con la regione 3, non appena essa verrà sintetizzata. Dato che la regione 3 è appaiata con la regione 2, essa non potrà appaiarsi con la regione 4, quando quest’ultima sarà sintetizzata. L’appaiamento 2:3 è un segnale di antiterminazione, e dato che il segnale di terminazione 3:4 non può formarsi, ciò permette all’RNA polimerasi di proseguire oltre l’attenuatore e continuare la trascrizione dei geni strutturali. Se, invece, è presente una quantità sufficiente di triptofano, il ribosoma può tradurre i codoni Trp e proseguire fino al codone di terminazione del peptide leader (Figura 17.17b). A quel punto il ribosoma sarà posizioU G CG C

U

U A Ribosoma U 80 G U G A C G G 60 70 50 G A G G U U G G U G G C G C A C U U C C U G A A AC Trp

Trp

Arg

Codone di stop

b) In presenza di triptofano: terminazione

90

G U A C C A C

U 60 70 80 A U UGGUGGCGCACUUCCUGAAACGGGCAGUG Trp

Trp

Arg

Thr

Ser Codone di stop

Figura 17.17 Modello per l’attenuazione nell’operone trp di E. coli.

G 100 U A C C A C

G A Le regioni 2 e 3 si appaiano U impedendo la formazione A 110 dell’appaiamento 3:4; C la trascrizione continua C 140 C A UUUUUUUU G C C G C G C G 130 G C C G A C G U U 1 A A

U G CG C

U

441

Regioni 2 3 4

G 100 U A C C A C

G A U A 110 1 C C 140 C A UUUUUUUU G C Le regioni 3 e 4 si appaiano; C G la trascrizione termina C G C G 130 G C C G A C G U U A A

2

3 4

Capitolo 17

U

G C C

A

G G

C

– –

C G

C



G

A



A

A

C

A

G

U

U U U U U U U

C



U

Sostituzioni trovate nei mutanti

140

C

113

– –

Operone

Parte del trascritto leader

– –

nato in modo da coprire parte della regione 2 e quindi la regione 3 potrà appaiarsi soltanto con la regione 4 quando quest’ultima verrà trascritta. L’appaiamento 3:4 è un segnale di terminazione della trascrizione (vedi Figura 5.5, terminatore Rho-indipendente). La struttura 3:4 viene chiamata attenuatore. Il segnale chiave per l’attenuazione è la concentrazione di Trp-tRNA nella cellula, la quale determina fino a che punto il ribosoma avanza sul trascritto leader, se in corrispondenza dei codoni Trp o sul codone di stop. La dimostrazione genetica del modello di attenuazione è stata ottenuta mediante lo studio di ceppi mutanti. Un tipo di mutanti mostra una terminazione della trascrizione al sito dell’attenuatore meno efficiente, che causa l’aumento dell’espressione dei geni strutturali. Le mutazioni coinvolte sono singole sostituzioni di coppie di basi che portano al cambiamento di basi nel trascritto leader mostrato nella Figura 17.18. In tutti i casi, il cambiamento di basi è nelle regioni di appaiamento 3:4; ciascuna di queste sostituzioni diminuisce la complementarità, così che la struttura diviene meno stabile. Nello stato meno stabile, la struttura ha una minore efficienza nell’impedire che la trascrizione proceda verso i geni strutturali. Un’altra dimostrazione diretta del modello dell’attenuazione è venuta da manipolazioni del DNA, nelle quali le sequenze di DNA dei due codoni Trp sono state sostituite con codoni che codificano per un altro amminoacido. In questi ceppi mutanti l’attenuazione non avviene in risposta a cambiamenti del livello di triptofano, bensì in risposta a cambiamenti del livello dell’amminoacido codificato da questi codoni. Il meccanismo di attenuazione è coinvolto nella regolazione genetica di diversi operoni per la biosintesi di altri amminoacidi in E. coli e in Salmonella typhimurium. In tutti i casi, esiste una sequenza leader all’interno della quale vi sono due o più codoni per un particolare amminoacido, la cui sintesi è controllata dagli enzimi codificati dall’operone (Figura 17.19). Per esempio, l’operone his di E. coli ha una serie di 7 istidine nel peptide leader e ben 7 dei 15 amminoacidi del peptide leader dell’operone pheA di E. coli sono fenilalanina. È stato dimostrato che l’attenuazione regola anche molti

– – – – – – – –

442

A U

G

U

A

A U C

A U

Figura 17.18 Mutazioni nella regione trpL che determinano una terminazione della trascrizione meno efficace al sito di attenuazione. Le mutazioni mappano nelle regioni di DNA che corrispondono alle regioni 3 e 4 dell’RNA.

Nota chiave La regolazione dell’operone triptofano (trp) di E. coli avviene a livello dell’inizio e del completamento della trascrizione dell’operone. Si compie innanzitutto tramite un sistema repressore-operatore, che risponde al livello di triptofano libero, e mediante un sistema di attenuazione costituito da una seconda sequenza di regolazione chiamata attenuatore, che risponde ai livelli di Trp-tRNA. L’attenuatore è localizzato nella regione leader, tra l’operatore e il primo gene strutturale trp. L’attenuazione agisce causando la terminazione della trascrizione in base alla concentrazione di triptofano. In presenza di grandi quantità di triptofano l’attenuazione è molto attiva; cioè la quantità di Trp-tRNA presente è sufficiente perché il ribosoma possa proseguire oltre l’attenuatore e permettere al trascritto leader di formare una struttura secondaria che causa la terminazione della trascrizione. In assenza di triptofano o in presenza di bassa concentrazione di triptofano, i ribosomi si arrestano nella regione dell’attenuatore e il trascritto leader forma una struttura secondaria che permette il proseguimento della trascrizione.

Sequenza del peptide leader

pheA:

Met – Lys – His – Ile – Pro – Phe – Phe – Phe – Ala – Phe – Phe – Phe – Thr – Phe – Pro – –

his:

Met – Thr – Arg – Val – Gln – Phe – Lys – His – His – His – His – His – His – His – Pro – Asp – –

leu:

Met – Ser – His – Ile – Val – Arg – Phe – Thr – Gly – Leu – Leu – Leu – Leu – Asn – Ala – Phe –

thr:

Met – Lys – Arg – Ile – Ser – Thr – Thr – Ile – Thr – Thr – Thr – Ile – Thr – Ile – Thr – Thr –

ilv:

Met – Thr – Ala – Leu – Leu – Arg – Val – Ile – Ser – Leu – Val – Val – Ile – Ser – Val – Val –

Ile – Val – Arg – Gly – Arg – Pro – Val – Gly – Ile – Gln – His – – Gly – Asn – Gly – Ala – Gly – – Val – Ile – Ile – Ile – Pro – Pro – Cys – Gly – Ala – Ala – Leu – Gly – Arg – Gly – Lys – Ala – –

Figura 17.19 Sequenze amminoacidiche dei peptidi leader di alcuni operoni batterici controllati da attenuatori. Sono mostrati i peptidi leader degli operoni pheA (fenilalanina), his

(istidina), leu (leucina), thr (treonina) e ilv (isoleucina e valina) di E. coli o Salmonella typhimurium. Sono evidenziati in arancio gli amminoacidi che regolano i rispettivi operoni.

Regolazione dell’espressione genica nei batteri e nei batteriofagi

geni che non sono coinvolti nella biosintesi di amminoacidi, come il gene ampC di E. coli (per la resistenza all’ampicillina).

L’operone ara di E. coli: controllo positivo e negativo Il modello di operone di Jacob e Monod per la regolazione dell’espressione genica convinse la maggior parte dei ricercatori dell’epoca che il controllo negativo fosse coinvolto nella regolazione dell’espressione genica in tutti i sistemi. Negli operoni lac e trp discussi precedentemente, il controllo negativo è il risultato dell’azione di un repressore che blocca la trascrizione. Nel caso dell’operone lac, il repressore prodotto dalla traduzione dell’mRNA trascritto dal gene lacI è attivo e blocca la trascrizione. Quando l’induttore è presente, il repressore è inattivato e così la trascrizione dei geni strutturali può avvenire. Nel caso dell’operone trp, il repressore è inattivo di per sé e diventa attivo per bloccare la trascrizione solo quando è legato al triptofano. Negli anni sessanta del secolo scorso, più o meno nello stesso periodo degli esperimenti di Jacob e Monod, Ellis Englesberg e collaboratori stavano utilizzando l’analisi genetica per studiare la regolazione dell’operone arabinosio (ara) di E. coli. I loro risultati indicarono che l’operone ara era sotto controllo positivo, cioè che era necessario un attivatore perché avvenisse la trascrizione. Questa conclusione non fu immediatamente accettata a quel tempo, ma le successive analisi biochimiche e molecolari la confermarono. È ora noto che la regolazione positiva, che coinvolge gli attivatori, avviene in diversi sistemi procarioti (incluso l’operone lac, come già descritto) e in tutti gli eucarioti. La Figura 17.20a mostra l’organizzazione dell’operone ara. I tre geni strutturali araB, araA e araD codificano per tre enzimi che convertono lo zucchero pentoso L-arabinosio in D-xilulosio-5-fosfato il quale poi è metabolizzato attraverso altre vie biochimiche. Così come il lattosio, l’arabinosio può essere usato come unica fonte di carbonio e di energia da E. coli. In questo caso l’arabinosio è l’induttore dell’operone e, così come l’operone lac e altri operoni per l’utilizzo di zuccheri, questo operone può essere trascritto soltanto se il glucosio è assente, perché cAMP-CAP deve legarsi al sito CAP affinché possa legarsi l’RNA polimerasi (vedi paragrafo “Controllo positivo dell’operone lac”). A monte dei geni strutturali vi sono il gene regolatore araC e diverse regioni di controllo per la trascrizione di quel gene e dei geni strutturali. Il polipeptide prodotto dal gene regolatore forma un dimero di due subunità identiche chiamato AraC; esso è il regolatore fondamentale dell’espressione genica. PBAD è il promotore a cui si lega l’RNA polimerasi per trascrivere i geni strutturali (da sinistra a destra), e PC è il promotore a cui si lega l’RNA polimerasi

443

per trascrivere l’araC (da destra a sinistra). Gli altri siti verranno spiegati descrivendo gli eventi di regolazione. Quando l’arabinosio e il glucosio sono assenti nel terreno di crescita, i geni strutturali araBAD non sono trascritti (Figura 17.20b). Ciò succede perché una subunità della proteina AraC si lega al sito induttore, araI1, e l’altra all’operatore, araO2. Questi legami determinano nel DNA la formazione di un loop (ossia un’ansa) che impedisce il legame di CAP-cAMP al sito CAP e dell’RNA polimerasi a PBAD; la trascrizione dei geni strutturali, quindi, non avviene. Questa parte della regolazione dell’operone ara prevede un controllo negativo in cui AraC agisce come repressore. Quando l’arabinosio è presente nel terreno di crescita (e il glucosio è assente) l’operone ara è indotto (Figura 17.20c). La trascrizione dei geni araBAD avviene quando l’arabinosio, agendo come induttore, si lega a ciascuna subunità di AraC causando una modificazione allosterica della proteina. In questa nuova conformazione, una subunità di AraC rimane legata al sito araI1 mentre l’altra subunità si stacca da araO2 e si lega invece ad araI2. In questo modo il DNA non forma più un loop. Quindi, CAP-cAMP si lega al sito CAP, l’RNA polimerasi a PBAD e la trascrizione dei geni strutturali può avvenire. Questa parte della regolazione dell’operone ara prevede un controllo positivo in cui AraC agisce come attivatore. Se è presente glucosio insieme ad arabinosio, i geni araBAD non sono trascritti a causa della repressione da cataboliti. Così come per l’operone lac, la diminuzione dei livelli di cAMP, che avviene quando il glucosio è presente, fa sì che i complessi CAP-cAMP non si formino e, mancando il legame del CAP-cAMP al sito CAP, l’avvio della trascrizione da parte dell’RNA polimerasi a partire da PBAD è del tutto inefficiente.

La regolazione dell’espressione genica nel fago lambda I batteriofagi per moltiplicarsi devono infettare le cellule batteriche. Molti o tutti i componenti essenziali per la riproduzione fagica sono forniti dalla cellula batterica ospite e l’uso di questi componenti è controllato dai prodotti dei geni del fago. Molti geni del fago, quindi, codificano per prodotti che controllano il ciclo vitale e la produzione delle particelle fagiche della progenie. Sono noti molti dettagli della regolazione genica di diversi batteriofagi. In questo paragrafo discuteremo della regolazione dell’espressione genica relativa alla scelta tra ciclo litico e lisogenia nel batteriofago lambda (λ). (Si ricordi, dal Capitolo 15, che nel ciclo litico il fago prende possesso del batterio e dirige la sua crescita e capacità riproduttiva in modo tale che esso esprima i geni del fago e produca progenie fagica. La lisogenia è il fenomeno per cui il genoma di un fago temperato si

444

Capitolo 17 a) Organizzazione dell’operone ara Siti induttori

Gene regolatore ara PC

araC

araO2 Operatore

Sito CAP

araI1

araI2

PBAD

araB

araA

Promotore dei geni strutturali

Promotore di araC Trascrizione

araD

Trascrizione

araBAD mRNA 5'

5'

mRNA per AraC 3'

Geni strutturali araBAD

3'

Traduzione

Traduzione

L-ribulochinasi L-arabinosio

Sito di legame dell’arabinosio

isomerasi

Polipeptide AraC

Reazioni catalizzate

L-arabinosio

L-ribulosio

Ribulosio-5fosfato epimerasi

L-ribulosio-

D-xilulosio-

5-fosfato

5-fosfato

ATP ADP + Pi

b) Arabinosio e glucosio sono assenti: la trascrizione dei geni strutturali è inibita

C

araO2

Pc

a ra

Proteina AraC

Sito CAP

araI1

PBAD

araI2

araB

araA

araD

L’RNA polimerasi non può legarsi e la trascrizione da PBAD non può avvenire. L’operone è represso

CAP-cAMP non può legarsi

c) Arabinosio presente e glucosio assente: la trascrizione dei geni strutturali è indotta Arabinosio CAP-cAMP

RNA polimerasi

AraC

cAMP CAP

araO2

araC

PC

Sito CAP

araI1

araI2

Figura 17.20 Regolazione dell’operone ara di E. coli.

integra nel cromosoma batterico, dove viene replicato ogni volta che il cromosoma batterico si replica. In questo stato il genoma fagico è represso e si dice che è allo stato di profago.)

Eventi precoci nella trascrizione La Figura 17.21 mostra la mappa genetica del fago λ. Il cromosoma maturo di λ è lineare e presenta estremità complementari “coesive” (siti cos). Una volta libero nella cellula ospite, il cromosoma di λ circolarizza, perciò la mappa genetica è mostrata in forma circolare. Ricor-

PBAD

araB

araA

araD

L’RNA polimerasi si lega e può avvenire la trascrizione da PBAD. L’operone è attivato

diamo che λ è un fago temperato (vedi Figura 15.12), quindi, quando infetta una cellula batterica può scegliere tra il ciclo litico (nel quale viene prodotta e liberata la progenie fagica dalla cellula) o il ciclo lisogenico (nel quale il cromosoma di λ si integra nel cromosoma batterico e non viene prodotta progenie fagica). La scelta tra ciclo litico e lisogenico avviene poco dopo l’infezione della cellula da parte di λ e la circolarizzazione del suo DNA, mettendo in funzione un sofisticato interruttore genetico. Dapprima, la trascrizione inizia dai promotori PL e PR (Figura 17.22, fase 1). Il promotore PL è il promotore per la trascrizione verso sinistra dell’ope-

Regolazione dell’espressione genica nei batteri e nei batteriofagi

445

Figura 17.21 Mappa del fago l, che mostra i geni principali. (Promotori menzionati nel testo: PL = promotore Regolatore per la trascrizione verso sinistra dell’operone preProteine per del gene cI Regolatore la replicazione coce di sinistra; PR = promotore per la trascrizioRepresdei geni precoci del DNA del fago ne verso destra dell’operone precoce di desore di λ cro O P Stabilizzatore cI cII stra; PRE = promotore per l’instaurazione N della proteina cII Regolatore del repressore e PRM = promotore cIII Proteine per dei geni tardivi per il mantenimento del repressore.) PRM PRE la ricombinazione Regolatore dell’espressione dei geni cI e int di λ

del fago

Origine Q della replicazione Promotori precoci PAQ PR„ e operatori Regolatore dei geni cos tardivi λ ~ 48 kb

bet exo

OL„ PL

Escissionasi (per l’escissione dal cromosoma) xis int Integrasi (per l’integrazione nel cromosoma)

PI att

OR„ PR

Proteine S per la lisi R Rz

Taglio del DNA al sito cos per l’impacchettamento

Nu1 A Terminasi W B

T

J I

K

L

M

G

V

U

Nu3 C D E FI Z F11

Geni per le proteine della testa e per l’assemblaggio

H

Geni per le proteine della coda e per l’assemblaggio

rone precoce di sinistra, mentre PR è il promotore per la trascrizione verso destra dell’operone precoce di destra. Partendo da PR, il primo gene a essere trascritto è cro (control of repressor and other, ovvero controllo del repressore e di altri geni) e il suo prodotto è la proteina Cro. Questa proteina gioca un ruolo importante nell’indirizzare l’interruttore genetico verso il ciclo litico. Partendo da PL, il primo gene a essere trascritto è N. La risultante proteina N è un antiterminatore della trascrizione, che permette alla trascrizione di procedere oltre i siti terminatori, localizzati a sinistra del gene N e a destra del gene cro, includendo quindi tutti i geni precoci (Figura 17.22, fase 2). I geni trascritti grazie all’azione della proteina N sono cII, O, P e Q. Il gene cII codifica per la proteina cII, che può far esprimere il gene cI (che codifica per il repressore di λ) e il gene int (che codifica per l’integrasi necessaria per l’integrazione del cromosoma di λ nel cromosoma batterico durante il ciclo lisogenico). Tuttavia, la proteina cII agisce solo quando il fago entra nel ciclo lisogenico. I geni O e P codificano per due proteine della replicazione del DNA, e il gene Q codifica per una proteina necessaria per l’attivazione dei geni tardivi per le proteine strutturali delle particelle fagiche e per la lisi dell’ospite. La proteina Q è un altro antiterminatore, che permette alla trascrizione di proseguire fino ai geni tardivi, coinvolti nel ciclo litico. Tuttavia, solo quando l’interruttore è rivolto verso il ciclo litico e la trascrizione da PR continua per un tempo sufficientemente lungo, la proteina Q si accumula e può funzionare efficacemente.

Il ciclo lisogenico Agli eventi di trascrizione precoce seguono o il ciclo litico o quello lisogenico (Figura 17.22, fase 3). L’interruttore viene spostato verso il ciclo lisogenico nel modo descritto di seguito. L’avvio della lisogenia richiede i prodotti proteici dei geni cII (operone precoce di destra) e cIII (operone precoce di sinistra; vedi Figura 17.21). La proteina cII (stabilizzata dalla proteina cIII) attiva la trascrizione verso sinistra del gene cI (localizzato tra i promotori PL e PR; vedi Figura 17.22, fase 4a) a partire da un promotore chiamato PRE (Promoter for Repressor Establishment, promotore per l’instaurazione del repressore). In questo caso, tuttavia, il gene cro non è trascritto perché la sua trascrizione avviene verso destra sotto il controllo di un promotore localizzato alla sua sinistra. Il prodotto del gene cI, il repressore di λ, si lega alle regioni dei due operatori, OL e OR (vedi Figura 17.21 e Figura 17.22, fase 5a), le cui sequenze sono sovrapposte, rispettivamente, ai promotori PL e PR. Il legame del repressore di λ impedisce all’RNA polimerasi di trascrivere gli operoni precoci controllati da PL e PR. Di conseguenza, la trascrizione dei geni N e cro viene bloccata e, dato che le proteine codificate da questi due geni sono instabili, le concentrazioni cellulari di queste proteine calano drasticamente. Inoltre, il repressore legato a OR stimola la sintesi di ulteriore mRNA per il repressore a partire da un diverso promotore, PRM (Promoter for Repressor Maintenance, promotore per il mantenimento

446

Capitolo 17 1

La crescita del fago inizia quando l’RNA polimerasi si lega ai promotori precoci PL e PR, sintetizzando l’mRNA dei geni N e cro. (In tutta la figura, i segmenti colorati in rosa ( ) sono promotori inattivi e quelli colorati in giallo ( ) promotori attivi.) mRNA 3¢ 5¢ ... ... Q cro cII O P int cI N 5¢ 3¢ Geni PI PRM PR ,OR PRE PR¢ Geni PL ,OL precoci tardivi mRNA La proteina N, agendo su 3 siti, fa proseguire la sintesi di RNA verso altri geni; le proteine O e P permettono l’inizio della sintesi del DNA; la proteina cII viene prodotta e agisce come indicato nel seguente diagramma:

2

N

mRNA 5¢ 3¢

...

int

cro cII

N

cI

PL ,OL

PRM PR ,OR

Geni precoci

O

Geni tardivi

mRNA

Ne conseguono due vie in competizione tra loro:

3

Verso lo sviluppo lisogenico: predomina il repressore (cI)

Verso lo sviluppo litico: predomina Cro 4b La proteina Cro occupa gli operatori OR e OL , impedendo

4a La proteina cII stimola la sintesi dell’mRNA da PRE

per il repressore (gene cI) e da PI per l’integrasi (gene int). cII mRNA 5¢ 3¢

mRNA

...

int

N

cI

PI

cro cII PRE

3¢ 5¢

5¢ 3¢

Geni precoci

5a Il repressore si lega a OR e OL , bloccando la sintesi

mRNA

questi geni codificano per le proteine strutturali che impacchettano il DNA a formare nuove particelle fagiche.

Repressore cro cII

N

cI

PL ,OL

PRM PR ,OR

la sintesi dell’mRNA per il repressore, ma permettendo una sufficiente trascrizione verso destra che porta a un accumulo della proteina Q. Cro mRNA 3¢ ... Q cro cII O P N cI 5¢ PRM PR ,OR PL ,OL Geni tardivi mRNA

5b La proteina Q stimola la trascrizione dei geni tardivi;

dell’RNA; il repressore legato a OR stimola la sintesi di ulteriore repressore da PRM . L’integrasi determina l’integrazione del DNA del fago. Viene stabilita la lisogenia.

5¢ 3¢

3¢ 5¢

... Q

P

O

P

5¢ 3¢

N

Q

Cro

mRNA 3¢ 5¢

cI

PL ,OL

cro cII

O

P

PRM PR ,OR

PR¢ mRNA

Figura 17.22 Espressione dei geni di l dopo l’infezione di E. coli e gli eventi trascrizionali in caso di ciclo lisogenico o di ciclo litico.

del repressore), in modo tale che venga mantenuta una alta concentrazione del repressore nella cellula (vedi Figura 17.22, fase 5a). Quindi, se è presente una quantità sufficiente di repressori di λ, viene stabilito lo stato lisogenico in seguito al legame del repressore alle regioni degli operatori OL e OR, seguito dall’integrazione del DNA di λ catalizzata dall’integrasi. L’integrasi è prodotta a partire dal promotore PI, regolato da cII. Quando la concentrazione di cII cala, la trascrizione da PI si arresta e PRM resta l’unico promotore attivo. In conclusione, il ciclo lisogenico è favorito quando viene sintetizzata una quantità elevata di repressore di λ, tale da permettere di spegnere i promotori precoci e quindi reprimere l’espressione di tutti i geni necessari per il ciclo litico. Un gene importante del ciclo litico, che

... Q

3¢ 5¢ Geni tardivi mRNA

Nella figura, la stimolazione della trascrizione è indicata da frecce verdi, la repressione della trascrizione da frecce rosse.

è represso, è Q; la proteina Q è un regolatore positivo per la produzione delle proteine litiche e delle proteine dell’involucro del fago (vedi prossimo paragrafo).

Il ciclo litico Consideriamo l’induzione del ciclo litico causata dall’irradiazione con raggi ultravioletti. Induttori come i raggi ultravioletti solitamente danneggiano il DNA e, in qualche modo, causano un cambiamento nella funzione della proteina batterica RecA (prodotto del gene recA). Normalmente RecA è coinvolta in eventi di ricombinazione del DNA, ma, quando il DNA viene danneggiato, RecA stimola i polipeptidi del repressore di λ a scindersi in due, rendendoli inattivi. La conseguente assenza di

Regolazione dell’espressione genica nei batteri e nei batteriofagi

repressore su OR permette alla RNA polimerasi di legarsi a PR e il gene cro viene quindi trascritto. La risultante proteina Cro riduce la sintesi di RNA da PL e PR, riducendo quindi anche la produzione della proteina cII, il regolatore della sintesi del repressore di λ, e inoltre blocca la sintesi dell’mRNA per il repressore di λ da PRM (Figura 17.22, fase 4b). Nello stesso tempo, la trascrizione dei geni dell’operone precoce di destra da PR viene diminuita, ma si è accumulata una quantità di proteina Q sufficiente per spostare l’interruttore genetico

447

verso la trascrizione dei geni tardivi per dare inizio al ciclo litico (Figura 17.22, fase 5b). Riassumendo, λ usa un complesso sistema di regolazione per scegliere tra ciclo litico e ciclo lisogenico. La decisione dipende da un sofisticato interruttore genetico che implica la competizione tra i prodotti del gene cI (il repressore) e del gene cro (la proteina Cro). Se predomina il repressore, viene intrapreso il ciclo lisogenico; se invece domina la proteina Cro, viene intrapreso il ciclo litico.

Sommario l Nel sistema di E. coli per l’utilizzo del lattosio, l’aggiunta di lattosio alle cellule determina una rapida sintesi di tre enzimi. In assenza di lattosio, la sintesi dei tre enzimi è repressa. I geni per gli enzimi sono contigui sul cromosoma di E. coli e adiacenti a due sequenze regolatrici: un promotore e un operatore. Il promotore, l’operatore e i geni costituiscono un operone. La trascrizione dei geni produce un singolo mRNA policistronico. Un gene regolatore è associato all’operone. Per avviare l’espressione genica nel sistema del lattosio, un metabolita del lattosio si lega alla proteina repressore (prodotta dal gene regolatore), la inattiva e le impedisce di legarsi all’operatore. Di conseguenza, l’RNA polimerasi può legarsi al promotore e trascrivere i tre geni in un singolo mRNA policistronico. Gli operoni sono di solito coinvolti nella regolazione dell’espressione genica in un gran numero di procarioti e batteriofagi. l Se nel terreno sono presenti sia glucosio sia lattosio, l’operone lattosio non è indotto perché il glucosio (che richiede meno energia del lattosio per essere metabolizzato) è la fonte energetica preferita. Questo fenomeno è chiamato repressione da cataboliti e coinvolge i livelli cellulari di AMP ciclico. Quindi, in presenza di lattosio e in assenza di glucosio, cAMP si unisce a CAP per formare un regolatore positivo necessario perché l’RNA polimerasi si leghi efficientemente al promotore. L’aggiunta di glucosio determina un abbassamento della concentrazione di cAMP, cosicché il complesso CAP-cAMP non si forma e l’RNA polimerasi non può legarsi in modo efficiente al promotore per trascrivere i geni lac. l Nei batteri, l’espressione di un buon numero di operoni per la sintesi di amminoacidi, come l’operone trp, è controllata da un sistema repressore-operatore e tramite l’attenuazione a livello di una seconda sequenza regolatrice, chiamata attenuatore. Il sistema repressore-operatore funziona essenzialmente come quello per l’operone lac, tranne per il fatto che l’aggiunta dell’amminoacido alle cellule attiva il repressore spegnendo l’operone. Un attenuatore localizzato tra la re-

gione dell’operatore e il primo gene strutturale è un sito di terminazione della trascrizione che, in base alla concentrazione di triptofano nella cellula, modula il proseguimento o meno della trascrizione da parte dell’RNA polimerasi oltre l’attenuatore stesso. L’attenuazione richiede uno stretto collegamento tra trascrizione e traduzione, e la formazione di strutture di RNA secondarie che segnalano se la trascrizione può continuare. l L’operone ara di E. coli codifica i geni per l’utilizzo dell’arabinosio. Questo operone ha un gene regolatore araC, il cui prodotto (AraC) funziona come repressore e come attivatore della trascrizione a seconda delle condizioni. Quando l’arabinosio è assente dal terreno di crescita, AraC si lega alla sequenza regolatrice causando la formazione di un loop nel DNA e così bloccando l’accesso dell’RNA polimerasi al promotore dei geni strutturali. In questo modo la trascrizione dei geni strutturali è bloccata dalla repressione. Quando l’arabinosio è presente nel terreno di crescita e il glucosio è assente, l’operone viene indotto. Agendo come induttore, l’arabinosio si lega ad AraC cambiandone la conformazione. In questa nuova conformazione, AraC cambia il modo in cui lega il DNA. Non si forma più il loop nel DNA e il legame dell’RNA polimerasi al promotore dei geni strutturali è stimolato da AraC che funziona da attivatore. In questo sistema di utilizzazione dello zucchero, la repressione da cataboliti funziona come nell’operone lac, cosicché l’operone non può essere indotto se il glucosio è presente. l I batteriofagi come lambda sono perfettamente adattati a riprodursi all’interno di un batterio ospite. Molti geni coinvolti nella produzione della progenie fagica, nell’instaurarsi o nella perdita della lisogenia nei fagi temperati sono organizzati in operoni. Come gli operoni dei batteri, essi sono controllati mediante l’interazione di proteine di regolazione con gli operatori e i promotori adiacenti ai gruppi di geni strutturali. Il fago lambda è stato un modello eccellente per studiare l’interruttore genetico che controlla la scelta tra ciclo litico o lisogenico in un fago temperato.

Approccio analitico alla soluzione di problemi di genetica D17.1 In laboratorio vi vengono dati dieci ceppi di E. coli con i seguenti genotipi dell’operone lac, dove I = lacI (il gene per

il repressore Lac), P = Plac (il promotore), O = lacO (l’operatore) e Z = lacZ (il gene per la β-galattosidasi):

448

Capitolo 17 1. 1+ P+ O+ Z+ 2. 1– P+ O+ Z+ 3. 1+ P+ Oc Z+ 4. 1– P+ Oc Z+ 5. 1+ P+ Oc Z– F′ 1+ P+ Oc Z– 6. –––––––––––– 1+ P+ O+ Z+ F′ 1+ P+ O+ Z– 7. –––––––––––– 1+ P+ Oc Z+ F′ 1+ P+ O+ Z+ 8. –––––––––––– 1– P+ O+ Z– F′ 1+ P+ Oc Z– 9. –––––––––––– 1– P+ O+ Z+ F′ 1– P+ O+ Z– 10. –––––––––––– 1– P+ Oc Z+

Per ciascun ceppo, dite se la β-galattosidasi verrà prodotta a. quando il lattosio è assente dal terreno di crescita e b. quando il lattosio è presente nel terreno di crescita. In entrambi i casi non è presente glucosio. (Nota: nei ceppi diploidi parziali 6-10 una copia dell’operone lac è nel cromosoma dell’ospite e l’altra copia è nel fattore extracromosomico F.) R17.1 Le risposte sono le seguenti, dove “+” = produzione di βgalattosidasi e “–” = mancanza di produzione di β-galattosidasi: Genotipo

Non indotto: assenza di lattosio

Indotto: presenza di lattosio

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

– + + + – – + – – +

+ + + + – + + + + +

Per rispondere in modo completo alla domanda, abbiamo bisogno di conoscere in modo preciso come l’operone lac sia regolato nel ceppo selvatico e le conseguenze di particolari mutazioni sulla regolazione dell’operone. Il ceppo (1) è l’operone standard selvatico. Nessun enzima viene prodotto in assenza di lattosio, dato che il repressore Lac prodotto dal gene I+ si lega all’operatore (O+) e blocca l’inizio della trascrizione. Quando viene aggiunto lattosio, esso si lega al repressore cambiandone la conformazione, cosicché non possa più legarsi alla regione O+, e ciò permette la trascrizione dei geni strutturali da parte dell’RNA polimerasi. Il ceppo (2) è un ceppo aploide con una mutazione nel gene lacI (I–). La conseguenza è che la proteina repressore Lac non può legarsi alla regione dell’operatore (normale), così non c’è inibizione della trascrizione anche in assenza di lattosio. Questo ceppo, quindi, è costitutivo, intendendo con ciò che la β-galattosidasi viene prodotta dal gene lacZ+ sia in presenza sia in assenza di lattosio.

Il ceppo (3) è un altro mutante costitutivo. In questo caso il gene per il repressore è selvatico e il gene per la β-galattosidasi, lacZ+, è selvatico, ma vi è una mutazione nella regione dell’operatore (Oc). Quindi, la proteina repressore Lac non può legarsi all’operatore e la trascrizione avviene in presenza e in assenza di lattosio. Il ceppo (4) porta entrambe le mutazioni di regolazione dei ceppi precedenti. Non viene prodotto il repressore funzionale Lac ma, anche se venisse prodotto, l’operatore è cambiato in modo tale che non potrebbe legarsi. La conseguenza è la stessa: produzione costitutiva dell’enzima. Il ceppo (5) produce un repressore funzionale Lac, ma l’operatore (Oc) è mutato. Quindi, la trascrizione non può essere bloccata e viene prodotto un mRNA policistronico lac sia in presenza sia in assenza di lattosio. Tuttavia, dato che vi è anche una mutazione nel gene per la β-galattosidasi (Z–), non viene prodotto alcun enzima funzionale. Nel ceppo diploide parziale (6), un operone lac è completamente selvatico e l’altro porta una mutazione di tipo costitutivo nel sito operatore e una mutazione nel gene per la β-galattosidasi. In assenza di lattosio, non viene prodotto enzima funzionale. Per l’operone selvatico, il repressore Lac si lega all’operatore e blocca la trascrizione. Per l’operone con le due mutazioni, il repressore non può legarsi alla regione dell’operatore perché è mutata, così viene prodotto mRNA per l’operone mutato; tuttavia, dato che anche il gene lacZ è mutato, non viene prodotto enzima funzionale. In presenza di lattosio, viene prodotto enzima funzionale, perché la repressione dell’operone selvatico viene eliminata così che possa essere trascritto il gene Z+. Questo tipo di ceppo fornisce la dimostrazione che la regione operatore non produce una sostanza diffusibile. Nel diploide parziale (7) l’enzima funzionale è prodotto in presenza o in assenza di lattosio, poiché uno degli operoni ha una mutazione Oc che non risponde al repressore ed è associata al gene Z+ selvatico. Questo operone è trascritto in modo costitutivo. L’altro operone è inducibile, ma, dato che vi è una mutazione Z–, non viene prodotto enzima funzionale. Il diploide parziale (8) ha un operone selvatico e un operone con una mutazione del gene regolatore I– e una mutazione Z–. Il prodotto del gene I+ è diffusibile, così può legarsi alla regione O+ di entrambi gli operoni, ponendo quindi entrambi sotto il controllo dell’induttore. Questo ceppo fornisce la classica dimostrazione che il gene I+ è trans-dominante sulla mutazione I–. In questo caso, la particolare localizzazione della mutazione Z– è irrilevante: lo stesso risultato sarebbe stato ottenuto se Z+ e Z– fossero scambiati fra i due operoni. In questo diploide parziale la β-galattosidasi non viene prodotta a meno che non sia presente il lattosio. Nel ceppo (9) la β-galattosidasi viene prodotta solo quando è presente il lattosio, perché la regione Oc controlla solo quei geni che sono adiacenti a essa sullo stesso cromosoma (cis-dominanza) e, in questo caso, uno dei geni adiacenti è Z–, che codifica per un enzima non funzionale. Il diploide parziale è eterozigote I+/I–, ma I+ è trans-dominante, come discusso per il ceppo (8). Quindi il gene normale Z+ è sotto il controllo dell’induttore. Il diploide parziale (10) ha una proteina repressore difettiva e una mutazione Oc adiacente al gene Z+. Solo per questo motivo il diploide parziale è costitutivo. Anche l’altro operone viene trascritto costitutivamente ma, dato che vi è una mutazione Z–, non viene prodotto enzima funzionale.

18

La regolazione dell’espressione genica negli eucarioti

A quali livelli è regolata l’espressione dei geni che codificano per proteine negli eucarioti?

In che modo la lunghezza della coda di poli(A) influisce sulla traduzione dell’mRNA?

In che modo le proteine regolatrici controllano l’inizio della trascrizione?

In che modo i piccoli RNA regolatori effettuano il silenziamento dei geni a livello post-trascrizionale?

In che modo l’organizzazione della cromatina influenza l’attivazione della trascrizione genica?

Come viene regolata la degradazione dell’mRNA?

In che modo la metilazione del DNA influisce sulla trascrizione dei geni?

Come viene regolata la degradazione delle proteine?

Come possono le variazioni nel processamento dell’RNA dare origine a proteine che sono codificate dallo stesso gene, ma che differiscono nella struttura e nella funzione?

Attività Per rispondere ai cambiamenti dell’ambiente o per permettere la realizzazione del programma di differenziamento, molto frequentemente le cellule devono accendere o spegnere parecchi geni in maniera coordinata. In questo capitolo apprenderete la regolazione dell’espressione genica negli eucarioti e, utilizzando la iAttività, potrete vedere come i ricercatori riescono a chiarirne i meccanismi nei dettagli.

Nel capitolo precedente è stata trattata la regolazione dell’espressione genica in batteri e batteriofagi. La maggior parte di tale regolazione avviene a livello di trascrizione. Si è osservato che sono necessarie sequenze specifiche di DNA – in particolare il promotore, a cui si lega l’RNA polimerasi, e le sequenze regolatrici, a cui si legano specifiche proteine di regolazione. Nell’operone lac, per esempio, la sequenza regolatrice è lacO, l’operatore, a cui si lega la proteina repressore Lac. Più in generale, la proteina di regolazione può essere un repressore (che inibisce la trascrizione – per esempio, Lac) o un attivatore (che promuove la trascrizione – per esempio CAP, nell’operone lac, o una conformazione di AraC, nell’operone dell’arabinosio). Anche se non discussa in modo esplicito nel capitolo precedente, la regolazione per alcuni geni nei batteri avviene anche a livello post-trascrizionale. Gli eucarioti presentano molte somiglianze con i procarioti, ma anche alcune differenze relativamente alla re-

golazione dell’espressione genica. Inoltre, esistono variazioni tra gli eucarioti stessi nella complessità dei sistemi di regolazione, dal più semplice esistente negli unicellulari, come il lievito, al più complesso nei mammiferi. Le somiglianze principali nella regolazione genica tra procarioti ed eucarioti sono a livello di (1) sequenze promotrici variabili che determinano l’inizio della trascrizione, (2) sequenze regolatrici che determinano la risposta del gene a molecole effettrici, e (3) proteine di regolazione – sia attivatori sia repressori – con domini specifici di legame al DNA, che interagiscono con le sequenze regolatrici per il controllo della trascrizione. In questo capitolo si apprenderà che la trascrizione negli eucarioti è regolata principalmente da attivatori. Vi sono anche delle differenze, che derivano dalla maggiore complessità dell’organizzazione della cellula eucariote, riguardanti (1) il ruolo della struttura della cromatina nel regolare l’espressione genica; (2) la necessità di aggiungere a una molecola di pre-mRNA un cappuccio all’estremità 5′ e una coda di poli(A) all’estremità 3′ e poi di tagliare il pre-mRNA per rimuovere gli introni e produrre l’mRNA maturo; (3) la possibilità, per un certo numero di geni che codificano per proteine, di uno splicing alternativo del pre-mRNA allo scopo di produrre diversi mRNA; (4) la regolazione del trasporto dell’mRNA dal nucleo al citoplasma; (5) la regolazione della traduzione degli mRNA. Infine, si è appreso nei precedenti capitoli che gli operoni sono unità di regolazione frequenti nei procarioti. L’eccitante scoperta

450

Capitolo 18

degli operoni nei batteri ha naturalmente focalizzato gli sforzi nel chiarire se il modello dell’operone fosse applicabile anche alla regolazione genica negli eucarioti. La risposta riguardo agli eucarioti è che non vi sono geni di funzione correlata codificanti per proteine organizzati in operoni, anche quando sono regolati in modo coordinato, e raramente vengono osservati mRNA policistronici. Un esempio è la trascrizione dei geni sul DNA mitocondriale (descritto nel Capitolo 13) che vengono trascritti come due mRNA policistronici a partire dai rispettivi promotori su ciascuno dei due filamenti di DNA. In questo capitolo sarà discussa la regolazione dell’espressione genica negli eucarioti a vari livelli. Nella trattazione, bisogna avere presente che le necessità di regolazione di procarioti ed eucarioti – in particolare degli eucarioti multicellulari – sono diverse. I procarioti crescono e si dividono, mentre gli eucarioti multicellulari si sviluppano e si differenziano, richiedendo, pertanto, un

DNA Controllo trascrizionale Trascritto primario di RNA

Nucleo Controllo della maturazione

mRNA maturo

Citoplasma

controllo più sofisticato dell’espressione genica nello spazio e nel tempo.

Livelli di controllo dell’espressione genica negli eucarioti Gli organismi procarioti sono per la maggior parte unicellulari e rispondono velocemente all’ambiente mediante cambiamenti nella regolazione genica prevalentemente a livello trascrizionale e, in parte, traduzionale. La risposta trascrizionale si realizza mediante l’interazione di proteine regolatrici con sequenze di regolazione del DNA situate a monte delle regioni codificanti. Cambiamenti rapidi nei livelli di sintesi proteica vengono generalmente ottenuti sia spegnendo la trascrizione del gene corrispondente, sia degradando rapidamente le molecole di mRNA implicate. Negli eucarioti, sia unicellulari sia multicellulari, il controllo dell’espressione genica è più complicato che nei procarioti. La ragione deriva, in parte, dalla compartimentalizzazione delle cellule eucariote e dalle esigenze determinate dalla necessità degli eucarioti multicellulari di generare numeri elevati e tipi diversi di cellule. In particolare, l’assenza nei procarioti di un nucleo circondato da una membrana consente alla traduzione di procedere su un mRNA durante la sua sintesi. In una cellula eucariote la presenza di un nucleo separa i processi di trascrizione e traduzione. Di conseguenza, negli eucarioti l’espressione di geni codificanti per proteine può essere regolata a più livelli. Nella Figura 18.1 sono rappresentati alcuni di questi livelli: trascrizione, processamento, trasporto, traduzione e degradazione dell’mRNA, e processamento e degradazione delle proteine.

Controllo del trasporto

Controllo dell’inizio della trascrizione da parte delle proteine regolatrici

mRNA maturo

Controllo traduzionale

Controllo della degradazione dell’mRNA

Proteine mRNA degradato

Controllo della degradazione delle proteine

Proteine degradate

Figura 18.1 Livelli a cui può essere controllata l’espressione genica negli eucarioti.

La regolazione dell’espressione di geni che codificano per proteine negli eucarioti avviene principalmente a livello di inizio della trascrizione. Come discusso nel Capitolo 5, l’inizio della trascrizione di geni codificanti per proteine è sotto il controllo del promotore, immediatamente a monte del gene, e degli enhancer, che sono posizionati distanti dal gene, sia a monte sia a valle rispetto al sito di inizio della trascrizione. In sintesi, dalla discussione del Capitolo 5 emerge che il macchinario generale di trascrizione, che si assembla a livello del “core” del promotore (regione centrale del promotore), è capace solo di un livello di trascrizione basale. La trascrizione regolata fino al massimo livello possibile per il gene dipende da proteine regolatrici (attivatori) che si legano agli elementi prossimali del promotore e agli elementi distali, gli enhancer. Questo legame determina il reclutamento di proteine necessarie a rendere la cromatina accessibile al macchinario di trascrizione e poi al reclutamento

La regolazione dell’espressione genica negli eucarioti Figura 18.2 Attivazione della trascrizione da parte dei fattori generali di trascrizione, degli attivatori e di un coattivatore (“mediatore”). TBP = proteina che lega la TATA box. CTD = dominio C-terminale (coda) dell’RNA polimerasi II.

del macchinario di trascrizione sul promotore e, quindi, alla preparazione per la trascrizione. Le proteine regolatrici (repressori) possono anche legarsi a sequenze di regolazione per indurre la diminuzione o lo spegnimento della trascrizione.

451

Enhancer

Attivatore

TBP

Mediatore

TFIID CTD RNA polimerasi II

TATA box

Gene

Regolazione dell’inizio della trascrizione da parte degli attivatori L’attivazione dell’inizio della trascrizione è mostrata nella Figura 18.2. Vi sono implicaAttivatore te tre classi di proteine. La prima classe comprende i fattori generali di trascrizioMediatore ne (GTF) discussi in precedenza (Capitolo 5, Figura 5.7). Si ricordi che i fattori generaTFIIE li di trascrizione si legano al promotore e soTFIIH no coinvolti nel reclutamento dell’RNA polimerasi II. In presenza dei fattori generali di trascrizione, si ha solamente un basso livello TFIIA RNA polimerasi II di trascrizione basale; tali fattori di per sé TBP TFIID non influenzano il tasso di inizio della traTFIIF scrizione. Nella Figura 18.2, TFIID, un complesso proteico contenente la proteina di legame alla dente) può presumibilmente concludere che quella proTATA box, TBP (TATA-Binding Protein), è un fattore teina è in grado di legare il DNA. All’altra estremità delgenerale di trascrizione che lega la TATA box del pro- la molecola i domini di attivazione variano notevolmente e non presentano motivi facilmente classificabili. I motore di un gene. La seconda classe è costituita dagli attivatori (Fi- domini di attivazione inducono l’aumento di inizio delgura 18.2). Gli attivatori promuovono l’inizio della tra- la trascrizione di circa un centinaio di volte. La terza classe di proteine è costituita dai coattivatoscrizione e hanno due domini chiave – un dominio di legame al DNA e un dominio di attivazione della trascri- ri (Figura 18.2). Un coattivatore è un grande complesso zione – separati da una regione flessibile. La maggior multiproteico che non lega direttamente il DNA, ma parparte degli attivatori funziona come monomero (una tecipa all’attivazione della trascrizione interagendo sia singola proteina), o come dimero: gli omodimeri con- con gli attivatori sia con i GTF. Si ritiene che gli attivatengono due copie dello stesso monomero, e gli eterodi- tori legati alle sequenze regolatrici dei geni reclutino un meri contengono una copia di ciascuno di due differen- coattivatore, inducendo il reclutamento della RNA politi polipeptidi. Il dominio di legame al DNA è in grado di merasi II. Successivamente l’RNA polimerasi II interalegare una particolare sequenza di DNA, il suo sito di le- gisce con i fattori generali di trascrizione rispetto all’ogame. Gli studi sui domini di legame al DNA hanno di- rientamento opportuno per l’inizio della trascrizione.* mostrato che nel riconoscimento e nel legame al DNA Le interazioni tra gli attivatori e il coattivatore, tra il cosono implicati alcuni motivi strutturali generali. I moti- attivatore e l’RNA polimerasi II e tra l’RNA polimerasi vi Helix-Turn-Helix (HTH, elica-giro-elica), zinc finger II e i GTF stimolano l’inizio della trascrizione. (dita di zinco) e leucine zipper (cerniera di leucine) (FiIn una cellula vi sono molti tipi di coattivatori e rigura 18.3) sono alcuni esempi. Quindi, se un ricercatore mangono ancora da chiarire alcuni dettagli, relativi per individua una di queste sequenze in una proteina codifi- esempio a quali coattivatori vengano impiegati per ciacata da un gene appena scoperto (per esempio, in un’analisi al computer di una sequenza di DNA genomico * In un modello alternativo il mediatore, l’RNA polimerasi II e alcuni TF sono reclutati in un unico complesso molto esteso. codificante o della sequenza amminoacidica corrispon-

452

Capitolo 18 a) Helix-turn-helix

b) Zinc finger

Figura 18.3 Esempi dei motivi strutturali (domini di legame al DNA) trovati in proteine che legano il DNA, come fattori trascrizionali e proteine che regolano la trascrizione (modelli elaborati al computer, con il DNA in verde). (a) Motivo “helix-turn-helix”: è mostrata la proteina Rap1 che lega il telomero di lievito. (b) Motivo “zinc finger”: è mostrata la proteina regolatrice 1 della via pirimidinica legata al DNA e allo zinco (in azzurro). Le “zinc finger” sono denominate così perché assomigliano a dita sporgenti dalle proteine stesse. In modo caratteristico, due cisteine e due istidine sono posizionate in modo da legare due atomi di zinco.

scun gene regolato e alle modalità del loro utilizzo. L’impegno è gravoso a causa del numero elevato di proteine nei complessi. Inoltre, molti coattivatori contengono enzimi che agiscono modificando la struttura della cromatina, come verrà discusso in seguito. Comunque, uno stesso coattivatore è sicuramente coinvolto nella stimolazione della trascrizione di molti geni diversi, dal momento che sono le proteine attivatrici ad agire in maniera specifica nel regolare l’espressione dei geni. Un esempio di coattivatore è il complesso denominato “mediatore” (Figura 18.2). Isolato originariamente nel lievito, questo complesso consiste di almeno 20 polipeptidi. Una superficie del complesso si lega al dominio carbossi-terminale dell’RNA polimerasi II, e altre superfici si legano agli attivatori. Omologhi del mediatore sono stati trovati in altri eucarioti, compresi i mammiferi.

Blocco dell’inizio della trascrizione a opera dei repressori I fattori di trascrizione definiti repressori inibiscono l’attivazione, operata dagli attivatori, dell’inizio della trascrizione. Come gli attivatori, i repressori hanno due domini: un dominio di legame al DNA e un dominio regolativo che, in questo caso, è un dominio di repressione. Si ricordi che i repressori della trascrizione nei batteri spesso agiscono legando sequenze di DNA che si sovrappongono al promotore e, di conseguenza, impediscono alla RNA polimerasi di legarsi. Questo meccanismo di repressione non è stato osservato negli eucarioti.

c) Leucine zipper

La regione che contiene le istidine è nella forma di un’α-elica che lega il DNA nel solco maggiore. (c) Motivo “leucine zipper”: è mostrata la proteina Gcn4 di lievito. Le proteine “leucine zipper” sono dimeri con ciascun dominio a cerniera di leucine consistente di due regioni a elica. Il nome deriva dalla presenza di leucina (L) a ogni settima posizione nella regione carbossi-terminale della proteina. Questo posizionamento presenta tutte le leucine sulla stessa faccia dell’elica amminoacidica e facilita il legame dei due polipeptidi assieme con avvolgimento a spirale. Le eliche amminoterminali del dimero legano il DNA.

Al contrario, i repressori eucariotici agiscono in molti modi diversi. In alcuni casi, una proteina repressore si lega a un sito di legame adiacente a un sito di legame di un attivatore in un enhancer e, mediante l’interazione tra il dominio di repressione del repressore e il dominio di attivazione dell’attivatore, l’azione dell’attivatore viene bloccata. In altri casi, un sito di legame dell’attivatore e un sito di legame di repressione si sovrappongono e il legame del repressore impedisce il legame dell’attivatore.

Nota chiave Negli eucarioti, i geni codificanti per proteine sono sotto il controllo di elementi regolativi come il promotore e gli enhancer. Affinché la trascrizione abbia inizio, sono necessari elementi nel core del promotore. Elementi nella regione prossimale del promotore hanno funzione regolatrice e sono specifici per il gene che controllano, in quanto legano specifiche proteine, gli attivatori, che modulano l’espressione del gene. Gli attivatori si legano anche agli enhancer e promuovono l’inizio della trascrizione mediante il reclutamento di un coattivatore che, a sua volta, recluta l’RNA polimerasi, formando così un complesso che interagisce con i fattori generali di trascrizione nel core del promotore. Le proteine repressori hanno una struttura simile a quella degli attivatori, ma la loro funzione è quella di bloccare l’inizio della trascrizione.

La regolazione dell’espressione genica negli eucarioti

453

Alternativamente, alcuni repressori agiscono reclutando dei corepressori in maniera analoga al reclutamento dei coattivatori da parte degli attivatori. Lo studio di un caso descritto di seguito presenta un esempio specifico di repressione.

centi a ogni gene, infatti, vi sono le sequenze del proprio promotore. Un gene regolatore distante, GAL4, è espresso soltanto in assenza di glucosio per produrre la proteina che agisce da attivatore, Gal4p. Come omodimero, Gal4p può legare ciascuno dei quattro siti di legame presenti in una sequenza attivatrice di GAL, chiamata UASG (Upstream Activating Sequence for GAL), situata a monStudio di un caso: regolazione positiva te del gene. Questa sequenza regolatrice è simile a una e negativa della trascrizione dei geni sequenza enhancer. L’espressione del gene GAL7 è reper l’utilizzo del galattosio nel lievito golata da una UASG situata a monte del gene (nella FiguLa regolazione dell’utilizzo del galattosio nel lievito of- ra 18.4 è schematizzata a destra del gene che viene trafre l’opportunità di esaminare una serie di principi già scritto da destra verso sinistra). L’espressione di GAL1 e discussi applicati a un sistema ben caratterizzato. GAL10 è controllata da una singola UASG localizzata fra Tre geni – GAL1, GAL7 e GAL10 – codificano per i due geni GAL1 e GAL10. enzimi necessari all’utilizzo, come fonte di carbonio, del In assenza di galattosio, un dimero Gal4p è legato a monosaccaride galattosio. In assenza di galattosio i geni ciascuna UASG (Figura 18.4b). Un’altra proteina, Gal80p GAL non vengono trascritti. Quando viene aggiunto ga- (codificata dal gene GAL80), è un repressore e si lega al lattosio si ha induzione rapida e coordinata della trascri- dominio di attivazione di Gal4p e, pertanto, impedisce a zione dei geni GAL e, quindi, una rapida produzione dei Gal4p di attivare la trascrizione. tre enzimi necessari per l’utilizzazione del galattosio, se Quando il lievito viene fatto crescere in presenza di il glucosio è assente o la sua concentrazione è bassa. galattosio, e il glucosio è assente, il prodotto del gene Analogamente alla repressione dell’operone batterico GAL3, Gal3p, converte il galattosio nell’induttore del silac, il glucosio nel sistema genico GAL di lievito eserci- stema (Figura 18.4c). La natura della molecola dell’indutta una repressione da catabolita. tore non è nota. L’induttore si lega a Gal80p e ne modifiStudi genetici hanno dimostrato che i geni GAL1, ca la posizione su Gal4p. Il dominio di attivazione di GAL7 e GAL10 sono localizzati l’uno vicino all’altro, Gal4p, ora esposto, attiva la trascrizione di GAL1, GAL7 ma non costituiscono un operone (Figura 18.4a). Adia- e GAL10 a partire dalle due UASG. Per i geni GAL1 e GAL10, una singola UASG regola a) Geni strutturali GAL la trascrizione di entrambi i geni, GAL10 GAL1 GAL7 con GAL10 trascritto in una direzione (da destra a sinistra, nella FiUASG UASG gura 18.4c) e GAL1 trascritto in dib) Assenza di galattosio rezione opposta (da sinistra a deGal80p si lega al dominio di attivazione di Gal4p, impedendo l’attivazione stra, nella Figura 18.4c). Riassudella trascrizione. Gal80p mendo, Gal4p agisce come regolaDominio di attivazione tore positivo (attivatore), Gal80p Dimero Dominio di legame Gal4p come regolatore negativo (represGAL10 GAL1 GAL7 sore), mentre il galattosio è una UASG UASG molecola effettrice. Si ricordi che Nessuna trascrizione anche l’espressione dell’operone lac è bloccata in presenza di glucoc) Presenza di galattosio sio, anche se è presente lattosio. Gal3p converte il galattosio nell’induttore che si lega a Gal80p, modificandone la posizione su Gal4p. Il dominio di attivazione di Gal4p, ora esposto, Questo effetto di repressione da caattiva la trascrizione. tabolita si verifica perché il glucoGalattosio sio è la sorgente di carbonio prefeGal3p rita, in quanto richiede per il metaInduttore Dominio di attivazione Dominio di legame

Gal80p GAL7

GAL10 UASG

GAL1 UASG

Trascrizione Galattosio transferasi

Galattosio epimerasi

Galattochinasi

Figura 18.4 Regolazione dell’utilizzo di galattosio nel lievito. (a) Organizzazione dei geni strutturali di lievito GAL1, GAL7 e GAL10 sul cromosoma II. (b) Repressione della trascrizione dei geni in assenza di galattosio. (c) Attivazione della trascrizione dei geni in presenza di galattosio.

454

Capitolo 18

bolismo meno energia di altri zuccheri, come per esempio il lattosio. Analogamente, il glucosio è la fonte di energia preferita dalle cellule eucariote, per cui i geni GAL sono trascrizionalmente inattivi se sono presenti glucosio e galattosio. Questa inattivazione della trascrizione si verifica mediante un sistema di repressione. Il glucosio causa l’attivazione del repressore Mig1p (prodotto del gene MIG1), che si lega a un sito con una sequenza di repressione per il galattosio, URSG, situata a monte (Upstream Repressing Sequence for Galactose) entro i promotori del gene GAL e blocca l’attivazione della trascrizione di Gal4p.

scono da segnali per la risposta cellulare in modo diretto o tramite molecole specifiche. Un esempio di queste ultime è costituito dagli ormoni, secreti da diversi tipi di cellule in risposta a segnali, e che circolano nel sangue finché non arrivano a stimolare le loro cellule bersaglio. Un ormone è una molecola effettrice che viene prodotta da una cellula e causa una risposta fisiologica in un’altra cellula. L’azione degli ormoni polipeptidici (come per esempio l’insulina, il glucagone, l’ormone adrenocorticotropo, ACTH, e la vasopressina) e degli ormoni steroidei (come per esempio il testosterone, il progesterone e l’idrocortisone) è esemplificata in Figura 18.5. Un ormone polipeptidico interagisce con specifici recettori Studio di un caso: regolazione presenti sulla membrana plasmatica e genera una risposta della trascrizione da parte degli ormoni mediante la stimolazione di una via di trasduzione del sesteroidei negli animali gnale, ovvero, quando un ormone polipeptidico si lega a Negli animali si differenziano molti tipi di cellule, cia- un recettore di superficie, il recettore viene attivato e trascuno dei quali svolge una o più funzioni specializzate. smette un segnale attraverso la membrana plasmatica. Il Le cellule degli animali non sono esposte a cambiamenti segnale viene successivamente trasdotto attraverso una rapidi nell’ambiente, come via che generalmente coinvolge una cascata proteica di nimazione lo sono le cellule dei batteri chinasi, enzimi che aggiungono gruppi fosfato alle proteio dei microrganismi euca- ne. Il risultato finale è un cambiamento nella cellula, osRegolazione rioti. Ciò si verifica perché sia la risposta cellulare specifica a quell’ormone. Un ordella trascrizione la maggior parte delle cel- mone steroideo agisce diffondendosi attraverso le memda parte degli lule degli animali è esposta brane plasmatiche delle cellule e poi legandosi a uno speormoni steroidei al fluido intercellulare (che cifico recettore citoplasmatico chiamato recettore per negli animali costituisce una sorta di l’ormone steroideo (SHR, Steroid Hormone Receptor); il “microambiente” per la cellula), il cui contenuto di so- complesso, quindi, si lega direttamente alle sequenze di stanze nutritive, ioni e altre importanti molecole è relati- regolazione dei geni controllati dall’ormone e regola l’evamente costante. Cambiamenti del microambiente agi- spressione genica. In questa attività il complesso agisce nello stesso modo in cui generalmenStimolo te agiscono gli attivatori o i repressori. Gli ormoni polipeptidici e gli ormoni steroidei operano in maniera specifica in quanto ciascuno esercita la propria azione su specifiche cellule Ormone prodotto bersaglio che possiedono recettori in dalla cellula grado di riconoscere e di legare solaRecettore inserito mente un particolare ormone. nella membrana plasmatica Ci concentreremo ora sugli ormoOrmone steroideo Recettore Via Ormone ni steroidei. È stato dimostrato che per l’ormone di trasduzione polipeptidico questi ormoni sono importanti nello steroideo del segnale sviluppo e nel controllo fisiologico di + una gamma di organismi che include Attivazione dovuta all’ormone che si lega al recettore dai funghi all’uomo. La Figura 18.6 Risposta mostra la struttura di quattro dei più cellulare Cellule bersaglio comuni ormoni steroidei di mammifero. Tutti hanno una struttura comune a quattro anelli; le differenze nei L’ormone diffonde liberamente L’ormone si lega al recettore all’interno gruppi laterali sono responsabili dei attraverso la membrana cellulare, della membrana plasmatica della cellula si lega al recettore e lo attiva; bersaglio e lo attiva. Il recettore attivo innesca loro diversi e specifici effetti fisioloun segnale che, tramite la via di trasduzione del segnale, determina la risposta cellulare attraverso la regolazione dell’espressione genica

Risposta cellulare

il complesso si lega al DNA e altera l’espressione genica

Risposta cellulare

Figura 18.5 Meccanismi di azione degli ormoni polipeptidici e degli ormoni steroidei.

La regolazione dell’espressione genica negli eucarioti a) Idrocortisone OH

OH C CH3

b) Aldosterone O

CH2OH

OH

O

CH3

OH CH3

O

C CH

O

455

Figura 18.6 Strutture di alcuni ormoni steroidei di mammifero. (a) Idrocortisone, che aiuta a regolare il metabolismo dei carboidrati e delle proteine. (b) Aldosterone, che regola il bilancio idrosalino. (c) Testosterone, che è usato per la produzione e il mantenimento delle caratteristiche sessuali maschili. (d) Progesterone, che, con gli estrogeni, prepara e mantiene la parete uterina per l’impianto dell’embrione.

O

La maggior parte degli ormoni steroidei esercita la propria azione nello stesso modo. Per esempio, CH3 CH3 in assenza di un particolare ormone steroideo, il C O recettore appropriato si trova nel citoplasma in CH3 CH3 uno stato inattivo associato a un vasto complesso di proteine denominate chaperonine, una delle CH3 quali è Hsp90. Studi effettuati su ceppi mutanti di O lievito suggeriscono che le chaperonine svolgano O un ruolo attivo nel mantenere funzionali i recettori per ormoni steroidei. Quando un ormone stegici. Il cortisolo (un ormone glucocorticoide noto anche roideo come un glucocorticoide passa attraverso la memcome idrocortisone), prodotto dalla corteccia surrenale, brana plasmatica ed entra in una cellula, si lega al domiha come bersaglio diversi tipi cellulari, in particolare le nio di legame per l’ormone del suo specifico recettore, ricellule del muscolo, del fegato e del tessuto adiposo do- muovendo l’Hsp90 legata nello stesso sito (Figura 18.7). ve, attraverso la stimolazione della degradazione di pro- Il legame con l’ormone provoca nel recettore un cambiateine e grassi, causa un aumento del contenuto di gluco- mento conformazionale, che lo rende attivo. Il risultante sio nel sangue. L’aldosterone, anch’esso prodotto dalla complesso glucocorticoide-recettore attivo è ora in grado corteccia surrenale, ha come bersaglio i tubuli renali, do- di entrare nel nucleo dove si lega a specifiche sequenze di ve contribuisce a mantenere l’equilibrio idrosalino nel regolazione del DNA, attivando o reprimendo la trascricorpo inducendo il riassorbimento dello ione sodio e la zione di specifici geni controllati dall’ormone. secrezione dello ione potassio nei reni. Mediante i geni attivati dall’ormone, i nuovi mRNA Il testosterone, che nei maschi viene prodotto dai te- appaiono pochi minuti dopo che l’ormone steroideo ha sticoli, ha come bersaglio tessuti diversi, in quanto con- incontrato la sua cellula bersaglio, rendendo possibile la trolla lo sviluppo e il mantenimento del sistema riprodut- rapida produzione di nuove proteine. I domini di legame tivo maschile. Il progesterone, prodotto nelle femmine al DNA di molte proteine recettoriali per ormoni steroidalle ovaie, agisce sull’utero preparandolo all’impianto e dei sono “zinc-finger”. al mantenimento dell’ovulo fecondato e, successivamenTutti i geni regolati da uno specifico ormone steroite, alla crescita e allo sviluppo dell’embrione. deo hanno in comune una sequenza di DNA a cui si lega La specificità della risposta agli ormoni steroidei è il complesso steroide-recettore. Le regioni di legame socontrollata dai rispettivi recettori. Con l’eccezione dei no chiamate elementi di risposta all’ormone (HRE, recettori per i glucocorticoidi, che sono ampiamente di- Hormone Response Elements). L’“H” nell’acronimo viestribuiti nei tessuti, i recettori steroidei sono generalmen- ne sostituita da un’altra lettera per indicare lo specifico te presenti in un numero limitato di tessuti bersaglio. Gli ormone coinvolto. Così, GRE è l’elemento di risposta ai ormoni steroidei hanno effetti ben caratterizzati sulla tra- glucocorticoidi ed ERE è l’elemento di risposta agli scrizione e possono anche influenzare la stabilità degli estrogeni. Gli HRE sono localizzati, spesso in molte comRNA e, probabilmente, il processamento dei precurso- pie, nei promotori dei geni che controllano, generalmente ri degli mRNA. entro 1 kb dal sito di inizio della trascrizione. GRE, per Le cellule di mammifero contengono da 10 000 a esempio, è localizzato circa 250 bp a monte del sito di ini100 000 molecole di recettori per ormoni steroidei, pro- zio della trascrizione. La sequenza consenso per GRE è teine con strutture simili a quelle di repressori e attivato- AGAACANNNTGTTCT, dove N è un qualsiasi nucleori discussi in precedenza. Esse hanno un dominio di lega- tide. La sequenza consenso per ERE è AGGTCANNNTme al DNA (BD) e presentano o un dominio di attivazio- GACCT. Si noti che, in entrambi gli HRE, le sequenze ad ne (AD) o un dominio di repressione, in base al partico- ambedue i lati dell’insieme di N sono complementari, lare recettore. Inoltre, un recettore per ormoni steroidei cioè la sequenza mostra una doppia simmetria. ha un terzo dominio: il dominio di legame all’ormone Non è completamente noto come i complessi ormosteroideo (HBD) per cui è specifico. ne-recettore regolino i livelli trascrizionali, una volta lec) Testosterone

OH

d) Progesterone

456

Capitolo 18 Ormone steroideo glucocorticoide

Hsp90

Il complesso glucocorticoide-recettore attivato entra nel nucleo, si lega al DNA e attiva o reprime la trascrizione dei geni bersaglio (è mostrata l’attivazione)

AD

RNA polimerasi DNA

HBD BD Recettore per il glucocorticoide

L’ormone si lega al recettore, rimuovendo Hsp90 e attivando il recettore

Trascrizione Pre-mRNA

mRNA Mediante traduzione vengono prodotte le proteine

Figura 18.7 Modello d’azione degli ormoni steroidei glucocorticoidi in cellule di mammifero. Per il recettore, AD = dominio

gati all’appropriato HRE. Potenzialmente, avvengono interazioni funzionali tra i complessi ormone-recettore e i coattivatori e i fattori generali di trascrizione nel complesso d’inizio di trascrizione. A questo proposito, si ricordi che sono presenti HRE multipli in molti geni, per cui molteplici complessi ormone-recettore possono legarsi a ciascun gene. Queste interazioni possono facilitare l’inizio della trascrizione da parte dell’RNA polimerasi II. Si presume che ogni ormone steroideo regoli la propria specifica attivazione trascrizionale mediante uno stesso meccanismo generale. L’azione unica di ciascun tipo di ormone steroideo deriva dalle diverse proteine recettoriali e dagli HRE coinvolti. Infine, è di particolare interesse rilevare che, in diversi tipi cellulari, lo stesso ormone steroideo può attivare differenti gruppi di geni, anche se le varie cellule hanno gli stessi recettori per ormoni steroidei, poiché molte proteine regolatrici si legano sia agli elementi promotori sia agli enhancer per regolare l’espressione genica (si veda la discussione precedente in questo capitolo e nel Capitolo 5). Così, un complesso steroide-recettore può attivare un gene solo se è presente la corretta combinazione delle altre proteine regolatrici. Poiché le altre proteine regolatrici sono specifiche relativamente al tipo cellulare, possono risultare differenti spettri di attivazione genica. In sintesi, gli ormoni steroidei agiscono come molecole effettrici e i recettori per ormoni steroidei agiscono come molecole regolatrici. Quando ormoni e recettori si combinano, il complesso risultante si lega al DNA e regola la trascrizio-

di attivazione, BD = dominio di legame al DNA, e HBD = dominio di legame per l’ormone.

ne genica, determinando un consistente e specifico aumento o una diminuzione dei livelli di mRNA cellulare dei geni bersaglio. Le peculiari risposte, caratteristiche di ciascun ormone steroideo, sono dovute ai recettori che si trovano solo in specifici tipi di cellule, le quali contengono differenti combinazioni di altre proteine regolatrici specifiche per il tipo di cellula che interagiscono con i complessi steroide-recettore per attivare determinati geni.

Nota chiave Negli eucarioti multicellulari un sistema di regolazione genica a breve termine studiato in modo approfondito è il controllo della sintesi proteica da parte degli ormoni. Un ormone polipeptidico si lega a uno specifico recettore sulla superficie cellulare, rendendolo attivo e, in tal modo, avviando una via di trasduzione del segnale che produce una risposta cellulare. Un ormone steroideo esercita la propria azione formando un complesso con una specifica proteina recettoriale nel citoplasma, attivando il recettore; il complesso entra quindi nel nucleo e si lega direttamente a particolari sequenze del genoma cellulare, per modulare l’espressione di specifici geni bersaglio. La specificità dell’azione ormonale è dovuta alla presenza di recettori ormonali solo in alcuni tipi cellulari e all’interazione dei complessi steroide-recettore con proteine regolatrici specifiche per il tipo di cellula.

La regolazione dell’espressione genica negli eucarioti

Attività MyLab

Andate nel sito dedicato agli studenti e, nella iAttività Sorting the Signals of Gene Regulation (Scelta dei segnali della regolazione genica), svolgete il ruolo di un ricercatore che analizza alcuni dei modi usati da una cellula eucariote per la regolazione sincronizzata dei geni.

Regolazione genica di tipo combinatorio: il controllo della trascrizione mediante combinazioni di attivatori e repressori Negli eucarioti i geni codificanti per proteine contengono sia elementi del promotore sia enhancer (Capitolo 5). Gli elementi del promotore sono localizzati appena a monte del sito di inizio della trascrizione. Gli enhancer si trovano in genere distanti, a monte o a valle. Possiamo interpretare i differenti elementi del promotore come moduli che funzionano nella regolazione dell’espressione del gene a cui sono associati. Certi elementi del promotore, come per esempio l’elemento TATA nel core del promotore, sono richiesti per definire dove la trascrizione deve iniziare. Altri elementi del promotore, nella regione prossimale a esso, determinano se avverrà la trascrizione del gene; specifiche proteine regolatrici si legano a questi elementi. Un elemento regolatore del promotore è specifico rispetto al gene (o ai geni) che controlla, perché si lega a una molecola segnale – attivatore o repressore – coinvolta nella regolazione dell’espressione di quel gene. Un particolare gene può avere uno, pochi o molti elementi regolativi del promotore, perché in condizioni diverse vi possono essere una, poche o molte proteine regolatrici, che controllano l’espressione di quel gene. La notevole specificità delle proteine regolatrici nel legarsi al loro specifico elemento di regolazione nel DNA, e non ad altri, assicura un accurato controllo di quali geni vengano attivati e quali repressi. Mentre gli elementi del promotore sono cruciali nel determinare se la trascrizione possa avvenire, gli elementi enhancer assicurano che avvenga la massima trascrizione di un gene. Elementi distali come gli enhancer ma con funzione inibitoria sulla trascrizione, sono gli elementi silenziatori (silencer), ai quali si legano repressori che interagiscono con il complesso basale della trascrizione, oppure modificano la struttura della cromatina, sfavorendo l’accesso del complesso di inizio sul DNA (vedi più avanti nel capitolo). (In alcuni casi, la stessa sequenza può essere legata sia da un attivatore sia da un repressore; l’effetto sulla trascrizione dipenderà dalla quantità relativa delle due molecole che competono per il legame al DNA). Sia gli elementi prossimali (promotore) sia quelli distali (enhancer e silencer) sono importanti nel regolare la trascrizione genica. Ogni elemento regolativo lega specifiche proteine regolatrici. Alcune proteine regolatrici si trovano nella maggior parte o in tutti i tipi di cellule,

457

mentre altre si trovano solo in un numero limitato di tipi cellulari. Poiché alcune proteine regolatrici attivano la trascrizione quando si legano a elementi del promotore o agli enhancer, mentre altre reprimono la trascrizione, l’effetto netto di un elemento di regolazione sulla trascrizione dipende dalla combinazione delle diverse proteine legate. Se degli attivatori sono legati sia agli elementi del promotore sia agli enhancer, il risultato sarà l’attivazione della trascrizione. Tuttavia, se un repressore si lega all’elemento silenziatore e un attivatore si lega all’elemento del promotore, il risultato dipende dall’interazione fra le due proteine regolatrici. Se il repressore ha un effetto forte, il gene viene completamente represso. Gli elementi regolativi del gene regolano la trascrizione mediante meccanismi simili, cioè tramite le interazioni di proteine regolatrici, come descritto in precedenza. Non vi è una proteina regolatrice per ciascun gene codificante per una proteina. Se così fosse, metà dei geni del genoma sarebbe costituita da geni regolatori, mentre solo una frazione relativamente piccola del genoma sembra codificare per proteine regolatrici. Come possono, allora, le proteine regolatrici controllare la trascrizione di tutti i geni codificanti per proteine? La risposta è che, combinando relativamente poche proteine regolatrici in modi particolari, si può regolare in modo specifico la trascrizione di diversi insiemi di geni (ciò è particolarmente importante per il differenziamento cellulare). Il processo viene chiamato regolazione genica combinatoriale. Un esempio teorico di regolazione genica combinatoriale è rappresentato nella Figura 18.8. La trascrizione massima del gene A implica il legame degli attivatori 1, 2, 3, e 4 ai corrispondenti siti enhancer 1, 2, 3 e 4. La trascrizione massima del gene B richiede il legame degli attivatori 2, 4 e 6 alle corrispondenti sequenze enhancer. Quindi, ciascuno dei due geni richiede gli attivatori 2 e 4 per un’attivazione completa, in combinazione con attivatori addizionali diversi. a) La trascrizione del gene A è controllata dagli attivatori 1, 2, 3 e 4 Attivatori 1 2 3 4

gene A Siti degli enhancer: 1

2

3

4

b) La trascrizione del gene B è controllata dagli attivatori 2, 4 e 6 2

4

6

gene B Siti degli enhancer:

2

4

6

Figura 18.8 Regolazione genica combinatoriale. Esempio teorico in cui (a) la trascrizione del gene A è controllata dagli attivatori 1, 2, 3 e 4 e (b) la trascrizione del gene B è controllata dagli attivatori 2, 4 e 6.

458

Capitolo 18

maniera sequenziale. Dapprima un set di geni a effetto materno, espressi dalla madre durante l’oogenesi, determina la polarità della cellula uovo mediante la generazione di gradienti di concentrazione di proteine regolatrici (fattori di trascrizione) da essi codificati lungo gli assi antero-posteriore e dorso-ventrale della cellula uovo. I due geni a effetto materno importanti per la nostra discussione sono bicoid e hunchback. Una volta che l’asse dell’embrione è stato stabilito, l’espressione di almeno 24 geni di segmentazione suddivide progressivamente l’embrione in regioni, determinando così i segmenti dell’embrione e dell’adulto. Questi geni cominciano a essere espressi a uno stadio precoce di sviluppo, quando l’embrione è una singola grande cellula – un blastoderma sinciziale – con molti nuclei alla periferia, tutti in un unico citoplasma (Figura 18.9a). I gradienti di a) Blastoderma sinciziale. L’embrione a questo stadio è una grande cellula concentrazione delle proteine regolatrici detercon molti nuclei disposti alla periferia, tutti situati in un citoplasma comune minano quale gene di segmentazione viene (un sincizio) espresso nell’embrione e in quali regioni dell’embrione viene espresso, cioè i genomi nucleari rispondono a particolari insiemi e concentrazioni delle proteine regolatrici che incontrano. Se un gruppo di attivatori è presente a una concentrazione sufficientemente alta, b) Parasegmenti e segmenti dell’embrione, e segmenti dell’adulto allora i geni controllati da questi attivatori Parasegmenti verranno espressi, e così di seguito. Embrione Tre set di geni di segmentazione sono renella fase precoce golati in una cascata di attivazione genica. 14 Il primo set a essere espresso è quello 1 2 3 4 5 6 7 8 9 10 11 12 13 dei geni gap, che rispondono ai gradienti di concentrazione delle proteine regolatrici codificaEspressione di even-skipped 2 3 4 5 6 7 8 9 10 11 12 13 14 nei parasegmenti (colorati) 1 te dai geni a effetto materno. a p a p a p a p a p a p a p a p a p a p a p a p a p a p La funzione dei geni gap, mediante la loro regolazione delp a p a p a p a p a p a p a p a p a p a p a p a p a p a l’espressione dei geni successiSegmenti della larva C1 C2 C3 T1 T2 T3 A1 A2 A3 A4 A5 A6 A7 A8 e dell’adulto vi in una cascata di eventi re-

Controlli combinatoriali sono stati osservati nella regolazione della trascrizione del gene even-skipped (eve) di Drosophila. L’espressione di eve rappresenta un evento importante durante lo sviluppo dell’embrione di Drosophila. Un mutante eve non sviluppa un certo numero di elementi dell’embrione e muore presto durante lo sviluppo. Di seguito viene fornita una breve descrizione dello sviluppo di Drosophila al fine di permettere la comprensione dell’importanza della regolazione di eve. (Lo sviluppo dell’embrione di Drosophila verrà descritto più in dettaglio nel Capitolo 19.) Un certo numero di geni regolatori controlla l’organizzazione del corpo dell’embrione. Questi geni regolano l’espressione di altri geni. Due classi di geni, i geni a effetto materno e i geni di segmentazione, lavorano in

A8

Embrione nella fase tardiva

C2 C1

A7 T1 T2 T3 A1 A2 A3 A4 A5 A6

C3

Ali

Capo

T2 T3 T1

Adulto

A1 A2 A3 A4 A5 A6 A7 A8

C2 C3

Zampa 2

Zampa 3

Zampa 1 Segmenti toracici

Segmenti addominali

Figura 18.9 Controlli combinatoriali della regolazione della trascrizione del gene even-skipped (eve) in Drosophila. (a) Blastoderma sinciziale, lo stadio dell’embrione al quale i geni di segmentazione iniziano a essere espressi. (b) 14 parasegmenti generati dall’azione dei geni pair-rule, e loro corrispondenza con i 14 segmenti in una fase tardiva dell’embrione. (c) Organizzazione dei siti di legame per le proteine regolatrici nell’enhnacer di even-skipped per l’espressione nella striscia 2. (d) Gradienti delle proteine regolatrici Bicoid, Hunchback, Giant e Krüppel lungo l’asse antero-posteriore del blastoderma sinciziale.

La regolazione dell’espressione genica negli eucarioti c) Siti di legame degli attivatori (Bicoid, Hunchback) e dei repressori (Giant e Krüppel) nell’enhancer di even-skipped per l’espressione della striscia 2 enhancer di even-skipped per l’espressione della striscia 2 (~500 bp)

Attivatori Repressori

Bicoid Attivatori Hunchback Giant Repressori Krüppel

d) Gradienti di concentrazione delle proteine regolatrici Bicoid, Hunchback, Giant e Krüppel lungo l’asse antero-posteriore del blastoderma sinciziale Espressione di eve nella striscia 2 Bicoid

Anteriore

1

Krüppel

Hunchback

Giant

2

3 Parasegmenti

4

5

Posteriore

Figura 18.9 (continua)

golativi, è quella di suddividere l’embrione lungo l’asse antero-posteriore, in varie ampie regioni. Due geni gap importanti per la nostra discussione sono giant e Krüppel. Le proteine regolatrici codificate dai geni gap attivano i geni pair-rule, i cui prodotti sono a loro volta proteine regolatrici. La funzione dei geni pair-rule è quella di generare 14 parasegmenti nell’embrione in una fase precoce (Figura 18.9b). Mediante l’azione dei geni segment polarity (della polarità dei segmenti) vengono definiti i 14 segmenti dell’embrione nella fase tardiva e, quindi, degli stadi larvali e dell’adulto. Ciascun segmento (a eccezione di C1) deriva dalla parte posteriore di un parasegmento (indicato con “p” nella Figura 18.9b) e dalla parte anteriore del parasegmento successivo (indicato con “a” nella Figura 18.9b). A partire dallo stadio di blastoderma sinciziale, i due geni pair-rule eve e fushi tarazu sono entrambi espressi in sette strisce che si alternano l’una con l’altra a produrre una serie ripetitiva di strisce. Il gene eve specifica i parasegmenti dispari (1, 3 e così via), mentre il gene fushi tarazu specifica i parasegmenti pari. Le sette strisce eve sono controllate da cinque distinti enhancer

459

del gene eve, ciascuno lungo circa 500 coppie di basi. Ciascun enhancer contiene siti di legame per attivatori e repressori trascrizionali e controlla l’espressione di una o due strisce. La regolazione della trascrizione di eve per l’espressione della striscia 2 (la seconda striscia di espressione, che corrisponde al parasegmento 3) è stata ben caratterizzata. L’enhancer per l’espressione della striscia 2 contiene siti di legame per le proteine regolatrici Bicoid, Hunchback, Giant e Krüppel, che sono codificate rispettivamente dai geni bicoid, hunchback, giant e Krüppel (Figura 18.9c). Bicoid e Hunchback sono attivatori trascrizionali, mentre Giant e Krüppel sono repressori trascrizionali. Alcuni siti di legame sono specifici per ciascun attivatore o repressore. Altri siti di legame per un attivatore o un repressore si sovrappongono così che il legame di una proteina impedisce che si leghi l’altra. A causa dell’attività genica di regolazione precedente, vi sono gradienti di concentrazione specifici di ciascuna di queste quattro proteine regolatrici lungo l’asse anteroposteriore del blastoderma sinciziale (Figura 18.9d). Il gene eve viene trascritto a un alto livello per produrre la striscia 2 in quanto sono presenti i due attivatori, mentre il repressore Giant è assente e Krüppel è a un basso livello. Ciò significa che la combinazione di repressori e attivatori proteici conduce all’attivazione della trascrizione di eve, producendo una striscia della proteina regolatrice di eve. L’espressione di eve nelle altre sei strisce è controllata indipendentemente. Concettualmente sono coinvolti gli stessi principi; ossia, l’espressione del gene è determinata da eventi regolativi che coinvolgono particolari combinazioni di proteine di regolazione genica che si legano all’enhancer controllando l’espressione di ciascuna striscia. Inoltre, nei parasegmenti pari, eve non è espresso: ciò significa che il gene in quelle regioni è spento dai repressori. Complessivamente, più di 20 differenti proteine regolatrici possono legare gli enhancer del gene eve, controllando, quindi, l’espressione del gene nei diversi modi necessari per produrre le sette strisce di eve.

Nota chiave Gli enhancer e gli elementi del promotore sembrano legare in molti casi le stesse proteine, dimostrando così che entrambi i tipi di elementi di regolazione influenzano la trascrizione mediante meccanismi simili che coinvolgono l’interazione di proteine regolatrici. Vi sono meno attivatori e repressori di quanti non siano i geni. Pertanto, la regolazione dell’inizio della trascrizione si verifica spesso come il risultato di particolari combinazioni di attivatori e repressori che si legano alle sequenze regolatrici di un gene.

460

Capitolo 18

Il ruolo della cromatina nella regolazione della trascrizione genica Come discusso nel Capitolo 2, una caratteristica distintiva del DNA eucariotico è quella di essere organizzato nella cromatina. I cromosomi eucarioti, infatti, non sono costituiti da DNA nudo; quest’ultimo è invece complessato con gli istoni (a formare i nucleosomi) e associato, direttamente o indirettamente, a proteine non istoniche. I livelli di compattazione della cromatina così costituita cambiano durante il ciclo cellulare, con una condensazione minore all’inizio della fase S, quando i cromosomi sono in procinto di duplicarsi, e maggiore durante la fase M. L’organizzazione strutturale della cromatina non svolge solamente la funzione di compattare il DNA in modo che possa essere contenuto nel nucleo della cellula, ma consente anche di regolare l’espressione genica. La condensazione della cromatina varia, infatti, in funzione della trascrizione: durante l’interfase, le regioni contenenti geni trascrizionalmente attivi hanno un minor grado di compattazione rispetto alle regioni inattive. In che modo il livello di condensazione della cromatina influenza la trascrizione? Innanzitutto bisogna considerare che l’organizzazione in nucleosomi del DNA ha, in generale, un effetto di repressione dell’espressione genica, poiché ostacola fisicamente l’accesso alle sequenze regolative da parte del macchinario di trascrizione. Per questo, mentre lo stato di base dei geni batterici, privi di nucleosomi, è acceso (on), purché non sia presente uno specifico repressore, negli eucarioti i geni non sono accessibili e quindi risultano spenti (off), a meno che non vengano attivati. Quindi, i nucleosomi devono essere spostati per permettere l’esposizione del promotore, e di altre sequenze consenso, alle proteine d’inizio della trascrizione. Questo processo prende il nome di rimodellamento della cromatina e, negli eucarioti, è fondamentale per la regolazione dell’espressione genica.

sto tipo di cromatina viene definita cromatina aperta (Figura 18.10). Le regioni dei geni trascrizionalmente attivi chiamate siti ipersensibili o regioni ipersensibili sono generalmente le prime a essere tagliate dalla DNasi I e corrispondono alle sequenze di DNA a cui si legano la RNA polimerasi e altre proteine di regolazione genica. Laddove, quindi, si rilevi ipersensibilità alla DNasi I, i geni possono essere considerati potenzialmente trascrivibili. Nella cromatina chiusa, invece, i nucleosomi limitano l’accesso alle sequenze regolative da parte dei fattori proteici e i geni risultano trascrizionalmente repressi (Figura 18.10). Negli eucarioti esistono, comunque, molti geni caratterizzati da regioni di DNA, lunghe circa 100-150 coppie di basi e localizzate a monte del sito di inizio della trascrizione, prive di nucleosomi (Nucleosome Depleted Regions, NDRs). Queste regioni comprendono siti di legame per attivatori e sono fiancheggiate da due nucleosomi che hanno posizioni ben precise (+1 e –1) rispetto al sito di inizio. In particolare, il nucleosoma +1 è definito da una variante dell’istone H2A, chiamata H2AZ, rimossa dal sito di inizio quando la trascrizione comincia. a) Cromatina chiusa Insensibile alla DNasi I e trascrizionalmente silente Nucleosoma Promotore

Enhancer

Sito di inizio della trascrizione

b) Cromatina aperta I nucleosomi vengono spostati e gli attivatori si legano Legame degli attivatori

La RNA polimerasi II e i fattori di trascrizione si legano al promotore

Regolazione negativa della trascrizione da parte degli istoni Sperimentalmente è possibile osservare l’effetto della struttura della cromatina sull’espressione genica e distinguere regioni potenzialmente trascrivibili da altre che, invece, non lo sono. I geni trascrizionalmente attivi, infatti, rispetto ai geni trascrizionalmente inattivi, hanno in vitro un’aumentata sensibilità alla DNasi I, enzima in grado di degradare il DNA. Questo, in generale, non significa che le regioni regolative dei geni trascrizionalmente attivi siano prive di nucleosomi, ma solo che la cromatina in queste regioni è meno condensata, rendendo il DNA più accessibile all’azione dell’enzima degradativo. (I geni che codificano per proteine, in genere, si adattano al modello descritto. I geni altamente trascritti come quelli per l’rRNA sono privi di nucleosomi.) Que-

Gene

Rilevazione di ipersensibilità alla DNasi I in seguito allo spostamento dei nucleosomi RNA polimerasi II

Persistenza di ipersensibilità alla DNasi I La trascrizione ha inizio

mRNA 5´

Figura 18.10 Struttura chiusa e aperta della cromatina e ipersensibilità alla DNAsi I. (a) La cromatina chiusa è insensibile alla DNAsi I e trascrizionalmente inattiva perché inaccessibile al legame diretto al DNA di proteine. (b) La cromatina aperta è ipersensibile alla DNAsi I e le sequenze regolative del DNA sono accessibili ai regolatori trascrizionali.

La regolazione dell’espressione genica negli eucarioti

Controllo dell’espressione genica e rimodellamento della cromatina Negli eucarioti, perché un gene sia attivato deve essere modificata la struttura della cromatina in vicinanza del core del suo promotore, riposizionando opportunamente i nucleosomi e, di conseguenza, facilitando il legame del macchinario di trascrizione. Questo processo, definito rimodellamento della cromatina, richiede l’attività di diversi complessi proteici. Alcuni di essi regolano il posizionamento dei nucleosomi (complessi di rimodellamento dei nucleosomi), altri sono complessi enzimatici responsabili di modifiche chimiche delle proteine istoniche (modificatori della cromatina). La cellula contiene diversi tipi di complessi di rimodellamento dei nucleosomi. Questi sono complessi multiproteici che svolgono la loro funzione in modi differenti: possono far scorrere un nucleosoma lungo il DNA, rendendo esposti i siti per le proteine leganti il DNA, ristrutturare il nucleosoma in loco per facilitare l’associazione di una proteina con una sequenza di DNA, o trasferire il nucleosoma da una molecola di DNA a un’altra. Alcuni complessi sono in grado di effettuare solo alcuni di questi eventi di rimodellamento, altri tutti e tre. Una classe fondamentale di rimodellatori è costituita dai complessi di rimodellamento dei nucleosomi ATP-dipendenti che comprendono SWI/SNF (si pronuncia all’inglese “switch sniff”). Questo complesso, costituito da 8-11 subunità, può catalizzare tutti e tre gli eventi di rimodellamento sopra menzionati ed è presente in tutti gli eucarioti, anche se identificato per la prima volta nel lievito. Ricordiamo che il lievito ha cellule di sesso a e di sesso ␣ (MATa e MAT␣) e può passare da un tipo all’altro. Il passaggio è controllato dal prodotto del gene HO, l’endonucleasi HO. I mutanti identificati per tre geni – SWI1, SWI2 e SWI3 (SWI = switch, “scambio”) – erano incapaci di passare da un tipo all’altro, quindi di commutare il tipo di riproduzione. L’attività dell’endonucleasi HO nei mutanti swi era un centinaio di volte più bassa rispetto ai ceppi wild-type, inoltre i mutanti swi mostravano una notevole diminuzione dell’espressione di molti geni non correlati con il passaggio da un tipo all’altro. Fu identificato un secondo gruppo di mutanti, incapaci di fermentare il saccarosio: SNF2, SNF5 e SNF6 (SNF dall’inglese sucrose nonfermentable). Ancora una volta, questi mutanti manifestavano una notevole diminuzione dell’espressione di molti geni non correlati all’utilizzo dello zucchero. Fu in seguito scoperto che SWI2 e SNF2 sono in realtà lo stesso gene, e ciò suggerì che le proteine di SWI e SNF potessero appartenere a un complesso con una funzione più generale che non il passaggio da un tipo sessuale all’altro o la fermentazione del saccarosio. SWI/SNF regola, infatti, l’espressione di molti geni perché, come abbiamo visto, è un complesso di rimodellamento della cromatina. In tutte le specie eucariotiche il

461

a) Cromatina chiusa Nucleosoma

Promotore

Gene

Sito di inizio della trascrizione b) Cromatina aperta Demetilazione Promotore ipersensibile alla DNasi I Complesso SWI/SNF

c) Inizio della trascrizione RNA polimerasi II

Complesso SWI/SNF

Figura 18.11 Attività del complesso proteico SWI/SNF. (a) Nello stato di cromatina chiusa, il promotore non è facilmente accessibile e il livello di trascrizione è basso. (b) Il riposizionamento dei nucleosomi da parte del complesso SWI/SNF, insieme all’acetilazione e la demetilazione delle code istoniche, causa l’apertura della cromatina. (c) I fattori trascrizionali, insieme alla RNA polimerasi, possono accedere al promotore e iniziare la trascrizione.

complesso funziona per aprire la struttura della cromatina scalzando o allontanando i nucleosomi. In questo modo il promotore e altre sequenze regolative possono essere esposte per il legame di fattori di trascrizione o attivatori (Figura 18.11). Altre classi di rimodellatori dei nucleosomi comprendono il complesso ISWI (imitation switch) che riconosce specifiche caratteristiche strutturali dei nucleosomi e ne determina il riposizionamento, e il complesso SWR1 (switch remodeling 1) responsabile della sostituzione di proteine istoniche comuni con forme varianti che influenzano localmente la stabilità del nucleosoma e il suo scorrimento sul DNA. Il rimodellamento della cromatina implica anche la modificazione dei nucleosomi: la porzione N-terminale delle singole molecole istoniche, che protrude dal nucleosoma, è soggetta, infatti, all’azione di differenti enzimi che catalizzano l’aggiunta, o la rimozione, di specifici gruppi chimici su specifici residui. Le modifiche chimiche degli istoni sono indicate come modifiche epigenetiche (dal greco ⑀␲␫`, epì = “sopra”). Gli enzimi responsabili delle modificazioni istoniche vengono chiamati nel complesso modificatori della cromatina. Le modifiche a carico degli istoni alterano la forza di associazione tra nucleosomi e DNA inducendo, pertanto, il rilassamento della cromatina, con conseguente apertura ed esposizione di promotori e sequenze regolative, oppure un maggior grado di compattazione e inibizione

462

Capitolo 18 Promotore inaccessibile

Attivatore

Istone acetiltransferasi Gruppo acetile Attivatore Ac

Ac

Promotore accessibile

Ac

Ac

Ac

Ac

Acetilazione degli istoni

Figura 18.12 Residui aminoacidici bersaglio di modifiche chimiche. Sono indicati per ciascun istone gli aminoacidi che possono essere bersaglio di specifiche modifiche chimiche. La lisina (K) nelle posizioni 4, 9 e 27 dell’istone H3 può essere bersaglio di acetilazione o metilazione in maniera competitiva.

Figura 18.13 Rimodellamento della cromatina a opera delle istone acetiltransferasi.

della trascrizione. È importante sottolineare come le modificazioni epigenetiche controllano lo stato della cromatina ma non modificano le sequenze del DNA: l’informazione genetica non è mutata ma ne è regolata la trascrivibilità e, quindi, l’espressione. Le principali modifiche istoniche sono acetilazione/deacetilazione e metilazione/demetilazione di specifici residui (Figura 18.12). Gli istoni sono acetilati mediante l’aggiunta di gruppi acetile da parte delle istone acetiltransferasi (HAT, Histone Acetyl Transferases), recentemente rinominate lisina (K) acetiltransferasi (KAT). L’acetilazione neutralizza le cariche positive dei residui di lisina. Con l’aumento dell’acetilazione, gli istoni carichi positivamente perdono lentamente l’affinità per il DNA carico negativamente; la fibra cromatinica da 30 nm (vedi Capitolo 2) perde l’istone H1 e cambia conformazione diventando fibra cromatinica da 10 nm. In questa conformazione, il promotore è più accessibile per l’attivazione della trascrizione (Figure 18.11 e 18.13). Questa forma di rimodellamento della cromatina è reversibile in risposta ai segnali di attivazione delle istone deacetilasi (HDAC, Histone DeACetylases) che rimuovono i gruppi acetile aggiunti. Il risultato è il ripristino della conformazione della fibra cromatinica da 30 nm. È stato dimostrato che alcuni enzimi in grado di acetilare o deacetilare gli istoni sono strettamente associati a fattori di trascrizione o, addirittura, costituiscono parte integrante della struttura di questi regolatori. Ciò suggerisce la capacità di questi enzimi di promuovere l’inizio della trascrizione non solo mediante modifiche strutturali della cromatina ma anche attraverso la formazione di legami con altre proteine e il reclutamento di alcune componenti del complesso di trascrizione.

L’acetilazione è solo una delle modificazioni chimiche che avvengono sulle code istoniche (Figura 18.12). L’aggiunta di gruppi metilici (CH3) su residui di lisina e arginina avviene a opera di istone metiltransferasi (HMT, Histone Methyl Transferases). La metilazione istonica, insieme alla deacetilazione, ha un ruolo importante nella conversione della cromatina da aperta a chiusa. La demetilazione è svolta da istone demetilasi (HDM, Histone DeMethylases) e, insieme all’acetilazione caratterizza una cromatina aperta. Un’altra modifica importante di specifici residui delle code istoniche associata a modifiche nella struttura della cromatina è la fosforilazione/defosforilazione (aggiunta/rimozione di gruppi fosfato). Le modifiche chimiche all’N-terminale di H2A, H2B, H3 e H4 riguardano amminoacidi specifici e specifiche posizioni: per esempio, la lisina (K) è l’aminoacido più interessato da acetilazione ma può essere anche metilato. La metilazione riguarda anche l’arginina (R), mentre la fosforilazione interessa treonina (T) e serina (S). L’acetilazione della lisina in posizione 4 di H3 (cioè H3K4) è di solito associata a una cromatina attivamente trascritta. Al contrario, la mancata acetilazione dei residui di H3 e H4, insieme alla metilazione della lisina in posizione 9 di H3 (H3K9) è generalmente associata a una cromatina trascrizionalmente repressa. Anche le metilazioni su lisina H3K27 e H4K20 spesso caratterizzano una cromatina non accessibile all’apparato di trascrizione. Variazioni dinamiche nella struttura della cromatina implicano ovviamente numerose, e non singole, modifiche chimiche degli istoni. Sappiamo oggi che esistono almeno 150 differenti modificazioni istoniche, di conse-

Il macchinario di trascrizione si lega al promotore

463

La regolazione dell’espressione genica negli eucarioti

guenza c’è un enorme numero di profili (e quindi di “informazioni”) possibili, la cui interpretazione determina un particolare rimodellamento cromatinico. La capacità delle modifiche istoniche di regolare la struttura della cromatina in maniera dinamica, quindi di regolare l’espressione genica controllando i livelli di trascrizione, ha portato i biologi molecolari Thomas Jenuwein e C. Davis Allis a teorizzare un vero e proprio codice istonico, composto da combinazioni distinte di modificazioni istoniche correlate a differenti strutture cromatiniche. In pratica, le modificazioni istoniche, pur se reversibili, rappresentano nel complesso un vero e proprio “codice”, nel senso che sono depositarie di informazioni precise dalla cui interpretazione dipende l’espressione genica. Queste informazioni, inoltre, sono ereditabili: infatti, le modifiche epigenetiche che guidano il rimodellamento della cromatina vengono trasmesse durante la divisione cellulare. Come abbiamo visto nel Capitolo 3 (Figura 3.17), durante la replicazione del DNA gli istoni vengono conservati e ciò fornisce un meccanismo per il mantenimento di una memoria epigenetica, che può essere trasmessa dalla cellula madre alla cellula figlia. I “vecchi” istoni sono in grado di marcare i “nuovi” istoni in modo che abbiano lo stesso tipo di impronta epigenetica. Il Focus sul genoma di questo capitolo esplora la regolazione della trascrizione mediante la modifica degli istoni con l’aggiunta di singoli polipeptidi di ubiquitina e descrive uno degli approcci più importanti della genomica per lo studio, su larga scala, di sequenze di DNA legate da proteine in contesto cromatinico.

Silenziamento genico e metilazione del DNA Oltre alle modificazioni istoniche descritte precedentemente, un’altra importante modifica epigenetica della cromatina, con un ruolo chiave nel controllo dell’espressione genica a livello della trascrizione, è la metilazione del DNA. Mentre, infatti, alcuni enzimi sono in grado di metilare le code istoniche, altri possono catalizzare l’aggiunta di gruppi metilici in corrispondenza di alcune basi presenti nel DNA; in particolare la citosina viene modificata in 5-metilcitosina (5mC), da parte di DNA metiltransferasi (DNMT) (Figura 18.14). La metilazione è un meccanismo di silenziamento genico frequente in molti eucarioti, in particolare nei vertebrati (ma non osservato nel lievito). La distribuzione nel genoma delle basi metilate non è casuale, ma la maggior parte delle 5mC (60-90% nel DNA dei vertebrati) fa parte di dinucleotidi CpG. (Si noti che questa sequenza è simmetrica nel DNA a dop5′-CG-3′ pia elica: . 3′-GC-5′

Nota chiave Le regioni dei cromosomi che sono trascrizionalmente attive hanno una organizzazione cromatinica meno compatta delle regioni trascrizionalmente inattive, per questo mostrano una maggiore sensibilità del DNA alla digestione con DNasi I. Le regioni dei promotori dei geni trascrizionalmente attivi in genere hanno una organizzazione cromatinica ancora meno compatta, e ciò determina un’ipersensibilità del DNA alla digestione con DNasi I. In altri termini, la struttura della cromatina a livello del “core” del promotore di un gene ne regola l’accessibilità, quindi la trascrivibilità. La struttura della cromatina in corrispondenza delle regioni regolative è controllata da diversi tipi di complessi di rimodellamento della cromatina. Questi ultimi possono modificare chimicamente le code degli istoni nei nucleosomi, allentandone pertanto l’associazione con il DNA, oppure possono spostare o modificare i nucleosomi, consentendo al macchinario di trascrizione l’accesso al promotore. Le modifiche degli istoni sono modifiche epigenetiche, cioè modifiche della cromatina che controllano la trascrizione senza tuttavia cambiare la sequenza del DNA. Queste modifiche sono ereditabili: gli stadi epigenetici, infatti, possono essere mantenuti nelle divisioni cellulari anche se possono variare durante il ciclo vitale della cellula.

La maggior parte delle citosine dei dinucleotidi CpG nei genomi dei vertebrati risulta metilata, ma non in maniera casuale. Alcune regioni genomiche hanno segmenti ricchi di CpG, con molte copie dei dinucleotidi, denominate isole CpG (CpG island). Nel genoma umano, e in quello degli altri mammiferi, molti geni codificanti per proteine hanno isole CpG nei loro promotori. Quando queste isole CpG sono non metilate, la cromatina corrsipondente è aperta, condizione che facilita l’inizio della trascrizione. Al contrario, quando i dinucleotidi CpG diventano metilati, la trascrizione è repressa. Si ritiene che H

H

N

N

2

O

H

4

DNA metilasi N

5

3 1

N

H

H

N

4

2

6

H

Desossiribosio Citosina (nel DNA)

CH3 (gruppo metilico)

O

5

3 1

N

CH3

6

H

Desossiribosio 5-metilcitosina (5mC)

Figura 18.14 Produzione nel DNA di 5-metilcitosina da citosina per azione dell’enzima DNA metilasi.

464

Capitolo 18

Focus sul genoma ChIP on chip Uno degli strumenti più potenti della genomica moderna viene chiamato ChIP on chip (Chromatin ImmunoPrecipitation on chip), o immunoprecipitazione della cromatina su microarray. Mediante questa tecnica i ricercatori possono identificare, su larga scala, sequenze di DNA legate da una specifica proteina. In breve, vengono utilizzati dei reagenti chimici per legare DNA e proteine assieme (se sono molto vicini nella cellula, come avviene nella cromatina). Successivamente la proteina specifica viene raccolta dalla soluzione (ora si trova associata al DNA a cui era legata) e il DNA viene tagliato in piccoli frammenti. Quindi i ricercatori rompono il legame tra il DNA e la proteina, isolano il DNA, lo marcano con un colorante fluorescente e lo utilizzano come sonda su un microarray a DNA. Tutti i segnali fluorescenti sul microarray corrispondono al DNA che era attaccato a quella specifica proteina. Analizzando le sequenze di DNA, i ricercatori possono identificare i siti di legame per la proteina. Ecco un esempio di applicazione di questa tecnica. Alcuni ricercatori fecero crescere una popolazione di cellule umane in coltura. Sapevano quali geni erano espressi in quelle cellule (e quali geni non erano espressi) sulla base di esperimenti precedenti. Essi esposero le cellule alla formaldeide, un agente chimico che penetra nella cellula e lega grandi molecole a molecole vicine creando legami covalenti tra esse (cross-linking). (I legami di un agente che determina il cross-linking possono essere stabili in modo permanente o in modo transitorio; nel caso della formaldeide, i legami possono essere rotti con un blando trattamento al calore in una fase successiva dell’esperimento.) I legami di interesse sono quelli che connettono il DNA alle proteine associate al DNA. Nel caso specifico, i ricercatori erano interessati ai legami che connettono il DNA ai nucleosomi, nei quali le molecole dell’istone H2B sono state modificate dall’aggiunta di un singolo polipeptide di ubiquitina (ubH2B). Esperimenti precedenti avevano infatti dimostrato che questo tipo di

la metilazione del DNA possa regolare l’espressione genica in due diversi modi: da un lato, specifici fattori di trascrizione non sono più in grado di riconoscere le loro sequenze di legame sul DNA se quest’ultimo è metilato; dall’altro, specifiche proteine (per esempio MeCP2) riconoscono e legano le sequenze CpG metilate, reclutando deacetilasi e metiltransferasi istoniche che, a loro volta, causano il rimodellamento della cromatina (in questo caso verso una conformazione in cui i promotori non so-

modificazione degli istoni gioca un ruolo importante nella regolazione della trascrizione. Immediatamente dopo che il trattamento di cross-linking era stato completato, i ricercatori raccolsero il DNA e tutte le proteine che erano legate a esso. Sonicarono, quindi, la soluzione per rompere le grandi molecole di DNA in piccoli frammenti. (La sonicazione è l’impiego di ultrasuoni a lunghezza d’onda molto elevata, ben al di sopra di ciò che ci è permesso di sentire, per frammentare cellule o molecole.) In questo caso l’energia delle onde sonore rompe il DNA in frammenti piccoli, ma non rimuove le proteine legate a esso. I ricercatori, in seguito, impiegarono una tecnica chiamata immunoprecipitazione (IP) per raccogliere in maniera specifica le proteine ubH2B (insieme a tutto ciò che è legato a esse). Durante l’immunoprecipitazione un anticorpo viene fatto legare a una specifica molecola bersaglio (in questo caso il bersaglio è ubH2B) in soluzione, e successivamente le molecole di anticorpo, e tutte le molecole legate a esse, vengono raccolte (precipitate) in soluzione. Tutto ciò che è presente in soluzione, non legato all’anticorpo, viene scartato. In questo esperimento i ricercatori raccolsero gli anticorpi che si erano legati a ubH2B, che a sua volta era legato (mediante cross-linking) al DNA. Trattando i campioni con calore moderato ruppero i crosslink, raccolsero il DNA, lo marcarono con colorante fluorescente, e usarono il DNA marcato con fluorescenza come sonda su un microarray a DNA. Osservarono che il loro DNA marcato ibridava in prevalenza con sequenze corrispondenti a geni altamente espressi, così poterono concludere che ubH2B si trova tendenzialmente nei nucleosomi associati a geni altamente espressi. Analizzando poi un singolo gene forzatamente indotto a essere trascritto, confermarono che l’aumento di ubH2B legato in corrispondenza di questo precedeva l’aumento dei livelli di trascrizione del gene.

no accessibili). Quindi differenti modifiche epigenetiche della cromatina, che riguardano sia il DNA sia gli istoni, cooperano nel controllo trascrizionale dell’espressione genica. La proteina MeCP2 è anche in grado di reclutare sulla cromatina, oltre agli enzimi che modificano gli istoni, la DNA metiltransferasi 3 (DNMT3). Questo enzima è responsabile della metilazione de novo di citosine, estendendo la regione di DNA che può essere repressa.

La regolazione dell’espressione genica negli eucarioti

In laboratorio è possibile studiare il profilo di metilazione di regioni di DNA utilizzando specifici enzimi. Le sequenze CG, infatti, sono parte di siti di restrizione ma molti enzimi nella cui sequenza di riconoscimento è presente citosina non sono in grado di tagliare il DNA a doppia elica quando questa base è metilata. L’enzima HpaII (“acca-pi-a-due”), per esempio, taglia il DNA in corrispondenza della sequenza 5′-CCGG-3′ (si ricordi che il sito di taglio è a doppio filamento, per comodità ne viene indicata solo un’elica), ma non effettua il taglio se una citosina interna delle due è metilata (cioè, se la sequenza è 5′-CmCGG-3′). Anche l’enzima MspI (“emmeesse-pi-uno”) taglia la stessa sequenza 5′-CCGG-3′, ma, a differenza di HpaII, taglierà anche la sequenza metilata 5′-CmCGG-3′. Pertanto, la metilazione di una regione di DNA può essere analizzata in un esperimento di Southern blot mediante digestione del DNA genomico con i due enzimi separatamente e l’utilizzo di una sonda specifica per la regione di interesse (per dettagli sulla procedura del Southern blot si veda il Capitolo 10). Il tipo di frammenti che possono essere individuati e il loro peso molecolare indicano il profilo di metilazione della regione in esame (Figura 18.15). La metilazione del DNA, come le altre modifiche epigenetiche, è ereditabile nella divisione cellulare. Il profilo di metilazione, una volta stabilito nella cellula, viene trasmesso alla generazione successiva grazie all’azione della DNA metiltransferasi 1 (DNMT1). Quest’enzima, alla replicazione, riconosce le citosine metilate sul filamento “vecchio” di DNA e metila le citosine nei dinucleotidi CpG corrispondenti sul filamento complementare “nuovo”. In questo modo, il profilo di metilazione del DNA è conservato dalla cellula madre alla cellula figlia. La metilazione del DNA rappresenta un meccanismo fondamentale per il silenziamento genico durante il differenziamento cellulare. Il confronto tra le sequenze degli stessi geni, differenzialmente espressi nei diversi tessuti dello stesso organismo, evidenzia, infatti, una relazione diretta tra elevati livelli di metilazione di specifici promotori e silenziamento trascrizionale. In Arabidopsis e nel topo, inoltre, è stato dimostrato che la mancanza di attività DNA-metiltransferasica non permette uno sviluppo embrionale corretto. La metilazione aberrante del DNA è stata anche associata all’insorgenza e alla progressione del cancro, come ad altre patologie. Un esempio si osserva nella sindrome dell’X fragile, in cui alla base del fenotipo patologico c’è il silenziamento del gene FMR-1, le cui sequenze risultano oggetto di una metilazione anomala in seguito all’espansione di una tripletta ripetuta (vedi Capitolo 7). Il controllo della trascrizione mediante metilazione del DNA è inoltre un meccanismo coinvolto nell’inattivazione del cromosoma X (vedi Capitoli 12 e 19) e nell’imprinting genomico.

465

a) Isola CpG

Le isole CpG non metilate presentano struttura cromatinica aperta

La metilazione delle isole CpG chiude la struttura cromatinica

b)

Isola CpG

Digestione con HpaII

Nessuna digestione

La metilazione di CpG blocca la digestione da parte di HpaII ma non da parte di Msp I

Sonda Digestione con MspI Sonda

c) Southern blot

L’elettroforesi su gel e l’analisi di Southern blot con le sonde indicate identificano la differenza tra la digestione con HpaII e MspI

Figura 18.15 Isole CpG e metilazione del DNA. (a) La metilazione delle isole CpG determina la formazione di cromatina chiusa. (b) Confronto dei risultati della digestione con enzimi di restrizione che tagliano o meno sequenze metilate. (c) Il Southern blot rivela la metilazione differenziale di sequenze di DNA.

Imprinting genomico Il silenziamento genico mediante metilazione del DNA è alla base dell’imprinting genomico, un importante fenomeno epigenetico per cui l’espressione di specifici geni dipende dalla loro trasmissione ereditaria, cioè dalla provenienza dal genitore femminile o dal genitore maschile. Si presume, in genere, che i geni ereditati dalla madre o dal padre siano “equivalenti”; per esempio, nel calcolare i rapporti mendeliani, non consideriamo se i geni provengono dall’uovo o dallo spermatozoo. Per circa 80 geni dei mammiferi, tuttavia, il contributo paterno o materno non è equivalente: di ognuno di questi specifici geni viene espressa solo la copia materna o solo quella paterna, mentre l’altra copia genica è silente, e ciò avviene in modo preciso e non casuale. Gli esempi più studiati di imprinting genomico sono due geni nell’uomo e nel topo vicini tra loro: Igf2, che

466

Capitolo 18

codifica per il fattore di crescita IGF2 (Insulin-like Growth Factor 2) e H19, che codifica per un RNA non codificante, cioè non tradotto, la cui funzione è sconosciuta. Nel topo, studi sul knock-out per Igf2 (cioè un mutante con una delezione che aveva rimosso completamente il gene Igf2) dimostrarono che la progenie che ereditava il cromosoma con la delezione dal genitore maschile era di taglia piccola, mentre la progenie che ereditava la stessa delezione dal genitore femminile era di dimensioni normali: l’assenza di Igf2 determinava, quindi, un fenotipo mutante solo quando la delezione era ereditata dal genitore maschile. L’interpretazione è che Igf2 è un gene imprinted, cioè soggetto all’imprinting genomico: questo gene è espresso solo dal cromosoma paterno e l’altra copia (sul cromosoma materno) è silenziata. Analogamente, anche il gene H19 è imprinted, essendo espresso solo dal cromosoma materno. Il processo di imprinting mediante silenziamento genico per Igf2 e H19 è regolato da diversi elementi. Un singolo enhancer situato a valle del gene H19 controlla l’espressione di entrambi i geni (Figura 18.16) Quando gli attivatori si legano all’enhancer, il macchinario di trascrizione potrebbe essere richiamato su entrambi i geni. Tuttavia un altro elemento di regolazione, situato tra i geni, influenza questa attivazione. Questo tratto di DNA, chiamato regione di controllo dell’imprinting (ICR) è un isolatore (insulator), così denominato perché, se funzionale, blocca l’attivazione del promotore situato a monte rispetto alla propria sequenza (a sinistra, nella Figura 18.16a) che potrebbe interagire con attivatori legati all’enhancer situato a valle (a destra, nella Figura 18.16a). Sul cromosoma materno, i geni e le sequenze regolatrici non sono metilati, e ciò consente alla proteina denominata CTCF (CCCTC-binding Factor, “fattore di legame alla sequenza CCCTC”), di legarsi all’isolatore (Figura 18.16a). Il fattore CTCF, legato alla sequenza, funziona come repressore della trascrizione di Igf2, impedendo l’attivazione della trascrizione da parte di attivatori lega-

ti all’enhancer. Svolge questa azione attraverso il reclutamento di un complesso contenente HDAC, che causa il rimodellamento della cromatina, come descritto precedentemente. Tuttavia l’attivatore legato all’enhancer può attivare la trascrizione di H19. In altri termini, sul cromosoma materno Igf2 è inattivo, mentre H19 è attivo. Sul cromosoma paterno, il DNA è metilato per un segmento del cromosoma che comprende il promotore del gene H19 e l’isolatore (Figura 18.16b). Di conseguenza, CTCF non può legarsi all’isolatore e l’attivatore può, quindi, attivare la trascrizione di Igf2. A causa della metilazione del promotore di H19, e del conseguente rimodellamento della cromatina, la trascrizione di H19 è silenziata. In altri termini, sul cromosoma paterno Igf2 è attivo e H19 è inattivo. Eventi chiave dell’imprinting sono la metilazione di specifiche sequenze di DNA e la trasmissione di queste sequenze metilate. Come abbiamo detto precedentemente, nelle divisioni mitotiche cellulari questa ereditarietà è diretta. Dopo la replicazione del DNA, ciascuna doppia elica del DNA figlia è emimetilata, cioè un filamento conserverà la metilazione del genitore e l’altro sarà privo di metilazione. Metilasi di mantenimento riconoscono l’emimetilazione e metilano il nuovo filamento di DNA per ripristinare il profilo di metilazione del genitore. La situazione è diversa nel passaggio attraverso la meiosi, quando il profilo di metilazione che è necessario per il fenomeno dell’imprinting deve essere stabilito nella formazione dei gameti e ripristinato a ogni generazione. Come schematizzato in Figura 18.17, nelle cellule primordiali della linea germinale i profili di metilazione ereditati vengono rimossi per poi essere ristabiliti in funzione della linea maschile o femminile solo nelle fasi precoci della gametogenesi. Si consideri ad esempio un allele, imprinted sul cromosoma paterno, come H19. Durante l’oogenesi in un individuo di sesso femminile vengono riattivati gli alleli sia materno sia paterno, mentre nella spermatogenesi in un individuo di sesso maschile gli alleli sia materno sia paterno diventano imprinted (silenziati per metilazione del DNA a) Cromosoma materno grazie all’azione di metilasi de noL’attivatore non può attivare la trascrizione di Igf2 vo). In questo modo i gameti maCTCF schili, ma non quelli femminili, L’attivatore attiva la trascrizione di H19 Attivatore avranno H19 inattivo. La progenie Acceso Igf2 Spento H19 di questi due genitori eredita, quindi, un allele silenziato dal padre e Isolatore Enhancer un allele attivo dalla madre (Figura 18.17). (Un discorso analogo b) Cromosoma paterno può essere fatto per Igf2; Figura L’attivatore attiva la trascrizione di Igf2 18.17). L’attivatore non può attivare la trascrizione di H19 Igf2

Acceso

Me

Me

Isolatore

Me

Me

Me

H19

Me

Spento Enhancer

Figura 18.16 Modello dell’imprinting dei geni Igf2 e H19.

La regolazione dell’espressione genica negli eucarioti

Mutazioni che alterano lo stato di metilazione che regola l’espressione di Igf2 sono responsabili dell’insorgenza di un numero significativo di casi della sindrome di Beckwith-Wiedemann (BWS; OMIM 130650), malattia congenita della crescita che si verifica in circa 1 su 15 000 nascite. La caratteristica generale della BWS è l’accrescimento anomalo ed eccessivo di molti apparati del corpo. Nella maggior parte dei casi, i bambini affetti da BWS nascono prematuri ma i loro valori di peso e altezza sono compresi in un intervallo che si avvicina ai massimi relativi all’età. Questi individui presentano, inoltre, un aumento delle dimensioni della lingua che può causare problemi nella respirazione, nella nutrizione e nel linguaggio; pelle arrossata sulla fronte e sulle palpebre nei primi anni di vita; e all’incirca un individuo su 12 sviluppa tumori al rene in età giovanile. Alcune malattie genetiche dell’uomo, come la sindrome di Prader-Willi (PWS; OMIM 176270) e quella di Angelman (AS; OMIM 105830), sono la conseguenza di effetti legati all’imprinting. In entrambi i casi si osserva la perdita di un particolare segmento del braccio lungo del cromosoma 15, ma la conseguenza è la manifestazione di una sindrome differente a seconda di quale cromoMaschio

Inattivo

Femmina

Attivo

Inattivo

Attivo

a) IGF2 espresso sul cromosoma paterno ma non su quello materno e H19 espresso sul cromosoma materno ma non su quello paterno

b) Cancellazione dei modelli di imprinting nelle cellule della linea germinale

c) Modello di imprinting ripristinato: H19 spento nel maschio; IGF2 spento nella femmina Cellule germinali Cellula ovocita Cellule gamete Fecondazione e sviluppo Attivo

Inattivo Inattivo

soma, paterno o materno, sia interessato dalla mutazione. Se il cromosoma con delezione è di derivazione paterna, il figlio sarà affetto dalla sindrome di Prader-Willi. Se invece il cromosoma mutato è di derivazione materna, il bambino avrà la sindrome di Angelman. La regione interessata dalla delezione comprende i geni SNRPN e UBE3A. Nel cromosoma paterno il primo è attivo e il secondo è soggetto a imprinting; nel cromosoma materno UBE3A è funzionale mentre SNRPN è sempre silenziato. La sindrome di Prader-Willi si verifica in circa 1 su 25 000 nascite. Gli individui con PWS generalmente alla nascita sono piccoli, deboli e manifestano vari sintomi, tra cui ritardo e denutrizione dovuta a una riduzione dei riflessi della deglutizione e della capacità di succhiare. Le difficoltà nella nutrizione migliorano dall’età di 6 mesi e da circa 12 mesi in poi si sviluppa una tendenza a mangiare in modo incontrollato che porta a obesità e a problemi psicologici associati. Gli adolescenti manifestano ridotte capacità di movimento e una fame insaziabile. Gli adulti sono di bassa statura, se confrontati con i loro familiari, e spesso sviluppano una forma di diabete dovuto ai disordini alimentari. Gli individui con PWS raramente vivono più di 30 anni, a meno di osservare dei rigidi programmi di controllo del peso, allo scopo di prevenire il diabete. Gli individui con la sindrome di Angelman mostrano vari sintomi, tra cui grave ritardo motorio e intellettivo, dimensione del cranio più piccola del normale, movimenti incontrollati degli arti, iperattività e frequenti scoppi di risa immotivati. Circa nel 50% dei pazienti con AS è presente una delezione della regione 15q11-q13, la stessa regione interessata negli individui con PWS.

Silenziamento genico in corrispondenza dei telomeri

Cellule germinali

Cellula spermatica

467

Attivo

Figura 18.17 Cancellazione e ripristino dell’imprinting genomico. I modelli di imprinting ereditati (a), vengono annullati nella cellule germinali (b) primordiali per poi essere ripristinati, nelle corrette forme sesso-specifiche, durante le fasi precoci della gametogenesi (c). (In rosso sono indicati i cromosomi di origine materna e in blu quelli di origine paterna.)

Normalmente in corrispondenza dei telomeri, che rappresentano regioni eterocromatiche costitutive (Capitolo 2), non vi sono geni codificanti per proteine. D’altra parte, quando geni attivi vengono spostati (sperimentalmente o in seguito a traslocazioni cromosomiche) all’interno della regione telomerica, vanno incontro a silenziamento: questo fenomeno è definito effetto di posizione telomerica e dipende dalla particolare condensazione della cromatina in corrispondenza di queste regioni. Nel lievito, le ultime 1-5 kb del cromosoma sono costituite da sequenze ripetute telomeriche ripiegate in una struttura complessa a forcina (Figura 18.18). Si ritiene che la proteina Rap1p (prodotto del gene RAP1, repressor-activator protein gene) si leghi alle sequenze ripetute telomeriche. Una volta legata, Rap1p recluta un complesso di silenziamento Sir costituito dalle proteine Sir2p, Sir3p e Sir4p (codificate dai geni SIR2, SIR3 e SIR4). Il complesso Sir prende anche contatto con gli istoni e Sir2p,

468

Capitolo 18 Istone deacetilato Telomero 1-5 kb Proteina Rap1p Proteina Sir2p

Proteine Sir3p, Sir4p Ac

Ac

Ac

Ac

Ac

Ac

Ac

Gruppo acetile Ac

Ac

Ac

Ac

Ac

Ac

Ac

Ac

Ac

Ac

Ac

Figura 18.18 Organizzazione cromatinica delle sequenze telomeriche.

che ha attività di istone deacetilasi, catalizza la rimozione locale dei gruppi acetile dalle loro code. Gli istoni deacetilati vengono riconosciuti direttamente dal complesso di silenziamento, causando così un’onda di legame e di deacetilazione che si propaga lungo il cromosoma per una distanza limitata e genera una struttura eterocromatica altamente condensata.

Nota chiave La metilazione del DNA è una modifica epigenetica ereditabile che regola il rimodellamento della cromatina. Sequenze di DNA metilate determinano la formazione di una cromatina condensata e inaccessibile ai regolatori trascrizionali e i geni corrispondenti sono repressi (silenziati). La metilazione è alla base dell’imprinting genomico, fenomeno per cui l’espressione di un allele è determinata dalla trasmissione ereditaria, ossia dall’origine materna o paterna del gene. Modifiche epigenetiche controllano anche l’organizzazione cromatinica di sequenze non geniche, come i telomeri.

Controllo del processamento dell’RNA: poliadenilazione alternativa e splicing alternativo

MyLab

Il controllo del processamento dell’RNA regola la produzione di molecole di mRNA maturo da molecole di RNA precursore (pre-mRNA). Il nimazione processamento dell’RNA è stato discusso nel Capitolo 5. Controllo del Tuttavia, le tappe descritte non processamento si osservano in ogni situaziodell’RNA ne. Per esempio, vi sono molti casi in cui siti di poliadenilazione alternativa possono essere usati per produrre diverse molecole di pre-mRNA

e può essere utilizzato lo splicing alternativo (chiamato anche splicing differenziale) per produrre diversi mRNA maturi funzionali. Quale prodotto si origini dipende dai segnali di regolazione. La poliadenilazione alternativa e lo splicing alternativo sono meccanismi indipendenti che, singolarmente o insieme, contribuiscono alla produzione di proteine diverse, strutturalmente e funzionalmente, a partire dallo stesso gene. Tali proteine sono definite isoforme e la loro sintesi può essere tessuto-specifica. La Figura 18.19 mostra un esempio in cui la poliadenilazione alternativa e lo splicing alternativo insieme danno origine a prodotti tessuto-specifici del gene della calcitonina (CALC) nell’uomo. CALC è costituito da cinque esoni e quattro introni e viene trascritto in alcune cellule di una ghiandola, la tiroide, e in alcuni neuroni cerebrali. La poliadenilazione alternativa avviene nelle cellule della tiroide a un sito di poliadenilazione accanto all’esone 4, pA1, e nelle cellule neuronali a un sito di poliadenilazione accanto all’esone 5, pA2 (Figura 18.19, parte 1). Lo splicing alternativo avviene al successivo stadio di rimozione degli introni (Figura 18.19, parte 2). Il premRNA nella tiroide viene congiunto per rimuovere i tre introni e unire gli esoni 1, 2, 3 e 4. Il pre-mRNA nelle cellule neuronali viene congiunto per rimuovere gli introni e unire gli esoni 1, 2, 3 e 5; l’esone 4 viene escisso ed eliminato. Gli mRNA prodotti vengono tradotti a formare dei polipeptidi precursori (pre-ormoni; vedi Figura 18.19, parte 3), da cui vengono generati gli ormoni funzionali mediante taglio post-traduzionale per mezzo di proteasi (Figura 18.19, parte 4). I due prodotti sono la calcitonina nella tiroide, la cui sequenza amminoacidica è codificata dall’esone 4, e il CGRP (peptide correlato al gene per la calcitonina), la cui sequenza amminoacidica è codificata da una parte dell’esone 5. (La parte rimanente dell’esone 5 è la regione 3′ o trailer dell’mRNA.) In questo caso, il risultato di poliadenilazione alternativa e splicing alternativo è la sintesi, in due diversi tessuti, di due diversi polipeptidi codificati dallo stesso gene. L’ormone tiroideo calcitonina è un ormone circolante che regola l’omeostasi dello ione calcio aiutando il rene a trat-

La regolazione dell’espressione genica negli eucarioti

tenere il calcio. Il CGRP si trova nell’ipotalamo e sembra avere attività di neuromodulazione e attività trofica (che promuove la crescita). I trascritti di molti geni sono soggetti a splicing alternativo. Nell’uomo, per esempio, i ricercatori ritengono che probabilmente tre quarti dei geni sono sottoposti a splicing alternativo che spesso produce relativamente poche varianti. Il “record” tra i casi analizzati di splicing alternativo riguarda il pre-mRNA trascritto dal gene Dscam di Drosophila, che codifica per alcune proteine richieste per la formazione delle connessioni tra i neuroni. Potenzialmente il gene Dscam mediante splicing alternativo sarebbe in grado di produrre 38 016 diverse isoforme proteiche. Quante realmente ne vengano prodotte non è noto. In Drosophila lo splicing alternativo gioca un ruolo anche nella determinazione del sesso conducendo, in definitiva, al differenziamento in cellule specifiche femminili o maschili. (La determinazione del sesso in Drosophila, con gli eventi di splicing alternativo e la loro regolazione, verrà descritta dettagliatamente nel Capitolo 19.) Dopo che gli mRNA sono stati generati mediante processamento dell’RNA, essi vengono esportati dal nucleo al citoplasma attraverso i pori nucleari. L’mRNA viene esportato complessato con molte proteine. Alcune di queste proteine vengono reclutate sull’mRNA durante i processi di trascrizione e splicing. Una volta arrivato nel citoplasma, l’mRNA può essere tradotto immediata-

mente, o immagazzinato per essere tradotto successivamente (vedi prossimo paragrafo).

Nota chiave L’espressione genica negli eucarioti può essere regolata a livello di maturazione dell’RNA. Questo tipo di regolazione controlla la produzione di RNA maturo da molecole di RNA precursore. Due eventi regolativi, che esemplificano questo livello di controllo, sono la scelta del sito di poli(A) e la scelta del sito di giunzione (splicing). In entrambi i casi, vengono prodotti diversi tipi di mRNA, in base alla scelta compiuta. Una volta che l’mRNA maturo è stato prodotto, viene esportato, complessato con molte proteine, in un processo controllato, dal nucleo al citoplasma attraverso il complesso dei pori nucleari.

Controllo della traduzione dell’mRNA Le molecole di RNA messaggero sono soggette, nel citoplasma, a controllo traduzionale. La traduzione differenziale può influenzare fortemente l’espressione genica. Per esempio, gli mRNA vengono accumulati nelle uova non fecondate di molti vertebrati e invertebrati. Nella cel-

pA1 3

2

Esoni: 1

469

pA2

4

5

Gene per la DNA calcitonina 1 Trascrizione con poliadenilazione alternativa

Tiroide Pre-mRNA 1

2

1

4

3

Cellule neuronali

2

4

3

AAA...

AAA...

Coda di poli(A)

Cappuccio

5

Cappuccio

Coda di poli(A)

2

1 2 3

4

mRNA

AAA... Cappuccio

Splicing alternativo per la produzione di mRNA 3

1 2 3

5 AAA...

Cappuccio

Traduzione per la produzione di polipeptidi precursori (pre-ormoni)

Polipeptide precursore

4 Taglio post-traduzionale Polipeptide

Calcitonina

CGRP

Figura 18.19 Poliadenilazione alternativa e splicing alternativo per la formazione di prodotti tessuto-specifici del gene per la calcitonina, CALC, nell’uomo. Nella tiroide viene prodotta la calcitonina, mentre in alcuni neuroni viene prodotto il CGRP (peptide correlato al gene per la calcitonina).

470

Capitolo 18

lula uovo prima della fecondazione la sintesi proteica procede molto lentamente; tuttavia, la sintesi delle proteine aumenta significativamente dopo la fecondazione. Questo aumento avviene senza la sintesi di nuovo mRNA, grazie al controllo traduzionale; ossia, gli mRNA sono modificati in modo da poter essere accumulati in uno stato in cui non vengono tradotti. L’inversione delle modificazioni rende gli mRNA traducibili. Generalmente gli mRNA sono immagazzinati associati con proteine, che li proteggono e ne inibiscono la traduzione. Inoltre, la lunghezza della coda di poli(A) dell’mRNA influisce sulla sua traducibilità. È noto infatti che la coda di poli(A) promuove l’inizio della traduzione. In generale, gli mRNA inattivi immagazzinati hanno code di poli(A) più corte (15-90 A) degli mRNA attivi (100-300 A). Gli mRNA sintetizzati negli oociti in crescita e destinati all’immagazzinamento e a essere tradotti in seguito hanno corte code di poli(A). In linea di principio, una molecola di mRNA può avere una coda di poli(A) corta o perché è stata aggiunta solo una breve serie di nucleotidi A al momento della poliadenilazione, o perché la normale coda di poli(A) aggiunta è stata successivamente tagliata. Almeno per alcuni messaggeri immagazzinati negli oociti in crescita di topo e rana, il meccanismo implicato è quest’ultimo. In un caso, l’esame di un particolare mRNA di questa classe ha mostrato che il pre-mRNA, ancora coinvolto nel processo di rimozione degli introni, ha una lunga coda di poli(A) (300-400 A), mentre l’mRNA maturo immagazzinato ha una corta coda di poli(A) (40-60 A). La diminuzione della lunghezza della coda di poli(A) per questa classe di messaggeri avviene rapidamente nel citoplasma a opera di un processo enzimatico di deadenilazione. Ciò che indirizza un peculiare mRNA verso una rapida deadenilazione, invece di una lenta diminuzione nella lunghezza della coda di poli(A), è una sequenza nella regione non tradotta nell’estremità 3′ (3′ UTR) dell’mRNA, a monte della sequenza di poliadenilazione AAUAAA. Questo segnale per la deadenilazione viene chiamato elemento ricco in adenilato/uridilato (ARE) e ha la sequenza consenso UUUUUAU. Per attivare un mRNA immagazzinato di questa classe, un enzima citoplasmatico di poliadenilazione riconosce l’ARE e aggiunge circa 150 nucleotidi di A. Così, lo stesso elemento di sequenza viene usato per controllare la lunghezza della coda di poli(A) e, quindi, la traducibilità dell’mRNA, in tempi diversi e in direzioni opposte.

Interferenza dell’RNA: silenziamento dell’espressione genica a livello post-trascrizionale mediante piccoli RNA regolatori Il paradigma del controllo dell’espressione dell’operone lac in E. coli da parte delle proteine portò a una visione

Nota chiave Gli mRNA nel citoplasma possono essere tradotti immediatamente o venire immagazzinati per essere poi tradotti successivamente. Tipicamente, gli mRNA immagazzinati sono associati a proteine che ne inibiscono la traduzione e possiedono code di poli(A) brevi al confronto con i medesimi mRNA attivi. Segnali presenti nella regione 3′ UTR controllano l’accorciamento e l’allungamento delle code di poli(A).

generalmente accettata in base alla quale la regolazione dell’espressione genica nei procarioti e negli eucarioti era ascrivibile a meccanismi basati sull’intervento delle proteine. Tuttavia, esperimenti condotti negli ultimi 20 anni hanno dimostrato che le molecole di piccoli RNA di regolazione possono silenziare l’espressione genica negli eucarioti in un processo chiamato interferenza dell’RNA (RNA interference, abbreviato in RNAi) o silenziamento dell’RNA. L’RNAi fu scoperta per la prima volta nelle piante, in cui fu chiamata silenziamento genico post-trascrizionale (PTGS, Post-Trascriptional Gene Silencing) sebbene il coinvolgimento dell’RNA nel silenziamento non fosse all’epoca dimostrato. Nel 1998 Andrew Fire e Craig Mello pubblicarono i risultati dei loro studi sulla regolazione genica condotti sul nematode Caenorhabditis elegans, di cui illustriamo brevemente i risultati. Questi scienziati iniettarono nel verme molecole di mRNA codificanti per una particolare proteina del muscolo, senza ottenere alcun fenotipo anomalo. Tuttavia, quando iniettarono entrambi gli RNA senso e antisenso contemporaneamente (l’“RNA senso” è l’mRNA che porta l’informazione corrispondente alla proteina codificata dal gene, mentre l’“RNA antisenso” è l’RNA complementare all’mRNA), il verme cominciò a muoversi come quei vermi che possiedono una forma mutata non funzionale del gene per la stessa proteina del muscolo. Fire e Mello ipotizzarono che la molecola di RNA a doppio filamento (dsRNA) formatasi in seguito all’appaiamento di RNA senso e RNA antisenso fosse responsabile del silenziamento dell’espressione del gene che codifica per il medesimo mRNA. Appurarono la loro ipotesi iniettando dsRNA relativamente a un certo numero di geni, e osservando che, in tutti i casi, l’espressione del gene corrispondente veniva silenziata. I due ricercatori dedussero che il dsRNA poteva silenziare i geni e denominarono questo fenomeno interferenza dell’RNA; nel 2006 ricevettero il Premio Nobel per la Fisiologia o Medicina “per la loro scoperta dell’interferenza dell’RNA/silenziamento dei geni mediante dsRNA”. Il loro studio rivoluzionò il pensiero scientifico riguardo alla regolazione dell’espressione genica e da allora in poi si è osservato che la regolazione dell’espressione genica basata su RNA è molto diffusa nell’ambito degli eucarioti.

La regolazione dell’espressione genica negli eucarioti

Ora è noto che i dsRNA non sono i diretti regolatori del silenziamento, ma sono i precursori di molecole di RNA a singolo filamento (ssRNA), che sono i veri regolatori del silenziamento. A seguire vengono discussi i principi fondamentali dell’RNAi rispetto al silenziamento della trascrizione e al silenziamento dell’espressione genica post-trascrizionale. Studi recenti, però, indicano che una via dell’RNAi è implicata anche nel rimodellamento della cromatina associato, almeno in alcuni casi, al silenziamento genico.

Il ruolo dei piccoli RNA regolatori nel silenziamento post-trascrizionale dei geni Negli eucarioti, i piccoli RNA regolatori possono essere classificati in due gruppi principali: microRNA (miRNA) e piccoli RNA interferenti (siRNA, short interfering RNA). Entrambi questi RNA non sono codificanti: ciò significa che non vengono tradotti e, pertanto, non specificano per alcun polipeptide. microRNA I microRNA sono molecole di ssRNA con funzione di regolazione, la cui lunghezza è di circa 21-23 nucleotidi (nt), che derivano da trascritti di RNA. I microRNA sono codificati da geni presenti nel genoma di tutti gli eucarioti multicellulari come anche di alcuni unicellulari (Saccharomyces cerevisiae, il lievito che replica per gemmazione, è un’eccezione degna di nota). A partire dal novembre 2007, più di 5000 geni per miRNA sono stati identificati negli eucarioti. Le molte centinaia di geni per i miRNA nell’uomo sono disseminate in tutti i cromosomi a eccezione del cromosoma Y. Circa il 30% dei geni per i miRNA dei mammiferi è localizzato nelle regioni intergeniche (per intergenico qui si intende “tra i geni che codificano per proteine”) del genoma; essi sono trascritti dalla RNA polimerasi II e risultano avere sia il cappuccio all’estremità 5′ sia la coda di poli(A) all’estremità 3′. Alcuni di questi geni sono localizzati nei trasposoni. I restanti geni per i miRNA dei mammiferi sono localizzati all’interno di altri geni – molti sono negli introni di geni che codificano per proteine, mentre altri sono negli introni e negli esoni di geni che non codificano per proteine. In tutti questi casi, la sequenza del miRNA viene trascritta da una RNA polimerasi come facente parte del trascritto del gene “ospite”. In qualche caso, un gene per miRNA situato all’interno di un introne viene trascritto dalla RNA polimerasi II in maniera indipendente. La Figura 18.20 illustra la produzione e le funzioni dei miRNA nel silenziamento genico post-trascrizionale negli animali. (La sintesi di miRNA avviene nelle piante mediante una via simile a quella degli animali, sebbene vi siano alcune differenze nei dettagli dei vari passaggi.) Il trascritto che contiene un miRNA viene chiamato trascritto primario del miRNA o pri-miRNA (primary miRNA). Come appena menzionato, in molti casi si tratta

471

di una molecola di pre-mRNA o di un RNA precursore per un RNA non codificante nella cellula. La molecola di pri-miRNA contiene una struttura a forcina lunga all’incirca 70 nt, all’interno della quale è presente l’eventuale miRNA. Nel nucleo la forcina viene rimossa dal primiRNA da una endonucleasi specifica per dsRNA, l’endonucleasi Drosha complessata con una proteina accessoria (Pasha in Drosophila). Drosha effettua dei tagli sfalsati, che danno origine nel singolo filamento a una estremità 3′ sporgente di ~2 nt. La forcina escissa – il premiRNA – viene rapidamente esportata nel citoplasma. Nel citoplasma un’altra endonucleasi specifica per dsRNA, Dicer, complessata con una proteina accessoria, (Loq in Drosophila), esegue dei tagli sfalsati nel premiRNA, rilasciando un breve miRNA: miRNA*, un dsRNA che consiste di alcune delle porzioni prima appaiate nella forcina. I due filamenti di RNA non sono perfettamente appaiati: il “miRNA” è il filamento maturo di miRNA che successivamente agisce nella cellula per il silenziamento dell’RNA (si veda in seguito), mentre il “miRNA*” è la sua elica complementare parziale e non agisce nel silenziamento dell’RNA. Dal momento che il miRNA presiede al silenziamento dell’RNA, esso viene definito filamento guida, mentre il miRNA* viene definito filamento passeggero. Successivamente il dsRNA, Dicer, e la proteina accessoria si legano ad Ago1, un membro della famiglia delle proteine Argonauta, e ad altre proteine per formare il complesso di silenziamento indotto da pre-microRNA o pre-miRISC (premicroRNA-Induced Silencing Complex). Ago1 è un’altra RNA endonucleasi, più frequentemente chiamata Slicer, che compie un singolo taglio all’interno del filamento passeggero, il miRNA*. Quindi, una elicasi appartenente al pre-miRISC svolge le due parti dal filamento guida, miRNA, ed esse si dissociano dal complesso. Il risultato è il miRISC maturo, il complesso della ribonucleoproteina che può silenziare l’espressione genica. In che modo un miRISC effettua il silenziamento genico post-trascrizionale? Il miRNA nel miRISC è una molecola di RNA regolatore trans-attiva; ciò significa che le molecole di mRNA bersaglio di un determinato miRNA non sono le stesse molecole da cui il miRNA deriva. Questa è una caratteristica distintiva dei miRNA rispetto ai siRNA. Un miRISC si lega a un mRNA bersaglio per mezzo dell’appaiamento complementare delle basi mediato dal miRNA. Solitamente le sequenze a cui il miRNA si lega sono brevi sequenze nella 3′ UTR dell’mRNA. Una molecola di mRNA può avere una o più sequenze nella 3′ UTR a cui lo stesso miRNA si può legare, e/o può avere parecchie sequenze nella sua 3′ UTR a cui possono legarsi molti miRNA diversi. Ciò aumenta la possibilità che la regolazione dell’espressione di uno stesso specifico gene possa essere effettuata (tramite il suo mRNA) da varie combinazioni di molecole di miRNA. Nella Figura 18.20a viene mostrato, per sempli-

472

Capitolo 18

ficazione, un singolo miRISC legato a una sequenza 3′ UTR. Negli animali, il legame tra la maggior parte dei miRISC e le loro molecole di mRNA bersaglio implica un appaiamento imperfetto tra il miRNA e la regione 3′ UTR dell’mRNA. Questo appaiamento dà il via alla rea) Produzione e funzioni dei microRNA (miRNA) nel silenziamento post-trascrizionale negli animali Un gene per un miRNA isolato o all’interno di un altro gene

Cappuccio

pressione della traduzione: la traduzione di quell’mRNA risulta pertanto inibita. L’mRNA, represso traduzionalmente, insieme a uno o più miRISC a esso associati, viene successivamente sequestrato dal macchinario della traduzione diventando o trasferendosi in un corpo P (P b) Produzione e funzioni dei piccoli RNA interferenti (siRNA) nel silenziamento post-trascrizionale negli animali

Trascrizione a opera dell’RNA polimerasi II



Pri-miRNA

Processamento mediante Drosha e proteina accessoria

AAA

Coda di poli(A)

3¢ 5¢

Nucleo 3¢

Pre-miRNA

Citoplasma

Nucleo

Citoplasma

Esportazione nel citoplasma 5¢ 3¢

Pre-miRNA

Dicer, con la proteina accessoria, si lega ed effettua dei tagli sfalsati miRNA (filamento guida) RNA* (filamento passeggero)

Proteina accessoria

miRISC si lega agli mRNA bersaglio



Degradazione dell’mRNA

Dicer Ago2 (Slicer), con le proteine accessorie (non mostrate), si lega

Pre-miRISC (complesso di silenziamento indotto da miRNA)

Ago2

Pre-siRISC (complesso di silenziamento indotto da siRNA)

Ago2 taglia uno dei due filamenti di RNA, una elicasi svolge i due pezzi, ed essi si dissociano dal complesso miRISC

siRNA

Appaiamento imperfetto del miRNA al sito siRISC si lega all’RNA bersaglio, bersaglio ossia un filamento della molecola di dsRNA da cui è derivato il siRNA ... AAAA 3¢ mRNA bersaglio

Il sito bersaglio è la 3¢ UTR dell’mRNA In seguito all’appaiamento imperfetto tra miRNA e il suo sito bersaglio, il legame del miRISC reprime la traduzione dell’mRNA; l’mRNA si trasferisce al corpo P dove viene degradato oppure immagazzinato

Proteina accessoria

RNA duplex di ~22 nt

Ago1 taglia il miRNA*, una elicasi svolge i due pezzi, ed essi si dissociano dal complesso

miRNA

Dicer, con la proteina accessoria, si lega ed effettua dei tagli sfalsati. La lunga molecola di dsRNA viene tagliata in molti duplex di ~22 nt (ne è mostrato uno)

Dicer

Ago1 (Slicer), con le proteine accessorie (non mostrate), si lega Ago1

3¢ Lunga molecola 5¢ di dsRNA

5¢ 3¢

Corpo P

o Immagazzinamento dell’mRNA

Figura 18.20 Interferenza dell’RNA (RNAi) mediante piccoli RNA regolatori.

siRISC

Appaiamento perfetto tra il siRNA e l’RNA bersaglio RNA bersaglio

Regione dell’RNA bersaglio complementare al siRNA In seguito all’appaiamento perfetto del siRNA con l’RNA bersaglio, l’RNA bersaglio è tagliato da Ago2 ... Corpo P I frammenti di RNA bersaglio sono trasferiti al corpo P per la degradazione Degradazione del frammento di RNA bersaglio

La regolazione dell’espressione genica negli eucarioti

body). Un corpo P è costituito da un aggregato localizzato nel citoplasma composto da mRNA immagazzinati, complessati con proteine, e da proteine deputate al “decapping” e alla degradazione dell’mRNA. Gli mRNA nei corpi P possono essere degradati utilizzando il macchinario di degradazione dell’mRNA ivi contenuto o essere immagazzinati in complessi ribonucleoproteici. Gli mRNA immagazzinati possono tornare a essere tradotti in tempi successivi, sempre in maniera regolata. In entrambi i casi, quando gli mRNA vengono degradati o immagazzinati, l’effetto dell’azione dei miRNA è quello di ridurre, a livello traduzionale, l’espressione del gene che codifica per l’mRNA bersaglio. Nelle piante, il legame della maggior parte dei miRISC ai loro mRNA bersaglio implica un appaiamento perfetto o quasi perfetto tra molti miRNA e la regione 3′ UTR dell’mRNA. L’appaiamento perfetto stimola la degradazione dell’mRNA piuttosto che la repressione della traduzione. In questo caso, la proteina Slicer Ago1 taglia in due parti la molecola di mRNA bersaglio e si forma il complesso mRNA-miRISC, oppure le due parti vengono trasferite a un corpo P al cui interno viene completata la degradazione dell’mRNA. I microRNA giocano un ruolo centrale nel controllo dell’espressione genica in molteplici processi a livello cellulare, fisiologico e dello sviluppo. Per esempio, i miRNA sono coinvolti in una varietà di meccanismi che riguardano lo sviluppo di animali e piante. Negli animali, i miRNA partecipano alla regolazione di specifici eventi dello sviluppo, della proliferazione cellulare, dell’espressione genica nei neuroni, della morfogenesi del cervello e della divisione delle cellule staminali. siRNA I piccoli RNA interferenti (siRNA) sono molecole di ssRNA con funzione di regolazione lunghe all’incirca 22 nt. Sono stati trovati in eucarioti filogeneticamente distanti tra di loro (ancora una volta con la rimarchevole eccezione di Saccharomyces cerevisiae). I siRNA sono prodotti dal processamento di lunghe molecole di dsRNA. La Figura 18.20b illustra la produzione e il funzionamento dei siRNA nel silenziamento genico post-trascrizionale. La via della produzione dei siRNA ha inizio con molecole di dsRNA, localizzate nel citoplasma, la cui lunghezza varia da alcune centinaia ad alcune migliaia di coppie di basi. Le fonti di queste molecole di RNA comprendono gli intermedi della replicazione di virus con genomi a RNA, molecole generate naturalmente a partire da trascritti senso e antisenso complementari o parzialmente complementari da regioni del genoma e trascritti che si ripiegano in lunghe ed estese strutture a forcina. Il lungo dsRNA viene processato utilizzando una via notevolmente simile a quella per il processamento dei pre-miRNA nel citoplasma. Inizialmente, la molecola viene processata da un complesso Dicer-proteina in

473

duplex di circa circa 22 nt, ciascuno con 2 nt sporgenti all’estremità 3′. Un filamento di ciascun duplex è il filamento guida di siRNA che effettuerà il silenziamento dell’RNA, mentre il filamento complementare (perfettamente complementare in queste molecole) è il filamento passeggero che verrà eliminato. In seguito, il complesso dsRNA-Dicer-proteina si lega ad Ago2, un altro membro della famiglia delle Argonauta, e ad altre proteine per formare il complesso di silenziamento indotto da pre-siRNA o pre-siRISC (pre-siRNA-Induced Silencing Complex). I passaggi successivi sono analoghi a quelli per la via dei miRNA, e portano alla formazione del siRISC maturo. Il siRISC agisce nel silenziamento genico post-trascrizionale mediante il riconoscimento di RNA a singolo filamento che sono complementari a uno o all’altro filamento dei dsRNA da cui i siRNA vengono prodotti. Il siRNA nel siRISC si appaia all’RNA bersaglio mediante un accoppiamento di basi perfetto, e Ago2 taglia l’RNA bersaglio in due. La degradazione delle due parti avviene in un corpo P. Se consideriamo la molecola di RNA bersaglio come un genoma virale o un trascritto virale, la conseguenza è che il ciclo vitale del virus viene inibito. Questo esempio di interferenza dell’RNA operata dal siRNA può essere considerato, pertanto, come una sorta di “sistema immunitario” controllato dall’RNA.

Regolazione dell’espressione genica a livello post-trascrizionale mediante il controllo della degradazione dell’mRNA e della degradazione delle proteine L’espressione genica è regolata a livello post-trascrizionale anche tramite il controllo della degradazione dell’mRNA e delle proteine.

Controllo della degradazione dell’mRNA Tutte le specie di RNA sono soggette al controllo della degradazione, mediante il quale il tasso di degradazione dell’RNA (chiamato anche turnover dell’RNA) viene regolato. Generalmente, sia gli rRNA (nei ribosomi), sia i tRNA sono specie altamente stabili. Al contrario, le molecole di mRNA mostrano diversi gradi di stabilità; è noto che alcuni tipi di mRNA sono stabili per molti mesi, mentre altri si degradano nel giro di pochi minuti. La stabilità delle peculiari molecole di mRNA può variare in risposta a segnali regolatori. Per esempio, l’aggiunta di una molecola regolatrice a un dato tipo cellulare può determinare un aumento della sintesi di una particolare proteina (o proteine), mediante un incremento del tasso di trascrizione dei geni coinvolti o della stabilità degli

474

Capitolo 18

Nota chiave Nell’interferenza dell’RNA (RNAi) piccole e peculiari molecole di RNA non codificanti, con funzione di regolazione, agiscono nel silenziamento dell’espressione di singoli geni a livello post-trascrizionale. I due principali gruppi di piccoli RNA sono i microRNA (miRNA) e i piccoli RNA interferenti (siRNA). I miRNA sono molecole a singolo filamento, ssRNA, che derivano da trascritti di RNA codificati da specifici geni nucleari. I siRNA sono molecole a singolo filamento derivate dal processamento di lunghi RNA a doppio filamento, dsRNA, come per esempio gli intermedi di replicazione dei genomi virali. Sia i miRNA sia i siRNA vengono prodotti in vie simili, in cui alcuni componenti sono condivisi e nelle quali una molecola di RNA a doppio filamento o una regione a doppio filamento di una molecola di RNA vengono processate da enzimi per produrre il piccolo RNA. L’RNA viene associato a proteine per formare un complesso di silenziamento indotto da RNA o RISC – miRISC e siRISC per i due tipi di RNA di interferenza. Il miRISC si lega specificatamente agli mRNA bersaglio – i trascritti genici regolati dal miRNA – tramite l’appaiamento del miRNA a una sequenza nella 3′ UTR. Se l’appaiamento è imperfetto, la traduzione viene inibita e l’mRNA può essere immagazzinato o degradato. Se l’appaiamento è perfetto, o quasi perfetto, un enzima nel miRISC taglia l’mRNA all’interno della regione di appaiamento con il miRNA, e i frammenti di mRNA sono successivamente degradati. Il siRISC riconosce gli RNA a singolo filamento, che consistono in uno o nell’altro dei due filamenti dell’RNA a doppio filamento da cui il siRNA nel complesso è derivato. Di conseguenza l’appaiamento è sempre perfetto e, pertanto, l’RNA a singolo filamento è tagliato e successivamente degradato. Il miRNA riconosce e lega specifici mRNA cellulari. Il siRNA riconosce e lega un RNA a singolo filamento, come per esempio un RNA virale, correlato al dsRNA da cui il siRNA era stato prodotto.

mRNA prodotti. La Tabella 18.1 presenta esempi di sistemi in cui cambiamenti di stabilità dell’mRNA per alcuni tipi cellulari avvengono in presenza o in assenza di specifiche molecole effettrici. La degradazione dell’mRNA è uno dei punti più rilevanti nella regolazione dell’espressione genica negli eucarioti. È stato dimostrato che varie sequenze o strutture influenzano l’emivita degli mRNA, tra cui gli elementi ricchi in AU (ARE) discussi in precedenza e diverse strutture secondarie. Le due vie principali di decadimento dell’RNA sono la via di decadimento dipendente dal-

la deadenilazione e la via di decadimento indipendente dalla deadenilazione. Nella via di decadimento dipendente dalla deadenilazione, le code di poli(A) sono deadenilate fino a che non sono troppo corte (5-15 A) per legare una PAB: Poly(A) Binding protein, “proteina di legame al poli(A)”. Nel lievito, il prodotto del gene PAN1, nucleasi del poli(A) PAB-dipendente, catalizza la deadenilazione. Quando la coda è quasi rimossa, viene eliminata la struttura del cappuccio al 5′ in una tappa chiamata decapping (“rimozione del cappuccio”), processo catalizzato da un enzima. Nel lievito l’enzima del decapping, o almeno una sua componente essenziale, è codificato dal gene DCP1. Una molecola di mRNA, dopo che il cappuccio è stato rimosso, viene degradata a partire dall’estremità 5′ da un’esonucleasi 5′-3′. Nel lievito, questo enzima – codificato dal gene XRN1 – degrada molto rapidamente gli mRNA privi del cappuccio, a riprova dell’importanza del cappuccio al 5′ nel proteggere gli mRNA attivi nella cellula. I ceppi di lievito con un gene DCP1 mutante sono vitali e la degradazione dell’mRNA avviene ancora, a dimostrazione dell’esistenza di vie di degradazione dell’mRNA diverse da quella appena descritta. In queste vie di decadimento indipendenti dalla deadenilazione, agli mRNA può venire rimosso il cappuccio senza che vi sia stata deadenilazione, con conseguente esposizione alla rapida degradazione da parte delle esonucleasi 5′-3′; alternativamente gli mRNA possono essere tagliati internamente da endonucleasi senza essere deadenilati e poi possono essere ulteriormente spezzettati. Si noti che, benché la nostra comprensione della degradazione dell’mRNA nel lievito stia diventando sempre più chiara, i dettagli della degradazione dell’mRNA nelle cellule di mammifero non sono altrettanto noti. Nei mammiferi vi sono sia la via di decadimento deadenilazione-dipendente, sia la via deadenilazione-indipendente, e il decapping è una tappa importante almeno nella prima via.

Controllo della degradazione delle proteine Esistono anche meccanismi regolatori a livello post-traduzionale che determinano la durata della vita di una proteina. Esiste una grande varietà di soluzioni per regolare la quantità di una determinata proteina in una cellula. Un mRNA prodotto costitutivamente può venire tradotto in continuazione con il livello di prodotto proteico controllato dal tasso di degradazione di quella proteina, oppure un mRNA a vita breve può codificare per una proteina altamente stabile così da persistere per lungo tempo nella cellula. Proteine nel cristallino degli occhi dei vertebrati superiori, per esempio, hanno una vita lunga. Anche se gli mRNA corrispondenti sono stati degradati da tempo, la proteina persiste generalmente per tutto il tem-

La regolazione dell’espressione genica negli eucarioti

475

Tabella 18.1 Esempi di tessuti o cellule in cui la regolazione della stabilità dell’mRNA avviene in risposta a specifiche molecole effettricia

mRNA

Tessuto o cellula

Segnale regolativo Y (= molecola effettrice)

Vitellogenina

Fegato (rana)

Estrogeno

500 h

16 h

Vitellogenina

Fegato (gallina)

Estrogeno

~24 h

<3 h

Apolipoproteina a densità molto bassa

Fegato (gallina)

Estrogeno

~20-24 h

<3 h

Ovalbumina, conalbumina

Ovidotto (gallina)

Estrogeno, progesterone

>24 h

2-5 h

Caseina

Ghiandola mammaria (ratto)

Prolattina

92 h

5h

Proteina prostatica legante steroidi

Prostata (ratto)

Androgeno

a

Emivita dell’mRNA Con effettore Senza effettore

Aumenta di 30 volte

Si noti che la molecola effettrice dà luogo, in ogni caso, a un aumento in trascrizione e a stabilizzazione dell’mRNA.

po di vita dell’individuo. Invece, i recettori degli steroidi e le proteine heat-shock hanno emivita breve. La degradazione delle proteine (proteolisi) negli eucarioti richiede l’aggiunta alle proteine di ubiquitina (una proteina ubiquitaria di 76 amminoacidi presente fondamentalmente in tutti gli eucarioti). Le proteine “ubiquitinate” vengono quindi trasportate al proteasoma, un grande complesso costituito da molteplici subunità e contenente proteasi, nel quale le proteine bersaglio vengono degradate in brevi peptidi. I peptidi vengono poi degradati in amminoacidi da enzimi proteolitici presenti nel citoplasma. L’ubiquitina viene rilasciata intatta durante la degradazione nel proteasoma e può venire utilizzata di nuovo per marcare altre proteine da degradare. Aaron Ciechanover, Avram Hershko e Irwin Rose ricevettero nel 2004 il Premio Nobel per la Chimica “per la loro scoperta della degradazione delle proteine mediata dall’ubiquitina”. La monoubiquitinazione, ovvero l’aggiunta di una singola ubiquitina a una proteina, gioca un diverso ruolo nella cellula, come descritto nel Focus sul genoma di questo capitolo. L’amminoacido all’estremità N-terminale di una proteina è la chiave per capire come una proteina inizialmente venga designata come bersaglio per il legame con l’ubiquitina. In quella che è nota come regola N-terminale, il particolare amminoacido N-terminale è direttamente correlato con l’emivita della proteina. In una prova con il sistema lievito, in cui è stata misurata la durata della vita della stessa proteina con diversi amminoacidi N-terminali, arginina, lisina, fenilalanina, leucina e triptofano, si è osservato che ciascuno di essi determinava un’emivita di 3 minuti o meno, mentre cisteina, alanina, serina, treonina, glicina, valina, prolina e metionina determinavano tutti un’emivita di più di 20 ore. La stessa gerarchia generale si osserva anche in E. coli. L’amminoacido N-terminale determina il tasso con cui le mo-

lecole di ubiquitina possono legarsi alla proteina, che, a sua volta, determina l’emivita della proteina. In sintesi, nei procarioti, il controllo dell’espressione genica avviene principalmente a livello trascrizionale, in associazione con un rapido ricambio di molecole di mRNA. Negli eucarioti, l’espressione genica è regolata a livelli trascrizionali, post-trascrizionali e post-traduzionali. Oltre alla degradazione, la regolazione funzionale delle proteine coinvolge modifiche chimiche degli amminoacidi (acetilazione, metilazione, fosforilazione, aggiunta di carboidrati) o proteolisi di residui specifici a opera di sistemi degradativi diversi dal proteasoma. Tali modifiche possono influire sul trasporto, la localizzazione intracellulare e l’attività funzionale delle proteine. L’intreccio degli eventi regolativi a questi diversi livelli determina una fine modulazione della quantità di una proteina nella cellula.

Nota chiave L’espressione genica viene regolata a livello posttrascrizionale anche mediante il controllo della degradazione dell’mRNA. La degradazione dell’mRNA è ritenuta il punto di controllo più rilevante nella regolazione dell’espressione genica. È stato dimostrato che caratteristiche strutturali dei singoli mRNA sono responsabili delle differenti entità di degradazione, benché i ruoli precisi di fattori cellulari ed enzimi siano ancora da determinare. Anche la degradazione delle proteine è sottoposta a regolazione. La stabilità della proteina è correlata all’amminoacido presente all’estremità N-terminale della proteina stessa e da ciò dipende il tasso con cui l’ubiquitina si lega alla proteina. A sua volta, essa ne determina il tasso di degradazione.

476

Capitolo 18

Sommario l Negli eucarioti la regolazione dell’espressione genica avviene a più livelli. Vi sono sistemi regolatori che controllano la trascrizione, il processamento dell’RNA precursore, il trasporto dell’RNA maturo al di fuori del nucleo, la traduzione dell’mRNA, la degradazione dell’RNA maturo e il processamento e la degradazione delle proteine. l L’attivazione dell’inizio della trascrizione per un gene eucariote che codifica per una proteina richiede tre classi di proteine: i fattori generali di trascrizione, gli attivatori e i coattivatori. I fattori generali di trascrizione si legano al core del promotore e sono necessari per una trascrizione basale. Gli attivatori si legano agli enhancer e agli elementi prossimali del promotore e promuovono l’inizio della trascrizione reclutando un coattivatore – un grande complesso multiproteico che non si lega direttamente al DNA, ma collega come un ponte le proteine dell’attivatore e i fattori generali di trascrizione. Una volta legati agli attivatori, i coattivatori reclutano la RNA polimerasi II che, mediante l’interazione con i fattori di trascrizione generali, viene orientata correttamente per iniziare la trascrizione. l Mentre gran parte della regolazione dell’espressione genica avviene mediante un sistema di regolazione positivo – attivazione della trascrizione –, per alcuni geni si verifica una regolazione negativa da parte dei repressori. I repressori si legano al DNA e agiscono in vari modi per bloccare o limitare l’inizio della trascrizione. l Ciascun elemento regolativo del promotore e ciascun enhancer lega specifiche proteine regolatrici. Tuttavia, vi sono molte meno proteine regolatrici di quanti siano i geni. Nella regolazione genica combinatoriale la particolare combinazione di poche proteine regolatrici (attivatori e/o repressori), controlla la trascrizione di diversi insiemi di geni. l La configurazione della cromatina crea una barriera alla trascrizione. Le regioni trascrizionalmente attive presentano una struttura della cromatina più rilassata rispetto alle regioni trascrizionalmente inattive. La cromatina presente nel core del promotore dei geni non espressi è compattata in modo tale da regolare negativamente la trascrizione. Il rimodellamento di questa regione di cromatina è necessario per l’attivazione della trascrizione. Il rimodellamento della cromatina necessita di grandi complessi multiproteici di rimodellamento che acetilano i nucleosomi, indebolendo la loro associazione con il DNA, oppure spostano o ristrutturano i nucleosomi permettendo così al macchinario di trascrizione di avere accesso al promotore. l Il silenziamento genico implica cambiamenti nella struttura della cromatina che si modifica in eterocromatina, conformazione che solitamente riguarda una regione di geni. Un gene può anche essere silenziato mediante la metilazione delle citosine presenti nel promotore a monte del gene. In taluni casi il profilo di metilazione è associato all’imprinting genomico, un fenomeno epigenetico in cui l’espressione di un gene è determinata dalla trasmissione ereditaria del gene, ovvero dalla provenienza dal genitore femminile o dal genitore maschile.

l La metilazione del DNA e le modificazioni istoniche sono modifiche epigenetiche, cioè capaci di controllare l’espressione genica senza modificare la sequenza del DNA. Queste modifiche sono ereditate nelle divisioni cellulari. l L’espressione genica può anche essere regolata a livello di processamento dell’RNA. Questo tipo di regolazione agisce determinando la produzione di molecole di RNA maturo da molecole di RNA precursore. Due eventi regolativi, che esemplificano questo livello di controllo, sono la scelta del sito di poli(A) e la scelta del sito di giunzione (poliadenilazione alternativa e splicing alternativo). In entrambi i casi, in base alla scelta compiuta, vengono prodotti differenti tipi di mRNA. Come conseguenza possono essere prodotte proteine, codificate dallo stesso gene, che differiscono per struttura e funzione. Una volta che l’mRNA maturo è prodotto, viene esportato dal nucleo al citoplasma. l Nel citoplasma l’mRNA maturo è sottoposto a controllo traduzionale, ossia un mRNA può venire direttamente tradotto dai ribosomi, oppure può essere immagazzinato complessato con proteine in una configurazione che non è traducibile. Tipicamente, gli mRNA immagazzinati hanno code di poli(A) corte. L’attivazione degli mRNA immagazzinati implica la rimozione delle proteine associate e l’allungamento della coda di poli(A). Segnali presenti nella 3′ UTR di un mRNA controllano l’accorciamento e l’allungamento della coda di poli(A). l L’interferenza dell’RNA (RNAi) implica il silenziamento dell’espressione di singoli geni a livello post-trascrizionale mediato da piccole molecole regolatrici di RNA non codificanti. I due principali gruppi di piccoli RNA sono costituiti dai microRNA (miRNA) e dai piccoli RNA interferenti (siRNA). I miRNA derivano da trascritti di geni nucleari e, in un complesso con proteine specifiche, si legano a specifiche sequenze nella 3′ UTR degli mRNA bersaglio. Quando l’appaiamento è imperfetto, l’interazione blocca la traduzione degli mRNA bersaglio. Se l’appaiamento è perfetto, l’interazione determina il taglio dell’mRNA bersaglio. I siRNA derivano da lunghi RNA a doppio filamento, dsRNA, come per esempio gli intermedi della replicazione virale. In un complesso con proteine specifiche, il siRNA si lega a un singolo filamento dell’RNA da cui si era originato e, dal momento che l’appaiamento è perfetto, taglia quella molecola di RNA. l L’espressione genica è anche sottoposta al controllo operato dalla degradazione dell’mRNA. Si ritiene che essa sia uno dei punti principali di controllo nella regolazione dell’espressione genica, come evidenziato dal riscontro all’interno degli organismi di un ampio spettro di stabilità degli mRNA. È chiaro che le nucleasi sono in definitiva responsabili della degradazione degli mRNA e che i segnali per la diversa stabilità degli mRNA sono una caratteristica degli aspetti strutturali dei singoli mRNA. La regolazione a livello proteico coinvolge un meccanismo che specifica la durata dell’esistenza e il tasso di degradazione delle proteine.

La regolazione dell’espressione genica negli eucarioti

477

Approccio analitico alla soluzione di problemi di genetica D18.1 Una regione di un cromosoma di lievito specifica per tre enzimi nella via biosintetica dell’istidina; questi enzimi vengono sintetizzati in modo coordinato. Come distinguereste fra i seguenti tre modelli? (Un suggerimento: si ricordi che la sequenza completa del genoma di lievito è stata determinata.) a. I tre geni non sono organizzati in un operone. Codificano per tre mRNA distinti, che vengono tradotti in tre enzimi differenti. b. I tre geni sono organizzati in un operone. L’operone viene trascritto in un singolo mRNA policistronico, la cui traduzione produce i tre distinti enzimi. c. Un gene (un supergene) viene trascritto in un singolo mRNA, la cui traduzione produce un singolo polipeptide con tre diverse attività enzimatiche. R18.1 L’esame della sequenza della regione del genoma di lievito che codifica per questi tre enzimi consentirà di distinguere tra il modello a tre geni indipendenti a e gli altri due modelli; cioè, se tre geni diversi specificano per i tre enzimi, allora ciascun gene avrà il proprio promotore. Se possono essere identificate le sequenze putative del promotore, adiacenti a ciascuna sequenza codificante per proteine, allora è probabile che il modello a sia corretto. Se una sola sequenza putativa del promotore può essere identificata a una o all’altra estremità del cluster delle tre sequenze codificanti per proteine, allora uno dei due modelli, b o c, è corretto. Anche un’analisi Northern blot potrebbe aiutare a distinguere quale dei modelli è corretto. Ciò significa isolare gli mRNA dal lievito nelle condizioni in cui gli enzimi per la biosintesi

dell’istidina vengono prodotti, separare gli mRNA mediante elettroforesi su gel e poi trasferire i frammenti di mRNA su una membrana mediante la tecnica del Northern blot. Il passaggio successivo sarà l’ibridazione del filtro separatamente con sonde di DNA, a singolo filamento marcato, derivate da ciascuna regione del cromosoma che codifica per i tre enzimi. Se il modello a è corretto, l’ibridazione rivelerà una banda per ciascuno dei tre DNA a singolo filamento marcati. Le dimensioni della banda varieranno in base alla lunghezza dell’mRNA, essendo la lunghezza correlata alle dimensioni dell’enzima per cui esso codifica. Anche nel caso in cui i modelli b o c siano corretti, la sonda rivelerà una banda. Quella banda sarà delle stesse dimensioni per ciascun modello, e si prevede che esse siano molto più grandi rispetto a quelle previste per ciascuna delle tre bande nel caso in cui il modello a sia quello corretto. La caratterizzazione delle attività enzimatiche codificate dai tre geni ci permetterebbe di distinguere fra i modelli b e c. Infatti, nel modello b dell’operone verrebbero prodotti tre diversi polipeptidi. Questi polipeptidi potrebbero venire isolati e purificati individualmente usando tecniche standard. Così, se il modello b dell’operone fosse corretto, potremmo dimostrare che vi sono tre diversi polipeptidi, ciascuno dei quali presenta solo una delle attività enzimatiche – ossia, tre polipeptidi e tre attività enzimatiche. Al contrario, se il modello c del supergene fosse corretto, dovrebbe essere possibile soltanto isolare un grande polipeptide con tutte e tre le attività enzimatiche; non dovrebbero esistere polipeptidi con una sola delle attività enzimatiche.

19

Analisi genetica dello sviluppo

Che cosa sono lo sviluppo e il differenziamento?

Come è compensata la diseguaglianza del dosaggio genico del cromosoma X nel maschio e nella femmina dei mammiferi?

Quali organismi modello vengono usati per l’analisi genetica dello sviluppo?

Come è determinato il sesso in Drosophila?

Durante lo sviluppo, il genoma rimane costante oppure si verifica una perdita di DNA?

Come è compensata la diseguaglianza del dosaggio genico del cromosoma X nel maschio e nella femmina di Drosophila ?

In quale modo i riarrangiamenti genetici generano differenti anticorpi?

Come è regolato geneticamente lo sviluppo del corpo in Drosophila?

Come è determinato il sesso nei mammiferi?

Come regolano lo sviluppo i microRNA (miRNA)?

Attività In che modo la singola cellula, formatasi in seguito alla fusione dello spermatozoo con la cellula uovo, si trasforma in un organismo complesso? In che modo le cellule di un organismo umano in sviluppo “sanno” come organizzarsi per formare un essere umano? Che cosa fa sì che cellule in divisione sviluppino una gamba piuttosto che un occhio, un cuore o una mano? Come apprenderete in questo capitolo, lo sviluppo dell’uomo e degli altri organismi eucarioti richiede una regolazione precisa di gruppi di geni. Dopo aver letto e studiato questo capitolo, potrete applicare ciò che avete imparato nell’iAttività, nella quale tenterete di identificare alcuni dei geni responsabili del differenziamento di cellule staminali embrionali in tessuti diversi.

È naturale che al capitolo sulla regolazione dell’espressione genica negli eucarioti segua un capitolo sulla genetica dello sviluppo, poiché i geni presiedono allo sviluppo e la comprensione della loro regolazione aiuta i ricercatori nelle analisi genetiche dello sviluppo. La genetica dello sviluppo è un campo della biologia dello sviluppo e l’entità di nozioni relative è troppo vasta per un solo capitolo di un corso introduttivo alla genetica. Verranno, quindi, presentati soltanto alcuni principi importanti e pochi esempi per illustrare alcuni aspetti dell’analisi genetica dello sviluppo.

Eventi base dello sviluppo Lo sviluppo è il processo di crescita regolata, che deriva dall’interazione del genoma con il citoplasma e con

l’ambiente esterno e che implica una sequenza programmata di eventi fenotipici a livello cellulare, generalmente irreversibili. La totalità dei cambiamenti fenotipici costituisce il ciclo vitale di un organismo. Per un organismo multicellulare, lo sviluppo inizia quando lo zigote si è formato in seguito alla fusione dello spermatozoo con la cellula uovo. Lo zigote è totipotente, ovvero ha la potenzialità di svilupparsi in qualsiasi tipo di cellula dell’organismo. Alcune cellule, anche a sviluppo avanzato, possono rimanere totipotenti; una condizione comune nelle piante, ma non negli animali dopo lo stadio embrionale di quattro cellule. La capacità di una cellula di dare origine a diversi tipi di cellule, durante lo sviluppo, viene definita potenziale di sviluppo. Mentre lo sviluppo procede, il potenziale di sviluppo della maggior parte delle singole cellule diminuisce. (Tuttavia, un alto potenziale di sviluppo viene mantenuto nelle cellule staminali adulte, per permettere il rinnovamento dei tessuti.) Seguendo una cellula nelle varie fasi dello sviluppo, i ricercatori possono individuare che cosa diventerà, cioè il suo destino. Più precisamente, possono essere seguiti i destini di tutte le cellule in un embrione, procedendo alla realizzazione di una mappa del destino, un diagramma della sorte di ciascuna cellula embrionale. Per esempio, nel 1983 John Sulston e i suoi collaboratori con una ricerca accurata osservarono al microscopio lo sviluppo di cellule embrionali di C. elegans ed elaborarono una mappa che mostrava la precisa derivazione (lineage) di ogni cellula adulta. Quando il programma genetico stabilisce il destino di una cellula si dice che la cellula è determinata, e il pro-

480

Capitolo 19

cesso viene definito determinazione. Si tratta ancora di uno stadio relativamente precoce dello sviluppo, per cui una cellula determinata, sebbene sia diversa dal punto di vista molecolare, non è morfologicamente distinguibile dalle sue vicine. I cambiamenti cellulari che avvengono durante la determinazione seguono una direzione e conducono a uno stato stabile; cioè, quando il destino di una cellula è determinato, non cambia. Naturalmente, il corollario è che una cellula determinata ha, a quel punto, un potenziale di sviluppo uguale a zero: non vi è più una gamma di tipi di cellule in cui può differenziarsi. Vi sono due principali meccanismi di determinazione cellulare. Nella maggioranza dei casi la determinazione avviene mediante induzione; cioè, un segnale induttivo prodotto da una cellula o da un gruppo di cellule influenza lo sviluppo di un’altra cellula o gruppo di cellule. Per esempio, il segnale può diffondersi attraverso lo spazio intercellulare ed essere riconosciuto da un recettore di superficie sulla cellula bersaglio. Oppure, cellule in contatto tra loro possono indurre l’interazione di proteine transmembrana nelle membrane plasmatiche, con conseguente produzione di un segnale in un tipo di cellule. In alcuni casi, durante la divisione cellulare, vi è una distribuzione asimmetrica di molecole implicate nella determinazione cellulare. Come risultato, le due cellule figlie differiscono relativamente al contenuto di segnali molecolari per la differenziazione futura. Dopo la determinazione si verifica l’aspetto più appariscente dello sviluppo: il differenziamento. Il differenziamento è il processo mediante il quale cellule determinate vanno incontro a programmi di sviluppo cellulari specifici, per dare origine a tipi di cellule con specifiche identità come, per esempio, negli animali le cellule nervose, le cellule che producono anticorpi, le cellule epite-

Nota chiave Lo sviluppo è una crescita regolata che dipende dall’interazione del genoma con il citoplasma e con l’ambiente extracellulare. Lo sviluppo inizia quando lo zigote si è formato. Lo zigote e le cellule delle prime generazioni che ne derivano sono totipotenti, cioè possono svilupparsi in qualsiasi tipo di cellule dell’organismo. A un certo punto il programma genetico stabilisce il destino di una cellula mediante un processo denominato determinazione. Dopo la determinazione avviene il differenziamento, mediante il quale le cellule determinate vengono sottoposte a programmi di sviluppo per produrre specifici tipi di cellule. Un processo correlato al differenziamento è la morfogenesi, nella quale vengono prodotte strutture anatomiche o cellule con forma e dimensione specifiche mediante modalità di divisione cellulare regolate e cambiamenti della forma cellulare.

liali e così via; e nelle piante le cellule del floema, le cellule stomatiche (“cellule di guardia”) delle foglie, le cellule meristematiche e così via. Nella maggior parte dei casi il differenziamento deriva da un’espressione genica differenziale, e non da una perdita differenziale di DNA, che lascerebbe gruppi di geni diversi nei diversi tipi di cellule. Perciò l’espressione di insiemi diversi di geni nei differenti tipi di cellule determinate porta nelle cellule a una diversificazione delle proteine, che guidano la progressione verso i vari stati differenziati. Collegata al differenziamento vi è la morfogenesi, letteralmente “generazione di una forma” e, per definizione, il processo di sviluppo mediante il quale vengono generate e organizzate strutture anatomiche o cellule con forma e dimensione specifiche. Sia negli animali sia nelle piante, la morfogenesi implica modelli regolati di divisioni cellulari, morte cellulare programmata (apoptosi) e variazioni nella morfologia cellulare. Nel processo di morfogenesi negli animali il movimento delle cellule riveste un aspetto importante.

Organismi modello per l’analisi genetica dello sviluppo Per l’analisi genetica dello sviluppo, i ricercatori devono disporre di mutanti che presentino alterazioni in questo processo. Questi mutanti possono insorgere spontaneamente in natura o possono essere indotti sperimentalmente ma, in entrambi i casi, deve essere possibile studiarli. Sebbene un’ampia gamma di organismi sia stata oggetto di studi descrittivi dello sviluppo, relativamente pochi organismi possono essere definiti dei modelli per l’analisi genetica dello sviluppo. Di seguito sono presentati i principali organismi che hanno contribuito maggiormente alle nostre conoscenze sulla genetica dello sviluppo. Per molti di essi il genoma è stato completamente sequenziato. (Le caratteristiche che rendono degli organismi un utile modello per la ricerca genetica sono state discusse nel Capitolo 1; vedi anche Figura 1.4.) Saccharomyces cerevisiae Il lievito è un organismo eucariote unicellulare. Le cellule di lievito si mandano reciprocamente dei segnali tramite una secrezione extracellulare di feromoni. Mediante questo meccanismo, una cellula MATa e una cellula MATα possono riconoscersi l’una con l’altra; solo la coniugazione tra le cellule dei due tipi sessuali può produrre uno zigote. Inoltre, il differenziamento delle cellule di lievito nei due tipi sessuali ha delle analogie con i processi di sviluppo che si osservano negli organismi multicellulari. Drosophila melanogaster Il moscerino della frutta è stato un organismo modello per i genetisti fin dai tempi del lavoro di Morgan attorno al 1910. Tra le migliaia di mutanti isolati ve ne sono molti con alterazioni

Analisi genetica dello sviluppo

481

Figura 19.1 Mutante dello sviluppo di Drosophila con quattro occhi invece dei due normali.

dello sviluppo. La Figura 19.1 mostra un mutante con quattro occhi, anziché i due normali. Lo studio dei mutanti dello sviluppo in Drosophila fornisce un vasto insieme di dati relativi agli aspetti molecolari dello sviluppo. Si discuterà, successivamente in questo capitolo, del modo in cui i mutanti hanno contribuito alla comprensione della determinazione del sesso, della formazione delle strutture nell’embriogenesi e delle modalità con cui i geni programmano i segmenti costitutivi dell’organismo adulto. Caenorhabditis elegans Questo verme nematode è trasparente e ciò permette di seguirne facilmente al microscopio i processi dello sviluppo. Per ogni cellula adulta è nota la mappa del destino, per cui è facile individuare dove le mutazioni alterano i meccanismi dello sviluppo. La Figura 19.2 mostra tre stadi dello sviluppo di C. elegans, da quello di due cellule all’organismo adulto. Arabidopsis thaliana Questa piccola pianta è utilizzata diffusamente nell’analisi genetica e molecolare, in particolare per lo studio dello sviluppo del fiore. La Figura 19.3 mostra un fiore selvatico accanto al mutante dello sviluppo agamous (ag), nel quale al posto degli stami si formano dei petali e al posto dei carpelli dei sepali. Danio rerio Il pesce zebra (zebrafish) (Figura 19.4, a sinistra) è un vertebrato i cui embrioni sono trasparenti e ciò facilita l’osservazione degli stadi di sviluppo (Figura 19.4, a destra). Possono essere effettuati degli incroci genetici, un gran numero di pesci può essere allevato in laboratorio e sono stati messi a punto “screening” (metodi di selezione genetica) per la ricerca dei geni che alterano l’embriogenesi e altri processi biologici. Mus musculus Il topo è un mammifero e ciò lo rende, naturalmente, un organismo modello particolarmente vicino all’uomo. Il topo è stato per molti anni utilizzato come oggetto dell’analisi genetica, compresa l’analisi genetica dello sviluppo. È nota la sequenza

Figura 19.2 Tre stadi dello sviluppo di Caenorhabditis elegans, da quello di due cellule all’organismo adulto.

del genoma del topo e l’ottenimento di knock-out genici (vedi Capitolo 9) è tecnicamente facile. Benché siano noti molti mutanti dello sviluppo, il loro studio in vivo è difficoltoso, poiché l’embriogenesi avviene nell’utero.

Figura 19.3 Fiore di Arabidopsis selvatico (a sinistra) e fiore del mutante dello sviluppo, agamous (ag) (a destra). I fiori del mutante ag hanno petali al posto degli stami in un verticillo e sepali al posto dei carpelli in un altro verticillo.

482

Capitolo 19

Figura 19.4 Adulto (a sinistra) ed embrione (a destra) del pesce zebra, Danio rerio.

Lo sviluppo è determinato da un’espressione genica differenziale In questo paragrafo saranno discussi alcuni esperimenti scelti che dimostrano come lo sviluppo sia determinato da un’espressione genica differenziale.

Costanza del DNA nel genoma durante lo sviluppo Nei primi studi sul controllo genetico dello sviluppo, un quesito rilevante era se lo sviluppo implicasse un’espressione genica differenziale di un genoma, tanto nelle cellule adulte quanto nello zigote, oppure implicasse una perdita di DNA, cosicché ciascun tipo di cellula differenziata trattenesse soltanto quei geni richiesti per quel tipo di cellula, e il restante DNA venisse eliminato durante il processo di differenziamento. Esperimenti di clonazione di piante e animali, cioè generazione di individui geneticamente identici all’individuo di partenza, indicano che il contenuto di DNA rimane costante durante lo sviluppo. Rigenerazione di piante di carota da una singola cellula matura Negli anni cinquanta del secolo scorso, Frederick Steward isolò piccoli pezzi di tessuto del floema di una carota (cioè di tessuto vascolare) in modo da separare le singole cellule e poi tentò di coltivare nuove piante di carota da quelle cellule, usando le tecniche di coltura di tessuto delle piante. Furono prodotte (clonate) con successo piante adulte con carote commestibili a partire da cellule del floema. Il risultato indicava che le cellule mature avevano il potenziale di svolgere le stesse funzioni degli zigoti e di svilupparsi in una pianta completa, e ciò significa che la cellula matura contiene tutto il DNA che si trova nello zigote. La clonazione animale Nel 1975 John Gurdon e i suoi colleghi dimostrarono che un nucleo di una cellula della pelle di una rana adulta iniettato in una cellula uovo enucleata poteva determinare lo sviluppo verso lo stadio di girino. In quegli esperimenti furono ottenuti pochi adulti, ed erano tutti sterili.

I risultati di Gurdon lasciarono irrisolto il problema se un nucleo di tessuto adulto differenziato fosse geneticamente in grado di determinare lo sviluppo dallo stadio di cellula uovo ad adulto fertile. La risposta affermativa è giunta nel 1997, quando Ian Wilmut e i suoi colleghi hanno realizzato la clonazione di un mammifero (una pecora) a partire da una cellula adulta. Il gruppo di Wilmut ha saggiato la capacità di nuclei di cellule embrionali, fetali e adulte di determinare lo sviluppo di una pecora. L’approccio sperimentale è stato il seguente (Figura 19.5). 1. Cellule embrionali, fibroblasti fetali (cellule del tessuto connettivo) e cellule epiteliali della ghiandola mammaria prelevati da pecore donatrici (rispettivamente di razza poll Dorset, black Welsh e Finn Dorset) sono stati posti in un terreno di coltura e poi indotti a entrare in uno stadio di quiescenza (fase G0 del ciclo cellulare), riducendo la concentrazione di siero nel terreno di coltura. 2. Le cellule sono state fuse con oociti (cellule uovo) enucleati e, quindi, si è lasciato che crescessero e si dividessero per sei giorni per produrre embrioni. 3. Gli embrioni sono stati impiantati in pecore riceventi e sono stati monitorati l’impianto nell’utero e il progredire della gravidanza. I risultati sono stati i seguenti: 4 delle 385 cellule di origine embrionale, 2 delle 172 cellule derivate dai fibroblasti fetali e 1 delle 277 cellule derivate dall’epitelio della ghiandola mammaria di una pecora adulta hanno prodotto agnelli. Il risultato più significativo è l’ultimo, perché dimostra che il nucleo adulto contiene tutta l’informazione genetica necessaria a determinare un nuovo organismo. Questo agnello, designato 6LL3 e chiamato Dolly, si è sviluppato normalmente fino alla maturità sessuale e nel 1998 ha partorito Bonnie. Nel 1999 Dolly ha avuto un parto trigemino. Dolly è deceduta mediante eutanasia all’età di 6 anni, essendole stata diagnosticata una malattia polmonare virale letale, che colpisce comunemente le pecore a quell’età. Il gruppo di Wilmut asserisce che la clonazione non è stata la causa dell’infezione di Dolly.

Analisi genetica dello sviluppo

La prova che Dolly era effettivamente il risultato dell’esperimento di fusione cellulare è di duplice natura. Primo, la cellula prodotta dalla fusione conteneva il nucleo di una pecora Finn Dorset (dal muso chiaro) ed era stata impiantata in una pecora ricevente Scottish (dal muso scuro); Dolly è morfologicamente Finn Dorset. Secondo, e più significativo, l’analisi di marcatori di DNA polimorfici, gli STR (microsatelliti) (vedi Capitolo 10), in quattro loci ha dimostrato che il DNA di Dolly combaciava con quello delle cellule epiteliali delle ghiandole mammarie donatrici e non con quello della pecora ricevente. In sintesi, benché la probabilità di successo dell’esperimento non fosse alta (per ragioni tecniche), il risul-

Pecora adulta con muso chiaro

Isolamento di cellule epiteliali della ghiandola mammaria dalla pecora donatrice con muso chiaro

Crescita delle cellule nel terreno di coltura Riduzione del siero per indurre le cellule a entrare nello stadio G0 del ciclo cellulare Micropipetta

Fusione della cellula bloccata in G0 con la cellula uovo enucleata Rimozione del nucleo dalla cellula uovo prodotta dalla pecora con muso scuro

Coltura per 6 giorni e impianto nella pecora ricevente con muso scuro

483

tato altamente significativo è stato lo sviluppo di un agnello vitale originato dal nucleo di una cellula adulta. Quando il risultato dell’esperimento è stato pubblicato, a livello internazionale sono state sollevate perplessità sulla possibilità di clonare l’uomo. La tecnologia della clonazione è potenzialmente applicabile all’uomo ma i problemi etici che solleva non sono indifferenti e continueranno a essere dibattuti. Problemi relativi alla clonazione di mammiferi Dopo la clonazione di Dolly è stata ottenuta la clonazione di molti altri mammiferi, compresi gatti, cervi, cani, furetti, capre, bovini, gaur (un tipo di bue selvatico), cavalli, topi, mufloni (ovini selvatici), muli, maiali, conigli, ratti, scimmie rhesus, bufali e lupi. Tuttavia, la clonazione di mammiferi non è stata così facile come si sperava. Non solo il processo in se stesso è molto inefficiente, ma sono sorti molti problemi con i cloni prodotti. Si consideri, per esempio, il gatto Cc (copia carbone) che è stato clonato all’Università A&M del Texas (Figura 19.6a). Questa femmina tigrata (calico) ha caratteristiche del mantello che non sono identiche a quelle di Rainbow (Figura 19.6b), il genitore donatore del nucleo da cui si è sviluppata Cc. Rainbow ha il tipico aspetto tigrato con chiazze nere e arancio su un fondo bianco, mentre il suo clone Cc ha chiazze nere su un fondo bianco senza chiazze arancio. Si ricordi dal Capitolo 12 che un fenotipo calico deriva dal processo di inattivazione del cromosoma X in una femmina eterozigote per un gene associato al cromosoma X (O/o), che determina la produzione del pigmento arancio, e omozigote o eterozigote per un gene autosomico (B/–), che determina la produzione di pigmento nero. (La base molecolare dell’inattivazione del cromosoma X verrà spiegata in seguito in questo capitolo.) Quando l’allele dominante O è espresso, viene prodotto pigmento arancio, indipendentemente dagli altri geni per il colore presenti nel gatto. Il diverso tipo di colore del mantello del gatto Cc

Crescita e sviluppo

Nascita e crescita normale di “Dolly”, un agnello con muso chiaro, clone della pecora donatrice

Figura 19.5 Rappresentazione schematica degli esperimenti di Wilmut di clonazione di una pecora, a dimostrazione della totipotenza del nucleo di una cellula adulta differenziata.

Figura 19.6 Problemi con la clonazione dei mammiferi. La gatta clonata, Cc (a), ha un mantello a chiazze diverso da quello di sua madre, Rainbow (b).

484

Capitolo 19

può essere spiegato considerando che l’inattivazione del cromosoma X è un processo casuale nelle diverse cellule. D’altra parte, Cc differisce da Rainbow anche nella forma del corpo e nella personalità, caratteri entrambi con una componente genetica. Quindi, se Cc e Rainbow sono geneticamente identiche, non lo sono fenotipicamente. Questo fatto dimostra che non è solo il programma genetico a determinare l’organismo adulto: i fattori ambientali e le modifiche epigenetiche (vedi Capitolo 18) in particolare svolgono un ruolo importante. Sono inoltre emersi problemi più seri delle differenze nel colore del mantello e nella personalità negli animali clonati. Come abbiamo già ricordato, la clonazione di mammiferi è estremamente inefficiente; generalmente la maggior parte dei cloni muore, prima o subito dopo la nascita. I pochi sopravvissuti sembrano rivelare diversi gradi di anomalie nello sviluppo, e ciò suggerisce l’esistenza di problemi a livello di espressione genica. Rudolph Jaenisch e i suoi colleghi al Whitehead Institute for Biomedical Research, mediante l’analisi condotta con i microarray a DNA, hanno studiato l’espressione di più di 10 000 geni nei fegati e nelle placente di topi clonati. Hanno trovato centinaia di geni con regolazione anomala; quei geni rappresentano circa il 4% dei geni codificanti per proteine nel genoma del topo. In particolare, gli stessi geni mostravano un’espressione anormale, sia che fossero isolati dai topi clonati, sia da cellule coltivate contenenti i nuclei del donatore (prima dell’impianto in una madre surrogata). L’interpretazione di questi risultati è che il trasferimento di un nucleo di un donatore in una cellula enucleata è la causa di molti cambiamenti dell’espressione genica. Praticamente, ciò significa che è improbabile che i cloni che sopravvivono siano normali. Il problema è che il nucleo del donatore è prelevato da una cellula differenziata e deve essere riprogrammato per ricominciare nuovamente il processo di determinazione/differenziamento. Questo è il punto cruciale e, al momento, i ricercatori non possiedono gli strumenti per affrontare questo problema. Ci si aspetta che la produzione di mammiferi clonati continui a essere inefficiente e che i cloni vitali mostrino vari problemi derivanti da un’espressione genica anormale. Coppie di basi

0

200

400

600

800

Sequenze codificanti Gene per l’a-globina 1 5¢ UTR

Gene per la b-globina

1

31 32

99 100 141

Introne 1

Introne 2

30

31

Attività Nella iAttività nel sito dedicato, The Great Divide (Il Grande Spartiacque), assumete il ruolo di ricercatore nell’Istituto sullo Sviluppo Animale per studiare come cambiano le modalità di espressione genica mentre le cellule staminali del topo si differenziano in tessuti specifici.

Esempi di attività genica differenziale durante lo sviluppo I seguenti esempi classici illustrano l’attività genica differenziale durante lo sviluppo.

Tipi di emoglobina durante lo sviluppo dell’uomo In questo volume, l’emoglobina adulta umana Hb-A è stata esaminata in diversi contesti. Hb-A è una proteina tetramerica costituita da due catene polipeptidiche α e due β. Ciascun tipo di catena polipeptidica è codificato da un gene diverso, il gene per l’α-globina e il gene per la β-globina. I due geni sembrano essersi originati, durante l’evoluzione, per duplicazione di un singolo gene ancestrale, seguita da modificazione della sequenza di basi in ciascun gene. Ogni gene contiene due introni (introne 1 e introne 2; Figura 19.7). Hb-A è solo uno dei tipi di emoglobina trovati nell’uomo. Studi genetici hanno dimostrato che molti geni distinti codificano per catene globiniche di tipo α o β‚ associati in combinazioni specifiche a formare diversi tipi di emoglobina in fasi differenti dello sviluppo umano (Figura 19.8). Nell’embrione umano, l’emoglobina prodotta inizialmente nel sacco vitellino è un tetramero costituito da due catene polipeptidiche ζ (zeta) e due catene polipeptidiche ε (epsilon). Confrontando le sequenze amminoacidiche, ζ è una globina di tipo α ed ε è una globina di tipo β. Dopo circa tre mesi di sviluppo, la sintesi dell’emoglobina embrionale cessa (i geni per le catene polipeptidiche ζ ed ε non sono più trascritti) e il sito di sintesi delle catene emoglobiniche si sposta al fegato fetale e alla milza, dove viene prodotta l’emoglobina fetale (Hb-F). Hb-F contiene due catene polipeptidiche di tipo α e due catene polipeptidiche γ 1000 1200 1400 1600 (gamma) di tipo β, che possono essere due γA o due γ G. γA e γ G differiscono l’una dall’altra per un solo amminoacido su 146 e ciascuna è codificata da un gene diverso. L’emoglobina fetale viene prodotta fino a Posizione degli amminoacidi poco prima della nascita, quando la sintesi dei due tipi di catene γ cessa e il sito di sintesi del3¢ UTR l’emoglobina si sposta nel midollo osseo. In

104

105 146 Sequenze codificanti

Figura 19.7 Organizzazione molecolare dei geni per le a-globine e le b-globine umane.

MyLab

Analisi genetica dello sviluppo Sacco vitellino embrionale Sito dell’eritropoiesi

Milza fetale

Fegato fetale

Midollo osseo adulto α

50 % della sintesi globinica totale

485

γ

40

β

30 20 ε 10 ζ

β

δ

γ

6 12 18 24 30 36 0 6 12 18 24 30 36 42 48 Età postconcepimento Età postnatale (settimane) (settimane) Nascita

Figura 19.8 Confronto della sintesi di differenti catene globiniche a determinati stadi di sviluppo embrionale, fetale e postnatale.

quel tessuto vengono prodotte le catene polipeptidiche α e β insieme a qualche catena polipeptidica δ (delta) di tipo β. Dal neonato fino all’adulto, la maggior parte dell’emoglobina è il tetramero a noi familiare α2β2 (Hb-A), con circa 1 molecola su 40 che presenta la costituzione α2δ2 (Hb-A2). Quindi, durante lo sviluppo umano si verifica un cambiamento dell’espressione dei geni per globine che coinvolge un sofisticato sistema di regolazione genica con accensione e spegnimento dei geni per globine per un lungo periodo di tempo. Nel genoma, i geni di tipo α (due geni α e un gene ζ) sono tutti collocati sul cromosoma 16, mentre i geni di tipo β (ε, γA, γ G, δ e β) sono tutti sul cromosoma 11 (vedi Figura 23.7). In modo significativo, i geni di tipo α e i geni di tipo β sono disposti sul cromosoma in un ordine esattamente corrispondente alla successione con cui vengono trascritti durante lo sviluppo umano. Si ricordi che l’emoglobina embrionale è formata dalle catene polipeptidiche ζ ed ε; questi geni sono i primi geni funzionali alla sinistra di ciascun gruppo (cluster). In seguito, vengono trascritti i geni α e γ per produrre l’emoglobina fetale (Hb-F) e questi geni sono i successivi geni funzionali trascritti nei relativi cluster. Infine, vengono prodotte le catene polipeptidiche δ e β e questi geni sono gli ultimi nel cluster dei geni per le globine di tipo β. Puff dei cromosomi politenici durante lo sviluppo dei ditteri (insetti con due ali) Si ricordi (Capitolo 16) che i cromosomi politenici sono un particolare tipo di cromosoma, che consiste di un fascio di cromatidi derivanti da cicli ripetuti di duplicazioni cromosomiche senza divisione nucleare e che sono facilmente visibili, se colorati, al microscopio ottico. Dopo la colorazione si possono notare, lungo ciascun cromosoma, bande distinte e caratteristiche. I geni sono localizzati sia nelle bande sia nelle regioni interbande. I cromosomi politenici si osservano, per esempio, nelle ghiandole salivari dei ditteri (Diptera) agli stadi larvali o nei nuclei di altre cellule somatiche.

Figura 19.9 Fotografia al microscopio ottico di un cromosoma politenico di Chironomus. Sono visibili due puff derivati dallo srotolamento localizzato della struttura cromosomica che indicano trascrizione in quelle regioni. (Il DNA è evidenziato in blu, l’RNA in rosso/violetto.)

In periodi caratteristici durante lo sviluppo, bande specifiche si srotolano localmente a formare zone denominate puff (rigonfiamenti) (Figura 19.9). Il fatto che i puff compaiano e scompaiano con modalità specifiche in corrispondenza di certi loci cromosomici, mentre lo sviluppo procede, indica che sono controllati dalle fasi dello sviluppo. La comparsa dei puff è determinata da un livello molto alto di trascrizione genica. (La maggior parte dei geni viene espressa a un basso livello e non dà luogo a puff.) Ciò significa che, durante lo sviluppo, quando un gene su un cromosoma politenico sta per essere trascritto, la struttura del cromosoma si rilassa per permettere una trascrizione efficiente di quella regione di DNA. Quando la trascrizione è terminata, il puff scompare e il cromosoma riassume la sua configurazione compatta. La formazione dei puff, in molti casi, è sotto controllo ormonale e l’ormone chiave è lo steroide ecdisone. (La regolazione dell’espressione genica da parte degli ormoni steroidei è stata discussa nel Capitolo 18.) Un modello per il controllo dell’attivazione genica sequenziale da parte dell’ecdisone è il seguente: l’ecdisone si lega a una proteina recettore e questo complesso si lega sia ai geni precoci (quelli che inducono la comparsa di puff precocemente) sia a quelli tardivi (l’espressione dei quali viene osservata tardivamente nello sviluppo). Il complesso attiva i geni precoci e reprime quelli tardivi. Uno o più geni precoci codificano per una proteina che si accumula durante lo sviluppo. Quando il livello di questa proteina raggiunge una certa soglia, sposta il complesso ecdisone-recettore sia dai geni precoci sia da quelli tardivi. Questo processo spegne i geni precoci e accende i geni tardivi. A supporto di questo modello, si è osservato che alcuni dei geni precoci codificano per proteine che legano il DNA corrispondenti ai prodotti attesi per i geni regolatori. Inoltre, è stato clonato un gene per un recettore dell’ecdisone e si è visto che codifica per una proteina recettore di tipo steroideo.

486

Capitolo 19

Nota chiave Lo sviluppo è il risultato di un’attività genica differenziale di un genoma che contiene una quantità costante di DNA dallo stadio di zigote a quello di organismo maturo. Nondimeno, i geni sono solo un termine dell’equazione dello sviluppo; fattori ambientali possono influenzare il fenotipo di un organismo adulto, come dimostrato dalle differenze fenotipiche nei mammiferi clonati rispetto al genitore che ha donato il nucleo per la clonazione.

Eccezione alla costanza del DNA genomico durante lo sviluppo: perdita di DNA nelle cellule che producono anticorpi Vi sono poche eccezioni alla regola per cui non vi è perdita di DNA durante lo sviluppo. Un esempio di questo tipo è relativo alla perdita di informazione genetica durante lo sviluppo delle cellule che producono anticorpi. Le molecole degli anticorpi Le cellule responsabili della specificità immunologica sono i linfociti, specificamente le cellule T e le cellule B. Di seguito viene affrontato un approfondimento relativo alle cellule B. I linfociti B si sviluppano nel midollo osseo adulto. Quando sono attivate da un antigene, le cellule B si modificano in plasmacellule che producono proteine denominate anticorpi. Le molecole di anticorpo sono inserite nella membrana plasmatica delle plasmacellule e sono anche rilasciate nel sangue e nella linfa, dove sono responsabili della risposta immunitaria umorale (“umore” = fluido). Gli anticorpi si legano specificamente agli antigeni che hanno stimolato la loro produzione. La risposta immunitaria nei confronti di un determinato antigene deriva dalla selezione clonale, un processo per cui le cellule che hanno già anticorpi specifici per un antigene sulla loro superficie sono stimolate a proliferare e a secernere quell’anticorpo. Durante lo sviluppo, ogni linfocita viene destinato a reagire con un particolare antigene, anche se la cellula non è mai stata esposta a quell’antigene. Per il sistema di risposta umorale, vi è una popolazione di cellule B ciascuna delle quali può riconoscere un singolo antigene. Una particolare cellula B riconosce un antigene perché essa ha prodotto molecole di anticorpo che sono attaccate alla sua membrana esterna e agiscono come recettori. Quando un antigene incontra una cellula B che ha l’appropriato anticorpo recettore, capace quindi di legare l’antigene, quella cellula B è stimolata selettivamente a proliferare. Ciò dà origine a una popolazione clonale di cellule B, cosiddette attivate, che differenzia in plasmacellule, ciascuna delle quali produce e secerne l’identico anti-

corpo. È importante notare che ogni data cellula produce solo uno specifico tipo di anticorpo verso uno specifico antigene. La risposta immunitaria, tuttavia, può implicare il legame di molti anticorpi diversi a vari di antigeni localizzati su un agente invasore, come per esempio un virus infettivo. Questo legame stimola una varietà di altri meccanismi che inattivano l’agente infettivo. Tutte le molecole di anticorpo prodotte da una data plasmacellula sono identiche; ovvero hanno le stesse catene proteiche e legano lo stesso antigene. Vi sono milioni di cellule B nell’intero organismo e possono venire prodotti milioni di tipi di anticorpi diversi, ciascuno con una differente sequenza di amminoacidi e una distinta capacità di legare specifici antigeni. Gli anticorpi costituiscono un gruppo di proteine denominate immunoglobuline (Ig). Una molecola di anticorpo (immunoglobulina) di tipo IgG è schematicamente illustrata nella Figura 19.10a, e un modello della molecola basato sulla cristallografia ai raggi X è mostrato in Figura 19.10b. Entrambe le figure mostrano le due catene polipeptidiche corte della molecola, chiamate catene leggere (L), e le due catene polipeptidiche lunghe, chiamate catene pesanti (H). (Tutte le molecole di anticorpo possiedono anche carboidrati attaccati alle regioni delle catene H non interessate al legame con le catene L.) Le due catene H sono tenute insieme da ponti disolfuro (–S–S–) e ciascuna catena L è legata a una delle due catene H sempre da ponti disolfuro. Altri ponti disolfuro all’interno di ciascuna catena L e H inducono ulteriori ripiegamenti che determinano le loro forme caratteristiche. La struttura complessiva assomiglia a una Y, in cui i due bracci contengono i due siti di legame per l’antigene. Le due catene L sono identiche in ciascuna molecola di Ig, così come le due catene H, per cui i due siti di legame dell’antigene sono identici. La regione a cerniera (vedi Figura 19.10a) permette ai due bracci di muoversi nello spazio, facilitando la reazione di legame all’antigene. Inoltre, un braccio può legare un antigene, per esempio su un virus, mentre l’altro braccio può legare lo stesso antigene su un virus differente dello stesso tipo. Tale legame incrociato di molecole di anticorpo facilita l’inattivazione degli agenti infettivi. Nei mammiferi vi sono cinque classi principali di anticorpi: IgA, IgD, IgE, IgG e IgM. Essi hanno catene H diverse, definite rispettivamente α (alfa), δ (delta), ε (epsilon), γ (gamma) e μ (mu). Vi sono due tipi di catene L: κ (kappa) e λ (lambda). Entrambi i tipi di catene L si trovano in tutte le classi di Ig, ma una data molecola di anticorpo avrà o due identiche catene κ o due identiche catene λ. Una discussione completa delle funzioni delle cinque classi di Ig non rientra negli obiettivi di questo volume. Per i nostri intenti ci basti sapere che la classe più abbondante di immunoglobuline nel sangue è quella delle IgG, e che le IgM giocano un ruolo importante negli stadi precoci della risposta immunitaria a un antigene non

Analisi genetica dello sviluppo a) Schema di una molecola di anticorpo IgG Sito di legame dell’antigene NH3+

Sito di legame dell’antigene NH+3

NH+3

NH+3

VH

VH Catena pesante (H) VL

VL C H1

CH1 Regione a cerniera

Catena leggera (L)

Regioni variabili (V)

487

Figura 19.10 Molecola di anticorpo IgG.

si di catene polipeptidiche, un tratto delle quali varia in molecole di cellule differenti e un altro è invece costante. Come ciò avvenga verrà discusso nel paragrafo successivo.

Riarrangiamento di segmenti genici per assemblare i geni per gli S S S S S anticorpi durante lo sviluppo delle COO– COO– cellule B Un mammifero può proCH2 CH2 Regioni durre da 106 a 108 anticorpi diversi. costanti (C) Poiché ogni anticorpo è costituito da un tipo di catena L e un tipo di cateLegami CH3 CH3 disolfuro na H, se le catene L e H si unissero a intercatena – – caso, per tutti questi anticorpi ci vorCOO COO rebbero 103-104 diverse catene L e b) Modello molecolare di una molecola di anticorpo IgG 103-104 diverse catene H. Tuttavia, Catene pesanti quasi non vi sono abbastanza geni nel genoma umano per specificare tante diverse molecole. Invece, la vaCatena Catena riabilità delle catene L e H deriva da leggera leggera particolari riarrangiamenti nel DNA, che avvengono durante lo sviluppo delle cellule B. Questi riarrangiamenti implicano l’unione di differenti segmenti genici in modo da formare un gene, che viene trascritto per produrre una catena H o L dell’immunoglobulina; il riconosciuto precedentemente. D’ora in poi concentrere- processo viene definito ricombinazione somatica e verrà mo la nostra attenzione su queste due classi di anticorpi. ora illustrato per le catene delle immunoglobuline di topo. Ogni catena polipeptidica in un anticorpo è organizzata in domini di circa 110 amminoacidi (vedi Figura Ricombinazione somatica del gene per la catena legge19.10a). Ogni catena L (κ o λ) ha due domini e la catena ra Nel DNA della linea germinale di topo, vi sono tre tiH delle IgG (catena γ) ha quattro domini, mentre la catena pi di segmenti genici localizzati sul cromosoma 6 e uno H delle IgM (catena μ) ha cinque domini. I domini N-ter- di ciascun tipo è necessario per costruire un gene per la minali delle catene H ed L hanno sequenze di amminoaci- catena leggera κ completo e funzionale (Figura 19.11). di estremamente variabili, che costituiscono i siti di legame con l’antigene. Questi domini, che rappresentano nel- 1. Ciascuno dei circa 350 segmenti L-Vκ, consiste di una sequenza leader (L) e di un segmento Vκ, che vale IgG la metà N-terminale delle catene L e il quarto N-terria da segmento a segmento. Ogni segmento Vκ codiminale delle catene H, sono chiamati regioni variabili, o fica per la maggior parte degli amminoacidi del doV. Le regioni V sono genericamente indicate con VL per le catene leggere e VH per le catene pesanti. Le regioni VL e minio variabile della catena leggera. La sequenza leaVH comprendono i siti di legame dell’antigene (Figura der codifica per una speciale sequenza chiamata se19.10a). La sequenza di amminoacidi del resto delle catequenza segnale (vedi Capitolo 6), richiesta per la sene L è costante per tutti gli anticorpi con lo stesso tipo di crezione della molecola di Ig; questa sequenza segnacatena L (cioè κ o λ) ed è chiamata CL. Analogamente, la le viene successivamente rimossa e non costituisce sequenza amminoacidica del resto delle catene H è costanparte della molecola di un anticorpo funzionale. te ed è chiamata CH. Per le IgG vi sono tre domini di CH 2. Un segmento Cκ specifica il dominio costante della approssimativamente uguali, chiamati CH1, CH2 e CH3 catena leggera κ. (vedi Figura 19.10a). Per le IgM, vi sono quattro domini di 3. Quattro segmenti Jκ (segmenti di giunzione) sono usati per congiungere i segmenti Vκ e Cκ per la produCH approssimativamente uguali, chiamati CH1, CH2, CH3 e CH4. Quindi, la produzione di anticorpi richiede la sintezione di un gene funzionale per la catena leggera κ. CL

S

S

S

CL

488

Capitolo 19 Vκ

L

Vκ1

L

Vκ2

L

Vκ3

Vκ350

L





Jκ1 Jκ2 Jκ3 Jκ4

C

DNA della linea germinale Ricombinazione V/J

L

Vκ1

L

Vκ2

Jκ3 Jκ4

C

L

Vκ2

Jκ3 Jκ4

C

DNA della cellula B Trascrizione



L

Figura 19.11 Produzione del gene per la catena leggera k nel topo, mediante ricombinazione di segmenti genici V, J e C durante lo sviluppo. Il riarrangiamento mostrato rappresenta solo una delle molteplici possibili ricombinazioni.

Nelle cellule pre-B, i segmenti L-Vκ, Jκ e Cκ, in questo ordine, sono ampiamente separati sul cromosoma. Quando la cellula B si sviluppa, un particolare segmento L-Vκ si associa con uno dei segmenti Jκ e con il segmento Cκ. Nell’esempio della Figura 19.11, L-Vκ2 viene ricombinato vicino a Jκ3. La trascrizione di questo nuovo arrangiamento del DNA produce il trascritto primario di RNA che include una coda di poli(A) all’estremità 3′ del trascritto. La rimozione dell’introne dal trascritto primario di RNA produce l’mRNA maturo, che ha l’organizzazione L-Vκ2Jκ3Cκ; la traduzione e la rimozione della sequenza leader producono la catena leggera κ per la quale la cellula B è determinata. Nel topo vi sono circa 350 segmenti genici L-Vκ, quattro segmenti genici funzionali Jκ e un segmento genico Cκ. Quindi, il numero di possibili regioni variabili della catena κ, che possono venire prodotte da questo meccanismo, è 350 × 4 = 1400. Ulteriori diversità derivano dalla giunzione imprecisa dei segmenti genici Vκ e Jκ. Infatti, durante il processo di giunzione, vengono perse alcune coppie di nucleotidi sia da Vκ sia da Jκ nel punto di giunzione VκJκ, generando differenze significative della sequenza in quel punto. Quindi, la diversità delle catene leggere κ deriva da (1) variabilità nelle sequenze dei segmenti genici multipli Vκ; (2) variabilità nelle sequenze dei quattro segmenti genici Jκ; (3) variabilità nel numero di coppie di nucleotidi delete nel punto di giunzione VκJκ. Un meccanismo simile esiste per il riarrangiamento del gene per la catena leggera λ di topo (localizzato sul cromosoma 16). In questo caso vi sono solo due segmenti genici L-Vλ e quattro segmenti genici Cλ, ciascuno con il proprio segmento genico Jλ. Quindi, possono venire prodotte meno regioni variabili per le catene λ rispetto a quelle delle catene κ. Ricombinazione somatica del gene per la catena pesante Anche il gene per la catena pesante delle im-

Vκ2



Jκ3

Vκ N

C

AAAAA 3¢ Trascritto pre-mRNA poli(A) Maturazione dell’RNA AAAAA 3¢ mRNA maturo Traduzione

Cκ C

Polipeptide della catena leggera κ

munoglobuline è codificato dai segmenti genici VH, JH e CH (sul cromosoma 12). In questo caso si ha un’ulteriore varietà dovuta a un altro segmento genico, D (diversità), collocato fra i segmenti VH e i segmenti JH (Figura 19.12). Per la catena pesante di IgG, nel DNA della linea germinale di topo vi è una disposizione in tandem di circa 500 segmenti L-VH, quindi uno spaziatore, poi 12 segmenti D, quindi uno spaziatore e infine 4 segmenti JH. Dopo un altro spaziatore, i segmenti genici della regione costante sono organizzati in un cluster che, nel topo, ha rispettivamente la sequenza μ, δ, γ, ε, e α per i domini costanti delle catene H delle IgM, IgD, IgG, IgE e IgA. Quindi, vi sono 500 × 12 × 4 = 24 000 possibilità per la costruzione di ogni tipo di catena pesante. Come per i riarrangiamenti del gene per la catena leggera L, un’ulteriore diversità negli anticorpi deriva dalla giunzione imprecisa dei segmenti genici che formano la regione variabile della catena. Mettendo insieme questa variabilità con quella per la catena leggera, si può produrre un’enorme varietà di anticorpi. Solo per gli anticorpi con uno dei tipi di catena pesante e una catena leggera κ, possono venire prodotte 24 000 × 1400 = 33 600 000 possibili molecole di anticorpo. Il sistema di riconoscimento dell’ordine dei frammenti che devono essere riarrangiati (V-D-J-C o V-J-C) è assicurato dalla presenza di specifiche sequenze di riconoscimento (dette sequenze segnale), legate da proteine RAG (Recombination Activating Gene), RAG1 e RAG2, responsabili del taglio del doppio filamento di DNA alle estremità dei frammenti e del loro ricongiungimento, insieme ad altri enzimi. I frammenti di DNA in eccesso sono eliminati definitivamente dal genoma. (Si noti che il riarrangiamento può portare alla formazione di molecole non funzionali e quindi può essere improduttivo. La mancata produzione di una immunoglobulina funzionale porta alla morte cellulare di quella cellula B in cui è avvenuto il riarrangiamento.)

489

Analisi genetica dello sviluppo VH

DNA della L linea germinale

VH1

L

VH2

L

Ricombinazione di V, D, J e C

D1-D12

VH3

L

VHn

DNA della cellula B

1

L

2 3

JH1-JH4

12

VH1

Geni della regione costante

1 2 3 4

L

VH2

D2 JH3

L

VH2

D2 JH3

μ

δ

γ3

γ1

γ2b γ2a

ε

α

Cγ1 Cγ2b Cγ2a Cε Cα

Trascrizione Trascritto pre-mRNA

Figura 19.12 Produzione dei geni per la catena pesante nel topo, mediante ricombinazione di segmenti genici V, D, J e C durante lo sviluppo. In base al segmento CH usato, la molecola di anticorpo risultante sarà IgM, IgD, IgG, IgE o IgA. Nello schema è rappresentata la formazione di una catena pesante di IgG. Questo riarrangiamento è solo uno delle molte migliaia possibili.



AAAAA 3¢ Cγ1

Maturazione dell’RNA L mRNA maturo



Traduzione

VH2 N

Polipeptide della catena pesante γ

Nota chiave Gli anticorpi sono proteine specializzate chiamate immunoglobuline, che legano in modo specifico gli antigeni. La risposta immunitaria contro un particolare antigene deriva dalla selezione clonale, meccanismo per cui cellule che già producono l’anticorpo richiesto sono stimolate a proliferare dallo specifico antigene. Le molecole di anticorpo sono costituite da due catene leggere (L) e due catene pesanti (H). La sequenza di amminoacidi di un dominio di ciascun tipo di catena è variabile; questa variabilità è responsabile della diversità dei siti di legame dell’antigene su differenti molecole di anticorpo. Gli altri domini di ogni catena sono costanti nella sequenza amminoacidica. Nel DNA della linea germinale di topo, le regioni codificanti per le catene delle immunoglobuline sono disperse in serie ripetute di segmenti genici. Così, per le catene leggere, vi sono molti segmenti genici per le regioni variabili (V), pochi segmenti genici di giunzione (J) e un segmento genico per la regione costante (C). Durante lo sviluppo avviene il processo di ricombinazione somatica, che unisce particolari segmenti genici a formare un gene funzionale per una catena L. Dai molti modi possibili in cui può avvenire la ricombinazione dei segmenti genici si origina un grande numero di geni diversi per la catena L. Riarrangiamenti simili si hanno anche per i geni delle catene H, ma con l’aggiunta di numerosi segmenti genici D (diversità), che si collocano fra V e J, aumentando le possibili differenze fra i geni delle catene H.

VH2

D2 JH3Cγ1

poli(A)

AAAAA 3¢

D2 JH3 Cγ1 C

Regione Regione VH CH

La determinazione del sesso e la compensazione di dose nei mammiferi e in Drosophila Nel paragrafo precedente di questo capitolo, abbiamo discusso esempi specifici relativi alla regolazione genetica nei processi dello sviluppo. In questo paragrafo, analizzeremo la determinazione del sesso e la compensazione di dose nei mammiferi e in Drosophila. Questi due argomenti sono correlati perché i cromosomi sessuali svolgono un ruolo nella determinazione del sesso in entrambi gli organismi ma, essendo in numero diverso tra i due sessi, rendono necessaria una regolazione che permetta di equilibrare l’espressione dei geni sul cromosoma X nei maschi e nelle femmine.

Determinazione del sesso nei mammiferi Nell’uomo e negli altri mammiferi placentati, il sesso viene stabilito dal meccanismo di determinazione del sesso legato al cromosoma Y. La presenza del cromosoma Y determina la mascolinità, in quanto le gonadi si sviluppano come testicoli, mentre in assenza di un cromosoma Y le gonadi si sviluppano come ovaie. Nel Focus sul genoma di questo capitolo si esamina la determinazione del sesso nell’ornitorinco, un mammifero che depone le uova, i cui maschi hanno cinque cromosomi X e cinque cromosomi Y e le femmine cinque coppie di cromosomi X. Il meccanismo di determinazione legato al cromosoma Y implica che solo il cromosoma Y presenta un gene importante (o forse più geni) che attiva la differenziazione sessuale maschile. Il prodotto di questo gene viene chiamato fattore di determinazione testicolare e l’ipotetico gene corrispondente è il gene per il fattore di

490

Capitolo 19

Focus sul genoma L’ornitorinco: uno strano mammifero con un genoma molto insolito L’ornitorinco australiano (Ornithorhynchus anatinus) è uno dei mammiferi più strani. Non soltanto appartiene all’ordine dei monotremi, cioè mammiferi che depongono le uova, ma è anche velenoso (il maschio produce un veleno sugli speroni delle zampe posteriori). Persino la determinazione del sesso in questo animale è originale e coinvolge cromosomi X e Y multipli. Recentemente il genoma dell’ornitorinco è stato sequenziato. Uova Nel genoma dell’ornitorinco sono presenti molti geni responsabili della deposizione delle uova e del loro sviluppo. Alcuni di essi sono comuni in tutti i mammiferi, mentre altri si trovano solo negli animali ovipari. Per esempio, l’ornitorinco può sintetizzare quattro proteine che sono molto simili alle quattro proteine che costituiscono la zona pellucida umana, una importante struttura che si forma subito dopo la fecondazione in molti amnioti. L’ornitorinco ha anche due geni ZPAX che codificano per le proteine dell’involucro dell’uovo. I geni ZPAX non sono stati trovati in altri mammiferi, ma sono presenti in uccelli, anfibi e pesci. Inoltre l’ornitorinco presenta un gene per la vitellogenina. Negli animali ovipari questi geni codificano per i precursori del tuorlo. Veleno Il veleno dell’ornitorinco è un cocktail di differenti peptidi. Diversi geni nel genoma dell’ornitorinco si sono duplicati, divergendo nel tempo, così che alcune “nuove” copie codificano per peptidi potenzialmente velenosi. Questi geni includono quelli che codificano per la β-difensina, per un fattore natriuretico di tipo C, e per il fattore di crescita del sistema nervoso. È affascinante che simili duplicazioni ed eventi di divergenza siano avvenuti negli stes-

determinazione testicolare o TDF. Il fattore di determinazione testicolare determina il differenziamento in testicoli, piuttosto che in ovaie, del tessuto destinato a diventare gonadi. Questo è l’evento chiave nella determinazione del sesso in molti mammiferi; tutte le altre differenze tra i sessi sono effetti secondari derivanti dall’azione degli ormoni o di fattori prodotti dalle gonadi. Quindi, la determinazione del sesso equivale alla determinazione testicolare. Il gene per il fattore di determinazione testicolare è stato isolato analizzando rari individui con inversione del sesso (sex reversal), cioè maschi XX (anziché XY) e femmine XY (anziché XX). Nei maschi XX, un piccolo

si geni nei rettili velenosi. Le sequenze di DNA suggeriscono che le duplicazioni negli antenati dell’ornitorinco avvennero indipendentemente da quelle dei rettili, fornendo un caso esemplare di evoluzione convergente. Mutazioni simili sono avvenute in ciascun gruppo, ma esse non erano presenti nell’antenato comune dell’ornitorinco e dei rettili. Cromosomi sessuali La femmina dell’ornitorinco ha cinque paia differenti di cromosomi X mentre il maschio ha cinque cromosomi X e cinque cromosomi Y. Come si può immaginare, questo assetto rende la meiosi molto complessa nel maschio. I cromosomi sessuali si associano in una catena durante la meiosi e lo sperma eredita o tutti e cinque i cromosomi X oppure tutti e cinque gli Y. Quando i ricercatori hanno studiato la sequenza nucleotidica dei cromosomi X e Y, hanno fatto due sorprendenti osservazioni. Innanzitutto, i cromosomi X dell’ornitorinco non sono affatto simili ai cromosomi X degli altri mammiferi. La maggior parte dei geni osservati sul cromosoma X di topo si trova su un autosoma di ornitorinco. I cromosomi X dell’ornitorinco sono molto più simili al cromosoma Z degli uccelli. (Gli uccelli, e alcuni altri organismi, hanno cromosomi sessuali Z e W invece che X e Y, come discusso nel Capitolo 12. I maschi sono ZZ e le femmine ZW.) Inoltre, SRY, il gene del cromosoma Y implicato nella maggior parte dei mammiferi nella determinazione dello sviluppo del maschio, è assente dal genoma di ornitorinco. Al suo posto, probabilmente, l’ornitorinco usa un gene chiamato DMRT1. Si ritiene che questo gene intervenga nella determinazione del sesso anche negli uccelli. Sembra che il gene SRY, così come i più familiari cromosomi X e Y, si sia evoluto dopo che i monotremi si sono separati dagli altri mammiferi (marsupiali e placentati).

frammento proveniente dall’estremità del braccio corto del cromosoma Y si era staccato durante la produzione dei gameti e si era attaccato a uno dei cromosomi X. Le femmine XY presentavano delezioni della stessa regione del cromosoma Y. Questi dati suggerirono che il gene per il fattore di determinazione testicolare fosse localizzato in quel piccolo frammento del cromosoma Y. Il gene è l’SRY (Sex-determining Region of the Y). Un gene equivalente, Sry, è stato identificato e clonato nel topo. Parecchie evidenze hanno confermato che il gene SRY è resposabile della determinazione testicolare. Primo, il gene Sry del topo viene espresso solo nella fase e nella localizzazione attese per un fattore di determinazione te-

Analisi genetica dello sviluppo

sticolare, cioè nelle creste genitali indifferenziate dell’embrione subito prima della formazione dei testicoli. Secondo, quando un frammento di DNA di 14 kb con il gene Sry del topo viene introdotto tramite microiniezione in embrioni di topo XX, i topi transgenici ottenuti sono maschi con differenziazione testicolare normale e successivo normale sviluppo dei caratteri sessuali secondari maschili. In altre parole, Sry da solo è sufficiente a determinare un’inversione del sesso fenotipica completa in un topo femmina con cromosomi XX. Terzo, nell’uomo vi sono rare femmine XY che, invece di aver perso un tratto del cromosoma Y, come descritto in precedenza, hanno semplicemente una mutazione nel gene SRY. SRY codifica per un fattore di trascrizione che specifica lo sviluppo delle gonadi in testicoli. I testicoli producono il testosterone, l’ormone steroideo mascolinizzante. Se il gene SRY è assente, le gonadi si sviluppano automaticamente in ovaie. Le ovaie producono l’estrogeno, l’ormone steroideo femminilizzante.

Meccanismo di compensazione di dose per i geni X-linked nei mammiferi Nei mammiferi esiste un diverso dosaggio genico (numero di copie dei geni) tra i due sessi: vi sono due copie di geni del cromosoma X nelle femmine e una copia nei maschi. Un meccanismo di compensazione di dose permette di equilibrare l’espressione genica relativa al cromosoma X per assicurare uno sviluppo corretto. Nei mammiferi di sesso femminile, ciò implica l’inattivazione di uno dei due cromosomi X nelle cellule somatiche a uno stadio precoce dello sviluppo (vedi Capitolo 12). Il cromosoma X da inattivare viene scelto a caso tra i cromosomi X di origine materna e paterna in un processo indipendente da cellula a cellula. Una volta che il cromosoma X materno o paterno in una cellula viene inattivato, tutte le cellule discendenti da quella ereditano la stessa particolare inattivazione. Si tratta di un altro esempio di fenomeno epigenetico (Capitolo 18). Tre fasi sono necessarie all’inattivazione dell’X: il conteggio dei cromosomi (determinazione del numero dei cromosomi X nella cellula), la scelta di un X da inattivare, e l’inattivazione dell’X vera e propria. Una regione chiave su ciascun cromosoma X denominata centro d’inattivazione dell’X (XIC nell’uomo, Xic nel topo) è implicata nel meccanismo di conteggio cromosomico. Perché avvenga l’inattivazione, devono essere presenti due o più XIC. Una dimostrazione di ciò è fornita da un esperimento in cui un frammento di 450 kb (450 000 bp) del cromosoma X del topo contenente l’Xic è stato introdotto in autosomi di cellule maschili di topo in una coltura in vitro. Nelle cellule maschili normali con un solo cromosoma X, l’inattivazione del cromosoma X non avviene. Invece, nelle cellule transgeniche di topo con Xic aggiunto a un autosoma, scatta il meccanismo di inatti-

491

vazione del cromosoma, con inattivazione casuale o del cromosoma X o dell’autosoma. Ciò significa che le cellule maschili geneticamente modificate hanno manifestato le caratteristiche dell’inattivazione del cromosoma X tipiche delle cellule femminili normali. Le 450 kb di DNA con Xic devono contenere tutte le sequenze necessarie per il conteggio dei cromosomi e per l’inizio dell’inattivazione del cromosoma X. Le cellule somatiche femminili hanno un meccanismo di scelta che determina quale X viene inattivato e quale X rimane attivo. La scelta viene effettuata a livello dell’elemento di controllo del cromosoma X (Xce), che è localizzato nella regione XIC/Xic. Anche un gene chiamato XIST (nell’uomo)/Xist (nel topo), acronimo di Xinactivation-specific transcripts (“trascritti specifici dell’inattivazione del cromosoma X”), è localizzato nella regione XIC/Xic. XIST viene espresso dal cromosoma X inattivo (Xi) e non dal cromosoma X attivo (Xa), un comportamento contrario a quanto avviene per l’espressione degli altri geni associati al cromosoma X. Si è dimostrato, in cellule in coltura e nel topo, che il gene Xist è essenziale per l’inattivazione del cromosoma X. XIST/Xist viene trascritto in un RNA non codificante insolitamente lungo (17 kb), che non viene tradotto. Questo RNA ha un effetto negativo sull’espressione genica, poiché determina l’eterocromatinizzazione del cromosoma Xi e quindi il silenziamento a livello trascrizionale dei geni su quel cromosoma. Non è del tutto chiaro in che modo l’RNA di

Nota chiave Nei mammiferi il sesso di un individuo è determinato dalla presenza o assenza del cromosoma Y. Se il cromosoma Y è presente, il gene SRY su quel cromosoma viene trascritto con produzione di un fattore di trascrizione che regola i geni necessari al differenziamento delle gonadi in testicoli. In assenza del gene SRY, come nella femmina XX, le gonadi si sviluppano automaticamente in ovaie. I geni sul cromosoma X sono particolari in quanto il loro dosaggio è diverso tra maschi e femmine. Nei mammiferi, un meccanismo di compensazione di dose opera per equilibrare l’espressione dei geni X-linked nei maschi e nelle femmine. Questo meccanismo implica nelle femmine l’inattivazione di uno dei due cromosomi X a uno stadio precoce dello sviluppo, lasciando un solo cromosoma X trascrizionalmente attivo, come avviene nei maschi. Il processo d’inattivazione è complesso, implicando la trascrizione del gene XIST sul cromosoma da inattivare; viene sintetizzato un RNA regolativo non codificante che copre il cromosoma in entrambe le direzioni a partire da XIC, inducendo un rimodellamento della cromatina che silenzia i geni a livello trascrizionale.

492

Capitolo 19

XIST determini l’inattivazione del cromosoma X. È noto che l’RNA di XIST ricopre il cromosoma X da cui è trascritto diffondendosi in entrambe le direzioni rispetto a XIC/Xic. L’RNA di XIST recluta una serie di enzimi responsabili del rimodellamento della cromatina, enzimi che deacetilano gli istoni, che metilano o demetilano specifici residui di lisina sugli istoni H3 e H4. Sia nei topi sia negli esseri umani, inoltre, le regioni dei promotori di molti geni sono metilate sul cromosoma X inattivo e non metilate su quello attivo. Il rimodellamento della cromatina lungo Xi silenzia i geni su quel cromosoma, e Xi diventa eterocromatico, cioè un corpo di Barr (Capitolo 12, Figura 12.24). XIST non è più necessario nel mantenimento del silenziamento genico a carico del cromosoma X inattivo. Un ruolo importante in questo fenomeno è stato invece attribuito alla metilazione del DNA.

funzione sono letali per lo sviluppo maschile, ciò significa che Sxl deve essere inattivo nei maschi. Uno splicing alternativo del pre-mRNA di Sxl negli embrioni destinati a diventare femmine o maschi dà l’avvio ai due diversi percorsi. Come vedremo, lo splicing alternativo del pre-mRNA regola i passaggi in ciascun percorso. Come viene riconosciuto il rapporto X:A? Sul cromosoma X vi sono i geni numeratori sisterless (sis-a, sis-b e sis-c) e su un autosoma il gene denominatore deadpan (dpn). L’espressione dei geni numeratori produce delle subunità proteiche che possono formare omodimeri o eterodimeri con la subunità codificata dal gene denominatore (Figura 19.14). Nelle femmine, un eccesso di subunità del numeratore rispetto alle subunità del denominatore è il risultato dell’espressione delle due copie di ciascun gene numeratore, per cui si formano molti omodimeri. Gli omodimeri del numeratore sono fattori di tra-

Determinazione del sesso in Drosophila

MyLab

In Drosophila il sesso è determinato dal rapporto tra il numero dei cromosomi X e gli autosomi (X:A) (vedi Capitolo 12). La nostra comprensione della determinazione del sesso in questo organinimazione smo è derivata da studi su nuDeterminazione merose mutaziodel sesso e ni che ne alteracompensazione no la normale di dose in determinazione. Drosophila Questi studi hanno condotto al modello della cascata regolativa, riassunto nella Figura 19.13. Innanzitutto, per il tipo selvatico di Drosophila, il rapporto che indirizza lo sviluppo verso il sesso femminile (XX) è 2X : 2 assetti di autosomi = 1,0, mentre il rapporto che indirizza lo sviluppo verso il sesso maschile (XY) è 1X : 2 assetti di autosomi = 0,5. Questa informazione viene trasmessa ai geni per la determinazione del sesso, che operano la scelta fra le vie alternative di sviluppo maschile o femminile a partire dal gene regolatore principale Sxl (Sex-lethal). Mutanti per perdita di funzione di Sxl sono letali per lo sviluppo embrionale femminile (ciò significa che Sxl deve essere attivo nelle femmine), ma non hanno alcun effetto sullo sviluppo embrionale maschile (ciò significa che l’espressione di Sxl non è necessaria per lo sviluppo maschile). D’altra parte, mutanti per acquisto di

Rapporto X:A = 1 (femmina XX)

Fase precoce dell’embrione di Drosophila

Rapporto X:A = 0,5 (maschio XY)

Geni Sxl

tra

Trascritto; splicing regolato del pre-mRNA

Proteina SXL

Assenza della proteina SXL

La proteina SXL dirige lo splicing regolato del pre-mRNA di tra

Lo splicing di default del pre-mRNA di tra comprende un codone di stop precoce

Proteina TRA

dsx

Figura 19.13 Cascata regolativa per la determinazione del sesso in Drosophila.

Trascritto; lo splicing di default del pre-mRNA mantiene un codone di stop precoce

La proteina TRA dirige lo splicing regolato del pre-mRNA di dsx

Assenza della proteina TRA

Splicing di default del pre-mRNA di dsx

Proteina DSX-F

Proteina DSX-M

DSX-F reprime l’espressione genica maschio-specifica

DSX-M reprime l’espressione genica femmina-specifica

Differenziamento delle cellule somatiche

Differenziamento delle cellule somatiche

Analisi genetica dello sviluppo X:A = 1 (XX AA)

Figura 19.14 Manifestazione del rapporto X:A nella determinazione del sesso in Drosophila mediante proteine codificate dai geni numeratore e denominatore. Nelle femmine, l’eccesso di proteine del numeratore produce dei dimeri numeratorenumeratore che funzionano come fattori di trascrizione per l’attivazione di Sxl.

X:A = 0,5 (XY AA)

Fattore di trascrizione X:A attivo

Subunità del numeratore (prodotto di sisterless) Subunità del numeratore (prodotto di deadpan)

Dimeri inattivi

Prodotto di sisterless legato al prodotto di deadpan

Eccesso di prodotto di sisterless

a) Embriogenesi, fase precoce Il fattore di trascrizione numeratorenumeratore attiva la trascrizione Gene Sxl

Femmina XX

Maschio XY Nessuna attivazione

Trascrizione da PE

L1

E1

Esoni

2

3

4

Introne Pre-mRNA di Sxl nella

5

6

7

8

5

6

7

8

Trascrizione

E1

2

3

4

AAAA...

Splicing mRNA maturo nella

E1

4

5 6 7

493

8 AAAA...

scrizione che attivano l’espressione di Sxl. Nei maschi vi è una sola copia di ciascun gene numeratore, per cui la maggior parte delle subunità espresse dal numeratore costituisce eterodimeri con le subunità del denominatore. Di conseguenza non vi sono omodimeri (o sono insufficienti) per attivare l’espressione di Sxl. In una fase precoce dell’embriogenesi nella femmina, il fattore di trascrizione dimerico numeratorenumeratore attiva la trascrizione del gene Sxl a partire da PE (promotore precoce), uno dei due promotori di questo gene, essendo l’altro un promotore più a monte, PL (promotore tardivo) (Figura 19.15). Il premRNA trascritto da PE presenta otto esoni; gli esoni 2 e 3 vengono eliminati per produrre l’mRNA maturo che comprende gli esoni E1, 4, 5, 6, 7 e 8. La traduzione di questo mRNA produce la proteina SXL precoce.

Traduzione Proteina SXL precoce b) Embriogenesi, fase tardiva Trascrizione da PL nella e nel Gene Sxl

L1

E1

2

3

4

5

6

7

8

5

6

7

8

Trascrizione Femmina SXL

L1

Pre-mRNA

2

E1

3

4

AAAA...

Codone di stop

Maschio

Splicing regolato da SXL nelle femmine; di default nei maschi Femmina

L1

2

4

5 6 7

8

Maschio

AAAA...

L1 Traduzione

Proteina SXL tardiva

2

3

4

5 6 7

8

Codone di stop Nessun prodotto funzionale

AAAA...

Figura 19.15 Espressione di Sex-lethal (Sxl) durante l’embriogenesi. (a) Durante la fase precoce dell’embriogenesi nelle femmine, i fattori di trascrizione dimerici numeratore-numeratore attivano la trascrizione di Sxl a partire da PE. Lo splicing del pre-mRNA rimuove gli esoni 2 e 3 (le linee ad angolo sopra il pre-mRNA indicano i segmenti rimossi durante lo splicing); l’mRNA risultante viene tradotto con produzione della proteina SXL precoce. (b) In seguito, nell’embriogenesi tardiva, il gene Sxl viene trascritto in modo costitutivo a partire da PL sia negli embrioni femminili sia in quelli maschili. Lo splicing del pre-mRNA avviene in modo regolato negli embrioni femminili a causa della presenza della proteina SXL precoce, e di default negli embrioni maschili a causa dell’assenza della proteina SXL precoce. Ne consegue che la proteina SXL tardiva viene prodotta negli embrioni femminili, ma non in quelli maschili.

494

Capitolo 19

Nei maschi, l’espressione di Sxl da PE non avviene, a causa dell’assenza di un numero sufficiente di fattori di trascrizione numeratore-numeratore, per cui la proteina SXL non viene prodotta. In una fase successiva dell’embriogenesi (dopo la gastrulazione), Sxl viene trascritto in modo costitutivo dal promotore tardivo, PL, in tutte le cellule, indipendentemente dal rapporto X:A (Figura 19.15b). Questa trascrizione non dipende dai fattori di trascrizione del numeratore. Il pre-mRNA prodotto è più lungo del trascritto corrispondente al promotore PE ed è soggetto a splicing alternativo (vedi Capitolo 18), in base alla presenza o assenza della proteina SXL precoce. Nelle femmine, la proteina SXL precoce si lega al pre-mRNA di Sxl e determina uno splicing regolato: gli esoni E1 e 3 vengono eliminati, producendo un mRNA maturo con gli esoni L1, 2, 4, 5, 6, 7 e 8. La traduzione di questo mRNA produce la proteina SXL tardiva. Nei maschi, l’assenza della proteina SXL precoce provoca lo splicing di default del pre-mRNA e quindi la produzione di un mRNA maturo che comprende l’esone 3. Questo esone ha un codone di stop in frame con il codone d’inizio dell’esone 2, quindi nei maschi non viene prodotta la proteina funzionale SXL tardiva. I meccanismi appena descritti stabiliscono la scelta verso il differenziamento maschile o femminile. Segue una cascata di eventi di splicing alternativi, come sche-

Gene tra

1

2

Esone

3

Introne Trascrizione

Femmine pre-mRNA 1 di tra

Nota chiave

SXL

2

3

AAAA...

Codone di stop

Maschi

Splicing regolato da SXL nelle femmine; di default nei maschi

Femmine

1

2

3

Maschi

1

AAAA... Maschi

Proteina TRA

2

matizzato nella Figura 19.13. Nell’embrione femminile, la proteina SXL tardiva regola lo splicing del premRNA del gene transformer (tra) (Figura 19.16). In questo caso, un segmento di esone contenente un codone di stop, contiguo e a monte rispetto all’esone 2, viene rimosso, con formazione di un mRNA con gli esoni 1, 2 e 3. La traduzione di questo mRNA produce la proteina TRA attiva. Nei maschi avviene uno splicing di default a causa dell’assenza della proteina SXL tardiva. Ciò significa che non viene rimosso il segmento contenente il codone di stop. La traduzione dell’mRNA risultante si ferma al codone di stop di quel segmento e così non viene prodotta la proteina funzionale TRA. Anche la proteina TRA è un regolatore dello splicing dell’RNA. Il bersaglio è il pre-mRNA del gene doublesex (dsx) (Figura 19.17). Nelle femmine, lo splicing regolato da TRA dà origine all’mRNA femminile di dsx, che codifica per la proteina DSX-F (F per “femmina”), un fattore di trascrizione che reprime l’espressione genica maschio-specifica in tutte le cellule. Di conseguenza, si verifica un differenziamento femmina-specifico delle cellule somatiche. Nei maschi, l’assenza della proteina TRA funzionale determina uno splicing di default del pre-mRNA di dsx per produrre l’mRNA maschile di dsx, che codifica per la proteina DSX-M (M per maschio), un fattore di trascrizione che reprime l’espressione genica femmina-specifica in tutte le cellule. Di conseguenza si verifica un differenziamento maschiospecifico delle cellule somatiche. I mutanti knock-out di dsx hanno caratteristiche maschili e femminili, a causa della mancata repressione dei geni per il differenziamento maschio- e femmina-specifico.

3

AAAA...

Codone di stop Nessun prodotto funzionale

Figura 19.16 Espressione di transformer (tra) durante l’embriogenesi. La proteina SXL tardiva negli embrioni femminili regola lo splicing del pre-mRNA di tra; la traduzione dell’mRNA risultante produce la proteina TRA che regola lo splicing del trascritto di doublesex (vedi Figura 19.17). Negli embrioni maschili, lo splicing del pre-mRNA di tra avviene di default perché è assente la proteina SXL tardiva. L’mRNA risultante ha un codone di stop prima dell’esone 2 e quindi non viene prodotta la proteina TRA.

In Drosophila, il sesso dell’individuo è stabilito dal rapporto tra il numero di cromosomi X e il numero di assetti di autosomi. Un rapporto pari a 1,0 determina una femmina e un rapporto pari a 0,5 determina un maschio. Il rapporto tra cromosomi si traduce in quantità diverse di proteine codificate dai geni numeratori del cromosoma X rispetto ai geni denominatori di un autosoma. Negli embrioni femminili vi è un eccesso di proteine del numeratore, che costituiscono dei fattori di trascrizione i quali attivano il gene principale della determinazione del sesso, Sexlethal (Sxl). Negli embrioni maschili, le proteine del numeratore sono legate alle proteine del denominatore, per cui non avviene l’attivazione di Sxl. Questo insieme di eventi chiave nella regolazione della trascrizione mette in moto una cascata di eventi regolativi di splicing alternativo dell’RNA, che alla fine conduce al differenziamento in cellule femmina- o maschio-specifiche.

Analisi genetica dello sviluppo

Gene dsx

1

2

3

4

6

5

Esone Introne Trascrizione

Femmine pre-mRNA 1 dsx

Sito del poli(A) TRA

2

3

4

5

6 Sito del poli(A)

Maschi

Splicing regolato da TRA nelle femmine; di default nei maschi. Nei due sessi sono usati differenti siti del poli(A) Femmine

1

2

3

Maschi

4 AAAA...

1

2

3

5

6

495

Figura 19.17 Espressione di doublesex (dsx) durante l’embriogenesi. La proteina TRA negli embrioni femminili regola lo splicing, per cui l’esone 4 viene incluso e il taglio e la poliadenilazione avvengono al sito del poli(A) successivo all’esone 4. Negli embrioni maschili, in assenza della proteina TRA avviene uno splicing di default, che determina l’esclusione dell’esone 4 ma l’inclusione degli esoni 5 e 6, dato che il taglio e la poliadenilazione avvengono al sito del poli(A) successivo all’esone 6. La traduzione dei due diversi mRNA produce la proteina DSX femmina-specifica, DSX-F, nelle femmine e la proteina DSX maschio-specifica, DSX-M, nei maschi.

AAAA...

Traduzione Proteina DSX-F (proteina DSX femmina-specifica)

Proteina DSX-M (proteina DSX maschio-specifica)

Compensazione di dose in Drosophila Nei mammiferi, la compensazione di dose avviene mediante la repressione dell’attività trascrizionale dei geni del cromosoma X nelle femmine per eguagliare quella dei maschi. In Drosophila avviene il contrario: l’attività trascrizionale viene raddoppiata nei maschi per eguagliare quella delle femmine, che hanno un numero doppio di cromosomi X. In entrambi i casi il rimodellamento della cromatina regola l’attività trascrizionale. La comprensione della compensazione di dose in Drosophila è derivata da studi di mutanti per geni essenziali per la vitalità dei maschi. Geni chiave letali maschio-specifici sono: mle (maleness), msl-1 (male-specific lethal-1), msl-2, msl-3 e mof (males absent on the first). Maschi con mutazioni in questi geni muoiono in uno stadio larvale tardivo, mentre femmine con le stesse mutazioni si sviluppano normalmente. I prodotti di questi geni sono chiamati collettivamente proteine letali maschio-specifiche (MSL). La proteina SXL tardiva (vedi paragrafo precedente) svolge un ruolo chiave nella compensazione di dose. Nelle femmine, la proteina SXL tardiva si lega al trascritto di msl-2 bloccando la sua traduzione e così la proteina MSL2 non viene prodotta. Nei maschi, il trascritto di msl-2 può essere tradotto dato che la proteina SXL tardiva è assente. MSL2 forma un complesso con le altre proteine MSL, cioè MLE, MSL1, MSL3 e MOF. Questi complessi MSL si legano a circa 35 siti di accesso alla cromatina (CES, Chromatin Entry Sites) sul cromosoma X del maschio di Drosophila e poi diffondono da questi siti nella cromatina fiancheggiante in entrambe le direzioni. La proteina MOF del complesso MSL è

una istone acetiltransferasi (HAT) la cui attività di rimodellamento della cromatina (vedi Capitolo 18) diffonde lungo il cromosoma X, ed è responsabile del doppio livello di trascrizione dei geni del cromosoma X nei maschi rispetto alle femmine. Nelle femmine vengono prodotte proteine MSL diverse da MSL2. Dato però che MSL2 è essenziale per il legame del complesso MSL al cromosoma X, nelle femmine XX non può avvenire alcun rimodellamento della cromatina.

Nota chiave Come nei mammiferi, in Drosophila vi è una dose diversa dei geni del cromosoma X nella femmina rispetto al maschio. Anche nei moscerini della frutta avviene una compensazione di dose, ma in questo caso il livello di attività trascrizionale dei geni sul cromosoma X del maschio raddoppia per eguagliare l’espressione dei geni X-linked nella femmina. Il meccanismo per la compensazione di dose è in relazione con i processi molecolari della determinazione del sesso. L’assenza nei maschi della proteina codificata da Sxl rende possibile la traduzione dell’mRNA di una proteina chiave. Questa proteina si associa ad altre proteine a formare un complesso che si lega a molti siti sul cromosoma X. Il complesso scatena eventi di rimodellamento della cromatina che si propagano in ogni direzione a partire dai siti di legame interessando l’intero cromosoma. Il rimodellamento della cromatina è responsabile del raddoppio dell’attività trascrizionale.

496

Capitolo 19

Regolazione genetica dello sviluppo del corpo di Drosophila

MyLab

Progressi significativi sono stati compiuti nella comprensione della regolazione genetica dello sviluppo in Drosophila. Molti mutanti dello sviluppo sono stati isolati in Drosophila in seguito nimazione a minuziose analisi genetiche, per cui quasi tutte le Regolazione aree dello sviluppo possono genetica dei essere studiate in dettaglio a piani di sviluppo livello genetico e molecoladel corpo in re. Le scoperte conseguenti Drosophila a tali studi sono diventate ancora più importanti in quanto molti geni scoperti in Drosophila hanno una controparte in tutti gli organismi superiori, uomo compreso. Ciò implica che gli stessi meccanismi che controllano lo sviluppo in Drosophila siano comuni anche agli organismi superiori.

Uovo fecondato 1 giorno (sviluppo embrionale)

1 giorno Stadi larvali

2 giorni

21/2-3 giorni

Stadi di sviluppo in Drosophila La formazione di un individuo adulto di Drosophila da un uovo fecondato implica una sequenza ben ordinata di eventi programmati di sviluppo sotto stretto controllo genetico (Figura 19.18). Circa 24 ore dopo la fecondazione un uovo di Drosophila diventa una larva, che subisce tre mute, in seguito alle quali viene chiamata pupa. La pupa va incontro a metamorfosi e diventa un moscerino adulto. L’intero processo da uovo ad adulto richiede circa 10-12 giorni a 25 °C.

Pupa Adulto

31/2-41/2 giorni

Sviluppo embrionale Lo sviluppo ha inizio da un singolo uovo fecondato, che dà origine a cellule con diversi destini. Prima che un uovo maturo venga fecondato, al suo interno si stabiliscono particolari gradienti molecolari, come verrà discusso in seguito. L’estremità posteriore è indicata dalla presenza di una regione chiamata citoplasma polare (Figura 19.19a). Alla fecondazione, i due nuclei parentali sono collocati in un’area quasi centrale dell’uovo. I due nuclei si fondono a produrre il nucleo 2N dello zigote (Figura 19.19b). Il nucleo dello zigote si divide per mitosi otto volte nello stesso citoplasma – non avviene la citocinesi – producendo un sincizio multinucleato, cioè i nuclei sono tutti nello stesso citoplasma senza una membrana nucleare attorno (Figura 19.19c). Questi 256 nuclei migrano alla periferia dell’uovo, producendo un blastoderma sinciziale (Figura 19.19d), in cui le divisioni mitotiche continuano. Dopo la nona divisione, circa 5 nuclei raggiungono il citoplasma polare al polo posteriore dell’embrione. Attorno a questi nuclei si formano le membrane plasmatiche e vengono prodotte le cellule polari, che sono i precurso-

Figura 19.18 Sviluppo di un adulto di Drosophila da un uovo fecondato.

ri delle cellule germinali. Dopo la tredicesima divisione, si formano le membrane attorno ai nuclei per produrre le circa 6000 cellule somatiche che costituiscono il blastoderma cellulare, pressappoco 4 ore dopo la fecondazione (Figura 19.19e). Lo sviluppo delle strutture del corpo dipende da due processi (Figura 19.20). 1. Vengono prodotti gradienti proteici, lungo l’asse antero-posteriore e lungo l’asse dorso-ventrale dell’uovo. L’espressione genica è influenzata dalla posizione di un nucleo rispetto alla concentrazione delle proteine nei due gradienti che si intersecano. 2. Nell’embrione vengono determinate regioni che corrispondono a segmenti del corpo adulto. Nello stadio di blastoderma cellulare si formano i paraseg-

497

Analisi genetica dello sviluppo a) L’uovo fecondato, con i due nuclei parentali

Anteriore

Pronucleo maschile (N)

Dorsale

Uovo

Posteriore

Posteriore

Anteriore

Pronucleo femminile (N) Citoplasma polare b) I nuclei parentali si fondono producendo il nucleo diploide dello zigote

Ventrale Blastoderma cellulare

Nucleo dello zigote (2N)

Parasegmenti

14 1 2 12 13 3 4 5 6 7 8 9 10 11

A P A PA P A P A P A P A P A P A PA PA P

c) Il nucleo di divide per 8 volte nello stesso citoplasma, generando un sincizio multinucleato

Segmenti

C2 C1

d) I nuclei migrano alla periferia dell’uovo producendo un blastoderma sinciziale. Le divisioni mitotiche continuano

Compartimenti

Embrione a 10 ore

A4 A5 A6 T1 T2 T3 A1 A2 A3

A8 A7

C3

Ali

Adulto Testa

T2 T3 T1

A1 A2 A3 A4 A5 A6 A7 A8

C2 (maxilla) C3 (labium)

Cellule polari (precursori delle cellule germinali) e) Dopo la tredicesima divisione, si formano le membrane attorno ai nuclei generando le cellule somatiche del blastoderma cellulare

Figura 19.19 Sviluppo embrionale in Drosophila.

menti. Ciascun parasegmento è una regione indistinta che comprende la zona che diventerà il compartimento posteriore di un segmento e il compartimento anteriore del segmento successivo nell’embrione. I segmenti embrionali sono visibili, formando una configurazione a strisce lungo l’asse antero-posteriore; essi danno luogo ai segmenti del corpo del moscerino adulto. L’architettura del corpo dell’adulto – segmenti della testa, del torace e dell’addome – deriva dall’architettura del corpo larvale. Infatti, le cellule del blastoderma cellulare specificano due tipi di cellule: quelle che produr-

Zampa 2

Zampa 3

Zampa 1 Segmenti toracici

Segmenti addominali

Figura 19.20 Lo sviluppo di Drosophila è causato da gradienti presenti nell’uovo, che definiscono i parasegmenti nel blastoderma cellulare e i segmenti nell’embrione e nell’adulto. L’organizzazione dei segmenti nell’adulto riflette direttamente la disposizione dei segmenti nell’embrione. A e P sono i compartimenti anteriore e posteriore dei segmenti.

ranno tessuti larvali e quelle che si svilupperanno in tessuti e organi nell’adulto. Per queste ultime, gruppi di cellule indifferenziate formano strutture larvali chiamate dischi imaginali (in latino imago significa “imitare”), ciascuno dei quali si differenzia in una struttura specifica nel moscerino adulto. Quando un disco imaginale contiene circa 20-50 cellule, all’inizio dello stadio larvale, è già programmato per specificare la sua determinata struttura adulta: il suo destino è stabilito. A partire da quel momento, il numero di cellule in ogni disco aumenta per divisione mitotica finché, alla fine dello stadio larvale, vi sono molte migliaia di cellule per disco. Ogni disco imaginale si differenzia in una struttura specifica del moscerino adulto, compresi elementi della bocca, antenne, occhi, ali, bilancieri, zampe e genitali esterni. Altre strutture, come il sistema nervoso centrale

498

Capitolo 19

Figura 19.21 Localizzazione dei dischi imaginali in una larva matura di Drosophila e strutture derivate da ciascun disco nell’adulto.

Dischi imaginali nella larva

e l’intestino, non si sviluppano dai dischi imaginali. La Figura 19.21 mostra le posizioni di alcuni dischi imaginali in una larva matura e le strutture dell’adulto che ne derivano. I geni coinvolti nella regolazione dello sviluppo in Drosophila sono stati identificati per mezzo di mutazioni, che determinano un fenotipo letale nelle fasi precoci dello sviluppo o che producono lo sviluppo di strutture anomale (come embrioni con segmentazione anormale o con due estremità anteriori). Tre classi principali di geni dello sviluppo sono coinvolte: geni a effetto materno, geni di segmentazione e geni omeotici. Il loro ruolo nell’embriogenesi di Drosophila è riassunto nella Figura 19.22. Esamineremo ciascuna classe e vedremo come la polarità dell’uovo di Drosophila determini i segmenti del corpo nel moscerino adulto. Geni a effetto materno I geni a effetto materno sono espressi dalla madre durante l’oogenesi; questi geni sono responsabili della polarità dell’uovo e, di conseguenza, dell’embrione. (L’effetto materno è trattato anche nel Capitolo 12.) Mediante analisi genetiche è stato identificato un gran numero di geni a effetto materno, necessari per lo sviluppo normale del corpo del moscerino. Ci focalizzeremo ora sui due gruppi principali di questi geni, uno responsabile del normale sviluppo dell’estremità anteriore dell’embrione e l’altro principalmente responsabile del normale sviluppo dell’estremità posteriore dell’embrione. Il gene bicoid (bcd) è il gene chiave a effetto materno implicato nella formazione delle strutture anteriori dell’embrione. Negli embrioni derivati da madri mutanti bicoid, le strutture della testa e del torace sono trasformate in quelle dell’addome, producendo un embrione con strutture posteriori a entrambe le estremità, un fenotipo letale (Figura 19.23). Il gene selvatico bicoid codifica per una proteina che agisce da morfogeno. Un morfogeno è una molecola diffusibile prodotta da un tipo di cellula che controlla il pattern di differenziamento di altre cellule. Il gene bicoid viene trascritto nella madre durante l’oogenesi e i prodotti di altri geni per le strutture anteriori a effetto materno hanno la funzione di posizionare l’mRNA di bicoid vicino al polo anteriore (A) del citoplasma dell’uovo (Figura 19.24). La traduzione dell’mRNA avviene dopo la fecondazione e la proteina Bicoid diffonde formando un gradiente la cui concentrazione maggiore è all’estremità anteriore dell’uovo

Strutture nell’adulto

Labbro Elementi della bocca Antenna Omero Occhio

Ala Prima zampa Seconda zampa

Terza zampa Bilanciere

Apparato genitale

Sincizio multinucleato

Nuclei D

A

V

Blastoderma cellulare

Geni a effetto materno I geni a effetto materno sono P espressi dalla madre durante l’oogenesi e controllano la polarità dell’uovo e, di conseguenza, dell’embrione. Geni di segmentazione I geni di segmentazione determinano i segmenti dell’embrione e dell’adulto. I geni gap suddividono l’embrione lungo l’asse antero-posteriore in ampie regioni, ciascuna delle quali copre aree che successivamente si svilupperanno in parecchi segmenti distinti. I geni pair-rule suddividono l’embrione in numerose regioni, ciascuna contenente una coppia di parasegmenti.

I geni per la polarità segmentale determinano le regioni che diventeranno i segmenti delle larve e degli adulti. Legenda Geni omeotici

A = anteriore P = posteriore D = dorsale V = ventrale

Adulto normale di Drosophila

Figura 19.22 Il ruolo dei geni a effetto materno, dei geni di segmentazione e dei geni omeotici nell’embriogenesi di Drosophila.

Analisi genetica dello sviluppo

499

mRNA materno di bicoid

A

P

mRNA

P

Proteina

Proteina Bicoid

Figura 19.23 Microfotografia al microscopio elettronico a scansione di un embrione derivante da una madre mutante bicoid (bcd).

diminuendo fino a zero nel terzo posteriore dell’uovo (Figura 19.24). Come il fenotipo del mutante bcd suggerisce, il gradiente di concentrazione della proteina Bicoid determina lo sviluppo della testa e del torace. La proteina Bicoid agisce sia come fattore trascrizionale attivando e reprimendo i geni lungo l’asse anteroposteriore dell’embrione, sia come repressore traduzionale per bloccare la traduzione dell’mRNA del gene caudal (cad). Gli mRNA di cad sono distribuiti in modo uniforme nell’uovo prima della fecondazione ma, dopo che l’mRNA di bicoid viene tradotto, la traduzione degli mRNA di cad produce un gradiente delle proteine Caudal la cui concentrazione è più bassa all’estremità anteriore e più elevata all’estremità posteriore. Il gradiente di Caudal è l’opposto del gradiente della proteina Bicoid. La proteina Caudal interviene successivamente nella fase di segmentazione per attivare i geni necessari alla formazione delle strutture posteriori. Analogamente, nanos (nos) è il gene chiave a effetto materno implicato nella formazione delle strutture posteriori dell’embrione. Madri con mutazioni nulle di nanos producono embrioni con fenotipo privo di addome. Anche il gene nanos viene trascritto nella madre durante l’oogenesi e il suo mRNA è posizionato nel polo posteriore del citoplasma dell’uovo dai prodotti di altri geni per le strutture posteriori a effetto materno. Questi mRNA vengono tradotti dopo la fecondazione a produrre la proteina Nanos, che forma un gradiente postero-anteriore e agisce come morfogeno nel determinare la formazione dell’addome. La proteina Nanos è un repressore traduzionale, in quanto reprime la traduzione in particolare dell’mRNA del gene hunchback (hb). Questi trascritti sono depositati nell’uovo durante l’oogenesi e sono distribuiti in modo uniforme. Tuttavia, affinché lo sviluppo proceda correttamente, la proteina Hunchback – un fattore trascrizionale – deve essere presente con un gradiente decrescente a partire dalla struttura anteriore verso la posteriore, mentre la proteina Nanos deve essere presente con un gradiente che decresce dalla struttura posteriore in cui la concentrazione è più elevata a quella anteriore, poiché la sua

Proteina Bicoid

A

mRNA materno di bicoid

Proteina Bicoid A

P

Figura 19.24 Distribuzione dell’mRNA di bicoid e della proteina Bicoid nell’uovo. Il gradiente dell’mRNA è localizzato vicino al polo anteriore (A) dell’uovo e la proteina Bicoid forma un gradiente con la concentrazione più elevata al polo anteriore e la concentrazione più bassa al polo posteriore (P).

attività di repressione traduzionale crea il gradiente opportuno della proteina Hunchback. Geni di segmentazione Nelle fasi successive, l’embrione viene suddiviso in regioni mediante l’azione dei geni di segmentazione, che determinano i segmenti dell’embrione e dell’adulto. Mutazioni nei geni di segmentazione alterano il numero dei segmenti o la loro organizzazione interna, ma non influenzano la polarità dell’uovo. I geni di segmentazione sono sottoclassificati, sulla base dei fenotipi dei loro mutanti, in geni gap, geni pair-rule e geni per la polarità segmentale (Figura 19.25). Mutazioni nei geni gap (quali Krüppel, hunchback, giant, tailless, che codificano tutti per fattori di trascrizione) provocano la delezione di regioni che contengono uno o più segmenti adiacenti; mutazioni nei geni pair-rule (quali hairy, even-skipped, runt, fushi tarazu, che codificano tutti per fattori di trascrizione) provocano la delezione di segmenti alternati; mutazioni nei geni per la polarità segmentale (quali engrailed, che codifica per un fattore di trascrizione; hedgehog, che codifica per una proteina segnale; armadillo, che codifica

500

Capitolo 19 Gene

Larva normale con zone alterate ombreggiate in blu

Effetto della mutazione

Tempo di espressione

Gap (Krüppel, hunchback, giant)

< 11 divisioni Mancano segmenti adiacenti

Pair-rule (even-skipped, fushi tarazu)

11-12 divisioni Delezione in segmenti alternati

polarità segmentale (gooseberry, engrailed, hedgehog)

13 divisioni Segmenti rimpiazzati da immagini speculari

Figura 19.25 Funzioni dei geni di segmentazione, caratterizzate per mezzo delle mutazioni.

per una proteina di trasduzione del segnale e gooseberry, che codifica per un fattore di trascrizione) provocano la sostituzione di porzioni di segmenti con le immagini speculari della metà dei segmenti adiacenti. I geni di segmentazione hanno un ruolo peculiare nella determinazione delle regioni dell’embrione. I geni gap sono attivati o repressi dai geni a effetto materno. Per esempio, molti geni gap sono attivati dalla proteina Bicoid. La trascrizione dei geni gap determina un’organizzazione dell’embrione in ampie regioni, ciascuna delle quali comprende delle aree che successivamente si svilupperanno in segmenti distinti; è rilevante, per questa ampia definizione di regioni, l’espressione del gene hunchback. Successivamente, mediante l’azione di regolazione della trascrizione dei geni gap, sono espressi i geni pair-rule (per esempio even-skipped; vedi Capitolo 18), che portano alla suddivisione dell’embrione in svariate regioni, ciascuna delle quali contiene una coppia di parasegmenti (Figure 19.20 e 19.22). I fattori di trascrizione codificati dai geni pair-rule regolano l’espressione dei geni per la polarità segmentale definendo le regioni che diventeranno i segmenti visibili nelle larve e negli adulti. Geni omeotici Quando la modalità di segmentazione è stata determinata, una classe rilevante di geni chiamati geni omeotici (che determinano la struttura e che sono anche chiamati geni selettori) specifica l’identità di ciascun segmento definendo la struttura del corpo che svilupperà alla metamorfosi. I geni omeotici sono stati identificati in base alle mutazioni che alterano lo sviluppo del moscerino, cioè le mutazioni omeotiche modificano l’identità di particolari segmenti, trasformandoli in copie di altri segmenti. Il principale pioniere degli studi genetici sui mutanti omeotici è stato Edward Lewis, e le più recenti analisi molecolari sono state

compiute in molti laboratori, compresi quelli di Thomas Kaufman, Walter Gehring, William McGinnis, Matthew Scott e Welcome Bender. Gli studi pionieristici di Lewis sono stati compiuti su un cluster di geni omeotici chiamato complesso bithorax (BX-C). BX-C determina l’identità della parte posteriore di Drosophila, precisamente il segmento toracico T3 e i segmenti addominali A1-A8. BX-C contiene tre geni chiamati Ultrabithorax (Ubx), abdominal-A (abdA) e Abdominal-B (Abd-B), ciascuno dei quali costituisce un’unità di trascrizione codificante per una proteina. Mutazioni in questi geni omeotici sono spesso letali e il moscerino generalmente non sopravvive dopo l’embriogenesi. Sono tuttavia stati caratterizzati alcuni alleli mutanti non letali, che permettono lo sviluppo in moscerini adulti. La Figura 19.26 mostra le strutture anomale, che possono derivare nell’adulto da mutazioni bithorax. Nella Figura 19.26a è illustrato un diagramma in cui (come si può notare anche nella Figura 19.28), le ali sono localizzate sul segmento toracico 2 (T2) e la coppia di bilancieri (ali rudimentali usate come stabilizzatori durante il volo) si trova sul segmento T3. Una fotografia di un normale moscerino adulto, che mostra chiaramente le ali e i bilancieri, è presentata nella Figura 19.26b. La Figura 19.26c illustra un tipo di anomalia di sviluppo che può derivare da mutazioni omeotiche non letali in BX-C; è mostrato un moscerino omozigote per tre distinte mutazioni nel gene Ubx, e precisamente abx, bx3 e pbx. Nell’insieme, queste mutazioni nell’adulto trasformano il segmento T3 in una struttura simile al segmento T2. Il segmento trasformato mostra chiaramente una coppia di ali perfettamente sviluppate. Il moscerino manca invece dei bilancieri, perché non è presente un normale segmento T3. Un altro gruppo di mutazioni studiate in dettaglio definisce un altro grande insieme di geni omeotici chiamato complesso Antennapedia (ANT-C). ANT-C deter-

Analisi genetica dello sviluppo a)

a)

Normale

b)

Antennapedia

501

Bilanciere (ala rudimentale)

b)

Leg parts

c)

Figura 19.26 Strutture dell’adulto che derivano da mutazioni bithorax. (a) Disegno di un moscerino normale. Il bilanciere (ala rudimentale) è sul segmento toracico 3 (T3, vedi Figura 19.28). (b) Fotografia di un moscerino normale con un singolo paio d’ali. (c) Fotografia di un moscerino omozigote per tre alleli mutanti (bx3, abx e pbx), che causano la trasformazione del segmento T3 in una struttura simile a T2: un segmento con un paio di ali. Questo moscerino, perciò, ha due paia di ali, ma non ha bilancieri.

mina l’identità della struttura anteriore del moscerino, ossia la testa e i segmenti toracici T1 e T2. ANT-C contiene cinque geni: labial (lab), proboscipedia (Pb), Deformed (Dfd), Sex combs reduced (Scr) e Antennapedia (Antp). La maggior parte delle mutazioni ANT-C è letale. Un gruppo di alleli mutanti non letali di Antp provoca la crescita di parti di zampa, anziché di antenna, nelle cellule vicine all’occhio durante lo sviluppo del disco per l’occhio (Figura 19.27a e b). Si noti che la zampa ha una struttura normale, ma è ovviamente collocata in una posizione anomala. Una diversa mutazione in Antp, chiamata Aristapedia, ha un effetto differente: solo la parte distale dell’antenna, l’arista, viene trasformata nella parte distale di una zampa. Quindi, i geni omeotici ANT-C e BX-C codificano per prodotti coinvolti nel controllo del normale sviluppo di strutture rilevanti del moscerino adulto.

Figura 19.27 Antennapedia. (a) Microfotografia al microscopio elettronico a scansione dell’area dell’antenna di un moscerino selvatico. (b) Microfotografia al microscopio elettronico a scansione dell’area dell’antenna del mutante omeotico Antennapedia di Drosophila, in cui l’antenna è trasformata in una zampa.

Il complesso Antennapedia (ANT-C) e il complesso bithorax (BX-C) sono stati clonati. Entrambi i complessi sono molto estesi. In ANT-C, per esempio, il gene Antp è lungo 103 kb, presenta molti introni e codifica per un mRNA maturo di solo poche kilobasi. BX-C è lungo più di 300 kb di DNA; quasi 50 kb di DNA corrispondono alle regioni dei geni codificanti per proteine Ubx, abdA e AbdB (Figura 19.28). Altri RNA sono trascritti da BX-C, ma non vengono tradotti. Questi RNA non codificanti (ncRNA) sembrano essere RNA regolativi che silenziano Ubx nelle fasi embrionali precoci; in altri termini, gli RNA agiscono come repressori trascrizionali per assicurare la corretta espressione temporale di Ubx. Poiché i geni codificanti per proteine dei complessi ANT-C e BX-C hanno funzioni simili, Lewis ipotizzò che i geni avessero sequenze correlate. L’analisi delle sequenze di DNA dei geni rivelò la presenza di sequenze simili di circa 180 bp, che sono state chiamate omeobox. L’omeobox è una regione della sequenza codificante per proteine di ciascun gene e la corrispondente regione di 60 amminoacidi di ciascuna proteina è chiamata omeodominio.

502

Capitolo 19

T1

Segmenti:

T2

T2 T3

T3

Mutazioni in Ubx

A1

A1 A2 A3 A4 A5 A6

A2

A3

A7 A8

A4

A5

A6

A7

A8

Ubx bxd

Mutazioni regolative

pbx abx bx

abx/bx

bxd/pbx

iab-2

iab-3 iab-4 iab-5 iab-6

iab-8,9

iab-7

Sequenze regolative: Geni strutturali: –100 Unità trascrizionali di geni che codificano per proteine: (linee di raccordo = introni)

–50

0

Ubx

+50

abdA

+100

+150

+200

AbdB

Figura 19.28 Organizzazione del complesso bithorax (BX-C). Il DNA di questo complesso è lungo 300 kb. T = segmento toracico. A = segmento addominale. I trascritti per Ubx, abdA e AbdB sono rappresentati sotto al DNA; gli esoni sono mostrati co-

me blocchi colorati e gli introni come linee piegate. Tutti e tre i geni sono trascritti da destra verso sinistra. I mutanti di regolazione, che alterano lo sviluppo di differenti segmenti del moscerino, sono mostrati sopra al DNA.

Sono stati trovati omeobox in più di 20 geni di Drosophila, la maggior parte dei quali regola lo sviluppo. Tutte le proteine contenenti omeodomini legano il DNA. L’omeodominio di queste proteine si lega fortemente a una sequenza consenso di riconoscimento di 8 bp, a monte di tutti i geni controllati insieme. Motivi elica-giro-elica vengono usati dagli omeodomini per legare il DNA. Quindi, le proteine contenenti omeodomini esercitano una funzione di regolazione trascrizionale mediante interazioni con specifiche sequenze di DNA. In Drosophila l’insieme completo dei geni e dei complessi omeotici – genericamente chiamati geni Hox – consiste di lab, pb, Dfd, Scr, Antp, Ubx, abdA e AbdB. Il dato più interessante è che questi complessi sono organizzati lungo il cromosoma nello stesso ordine in base al quale sono espressi lungo l’asse antero-posteriore del corpo; questa disposizione è nota come regola della colinearità. I complessi di geni omeotici sono presenti

anche in tutti i più importanti phyla animali, con l’eccezione delle spugne e dei celenterati. Le sequenze omeobox nei geni Hox sono altamente conservate, e ciò suggerisce una funzione comune in organismi diversi. Come in Drosophila, i geni omeotici dei vertebrati – i geni Hox – sono disposti secondo la regola della colinearità. Nei mammiferi, per esempio, vi sono quattro cluster di geni omeotici denominati HoxA-D. Si ritiene che ogni cluster abbia avuto origine dalla duplicazione di un cluster genico ancestrale, seguita da una successiva divergenza evolutiva. Le modalità dell’espressione dei geni Hox, gli effetti delle mutazioni e le analisi embriologiche dimostrano che i geni dei vertebrati hanno effetti omeotici simili a quelli dei geni omeotici di Drosophila, e ciò indica che i geni Hox determinano il piano di sviluppo del corpo dei vertebrati. La Figura 19.29 confronta l’organizzazione e l’espressione dei geni Hox in Drosophila e nel topo.

Analisi genetica dello sviluppo Embrione di Drosophila Torace Testa

mx int

fiore. Studi sui mutanti omeotici hanno condotto a modelli dello sviluppo del fiore e, più in generale, dello sviluppo della pianta. In analogia con i geni omeotici di Drosophila, i geni omeotici delle piante sembrano appartenere a una serie sequenziale di geni che controlla lo sviluppo.

Addome

A4 A5 T1 T2 T3 A1 A2 A3

A8 A6 A7

la

Analisi dello sviluppo di Drosophila mediante microarray

Cromosoma di Drosophila Hox C lab

pb

Dfd Scr Antp Ubx abdA AbdB

Cromosomi di topo Hoxa a1

a2

a3

a4

a5

a6

a7

b1

b2

b3

b4

b5

b6

b7

c4

c5

c6

a9 a10 a11

a13

Hoxb b8

b9

c8

c9 c10 c11 c12 c13

d8

d9 d10 d11 d12 d13

Hoxc Hoxd d1

503

d3

Cervello posteriore

d4

Corda spinale Cervicale Toracico Lombare

Cervello mediano Cervello anteriore

Embrione di topo

Figura 19.29 Organizzazione ed espressione dei geni Hox in Drosophila e nel topo. Nell’embrione di Drosophila, int = segmento intercalare, mx = segmento maxillare, la = segmento labiale, T = toracico, A = addominale.

Geni omeotici sono stati trovati anche nelle piante. Per esempio, sono state identificate in Arabidopsis molte mutazioni omeotiche che influenzano lo sviluppo del

Nota chiave Lo sviluppo delle strutture del corpo di Drosophila deriva da gradienti proteici lungo gli assi antero-posteriore e dorso-ventrale dell’uovo e dalla successiva determinazione di regioni dell’embrione, che corrispondono direttamente ai segmenti del corpo nell’adulto. Attraverso lo studio delle mutazioni, sono stati individuati i geni che controllano lo sviluppo di Drosophila mediante una cascata temporale di eventi regolativi. Dapprima, i geni a effetto materno specificano i gradienti delle proteine nell’uovo, poi i geni di segmentazione (geni gap, pair-rule e per la polarità segmentale) determinano i segmenti dell’embrione e dell’adulto e successivamente i geni omeotici specificano l’identità dei segmenti.

Essendo stato completato il sequenziamento del genoma di Drosophila, sono ora in corso studi per mettere a punto dei sistemi che permettano di utilizzare le informazioni acquisite per arricchire le conoscenze molecolari sullo sviluppo di Drosophila. Per esempio, si stanno usando i microarray a DNA (vedi Capitolo 9) per studiare le variazioni dell’espressione genica nelle varie fasi dello sviluppo. Un’analisi di questo tipo è stata utilizzata, per esempio, per esaminare la metamorfosi indotta dall’ormone ecdisone nell’intervallo compreso tra 18 ore prima della formazione della pupa (BPF, Before Pupal Formation) e 12 ore dopo la formazione della pupa (APF, After Pupal Formation). È stata analizzata l’espressione di 6240 cloni di cDNA (circa il 40% dei geni stimati di Drosophila). I risultati hanno mostrato che 534 geni erano espressi in modo differenziale durante la metamorfosi: alcuni erano repressi e altri indotti. A un livello più specifico, lo studio ha evidenziato l’induzione determinata dall’ecdisone di alcuni geni implicati nel differenziamento del sistema nervoso centrale durante la fase precoce della metamorfosi, 4 ore BPF. Analogamente si è dimostrato che alcuni geni, che codificano per proteine necessarie alla formazione dei muscoli, erano repressi 4 ore BPF; ciò è in relazione alla preparazione della metamorfosi in Drosophila, che inizia 2 ore APF quando avviene la degenerazione del tessuto muscolare larvale.

Ruolo dei miRNA nello sviluppo Prove sperimentali di vario genere indicano che i microRNA (miRNA, vedi Capitolo 18) sono essenziali per lo sviluppo. La prima di queste prove venne da uno studio di Rosalind Lee, Rhonda Feinbaum e Victor Ambros nel 1993 su mutanti per perdita di funzione del gene lin-4 di C. elegans. I ricercatori proposero che un trascritto di 22 nucleotidi (nt) di lin-4 regolasse l’espressione dell’mRNA di lin-14 mediante l’appaiamento dell’RNA di lin-4 con la regione 3′ UTR dell’RNA di lin-14. Sappiamo ora che il gene lin-4 è un gene per miRNA, il trascritto di 22 nucleotidi è il miRNA a singolo filamento maturo. Esso regola il gene lin-14 silenziando la sua espressione a livello traduzionale. lin-14 è un gene cosiddetto eterocronico, cioè è coinvolto nella regolazione temporale dello sviluppo.

504

Capitolo 19

Nei vermi normali, cellule staminali particolari vanno incontro a un programma regolato di divisioni cellulari, sincronizzato con le quattro mute larvali dell’animale. Poi, nell’adulto queste cellule si differenziano. Nei mutanti lin-4 le cellule staminali ripetono il pattern di divisioni caratteristico del primo stadio larvale. In altri termini, le cellule rimangono bloccate nella forma dello stadio larvale 1. Le mutazioni per perdita di funzione nel gene lin-14 danno origine a un fenotipo in cui le cellule staminali si differenziano prima rispetto al normale. Un altro miRNA coinvolto nella regolazione temporale dello sviluppo in C. elegans è codificato dal gene let-7. Studi su mutanti per perdita di funzione di miRNA e su organismi con biosintesi difettiva di miRNA hanno rivelato molti altri importanti ruoli dei miRNA nello sviluppo e nel differenziamento, compresi l’embriogenesi, l’organogenesi e lo sviluppo della linea germinale. Per esempio, in C. elegans, i miRNA regolano, oltre alla divisione cellulare importante per lo sviluppo descritta sopra, anche lo sviluppo della linea germinale e lo sviluppo della vulva. In Drosophila, i miRNA so-

no richiesti per lo sviluppo sia dei tessuti somatici sia della linea germinale, e per il mantenimento delle cellule staminali nella linea germinale. Nel pesce zebra, i miRNA sono essenziali per lo sviluppo; per esempio, un mutante knock-out di Dicer (vedi Capitolo 18) causa un arresto dello sviluppo 7-10 giorni dopo la fecondazione. I miRNA sono coinvolti anche nella gastrulazione, nella formazione del cervello, nella somitogenesi (generazione di somiti, masse di tessuto che danno origine ai muscoli dei vertebrati) e nello sviluppo del cuore. Nel topo (e, per estrapolazione, in altri mammiferi) i miRNA sono essenziali per lo sviluppo; un mutante knock-out di Dicer muore a 7,5 giorni di gestazione. Dicer è necessario anche per il differenziamento di cellule staminali embrionali in vitro e, quindi, probabilmente anche in vivo. In conclusione, le proteine indubbiamente giocano ruoli chiave nel regolare i processi differenziativi ma, in aggiunta a esse, i microRNA svolgono ruoli essenziali nello sviluppo e nel differenziamento, compresi l’embriogenesi, l’organogenesi e lo sviluppo della linea germinale.

Sommario l Lo sviluppo è la crescita regolata che deriva dall’interazione del genoma con il citoplasma e con l’ambiente extracellulare. Lo sviluppo inizia quando lo zigote si è formato. Lo zigote e le cellule delle generazioni immediatamente successive sono totipotenti, cioè possono svilupparsi in ogni tipo di cellula dell’organismo. A un certo punto, il programma genetico stabilisce il destino di una cellula in un processo chiamato determinazione. Dopo la determinazione avviene il differenziamento, in cui le cellule determinate attivano programmi di sviluppo per dare origine a tipi di cellule specifiche. Un processo collegato al differenziamento è la morfogenesi, in cui le strutture anatomiche o la forma e la dimensione delle cellule sono il prodotto di una succcessione regolata di divisione, migrazione, morte cellulare programmata e cambiamenti nella forma delle cellule. l Lo sviluppo è il risultato dell’espressione genica differenziale di un genoma il cui contenuto in DNA rimane costante dallo stadio di zigote a quello di organismo maturo. In ogni caso, i geni sono soltanto una componente del processo di sviluppo; i fattori ambientali possono influenzare il fenotipo di un organismo adulto, come è stato dimostrato dalle differenze fenotipiche osservate nei mammiferi clonati rispetto al genitore che ha donato il nucleo per la clonazione. La stessa informazione genetica può inoltre essere “interpretata” in modo diverso secondo le modifiche epigenetiche che caratterizzano la cromatina corrispondente. l Vi sono alcune eccezioni alla regola per cui le cellule differenziate contengono lo stesso genoma dello zigote da cui

sono derivate. Un esempio sono le cellule B coinvolte nella produzione di anticorpi. Gli anticorpi sono proteine specializzate chiamate immunoglobuline, che legano in modo specifico gli antigeni (antibody generators: sostanze chimiche riconosciute come estranee dall’organismo e che quindi inducono una risposta immunitaria). Le molecole di anticorpo sono costituite da due catene leggere e due pesanti. Nel DNA della linea germinale le regioni che codificano per le catene delle immunoglobuline sono organizzate in sequenze in tandem di segmenti genici. Durante lo sviluppo avviene la ricombinazione somatica che avvicina particolari segmenti genici in modo da formare i geni che codificano per le catene funzionali degli anticorpi. I molti modi in cui i segmenti genici possono ricombinare consentono la produzione di un numero elevato di geni per le differenti catene degli anticorpi. l Nei mammiferi il sesso degli individui è determinato dalla presenza o assenza del cromosoma Y. Se il cromosoma Y è presente, il gene SRY, che è localizzato su quel cromosoma, viene trascritto per produrre il fattore di determinazione testicolare, un fattore di trascrizione che regola i geni richiesti per dirigere la trasformazione delle gonadi in testicoli. In assenza del gene SRY, come nelle femmine XX, le gonadi si sviluppano spontaneamente in ovaie. l Esiste un differente dosaggio dei geni localizzati sul cromosoma X tra maschi e femmine. Nei mammiferi, un meccanismo di compensazione di dose eguaglia l’espressione dei geni X-linked nei maschi e nelle femmine, in una fase precoce dello sviluppo, per mezzo dell’inattivazione di uno

505

Analisi genetica dello sviluppo dei due cromosomi X nella femmina, il che lascia un solo cromosoma X trascrizionalmente attivo, come nei maschi. Il processo di inattivazione è complesso e coinvolge la trascrizione del gene XIST sul cromosoma che deve essere inattivato; l’RNA prodotto, non codificante, ricopre il cromosoma inducendo un rimodellamento della cromatina che silenzia i geni. l In Drosophila, il sesso degli individui è determinato dal rapporto tra il numero dei cromosomi X e il numero di assetti di autosomi. Un rapporto pari a 1 corrisponde a una femmina, un rapporto pari a 0,5 a un maschio. I differenti rapporti tra cromosomi danno origine a un livello differente di particolari proteine, le quali influenzano il gene regolatore principale della determinazione del sesso Sxl. Sxl controlla una cascata di eventi regolativi di splicing alternativo dell’RNA che alla fine conduce al differenziamento in cellule femmina- o maschio-specifiche. l Come nei mammiferi, nelle femmine e nei maschi di Drosophila vi è un dosaggio differente dei geni localizzati sul cromosoma X. In Drosophila, la compensazione di dose avviene raddoppiando nel maschio il livello di trascrizione dei geni X-linked in modo da eguagliare l’espressione genica delle femmine. Il meccanismo di compensazione di dose è collegato ai passaggi molecolari della determinazione del sesso. Quindi, l’assenza nei maschi della proteina codificata da Sxl rende possibile la traduzione dell’mRNA di una proteina chiave che, associandosi ad altre proteine, forma un complesso che si lega a molti siti sul cromosoma X. Questo complesso favorisce l’estendersi di

eventi di rimodellamento della cromatina dai siti in cui si è legato in entrambe le direzioni fino a coinvolgere l’intero cromosoma. l Drosophila è diventata un importante sistema modello per lo studio del controllo genetico dello sviluppo. Le strutture del corpo di Drosophila derivano da gradienti proteici specifici nell’uovo e dalla conseguente determinazione dei segmenti nell’embrione che corrispondono direttamente ai segmenti del corpo dell’adulto. Entrambi i processi sono sotto controllo genetico, come è stato dimostrato mediante mutazioni che aboliscono gli eventi dello sviluppo. Gli studi sulle mutazioni indicano che lo sviluppo di Drosophila è guidato da una cascata temporale di eventi regolativi. l In Drosophila, una volta che il programma di base della segmentazione sia stato stabilito, i geni omeotici determinano l’identità dei segmenti. I geni omeotici condividono sequenze di DNA comuni chiamate omeobox. Gli omeobox sono stati trovati nei geni dello sviluppo in altri organismi e gli omeodomini, cioè le regioni delle proteine codificate dagli omeobox, regolano la trascrizione legandosi a specifiche sequenze di DNA. l Le proteine giocano ruoli chiave nel regolare i processi dello sviluppo e del differenziamento e sono certamente dei componenti fondamentali delle strutture prodotte dallo sviluppo e dal differenziamento. In aggiunta alle proteine, anche i microRNA (miRNA) svolgono ruoli essenziali nello sviluppo e nel differenziamento, compresi l’embriogenesi, l’organogenesi e lo sviluppo della linea germinale.

Approccio analitico alla soluzione di problemi di genetica D19.1 Abbiamo imparato in questo capitolo che, nell’uomo, vi sono parecchi geni distinti che codificano per i polipeptidi globinici di tipo α e di tipo β. Questi geni per le globine α, β, γ, δ, ε e ζ sono trascrizionalmente attivi in stadi specifici dello sviluppo e determinano la sintesi di polipeptidi che vengono assemblati in combinazioni specifiche a formare tipi diversi di emoglobina (vedi Figura 19.8). Riempite la seguente tabella, indicando se il gene per la globina in questione è sensibile (S) o resistente (R) alla digestione con DNasi I in ciascuno degli stadi di sviluppo indicati. Tessuto Gene per le globine α β γ δ ζ ε

Sacco vitellino embrionale

Milza fetale

Midollo osseo adulto

____________________________________ ____________________________________ ____________________________________ ____________________________________ ____________________________________ ____________________________________

R19.1 La tabella completata correttamente è la seguente: Tessuto Gene per le globine α β γ δ ζ ε

Sacco vitellino embrionale

Milza fetale

Midollo osseo adulto

R R R R S S

S R S R R R

S S R S R R

La spiegazione delle risposte è la seguente: la DNasi I digerisce specificamente le regioni del DNA trascrizionalmente attive, mentre non digerisce le regioni inattive. La ragione di ciò è che il DNA trascrizionalmente inattivo è più altamente condensato del DNA trascrizionalmente attivo. R significa, pertanto, che il gene era trascrizionalmente inattivo, mentre S significa che il gene era trascrizionalmente attivo.

506

Capitolo 19

Considerando un gene per le globine alla volta, il gene α è trascrizionalmente inattivo nel sacco vitellino embrionale, ma attivo nella milza fetale e nel midollo osseo adulto; cioè, nella milza fetale viene prodotta l’emoglobina fetale (Hb-F), che contiene due catene polipeptidiche α e due catene polipeptidiche γ. Nel midollo osseo, viene prodotta l’emoglobina Hb-A che contiene due catene polipeptidiche α e due catene polipeptidiche β. Il gene per la β-globina è inattivo nel sacco vitellino e nella milza ed è attivo nel midollo osseo, in quanto codifica una delle due catene polipeptidiche di Hb-A, la classe più importante dell’emoglobina dell’adulto. La catena polipeptidica γ di tipo β si trova in Hb-F, che viene prodotta solo nel fegato e nella

milza; quindi, il gene per γ è attivo nella milza e inattivo nel sacco vitellino e nel midollo osseo. La catena polipeptidica δ di tipo β si trova nell’emoglobina α2δ2, che è la classe di emoglobina meno frequente negli adulti; quindi, il gene per δ è attivo solo nel midollo osseo dell’adulto. Il gene per ζ codifica per una catena polipeptidica di tipo α che si trova solo nell’emoglobina embrionale, per cui il gene per ζ è attivo nel sacco vitellino ma inattivo nella milza e nel midollo osseo. Infine, il gene per ε codifica la catena polipeptidica di tipo β dell’emoglobina embrionale, per cui anche questo gene è attivo nel sacco vitellino ma inattivo nella milza e nel midollo osseo.

20

La genetica del cancro

Come fa una cellula normale a trasformarsi in una cellula tumorale?

Che cosa sono i geni oncosoppressori, e come sono coinvolti nello sviluppo del cancro?

Qual è la differenza tra tumore e cancro?

Come sono coinvolti nello sviluppo del cancro i geni per i miRNA?

Che relazione c’è tra cancro e ciclo cellulare?

Che cosa sono i geni mutatori, e come sono coinvolti nello sviluppo del cancro?

Qual è la prova che il cancro è una malattia genetica?

Quali geni contribuiscono alla progressione tumorale e alla metastasi?

Che cosa sono gli oncogèni, e come sono coinvolti nello sviluppo del cancro?

Che cosa sono i cancerogeni, e come contribuiscono allo sviluppo del cancro?

Attività Con il termine cancro facciamo riferimento in maniera generica a un insieme di malattie caratterizzate dalla divisione incontrollata e anormale di cellule eucariotiche. Quando le cellule si dividono senza controllo all’interno del corpo, esse possono dare origine a masse di tessuto note come tumori. Alcuni di questi non sono una minaccia alla vita degli individui, mentre altri possono invadere e alterare i tessuti circostanti. Quali sono i meccanismi che regolano la crescita e la divisione cellulare? Che cosa causa la crescita incontrollata di una cellula? Quali geni sono coinvolti nello sviluppo del cancro? Il cancro è ereditario? In questo capitolo conoscerete le risposte a queste e ad altre domande. Quindi, nella iAttività, potrete applicare quanto imparato, indagando sulle origini di una forma di cancro alla vescica.

Nel Capitolo 19 sono stati descritti alcuni dei processi che, sotto controllo genetico, sono coinvolti nello sviluppo e nel differenziamento cellulare. Durante lo sviluppo, tessuti e organi specifici originano da una programmazione genetica della divisione e del differenziamento. Nell’adulto, i molti tipi differenti di cellule del corpo proliferano soltanto in modo controllato. In molti tessuti, per esempio, si ha divisione cellulare soltanto per sostituire la perdita di cellule che avviene naturalmente o in seguito a un danno. Altre cellule, come quelle dello strato intestinale e quelle che danno origine alle cellule del sangue, devono dividersi regolarmente per sostituire le cellule morte.

Talvolta, tuttavia, le cellule in divisione si discostano dal loro programma genetico normale e danno origine a masse di tessuto chiamate tumori o neoplasie (“nuova crescita”). Nella Figura 20.1 è illustrata una mammografia che dimostra la presenza di un tumore. Il processo per il quale una cellula perde la capacità di limitare le proprie attività proliferative è definito trasformazione neoplastica (da non confondere con la trasformazione di una cellula in seguito all’acquisizione di DNA esogeno). Se le cellule trasformate rimangono circoscritte in una massa tumorale unica, il tumore è definito benigno. I tumori benigni normalmente non mettono a repentaglio la vita dell’individuo e la loro asportazione chirurgica porta ge-

Tumore

Figura 20.1 Una mammografia che mostra un tumore.

508

Capitolo 20

neralmente a guarigione completa. (Un’eccezione potrebbe essere costituita dai tumori al cervello, e in questo caso il rischio di morte deriva dal fatto che questi tipi di tumore ledono cellule essenziali.) La divisione non regolata delle cellule trasformate è evidente nelle colture in piastra. I fibroblasti normali (le cellule che sintetizzano le fibre strutturali e la sostanza fondamentale del tessuto connettivo) cresciuti in coltura si attaccano alla superficie della piastra e si dividono finché non entrano in contatto tra loro. Si forma un monostrato, uno strato singolo di cellule, che copre la piastra. Questo fenomeno avviene per azione dell’inibizione da contatto, un processo per il quale le cellule in contatto comunicano tra loro e interrompono la divisione cellulare. L’inibizione da contatto riflette la natura regolata della divisione cellulare mostrata dalle cellule normali. Al contrario, le cellule trasformate non mostrano inibizione da contatto e continuano a crescere e a dividersi anche dopo essere entrate in contatto con cellule vicine, impilandosi in strati multipli. Se le cellule di un tumore invadono e distruggono i tessuti circostanti, il tumore è definito maligno ed è identificato come cancro. Le cellule di tumori maligni possono staccarsi e muoversi attraverso il sistema sanguigno o il sistema linfatico, dando origine a tumori in altri siti corporei. La diffusione in tutto il corpo di cellule tumorali maligne si chiama metastasi (“cambiamento di stato”). Un tumore maligno può causare la morte in seguito ai danni che produce a organi fondamentali, per la comparsa di infezioni secondarie, perché causa problemi al metabolismo, perché determina l’insorgenza di tumori maligni secondari o perché causa emorragie. Si stima oggi che il cancro rappresenti la seconda causa di morte, dopo le malattie cardiache, nei paesi occidentali. La comparsa di tumori in un organismo è definita oncogenesi (da onkos, “massa”; e genesis, “nascita”) o tumorigenesi. Il cambiamento di un tumore benigno in un tumore maligno e aggressivo è definito progressione tumorale. Il cancro è una patologia genetica, questo vuol dire che alla sua base ci sono delle mutazioni. Diversamente da altre malattie genetiche, però, le mutazioni che determinano l’insorgenza e/o la progressione tumorale riguardano cellule somatiche, sono cioè acquisite e non ereditabili (anche se specifiche mutazioni ereditabili possono predisporre all’insorgenza della trasformazione neoplastica, senza esserne direttamente la causa). In questo capitolo ci occuperemo delle basi genetiche del cancro.

to cellulare. Nella maggior parte dei tessuti il differenziamento cellulare è associato anche alla perdita progressiva della capacità di proliferare delle cellule: la cellula che ha raggiunto il più alto livello di differenziamento, cioè quella che è completamente funzionale nel tessuto, non è più capace di dividersi. (Alcune cellule mantengono anche se differenziate la loro capacità di proliferare, come gli epatociti nel fegato.) Queste cellule sono definite anche cellule a differenziamento terminale, hanno un periodo di vita definito e sono sostituite nel tessuto da cellule più giovani, che sono prodotte per divisione di cellule non specializzate, chiamate cellule staminali. In un determinato tessuto le cellule staminali rappresentano una piccola quota di cellule capaci di autorinnovarsi (self-renewal). Generalmente le cellule tumorali che mantengono le loro caratteristiche differenziate (e quindi hanno minore capacità proliferativa) sono meno aggressive di quelle che invece sono indifferenziate o poco differenziate (e quindi mantengono una maggiore capacità di proliferare). Quindi, nella trasformazione neoplastica la “malignità” è inversamente proporzionale al “differenziamento”. Per questo si ritiene oggi che i tumori maligni si origino principalmente da mutazioni in cellule staminali che diventano cellule staminali tumorali (cancer stem cells) piuttosto che da mutazioni in cellule differenziate che ne inducano de-differenziamento e ne aumentino la capacità di autorinnovarsi. Attualmente sono state identificate cellule staminali tumorali in tumori di diversa origine, dove rappresentano la frazione più maligna della massa tumorale. Qualunque sia l’origine della cellula cancerosa (da cellula staminale o differenziata), le sue caratteristiche distintive (o hallmarks, definite nel 2000 da Robert A. Weinberg e Douglas Hanahan) possono essere così riassunte: le cellule tumorali presentano autosufficienza nei processi di crescita e divisione cellulare (per acquisita indipendenza da stimoli di crescita e proliferazione), insensibilità a segnali inibitori della crescita, capacità di evadere la morte programmata (apoptosi) e la senescenza/invecchiamento cellulare, capacità di stimolare l’angiogenesi (per aumentare in loro prossimità l’apporto di sostanze nutritive) e di invadere altri tessuti. A queste caratteristiche ne sono state affiancate altre, negli ultimi anni, che sottolineano l’influenza che la cellula tumorale esercita nel microambiente tissutale in cui si trova, modificandolo e influenzando il destino delle cellule normali adiacenti. Nel paragrafo seguente analizzeremo in che modo la cellula tumorale altera il controllo del ciclo cellulare.

Le relazioni tra il ciclo cellulare, il differenziamento e il cancro

Il controllo molecolare del ciclo cellulare

Durante lo sviluppo, un tessuto viene prodotto per proliferazione cellulare. In seguito a una serie di divisioni, la progenie cellullare incomincia a esprimere i geni specifici di quel tessuto, in un processo che è definito differenziamen-

In ogni ciclo cellulare, tutti i cromosomi devono essere duplicati fedelmente e una copia di ciascuno di essi deve essere distribuita a entrambe le cellule figlie. Nella maggior parte delle cellule somatiche degli eucarioti superio-

La genetica del cancro

ri il ciclo cellulare è suddiviso in quattro fasi: la fase di intervallo 1 (gap 1 o G1), la fase di sintesi (S), la fase di gap 2 (G2) e la mitosi (M). La progressione attraverso il ciclo cellulare è strettamente controllata dall’attività di molti geni, in un sistema sofisticato di controlli e di bilanciamenti (Figura 20.2). I checkpoint sono dei punti di controllo (che agiscono in fasi diverse del ciclo cellulare) in cui il ciclo cellulare si arresta se è avvenuto un danno al DNA o se si sono verificati errori nella replicazione o nel meccanismo stesso del ciclo cellulare (per esempio nella formazione del fuso mitotico, nella segregazione dei cromosomi o nella citocinesi). L’arresto del ciclo cellulare consente la riparazione del danno o, se ciò non è possibile, la morte programmata della cellula. Questi processi sono necessari per evitare la possibilità che cellule danneggiate si dividano e trasmettano anomalie genetiche o strutturali alle cellule figlie. L’alterazione dei checkpoint, infatti, porta a instabilità genomica e all’accumulo di mutazioni, predisponendo al cancro. La ciclina G2 si lega alla Cdk. La fosforilazione della Cdk mantiene inattiva la chinasi finché la cellula non è pronta per entrare in mitosi. Una fosfatasi rimuove il fosfato, la Cdk è attivata e la cellula procede verso M. Ciclina G2

La ciclina G2 viene degradata

Ciclina G2

Cdk

Cdk Checkpoint M

Checkpoint G2-M

M

G2 Sistema di controllo

G1

S

START Checkpoint G1-S

509

A mano a mano che la cellula procede attraverso la fase G1, essa si prepara alla replicazione del DNA e alla duplicazione dei cromosomi nella fase S. Un punto di controllo principale di G1, chiamato START nel lievito e punto di restrizione (restriction point) nei mammiferi, stabilisce se la cellula può entrare nella fase S. La cellula rimarrà in G1 finché non sarà sufficientemente grande e le condizioni ambientali non saranno favorevoli. In questa fase, uno specifico checkpoint controlla anche che non ci siano stati danni al DNA non riparati, per evitare che nella fase S venga replicato un DNA danneggiato o mutato. Un altro checkpoint principale è il checkpoint G2-M. Se la cellula non ha replicato il DNA, non è sufficientemente grande e le condizioni ambientali non sono favorevoli, allora non può entrare nella fase mitotica del ciclo cellulare. Un terzo checkpoint avviene durante la fase M: in particolare, esso controlla che i cromosomi siano correttamente attaccati alle fibre del fuso mitotico per permettere la separazione dei cromatidi e il completamento della mitosi. Nella cellula tumorale questi meccanismi sono andati perduti a causa di mutazioni e la cellula non è in grado di riparare il danno, oppure di arrestare il ciclo (in presenza di DNA danneggiato o errori durante la replicazione del DNA o durante la mitosi) o di innescare un processo di morte cellulare programmata in caso di danno irreparabile. In questo caso le mutazioni si accumulano e, se sono compatibili con la sopravvivenza cellulare, quella cellula farà un primo passo verso la trasformazione neoplastica. Le componenti chiave degli eventi che regolano la progressione del ciclo cellulare nelle sue diverse fasi sono le proteine conosciute come cicline (così chiamate perché la loro concentrazione cresce e diminuisce in modo regolare durante il ciclo cellulare) e gli enzimi conosciuti come chinasi dipendenti dalle cicline (Cdk). Nella fase G1-S si formano due complessi diversi ciclina G1Cdk attivi che catalizzano una serie di fosforilazioni (aggiunta di gruppi fosfato) delle proteine che controllano il ciclo cellulare, influenzandone le funzioni e portando quindi alla transizione verso la fase S. Un processo simile avviene nella fase G2-M. Una ciclina G2 Ciclina G1 si lega a una Cdk e forma un complesso. Finché la cellula non è pronta a entrare in mitoCiclina G1 si, la fosforilazione di Cdk da Chinasi dipendente parte di un’altra chinasi mandalla ciclina (Cdk)

Cdk La ciclina G1 viene degradata

Si forma un kinase complesso (Cdk) tra la ciclina G1 e la Cdk; la Cdk fosforila le proteine necessarie per la progressione verso la fase S

Figura 20.2 Alcuni degli eventi molecolari che controllano il ciclo cellulare.

510

Capitolo 20 a) Stimolo alla divisione cellulare indotto da fattori di crescita

b) Inibizione della divisione cellulare indotta da fattori inibitori della crescita Fattori di inibizione della crescita

Fattori di crescita

Membrana cellulare

Recettore

Membrana cellulare Il segnale viene trasdotto nella cellula e trasmesso al nucleo

Fattore di trascrizione

Recettore

Il segnale viene trasdotto nella cellula e trasmesso al nucleo

Fattore di trascrizione

DNA

DNA

Nucleo mRNA Proteina che stimola la divisione cellulare

Progenie cellulare

Figura 20.3 Gli eventi generali della regolazione della divisione cellulare in cellule normali. (a) Quando un fattore di crescita lega il suo recettore di membrana, esso agisce come un segnale di stimolo alla crescita cellulare. Affinché ciò avvenga, il segnale è trasdotto nella cellula e trasmesso al nucleo, attivando così l’espressione di uno o più geni che codificano per le proteine necessarie per stimolare la divisione cellulare.

tiene la Cdk inattiva. A quel punto, una fosfatasi elimina il fosfato critico dalla Cdk, attivando l’enzima. La fosforilazione di proteine da parte della Cdk complessata alla ciclina G2 fa procedere la cellula verso la mitosi.

La regolazione della divisione cellulare nelle cellule normali

MyLab

Il controllo della divisione cellulare di una cellula normale è gestito da molecole extracellulari e intracellulari che operano secondo un complicato sistema di segnalazione. Le molecole extracellulari sono gli ormoni steroidei e polipeptidici prodotti in nimazione alcuni tessuti, che influenzano la crescita e la divisione La regolazione cellulare di altri tessuti. Un della divisione fattore di crescita, per esemcellulare nelle pio, è una molecola che sticellule normali mola la divisione cellulare di una cellula bersaglio (Figura 20.3a). I fattori di crescita hanno effetti specifici perché si legano a recettori specifici sulle loro cellule bersaglio. I recettori sono proteine che si estendono attraverso la membrana plasmatica. Il

Nucleo mRNA Proteina che inibisce la divisione cellulare

Nessuna divisione

(b) Quando un fattore di inibizione della crescita lega il suo recettore di membrana, esso agisce come segnale di inibizione della crescita cellulare. Nel caso illustrato, il segnale è trasdotto nella cellula e trasmesso al nucleo, attivando uno o più geni che codificano per le proteine necessarie per inibire la divisione cellulare.

fattore di crescita si lega alla parte del recettore che si trova all’esterno della cellula. L’interazione fattore di crescita-recettore determina un cambiamento conformazionale della molecola del recettore che si attiva e trasmette il segnale di attivazione a una serie di proteine intracellulari (in genere attraverso una cascata di fosforilazioni). Proteine effettrici di questa cascata attivatoria traslocano nel nucleo dove attivano, direttamente (legando il DNA) o indirettamente (attivando fattori trascrizionali), l’espressione di geni che codificano per proteine coinvolte nella proliferazione cellulare. Esistono percorsi di segnalazione simili per i fattori di inibizione della crescita, che portano all’inibizione della crescita e della divisione cellulare (Figura 20.3b). Il processo di trasmissione del segnale di stimolo o di inibizione della crescita è chiamato trasduzione del segnale e le proteine coinvolte sono dette trasduttori del segnale. Le cellule normali si dividono soltanto quando l’equilibrio fra i segnali di stimolo e di inibizione proveniente dall’esterno della cellula è a favore della divisione cellulare. Una cellula neoplastica, invece, ha perso il controllo della divisione cellulare e si riproduce senza freni. Ciò può accadere quando mutano i geni per i fattori di cresci-

La genetica del cancro

ta/inibizione, per i loro recettori o per i trasduttori del segnale, o quando mutano i geni che codificano per i fattori trascrizionali coinvolti nel controllo del ciclo cellulare. •

Nota chiave La progressione attraverso il ciclo cellulare è strettamente controllata dall’attività di numerosi geni. I checkpoint verificano in punti chiave se una cellula ha un danno al DNA o al meccanismo che regola il suo ciclo cellulare, permettendo soltanto alle cellule normali di continuare. Le molecole chiave utilizzate in questi punti di controllo del ciclo cellulare sono le cicline e le chinasi dipendenti dalle cicline. Inoltre le cellule sane crescono e si dividono soltanto quando il bilancio tra segnali stimolatori e inibitori esterni ricevuti dalla cellula favorisce la proliferazione. Una cellula tumorale non risponde ai segnali consueti e si divide senza controlli. Anche la perdita dei checkpoint da danno al DNA o da errori nella replicazione o nella divisione cellulare contribuisce alla trasformazione neoplastica.

Il cancro è una malattia genetica Numerose evidenze, elencate di seguito, fanno ritenere che il cancro sia una malattia genetica. •







C’è una forte incidenza di particolari forme di cancro in alcune famiglie umane. I cancri che ricorrono nelle famiglie sono detti cancri familiari, quelli che non sembrano avere una predisposizione ereditaria sono conosciuti come cancri sporadici (o non familiari). I cancri sporadici sono più frequenti di quelli familiari; questi ultimi, infatti, riguardano solo circa il 510% dei casi. Nel caso dei tumori familiari, a essere ereditaria è una mutazione predisponente all’insorgenza del cancro e non il cancro stesso. In genere a essere mutato è un gene oncosoppressore (vedi più avanti nel capitolo) e l’ereditarietà della mutazione è mendeliana. La presenza di questa prima mutazione può diminuire il tempo necessario ad accumulare successive mutazioni che possono infine portare allo sviluppo del tumore. Alcuni virus possono indurre il cancro. Questo significa che l’espressione di geni virali indotta nell’ospite è in grado di distruggere i normali controlli del ciclo cellulare. Le cellule tumorali danno origine per divisione cellulare ad altre cellule, anch’esse tumorali (il tumore quindi può essere considerato “clonale”). L’incidenza di cancro aumenta in seguito all’esposizione ad agenti mutageni. Questo si verifica negli organismi sperimentali trattati in condizioni di labora-

511

torio controllate, ma anche in esseri umani esposti ad alcune sostanze chimiche e a radiazioni presenti nell’ambiente (si veda più oltre in questo capitolo). Alcune mutazioni cromosomiche sono associate a particolari forme di cancro. Alcuni esempi includono il linfoma di Burkitt e la leucemia mieloide cronica (Capitolo 16). In questi casi la mutazione cromosomica determina un’espressione genica anomala ed è responsabile della perdita del controllo del ciclo cellulare.

Geni e cancro Alcune classi di geni sono di particolare rilevanza nello studio della genetica del cancro, in quanto le loro mutazioni svolgono un ruolo chiave nell’insorgenza e/o nella progressione tumorale. Tra questi ci sono i proto-oncogèni, i geni soppressori di tumori o oncosoppressori, i geni per i microRNA (miRNA) e i geni mutatori. I prodotti dei proto-oncogeni normalmente controllano positivamente la proliferazione cellulare. Proto-oncogeni mutati, chiamati oncogèni, sono presenti nelle cellule tumorali e la loro mutazione può renderli più attivi dei geni normali oppure attivi in tempi e/o modi non appropriati. I prodotti degli oncosoppressori non mutati invece inibiscono di norma la proliferazione cellulare: forme mutate dei geni oncosoppressori riscontrate nelle cellule tumorali hanno perso invece la loro funzione inibitoria. I prodotti dei geni normali per i miRNA si legano a mRNA codificati da altri geni e ne regolano la traducibilità; alcuni di questi geni, dei quali l’espressione risulta silenziata, sono coinvolti nella proliferazione cellulare. Geni per miRNA sovraespressi agiscono come oncogeni, mentre geni sottoespressi agiscono come oncosoppressori difettivi. I prodotti dei geni mutatori selvatici sono invece necessari per il controllo del processo di replicazione del DNA e per mantenere l’integrità del genoma. Geni mutatori mutati nelle cellule tumorali hanno perso la loro funzione normale e rendono la cellula soggetta all’accumulo di errori non riparati e nuove mutazioni in ogni gene, compresi i proto-oncogeni e gli oncosoppressori.

Oncogeni virali La trasformazione neoplastica delle cellule può derivare dall’infezione da parte di virus tumorali. Nel regno animale sono molto diffusi virus tumorali sia a RNA sia a DNA. I virus tumorali a RNA causano tumori attraverso meccanismi diversi rispetto a quelli dei virus tumorali a DNA. I virus tumorali a RNA trasformano una cellula in virtù dell’azione di uno o più geni presenti nel genoma virale chiamati oncogeni virali. Per definizione un oncogene è un gene che determina la proliferazione cellulare non controllata. In questo paragrafo analizzeremo in che modo i virus possono causare l’insorgenza di tumori.

512

Capitolo 20 Genoma a RNA a singolo filamento (due copie)

Figura 20.4 Disegno schematico di un retrovirus.

Involucro virale

Nucleo icosaedrico del virus Glicoproteine virali

Recettore di superficie codificato dalla cellula ospite

Cellula ospite

Retrovirus e oncogeni Tutti i virus tumorali a RNA sono retrovirus e gli oncogeni portati dai virus tumorali a RNA sono forme mutate di geni normali presenti nella cellula ospite. È opportuno ricordare tuttavia che non tutti i retrovirus sono virus tumorali. La caratteristica distintiva di un retrovirus è che, una volta che ha infettato una cellula, il genoma a singolo filamento di RNA è convertito in DNA provirale a doppio filamento. Il DNA provirale si integra in un cromosoma dell’ospite e dirige la generazione della progenie retrovirale. Esempi di retrovirus sono il virus del sarcoma di Rous (RSV), il virus della leucemia felina (FLV), il virus del tumore mammario del topo (MMTV) e il virus umano dell’immunodeficienza (HIV-1, l’agente che causa la sindrome dell’immunodeficienza acquisita o AIDS). In Figura 20.4 è raffigurata una particella retrovirale. All’interno di un nucleo proteico, che ha spesso una forma icosaedrica, si trovano due copie del genoma a RNA a singolo filamento, di senso positivo (cioè traducibile direttamente), delle dimensioni di 7-10 kb. Il nucleo proteico è circondato da un rivestimento derivato dalle membrane dell’ospite, nel quale sono inserite delle glicoproteine di origine virale. Quando il virus infetta una cellula, il rivestimento glicoproteico interagisce con un recettore di superficie della cellula ospite per iniziare il processo mediante il quale il virus penetra nella cellula. I retrovirus tipici hanno tre geni che codificano per proteine coinvolte nel ciclo vitale virale: gag, pol ed env. Il gene gag codifica una proteina precursore che, una

volta tagliata, produce proteine della particella virale. Il gene pol codifica per una proteina precursore che viene tagliata per produrre la trascrittasi inversa, l’enzima che converte il genoma a RNA a singolo filamento in DNA provirale a doppio filamento, e un enzima necessario per l’integrazione del DNA provirale nel cromosoma della cellula ospite. Il gene env codifica il precursore della glicoproteina dell’involucro. La Figura 20.5 mostra il ciclo vitale di un retrovirus non oncògeno (che non causa cancro), come per esempio l’HIV-1.* Quando il retrovirus infetta una cellula, il suo genoma a RNA viene rilasciato dalla particella virale e la trascrittasi inversa, un enzima portato nella cellula dentro la particella virale e codificato dal gene pol, sintetizza una copia di DNA provirale a doppia elica del geno* Il genoma dell’HIV-1 contiene i geni gag, pol ed env al completo, e quindi può autopropagarsi. In più, HIV contiene diversi altri geni che non sono oncogeni ma aiutano il controllo dell’espressione genica. Uno di questi, tat, codifica per una proteina che regola la trascrizione e la traduzione dei geni gag e pol. HIV1 si lega a un recettore sulla superficie di alcune cellule del sistema immunitario e le infetta. Attraverso la replicazione virale normale, HIV-1 causa la morte della cellula infettata (il virus è citolitico) rilasciando altre particelle virali che infettano altre cellule. A causa della sistematica distruzione delle cellule del sistema immunitario infettate, il sistema stesso diventa progressivamente meno funzionante. Come conseguenza, una persona infettata da HIV-1 è incapace di combattere le infezioni, e inoltre diventa suscettibile a numerosi tipi di cancro.

La genetica del cancro

513

Retrovirus non oncògeno

Infezione

gag

pol

env

Genoma virale a RNA

Sintesi del DNA da parte della trascrittasi inversa gag

pol

env

DNA provirale

LTR (U3 R U5)

LTR (U3 R U5)

Integrazione nel genoma

gag

pol

LTR (U3 R U5)

env LTR (U3 R U5)

Trascrizione

mRNA

gag

pol

env

gag

pol

env

Genoma virale a RNA

Traduzione Gag Pol Env

Impacchettamento in particelle virali a livello della membrana plasmatica e rilascio delle particelle al di fuori della cellula

Figura 20.5 Ciclo vitale di un retrovirus non oncògeno.

ma a RNA. Usando il filamento di RNA come stampo, la trascrittasi inversa produce inzialmente una copia di DNA complementare, e quindi duplica il DNA per produrre DNA a doppia elica. Il DNA provirale si integra nel cromosoma dell’ospite nel modo seguente. L’estremità sinistra di tutti i genomi a RNA dei retrovirus contiene le sequenze R e U5 e l’estremità destra le sequenze U3 e R. Durante la sintesi del DNA provirale da parte della trascrittasi inversa, il processo di replicazione delle sequenze terminali produce lunghe sequenze terminali ripetute (LTR) di U3-R-

U5, che contengono numerosi segnali di regolazione virale. Il DNA provirale si integra quindi nel genoma dell’ospite. Il DNA provirale integrato è trascritto per produrre sia la progenie virale con genoma a RNA sia gli mRNA che codificano per le singole proteine virali. Alcuni retrovirus portano anche un oncogene che dà loro la capacità di trasformare le cellule che infettano: questi sono i retrovirus oncògeni. I retrovirus oncògeni hanno lo stesso ciclo vitale dei retrovirus non-oncògeni (infatti, gli oncogeni portati da un retrovirus oncògeno non hanno alcun ruolo nel suo ciclo vitale).

514

Capitolo 20

Tabella 20.1 Alcuni retrovirus trasducenti e loro oncogeni virali Oncogene

Retrovirus di origine

Origine del v-onc

Proteina del v-onc

Tipo di cancro

src

Virus del sarcoma di Rous

Pollo

pp60src

Sarcoma

abl

Virus della leucemia murina di Abelson

Topo

P90-P160gag-abl

Leucemia a cellule pre-B

erbA

Virus dell’eritroblastosi aviaria

Pollo

P75gag-erbA

Eritroblastosi e sarcoma

erbB

Virus dell’eritroblastosi aviaria

Pollo

gp65erbB

Eritroblastosi e sarcoma

fms

McDonough (SM)-FeSV

Gatto

gp180gag-fms

Sarcoma

fos

FBJ (Finkel-Biskis-Jinkins)-MSV

Topo

pp55fos

Osteosarcoma

myc

MC29

Pollo

P100gag-myc

Sarcoma, carcinoma e mielocitoma

Virus della mieloblastosi aviaria (AMV) AMV-E26

Pollo Pollo

p45myb P135gag-myb-ets

Mieloblastosi Mieloblastosi ed eritroblastosi

raf

3611-MSV

Topo

P75gag-raf

Sarcoma

H-ras

Harvey MSV RaSV

Ratto Ratto

pp21ras p29gag-ras

Sarcoma ed eritroleucemia Sarcoma

K-ras

Kirsten MSV

Ratto

pp21ras

Sarcoma ed eritroleucemia

myb

Differenti retrovirus portano oncogeni diversi. Nel virus del sarcoma di Rous (RSV), che causa un sarcoma (cancro del tessuto connettivo o delle cellule muscolari), l’oncogene si chiama src. La maggior parte dei retrovirus oncògeni (RSV è un’eccezione) non è in grado di replicarsi perché l’aggiunta dell’oncogene al loro genoma determina la perdita di uno o più geni necessari al ciclo vitale virale. Gli oncogeni virali (genericamente indicati come vonc) sono responsabili di molte forme diverse di cancro. Il nome dei geni v-onc deriva dal tumore che inducono e il prefisso “v” indica che il gene è di origine virale. Quindi il gene v-onc di RSV è indicato come v-src. I retrovirus che possiedono oncogeni sono chiamati retrovirus trasducenti, poiché hanno prelevato un oncogene o un proto-oncogene dal genoma cellulare. Nella Tabella 20.1 sono elencati alcuni retrovirus trasducenti e i loro oncogeni virali. I retrovirus non oncògeni che non portano oncogeni sono detti retrovirus non trasducenti. Sebbene il retrovirus non trasducente non abbia oncogèni nel suo genoma, può, anche se raramente, indurre tumori attraverso due meccanismi: la mutagenesi inserzionale e l’attivazione genica. Nel primo caso, il retrovirus, integrandosi, interrompe una sequenza genica con conseguente perdita di funzione del gene interessato dall’inserzione (per esempio un gene oncosoppressore o un gene mutatore). Nel secondo caso, invece, il retrovirus si integra nelle vicinanze di un proto-oncogene il quale viene posto così sotto il controllo di sequenze promotrici o enhancer retrovirali (presenti nelle LTR) che essendo forti attivatori trascrizionali ne determinano un’attivazione normale e/o costitutiva (indipendente da stimoli ambientali).

Come è prodotto un retrovirus trasducente? Il DNA retrovirale (il provirus) si integra nel DNA cellulare in un punto a caso. Qualche volta avviene un riarrangiamento genetico mediante il quale l’unità trascrizionale del provirus è collegata a geni cellulari vicini, spesso per un evento di delezione che determina la perdita di alcuni o di tutti i geni gag, pol ed env. In questo modo l’RNA virale contiene tutto o una parte di un gene cellulare. Tutta la progenie virale porta quindi il gene cellulare e, sotto l’influenza dei promotori virali delle LTR, esprime la proteina cellulare nelle cellule infettate. Se il gene cellulare che è stato prelevato era un oncogene, il retrovirus modificato è oncògeno. Se il gene cellulare che è stato prelevato era un proto-oncogene, il retrovirus modificato può essere oncògeno se l’espressione accresciuta del proto-oncogene causa oncogenesi. Nel caso di RSV, le cellule infettate da questo virus si trasformano rapidamente nello stato tumorale per l’attività del gene v-src. Poiché RSV possiede tutti i geni necessari per la replicazione virale (gag, pol ed env), una cellula trasformata da RSV produce una progenie di particelle di RSV. Per questa sua capacità RSV costituisce un’eccezione. Come abbiamo detto, tutti gli altri retrovirus trasducenti hanno nel loro genoma delezioni che causano la perdita della funzione di uno o più geni virali. Essi sono in grado di trasformare le cellule, ma non possono produrre una progenie virale giacché mancano di uno o più geni necessari per la riproduzione virale. Questi retrovirus difettivi possono produrre una progenie di particelle virali soltanto se le cellule che li contengono sono state infettate anche da un virus normale (un virus helper) che può fornire i prodotti genici mancanti.

La genetica del cancro

Nota chiave I retrovirus sono virus a RNA che si replicano attraverso un intermedio a DNA. Tutti i virus a RNA che causano tumori sono dei retrovirus, ma non tutti i retrovirus provocano il cancro. Quando un retrovirus infetta una cellula, il genoma a RNA viene rilasciato dalla particella virale e, attraverso l’azione della trascrittasi inversa, viene sintetizzata una copia del genoma sotto forma di cDNA, chiamato DNA provirale. Il DNA provirale si integra nel genoma della cellula ospite. Successivamente, sfruttando l’apparato trascrizionale della cellula ospite, i geni virali vengono trascritti e vengono prodotti RNA virali completi. I nuovi virus vengono assemblati nella cellula e quindi ne fuoriescono e possono infettare altre cellule. L’infezione da retrovirus è una causa comune di insorgenza di cancro negli animali. Un retrovirus può causare il cancro se porta nel suo genoma un oncogene sotto il controllo di promotori retrovirali. Tali virus sono detti trasducenti perché hanno prelevato un oncogene originariamente dal genoma di una cellula ospite in una precedente infezione.

I virus tumorali a DNA I virus tumorali a DNA sono oncògeni, cioè inducono la proliferazione cellulare, ma, come detto precedentemente, il meccanismo attraverso il quale trasformano le cellule è completamente diverso. Questi virus trasformano le cellule nello stato canceroso per l’azione di uno o più oncogeni del genoma virale. Gli oncogeni dei virus tumorali a DNA, a differenza di quelli dei retrovirus oncògeni, sono geni virali essenziali che non hanno alcuna relazione con i geni cellulari. Esempi di virus tumorali a DNA si trovano in cinque delle sei famiglie nelle quali sono classificati i virus a DNA: papovavirus, virus dell’epatite B, herpes virus, adenovirus e pox virus. I virus tumorali a DNA generalmente procedono nel loro ciclo vitale senza trasformare la cellula. Di norma il virus produce una proteina virale che attiva la replicazione del DNA nella cellula ospite. Quindi il genoma virale viene replicato e trascritto sfruttando l’apparato proteico della cellula ospite, e viene prodotta una numerosa progenie di particelle virali che portano alla lisi e alla morte della cellula ospite. I virus rilasciati possono infettare altre cellule. Raramente, tuttavia, il DNA virale non viene replicato ma si integra nel genoma della cellula ospite. In questa condizione, se viene sintetizzata la proteina virale che attiva la replicazione del DNA, si determina la trasformazione della cellula nello stato canceroso in quanto la proteina stimola la cellula quiescente alla proliferazione; la cellula passa quindi dalla fase G0 alla fase G1/S del ciclo cellulare. Esempi di virus tumorali a DNA sono rappresentati dai papillomavirus. Alcuni di questi virus causano nel-

515

l’uomo tumori benigni come le verruche della pelle o quelle veneree. Altri papillomavirus (HPV-16, HPV-18 o entrambi) predispongono all’insorgenza del cancro alla cervice, che è una delle cause principali di morte per cancro nelle donne in tutto il mondo. La trasformazione è causata dai geni virali fondamentali E6 ed E7, che codificano proteine che inducono a progressione nel ciclo cellulare, inattivando due importanti oncosoppressori cellulari, Rb e p53 (vedi più avanti nel capitolo). Ora è disponibile un vaccino contro HPV che permette di evitare di contrarre l’infezione e ridurre così il rischio di sviluppare il tumore della cervice.

Oncogeni cellulari A metà degli anni settanta del secolo scorso, J. Michael Bishop, Harold Varmus e altri dimostrarono che cellule animali normali contenevano geni con sequenze di DNA strettamente correlate a quelle di oncogeni virali, trovati nei retrovirus oncògeni. Questi geni normali sono chiamati proto-oncogeni. (Bishop e Varmus nel 1989 ricevettero il Premio Nobel per la Fisiologia o Medicina per la loro “scoperta dell’origine cellulare degli oncogeni retrovirali”). Agli inizi degli anni ottanta, R.A. Weinberg e M. Wigler dimostrarono in modo indipendente che una gran varietà di cellule tumorali umane conteneva oncogeni. Questi geni, quando erano introdotti in cellule in coltura, le trasformavano in cellule tumorali. Fu scoperto che gli oncogeni umani erano molto simili agli oncogeni virali descritti in precedenza, anche se i virus non inducevano le relative neoplasie umane. Fu dimostrato inoltre che gli oncogeni umani erano forme mutate di geni normali, i proto-oncogeni cellulari. I proto-oncogeni svolgono un ruolo importante nella regolazione del ciclo cellulare. Quando i proto-oncogeni mutano o sono deregolati in modo tale da contribuire all’induzione di tumore, diventano oncogeni (onc). La mutazione di un solo proto-oncogene di una coppia di omologhi, che produca un oncogene, è sufficiente a causare la perdita del controllo del ciclo cellulare. Pertanto questa mutazione è una mutazione dominante. Gli oncogeni che risiedono nella cellula ospite, sono indicati come oncogeni cellulari o c-onc. I prodotti proteici dei proto-oncogeni Circa un centinaio di proto-oncogeni è stato identificato attraverso gli oncogeni che ne derivano. I proto-oncogeni sono raggruppati in diverse classi distinte, in base alla similarità delle loro sequenze nucleotidiche e di quelle amminoacidiche dei loro prodotti proteici (Tabella 20.2). In tutti i casi, comunque, il prodotto genico di un proto-oncogene è coinvolto nel controllo positivo della crescita e della divisione cellulare; vale a dire che i prodotti dei proto-oncogeni stimolano la crescita cellulare o sono presenti nelle vie coinvolte nella stimolazione della cre-

516

Capitolo 20

Tabella 20.2 Classi di prodotti proteici dei proto-oncogeni Fattori di crescita sis Catena B del fattore di crescita PDGF int-2 Fattore di crescita correlato a FGF Tirosina chinasi e serina/treonina chinasi recettoriali e non recettoriali src Tirosina chinasi non recettoriale associata alla membrana fgr Tirosina chinasi non recettoriale associata alla membrana fps/fes Tirosina chinasi non recettoriale kit Tirosina chinasi del recettore troncato delle cellule staminali pim-1 Serina chinasi citoplasmatica mos Serina chinasi citoplasmatica (fattore citostatico) Recettori privi dell’attività chinasica mas Recettore dell’angiotensina Proteine G associate alla membrana attivate da recettori di superficie H-ras Proteina GTPasi che lega il GTP associata alla membrana K-ras Proteina GTPasi che lega il GTP associata alla membrana gsp Forma di Gα attivata da mutazione Regolatori citoplasmatici crk Proteina SH-2/3 che lega proteine che contengono fosfotirosina Fattori trascrizionali nucleari myc Proteina che lega una sequenza specifica di DNA fos Si combina al prodotto di c-jun per formare il fattore trascrizionale AP-1 jun Proteina che lega una sequenza specifica di DNA; è una parte di AP-1 erbA Recettore mutante della tiroxina (T3) dominante negativo ski Fattore trascrizionale

scita. Nella parte che segue ne descriveremo tre esempi: i fattori di crescita, le proteine chinasi e le proteine G associate alla membrana. I fattori di crescita L’effetto degli oncogeni sulla crescita e sulla divisione cellulare portò a un’ipotesi iniziale secondo la quale i proto-oncogeni erano ritenuti geni regolatori coinvolti nel controllo della moltiplicazione cellulare durante il differenziamento. Prove a favore di questa ipotesi giunsero quando fu dimostrato che il prodotto dell’oncogene virale v-sis era identico a una porzione del fattore di crescita derivato dalle piastrine (PDGF, Platelet-Derived Growth Factor, un fattore isolato nelle piastrine del sangue dei mammiferi), che è rilasciato quando un tessuto viene danneggiato. Il PDGF influenza un solo tipo cellulare, i fibroblasti, determinandone la crescita e la divisione. I fibroblasti fanno parte del sistema

di rimarginazione delle ferite. Il legame causale tra PDGF e l’induzione di tumori fu dimostrato in un esperimento nel quale il gene che codifica per il PDGF venne introdotto in una cellula che normalmente non produce PDGF (per esempio un fibroblasto): quella cellula, in grado di produrre autonomamente il fattore di crescita, venne trasformata in una cellula cancerosa. Generalizzando, possiamo affermare che la sintesi di fattori di crescita, eccessiva o fuori tempo, in cellule che normalmente non producono questi fattori può indurre trasformazione neoplastica. Un gene alterato che codifica per un fattore di crescita, come per esempio un v-onc o una mutazione di un proto-oncogene cellulare, è un esempio di cambiamento che può modificare i livelli dei fattori di crescita. Le proteine chinasi Molti proto-oncogeni codificano per delle chinasi, enzimi che aggiungono gruppi fosfato a proteine bersaglio, modificandone in questo modo la funzione. Le proteine chinasi sono parte integrante della via di trasduzione del segnale cellulare. Il prodotto genico di src, per esempio, è una proteina chinasi non recettoriale, designata come pp60src. La proteina virale pp60v-src e quella derivata dall’oncogene cellulare pp60c-src differiscono soltanto per pochi amminoacidi e sono entrambe in grado di legarsi alla superficie interna della membrana plasmatica. Tuttavia, la mutazione di src rende la proteina attiva in modo costitutivo. I risultati ottenuti studiando src suggerivano una spiegazione su come altri oncogeni codificanti per tirosina chinasi potessero trasformare una cellula normale in una cancerosa, metabolicamente molto diversa. Per esempio, i recettori dei fattori di crescita usano la fosforilazione per trasmettere segnali attraverso la membrana. Quindi, l’azione delle chinasi è anch’essa legata ai fattori di crescita e alle loro funzioni. Proteine G associate alla membrana attivate da recettori di superficie In precedenza abbiamo considerato come un segnale prodotto dal legame di un fattore di crescita al suo recettore immerso nella membrana sia trasdotto attraverso la cellula, attivando geni nucleari fondamentali che controllano il ciclo cellulare. I passaggi dal recettore del fattore di crescita al nucleo sono numerosi e formano quella che è conosciuta come una cascata di segnali. Le proteine G associate alla membrana sono coinvolte in questa cascata: esse sono attivate dal legame del fattore di crescita al recettore di superficie cellulare. La proteina Ras, codificata dal gene ras, è un esempio di proteina G. Questo gene è mutato in numerose forme di cancro. La Figura 20.6 mostra una parte della cascata di segnali che coinvolge Ras. Il legame del fattore di crescita EGF al suo recettore ne stimola l’autofosforilazione. La proteina Grb2 può quindi legarlo, e il complesso recluta sulla membrana plasmatica la proteina SOS. SOS sposta il

La genetica del cancro

GDP da Ras (che è ancorata alla parte interna della membrana plasmatica), e consente a Ras di legare GTP. Il complesso Ras-GTP recluta Raf-1 e la attiva. Ciò dà il via a una cascata di fosforilazione di proteine citoplasmatiche (la cascata delle MAP chinasi), che alla fine attiva la MAPK ERK fosforilandola. Questa molecola si muove dal citoplasma al nucleo, dove fosforila parecchi fattori trascrizionali, incluso Elk-1 e li attiva. I fattori trascrizionali attivati a loro volta avviano la trascrizione di una serie di geni bersaglio che stimolano la divisione cellulare. Lo spegnimento del segnale di Ras nelle cellule normali coinvolge GAP (una proteina che attiva la GTPasi), che induce Ras a idrolizzare il GTP legato per riportarlo alla forma di GDP. Questo passaggio inattiva Ras e cancella il segnale di stimolo del ciclo cellulare. Come accade che ras diventi un oncogene? Un modo consiste in una mutazione che abolisce la sua capacità di idrolizzare GTP a GDP. Quindi, anche in seguito alla stimolazione da parte di GAP, il complesso Ras-GTP persiste e il segnale è continuamente acceso. Trasformazione dei proto-oncogeni cellulari in oncogeni Nelle cellule normali l’espressione dei proto-oncogeni è strettamente controllata, in modo che la crescita e la divisione cellulare avvengano soltanto quando ciò sia appropriato per il tipo di cellula in questione. Tuttavia, quando i proto-oncogeni vengono trasformati in oncogeni, questo controllo stretto può essere perso e si ha proliferazione cellulare incontrollata.

Tre esempi dei tipi di cambiamenti che sono stati identificati sono riportati qui di seguito. 1. Mutazioni puntiformi (sostituzioni di coppie di basi). Mutazioni puntiformi nella regione codificante di un gene o nelle sue regioni di controllo (promotore, elementi regolativi, enhancer) possono trasformare un proto-oncogene in un oncogene, causando un’alterazione della sua funzione, un aumento nell’attività del prodotto proteico oppure nell’espressione del gene, che a sua volta determina un incremento della quantità di prodotto genico presente nella cellula. Per esempio, le mutazioni di ras descritte in precedenza sono di norma mutazioni puntiformi. 2. Delezioni o inserzioni. Delezioni di una parte della regione codificante o delle sequenze di controllo di un proto-oncogene sono state rilevate frequentemente in numerosi oncogeni. Le delezioni possono determinare cambiamenti nella quantità o nell’attività delle proteine codificate. Nel primo caso possono essere delete sequenze inibitorie di regioni regolative; nel secondo caso ci può essere perdita di esoni e quindi formazione di proteine mancanti di domini regolativi o inibitori, la cui perdita fa aumentare o deregola l’attività della proteina stessa. Per esempio, delezioni nel gene che codifica per il recettore del fattore di crescita EGF danno origine a una molecola di recettore mutata, che dimerizza e si attiva in assenza del fattore di crescita, risultando quindi costitutivamente attiva.

Figura 20.6 Il ruolo di Ras, proteina G associata alla membrana, nell’attivazione della trascrizione di geni bersaglio coinvolti specificamente nel ciclo cellulare. Recettore per l’EGF

EGF Membrana plasmatica Esterno della cellula

GAP GRB2

SOS

Ras

Ras

GDP

GTP GDP

Raf

GTP MEK

MEK

Fattore Elk-1 di trascrizione ERK Nucleo

ERK

ERK

Elk-1 Citoplasma Attivazione della trascrizione dei geni bersaglio

517

Cascata delle MAP chinasi

518

Capitolo 20

3. Amplificazione genica (aumento del numero di copie di un gene). Alcune cellule tumorali hanno fino a centinaia di copie di proto-oncogeni, che probabilmente hanno avuto origine per l’eccessiva replicazione casuale di piccole porzioni di DNA genomico. In generale le copie soprannumerarie di un proto-oncogene portano a un aumento del prodotto genico nella cellula, che induce o contribuisce a una proliferazione cellulare non programmata. Per esempio, nei tumori adrenocorticali del topo sono state trovate copie multiple del gene ras. Altri meccanismi già discussi possono condurre all’attivazione di un oncogene. Tra questi, l’inserzione e la traslocazione cromosomica. L’inserzione di sequenze virali in prossimità di proto-oncogeni cellulari può attivarne la trascrizione incontrollata (come già discusso precedentemente in questo capitolo). L’amplificazione può portare ad aumentare il numero di copie di un oncogene nella cellula (come avviene per il gene N-myc nel neuroblastoma). Infine, la traslocazione cromosomica può attivare un oncogene ponendolo sotto il controllo di regioni regolative di geni molto espressi (come avviene nel linfoma di Burkitt) oppure creare proteine di fusione come nella leucemia mieloide cronica (vedi Capitolo 16).

Nota chiave Dopo l’infezione da parte di un retrovirus, si può avere induzione di tumore per effetto dell’attività di un oncogene virale (v-onc) presente nel genoma retrovirale. I retrovirus che portano un oncogene sono detti retrovirus trasducenti. Geni cellulari normali, detti proto-oncogeni, hanno sequenze di DNA simili a quelle degli oncogeni virali. I proto-oncogeni codificano per proteine che stimolano la crescita e la divisione cellulare. Se mutati, i proto-oncogeni sono chiamati oncogeni cellulari (c-onc) e possono indurre la formazione di tumori. Gli oncogeni retrovirali sono copie mutate di proto-oncogeni cellulari che sono state integrate nel genoma virale.

I geni soppressori dei tumori o oncosoppressori Alla fine degli anni sessanta del secolo scorso, Henry Harris fuse insieme cellule normali di roditore con cellule cancerose e osservò che alcuni ibridi cellulari non formavano tumori, ma avevano una crescita normale. Harris ipotizzò che le cellule normali contenessero dei prodotti genici capaci di sopprimere la proliferazione cellulare incontrollata caratteristica delle cellule cancerose. Questi geni furono chiamati geni soppressori di tumori o oncosoppressori.

Ulteriori prove a favore dell’esistenza di geni oncosoppressori vennero dai risultati che indicavano come certi tumori fossero caratterizzati da specifiche delezioni cromosomiche in entrambi i cromosomi omologhi. È logico pensare che, se la perdita della funzione di alcuni geni è correlata all’insorgenza di tumori, gli alleli normali di questi geni devono avere una funzione di soppressione della formazione del tumore. In altre parole, i prodotti normali dei geni oncosoppressori inibiscono la crescita e la divisione cellulare. Qualora i geni oncosoppressori siano inattivati, l’azione inibitoria viene perduta e può avere inizio la proliferazione cellulare incontrollata. L’inattivazione di geni oncosoppressori è stata messa in relazione allo sviluppo di numerosi tipi di cancro umani, tra i quali il cancro del seno, del colon e del polmone. A differenza di quanto avviene per le mutazioni che trasformano i proto-oncogeni in oncogeni, quelle a carico di geni oncosoppressori sono recessive, poiché la proliferazione cellulare può avvenire soltanto se entrambi gli alleli sono inattivati. Gli oncogeni possono quindi essere individuati in laboratorio in quanto stimolano la crescita delle cellule in coltura, mentre così non avviene per i geni oncosoppressori. L’introduzione di oncosoppressori in cellule in coltura non determina nessun cambiamento, oppure uccide le cellule. Un certo numero di oncosoppressori è stato clonato a livello molecolare e messo in relazione con alcune forme ereditarie di tumore nell’uomo (vedi Tabella 20.3). I prodotti di questi geni sono ubiquitari nella cellula. RB, il gene oncosoppressore del retinoblastoma RB è un gene oncosoppressore (OMIM 180200) che prende il nome dal retinoblastoma, un tipo di tumore infantile dell’occhio a cui è stato strettamente associato (Figura 20.7). Il retinoblastoma si manifesta tra la nascita e i 4 anni di età ed è la forma più comune di tumore dell’occhio nei bambini. Se diagnosticato precocemente, oltre il 90% dei tumori dell’occhio può essere distrutto in modo definitivo, per esempio con il laser o la radioterapia. Esistono due forme di retinoblastoma. Nel retinoblastoma sporadico (60% dei casi) lo sviluppo di un tumore dell’occhio è un evento spontaneo in un paziente nella cui famiglia non sono presenti casi precedenti dello stesso tumore. In questi casi si sviluppa un tumore unilaterale. Nel retinoblastoma ereditario (40% dei casi) la predisposizione a sviluppare tumori agli occhi viene ereditata. I pazienti con questa forma di retinoblastoma sviluppano generalmente tumori in entrambi gli occhi (tumori bilaterali), spesso in un’età inferiore a quella nella quale si sviluppano i tumori unilaterali nei pazienti con retinoblastoma sporadico. Nel 1971 Alfred Knudson propose il seguente modello per spiegare l’origine delle forme sporadiche ed ereditarie di retinoblastoma. “Il retinoblastoma è un cancro causato da due eventi mutazionali... Una mutazione è

La genetica del cancro

ereditata per via germinale mentre la seconda avviene nelle cellule somatiche. Nella forma non-ereditaria invece entrambe le mutazioni avvengono nelle cellule somatiche”.* Il modello delle due mutazioni di Knudson, come esemplificato per il retinoblastoma, è illustrato nella Figura 20.8. Per il retinoblastoma sporadico (Figura 20.8a) un figlio nasce con due copie selvatiche del gene del retinoblastoma (genotipo RB/RB) e deve avvenire una mutazione in ciascun allele nella stessa cellula dell’occhio per produrre due alleli mutati rb. Poiché la probabilità di avere due eventi mutazionali nella stessa cellula è molto bassa, ci si attende che i pazienti con retinoblastoma sporadico sviluppino prevalentemente tumori unilaterali, come infatti avviene. Inoltre, la rarità dell’evento di mutazione significa che le due copie del gene vengano mutate in tempi diversi, con la prima mutazione che produce una cellula RB/rb. Una seconda mutazione nella stessa cellula produce il genotipo omozigote rb/rb, che determina lo sviluppo del tumore oculare. Nel retinoblastoma ereditario i pazienti ereditano una copia mutata del gene del retinoblastoma attraverso la linea germinale, * Knudson, A.G. Jr. 1971. Mutation and cancer: statistical study of retinoblastoma. Proc. Natl. Acad. Sci. USA 68:820-823.

519

cioè sono eterozigoti RB/rb (Figura 20.8b). Di conseguenza è necessaria soltanto una singola mutazione del gene del retinoblastoma in una qualsiasi cellula dell’occhio per produrre un omozigote rb/rb, che causa lo sviluppo del tumore. Dato il numero di cellule in una retina in via di sviluppo e il tasso di mutazione per cellula, è molto probabile che questo avvenga, almeno in alcune cellule, portando alla perdita di eterozigosi (LOH, Loss Of Heterozigosity, vedi Box 20.1; qui una mutazione nell’allele RB). Va sottolineato che il retinoblastoma è tra i pochissimi tipi di cancro nei quali le mutazioni in un unico gene sono cruciali per lo sviluppo tumorale. In questo caso si tratta di mutazioni in un gene per un regolatore negativo della proliferazione, cioè un oncosoppressore. Nella maggior parte dei casi, invece, il cancro si sviluppa come un processo a varie tappe che prevede mutazioni in geni diversi, implicati nel controllo della divisione cellulare (come vedremo più avanti). Secondo il modello di Knudson la mutazione che causa il retinoblastoma è recessiva, perché il cancro si sviluppa solo se entrambi gli alleli sono mutati. Tuttavia, se uno degli alleli mutati viene ereditato attraverso la linea germinale, per la formazione del tumore basta un unico evento di mutazione a carico dell’allele selvatico rimasto in una cellula qualsiasi di quel particola-

Tabella 20.3 Esempi di geni oncosoppressori Gene

Tipo di cancro

Funzione della proteina

Sindrome ereditaria

Localizzazione cromosomica

APC

Carcinoma del colon

Adesione cellulare

Poliposi adenomatosa familiare (FAP)

5q21-q22

BRCA1

Cancro del seno

Ha un possibile dominio di attivazione trascrizionale; interagisce con l’apparato di riparazione del danno al DNA

Cancro del seno e dell’ovaio

17q21

BRCA2

Cancro del seno

Ha un possibile dominio di attivazione trascrizionale; interagisce con l’apparato di riparazione del danno al DNA

Cancro del seno

13q12-q13

DCC

Carcinoma del colon

Adesione cellulare

Implicato nel cancro del colon-retto

18q21.3

NF1

Neurofibromi

Proteina che attiva la GTPasi

Neurofibromatosi di tipo I

17q11.2

NF2

Schwannomi e meningiomi

Lega la glicoproteina di superficie cellulare al citoscheletro di actina?

Neurofibromatosi di tipo II

22q12.2

p16

Melanoma e altri

Inibitore di Cdk

Melanoma familiare

9p21

RB

Retinoblastoma

Regolazione del ciclo cellulare e della trascrizione

Retinoblastoma

13q14.1-q14.2

TP53

Ampia gamma

p53 è un fattore di trascrizione

Sindrome di Li-Fraumeni

17p13.1

VHL

Cancro del rene, tumori del pancreas e altri

Allungamento della trascrizione

Sindrome di von Hippel-Lindau

3p26-p25

WT1

Nefroblastoma

Attivatore o repressore della trascrizione a seconda del tipo cellulare

Tumore di Wilms 1

11p13

520

Capitolo 20

Box 20.1

Meccanismi genetici responsabili della perdita dell’eterozigosi (LOH)

Nelle forme familiari di tumori, l’individuo eredita generalmente un allele mutato di un oncosoppressore mentre l’altro allele è normale. Sebbene questa mutazione sia recessiva (le mutazioni a carico dei geni oncosoppressori sono generalmente associate a perdita di funzione), negli alberi genealogici di questo tipo di tumori mostra una alta penetranza ed una trasmissione che appare dominante. Questo avviene perché durante le divisioni mitotiche delle cellule somatiche di un individuo eterozigote per la mutazione, si verifica una perdita dell’eterozigosi o LOH (Loss Of Heterozigosity) con perdita funzionale del prodotto del gene oncosoppressore. Quali sono i meccanismi molecolari alla base della LOH? La perdita di eterozigosi può essere dovuta all’insorgere di nuove mutazioni puntiformi (evento tuttavia raro perché, normalmente, queste vengono facilmente riparate), delezioni o silenziamento epigenetico. Tuttavia sono stati descritti altri meccanismi genetici più specifici per la LOH: la non-disgiunzione mitotica, la ricombinazione mitotica e la conversione genica (quest’ultima sarà descritta nel a)

Capitolo 23). Nel primo meccanismo, la non disgiunzione dei cromatidi durante la mitosi produce due cellule: una con tre cromatidi e una con un solo cromatidio (cellula non funzionale e quindi generalmente eliminata). La cellula con tre cromosomi tende a perderne uno. Se la cellula con tre cromosomi, due con l’allele mutato e uno normale, perde proprio quest’ultimo, si avrà LOH (Figura box 20.1a). Il secondo meccanismo consiste in un evento di ricombinazione tra cromatidi di due cromosomi omologhi in mitosi, che coinvolge il locus del gene oncosoppressore. Casualmente, durante la segregazione dei cromatidi, si potranno generare cellule con due cromosomi entrambi mutati, come quelli mostrati in Figura box 20.1b. In genere, l’inattivazione del secondo allele del gene oncosoppressore viene evidenziata come perdita di eterozigosi di un marcatore polimorfico a esso associato e in tal modo è stata verificata anche in cellule in coltura. Attualmente sono in corso applicazioni su larga scala di mappatura dei loci più soggetti a LOH, mediante l’analisi di SNP. b)

Mitosi con non-disgiunzione dei cromatidi contenenti la mutazione dell’oncosoppressore

LOH per perdita casuale del cromosoma sovrannumerario con l’allele normale

Ricombinazione tra cromatidi omologhi in mitosi

LOH per segregazione di due cromatidi con l’allele mutato nella stessa cellula

Figura Box 20.1a LOH da non disgiunzione mitotica (a) e da ricombinazione mitotica (b). L’allele mutato dell’oncosoppressore è indicato in rosso.

re tessuto. Poiché quest’evento ha un’alta probabilità di verificarsi, dall’osservazione degli alberi genealogici la mutazione sembra dominante. Quindi per il retinoblastoma ereditario, e in generale per le neoplasie eredita-

rie, l’ereditarietà di una singola mutazione predispone la persona al cancro, ma non lo causa direttamente, poiché è necessaria una seconda mutazione per avere la perdita di eterozigosi. Per questo motivo, in questo tipo di fami-

La genetica del cancro a) Retinoblastoma sporadico. Due mutazioni indipendenti del gene (RB) del retinoblastoma sono necessarie perché si manifesti il cancro.

RB

RB

Due mutazioni

RB

b) Retinoblastoma ereditario. Un individuo eredita un singolo allele (rb) mutato del retinoblastoma; la mutazione dell’altro allele normale causerà poi il cancro.

Cellula della retina alla nascita

RB/RB-normale crescita cellulare Prima mutazione

521

RB

rb

RB/rb-mutazione RB ereditata; normale crescita cellulare

rb

Seconda mutazione

RB/rb-normale crescita cellulare Seconda mutazione

Figura 20.7 Un tumore dell’occhio in un paziente con retinoblastoma.

glie si parla generalmente di predisposizione ereditaria al cancro. Un sostegno all’ipotesi di Knudson venne negli anni ottanta del secolo scorso dall’analisi dei cromosomi di cellule tumorali e di tessuti normali di pazienti con retinoblastoma. Fu scoperto che molti pazienti portavano delezioni in una regione del cromosoma 13 e, mediante analisi genetica, il gene RB venne mappato sul cromosoma 13 nella zona cromosomica 13q14.1-q14.2. RB è stato clonato nel 1986, è lungo circa 180 kb e codifica un mRNA di 4,7 kb che, tradotto, produce la fosfoproteina (ovvero una proteina che può essere fosforilata) nucleare pRB di 928 amminoacidi, coinvolta nella regolazione del ciclo cellulare al checkpoint G1-S (Figura 20.2). Durante la fase G1 si formano due complessi Cdk-ciclina, ovvero Cdk4-ciclina D e Cdk2-ciclina E (Figura 20.9). Questi complessi determinano la progressione nella fase S catalizzando una serie di fosforilazioni di proteine che controllano il ciclo cellulare, compresa pRB. pRB si trova in un complesso con il fattore trascrizionale E2F e, quando pRB non è fosforilata, l’attività di E2F è inibita. Allorché pRB viene fosforilata, l’inibizione dell’attività di E2F viene eliminata e il fattore trascrizionale ora attivo avvia la trascrizione di geni per la sintesi del DNA. Quando la cellula inizia la sintesi del DNA, le cicline D ed E vengono degradate e viene

rb

rb

rb

rb

rb/rb-perdita del controllo della crescita

rb/rb-perdita del controllo della crescita

Tumore all’occhio

Tumore all’occhio

Figura 20.8 Il modello di Knudson delle due mutazioni per i tumori di tipo familiare.

prodotta la ciclina A. Si forma dunque un complesso Cdk2-ciclina A che attiva la replicazione del DNA. Dopo la fase S, pRB viene nuovamente defosforilata ed E2F viene reso inattivo. In una cellula con due alleli rb mutati, pRB è incapace di legare il complesso E2F, che è quindi libero di attivare i geni per la sintesi del DNA. Avviene così la divisione cellulare incontrollata. Come già accennato, molti virus tumorali a DNA (per esempio gli adenovirus ed SV40) svolgono la loro azione di induzione del tumore in parte attraverso un processo nel quale le proteine codificate dai loro oncogeni formano nella cellula complessi proteici con pRB, bloccandone la capacità di legare E2F e inattivandone la funzione di soppressione. È stato dimostrato che sia mutazioni puntiformi sia delezioni del gene RB portano alla perdita della funzione di pRB nei pazienti con retinoblastoma. In circa il 5% dei pazienti con retinoblastoma, l’anomalia genetica può es-

522

Capitolo 20 Ciclina D

La ciclina D viene degradata

Ciclina E Cdk4 pRB

Cdk2 pRB E2F

E2F attivato trascrive geni per la sintesi del DNA

La ciclina A viene sintetizzata

Cdk2

Cdk2

E2F

Ciclina A

pRB E2F

Replicazione del DNA attivata

G1

S

Figura 20.9 Ruolo di pRB nella regolazione del ciclo cellulare al checkpoint G1-S.

sere individuata mediante analisi del cariotipo. Negli altri casi invece è difficile individuare la mutazione, anche mediante analisi molecolari.

Nota chiave Il modello delle due mutazioni spiega la differenza tra tumori familiari (ereditari) e sporadici (non ereditari). Nel cancro di tipo familiare una mutazione viene ereditata, rendendo così la persona predisposta al cancro. Infatti, il secondo allele può essere facilmente perso o mutato portando alla perdita di eterozigosi. Quando la seconda mutazione avviene successivamente nelle cellule somatiche, il cancro può svilupparsi. Nel cancro sporadico entrambe le mutazioni avvengono nelle cellule somatiche, quindi questi tipi di cancro insorgono più tardivamente rispetto ai cancri familiari, poiché la probabilità che avvengano due mutazioni è più bassa della probabilità che ne avvenga una sola.

MyLab

Il gene oncosoppressore TP53 Il gene oncosoppressore TP53 (Tumor Protein 53, OMIM 191170) codifica per una proteina del peso molecolare di 53 kDa, chiamata p53. La mutazione di p53 è nimazione coinvolta nello sviluppo di circa il 50% dei tipi di canIl gene cro umani, compresi il canoncosoppressore cro del seno, del cervello, TP53 del fegato, del polmone, del colon-retto, della vescica e delle cellule del sangue. In altri tumori la proteina, pur non essendo mutata, è inattivata mediante diversi meccanismi (per esempio la sua degradazione o delocalizzazione dal nucleo dove svolge la sua funzione). Oltre alle mutazioni con perdita di funzione (le più frequenti), sono state identificate anche mutazioni con guadagno di funzione. In questo caso la proteina mutante si comporta da oncogene, bloccando l’attivi-

tà della proteina normale (forma complessi trascrizionalmente inattivi) e attivando l’espressione di geni coinvolti nella proliferazione cellulare e nella motilità/invasività della cellula. Il gene umano TP53 è localizzato nel sito del cromosoma 17p13.1. Individui che ereditano una copia mutata di TP53 sviluppano la sindrome di Li-Fraumeni, una rara forma di cancro che viene ereditata come un carattere autosomico dominante perché il cancro si sviluppa quando la seconda copia di TP53 viene mutata. Individui con questa sindrome sviluppano cancri in diversi tessuti, tra i quali seno e sangue, tumori rari e spesso bilaterali. La proteina p53, costituita da 393 amminoacidi, è un fattore di trascrizione regolato dalla fosforilazione e dalla sua interazione con un’altra fosfoproteina, il regolatore negativo Mdm2 (Figura 20.10). In una cellula normale, entrambe le proteine non sono fosforilate, il che consente loro di legarsi. Mdm2 stimola la degradazione di p53 e, come risultato, la quantità di p53 nella cellula è bassa. Quando il DNA è danneggiato, p53 avvia una cascata di eventi che portano all’arresto in G1. Il danno del DNA determina la fosforilazione di entrambe le proteine, p53 e Mdm2, a livello dei domini dove esse di norma interagiscono. Quindi, il complesso p53-Mdm2 non si può formare, la degradazione di p53 non viene indotta e p53 si accumula. Funzionando come fattore trascrizionale, p53 avvia la trascrizione dei geni per la riparazione del DNA e di WAF1, che codifica una proteina del peso di 21 kDa, chiamata p21. La proteina p21 si lega al complesso Cdk4-ciclina D del checkpoint G1-S e ne inibisce l’attività.* Ne risulta che pRB nel complesso pRB-E2F non viene fosforilata, e quindi mantiene inibito E2F. L’entrata nella fase S viene bloccata (Figura 20.10) e la cellula si arresta in G1. p53 fornisce una certa protezione contro gli oncogeni. L’espressione di oncogeni virali o cellulari come ras * La proteina p21 si può legare anche ad altri complessi Cdk-ciclina e può inibire la loro attività, bloccando così il ciclo cellulare in ogni fase. L’esempio qui riportato si focalizza sulla proteina del retinoblastoma e sulla fase G1-S del ciclo cellulare.

La genetica del cancro Cellula normale Mdm2 Mdm2 Mdm2 stimola la degradazione di p53. I livelli cellulari di p53 sono bassi.

p53 p53 Cellula con danni al DNA Induzione di danno al DNA

Porta alla fosforilazione di Mdm2 e di p53 Mdm2 Mdm2 e p53 non possono legarsi. p53 si accumula. p53 Attivazione di WAF1 WAF1 Promotore p21

Ciclina D Cdk4

Attività chinasica Assenza di attività chinasica L’assenza della chinasi determina l’assenza di fosforilazione di pRB e quindi E2F non è attivato. L’entrata in fase S è bloccata. G1

S

Arresto in G1

Figura 20.10 La funzione di p53 nel controllo del ciclo cellulare.

induce l’espressione del gene ARF. Il prodotto di ARF, la proteina p14, si lega a Mdm2 nel complesso p53-Mdm2 e blocca la degradazione di p53 da parte di Mdm2. In qualche modo, la richiesta di fosforilazione di p53 per l’attivazione della trascrizione viene resa non necessaria. p53 svolge un ruolo anche nella morte cellulare programmata (apoptosi), un processo mediante il quale una cellula con un livello elevato di danno al DNA si suicida. Durante l’apoptosi il DNA viene degradato e il nucleo si condensa, e la cellula può essere eliminata dai fagociti. In questo processo p53 non induce i geni della riparazione del DNA né WAF1, ma attiva il gene BAX per la via metabolica dell’apoptosi. La proteina BAX blocca la funzione della proteina BCL-2, che è un repressore

523

della cascata di segnali per l’apoptosi. Senza il repressore BCL-2 in forma attiva, la via di segnale che induce l’apoptosi viene attivata e la cellula si suicida. Se entrambi gli alleli di TP53 portano mutazioni con perdita di funzione, non può essere prodotta una proteina p53 attiva. Così WAF1 non può essere attivato e non c’è p21 disponibile per bloccare l’attività di Cdk, quindi la cellula non è in grado di arrestarsi in G1. La cellula può dunque procedere nella fase S anche se ciò non è conveniente. Nello stesso modo, una cellula con un livello elevato di danno al DNA non sarà in grado di andare incontro a morte cellulare programmata. La maggior parte delle mutazioni con perdita di funzione di TP53 avviene nella parte del gene che codifica per il dominio di legame al DNA del fattore di trascrizione p53, per cui le molecole di p53 mutate non sono capaci di attivare la trascrizione dei geni bersaglio. Sono stati prodotti topi transgenici con delezione di entrambi gli alleli di TP53. Questi topi knock-out TP53–/TP53– in realtà sono vitali e si sviluppano, il che dimostra che il gene TP53 non è essenziale per i processi di crescita, divisione e differenziamento cellulare, almeno nel topo. I topi knock-out hanno però mostrato come fenotipo principale un’alta percentuale di cancro dai primi sei mesi di vita (75%) fino a raggiungere il 100% dopo 10 mesi di vita. Queste osservazioni sono a sostegno del ruolo di p53 nella soppressione di tumori e nel mantenimento della stabilità genetica delle cellule. I geni oncosoppressori del tumore della mammella Negli Stati Uniti vengono diagnosticati ogni anno oltre 185 000 nuovi casi di cancro al seno, che costituiscono oltre il 31% di tutte le nuove neoplasie diagnosticate nelle donne, e oltre 46 000 donne muoiono ogni anno a causa di questa forma di cancro. Nei Paesi sviluppati esiste una probabilità su 10 che nel corso della vita a una donna sia diagnosticato il cancro del seno, e l’età media di insorgenza è 55 anni. Circa il 5% dei cancri del seno è ereditabile e, come nel caso del retinoblastoma ereditario, questa forma di cancro si manifesta più precocemente rispetto alla forma sporadica ed è spesso bilaterale. Due tra i numerosi geni coinvolti nel cancro del seno familiare sono BRCA1 (OMIM 113705) e BRCA2 (OMIM 600185). La maggior parte dei cancri ereditari del seno sembra dipendere da mutazioni in uno di questi due geni, con una maggioranza di casi a carico di BRCA1. Il gene della suscettibilità al cancro BRCA1 mappa in posizione 17q21. Mutazioni a carico di BRCA1 portano anche a suscettibilità al cancro ovarico. Il gene si estende per oltre 100 kb, è trascritto in numerosi tessuti, tra i quali il seno e le ovaie, e produce un mRNA di 7,8 kb, che è tradotto in una proteina di 1863 amminoacidi del peso di 190 kDa. La proteina BRCA1 svolge numerose funzioni, comprese le risposte cellulari ai danni al DNA (la proteina è essenziale per la riparazione del danno), la regolazione della

524

Capitolo 20

trascrizione e l’aggiunta di ubiquitina alle proteine (le proteine ubiquitinate sono destinate alla degradazione). BRCA2 mappa in posizione 13q12-q13 e, a differenza di BRCA1, non è stato associato alla suscettibilità al cancro ovarico. BRCA2 si estende per circa 70 kb e codifica per una proteina di 3418 amminoacidi. Le diverse funzioni proposte per BRCA2 sono simili a quelle di BRCA1.

Nota chiave I geni oncosoppressori, al pari dei proto-oncogeni, sono coinvolti nella regolazione della crescita e della divisione cellulare. Mentre i prodotti normali dei proto-oncogeni esercitano un effetto di stimolo di questi processi, i prodotti selvatici dei geni oncosoppressori svolgono una funzione inibitoria. Ne consegue che quando entrambi gli alleli di un oncosoppressore sono inattivati o persi, l’attività di inibizione viene persa e può avvenire una proliferazione cellulare non programmata. L’inattivazione di geni oncosoppressori è coinvolta nello sviluppo di numerosi tipi di cancro nell’uomo, compresi quelli familiari del seno e del colon.

presentano omologia con geni di E. coli e di lievito coinvolti nella riparazione del DNA. hMSH2, per esempio, è omologo di mutS in E. coli, mentre gli altri tre sono omologhi di mutL di E. coli. Il ruolo di questi geni nel meccanismo di riparazione degli appaiamenti di base errati (mismatch) lasciati dopo la replicazione del DNA è stato ben caratterizzato in E. coli (questo meccanismo di riparazione è descritto nel Capitolo 7). I geni di lievito svolgono un ruolo molto simile. In altre parole, questi geni di E. coli, di lievito e umani sono tutti geni mutatori perché sono coinvolti nei sistemi di riparazione del DNA. Mutazioni in questi geni rendono la replicazione del DNA soggetta a errori e di conseguenza il tasso di mutazione è significativamente più alto rispetto alle cellule normali. Che il gene umano hMSH2 fosse effettivamente un gene mutatore è stato confermato da un esperimento nel quale un cDNA di hMSH2 è stato clonato in un plasmide ed espresso in E. coli. Ciò ha portato a un accumulo di mutazioni dieci volte superiore al normale perché hMSH2 interferiva con il normale meccanismo di riparazione batterico. Attualmente sono disponibili dei saggi basati sull’analisi del DNA per diagnosticare la presenza di forme mutate di questi quattro geni, che permettono di individuare individui portatori mediante analisi del sangue.

I geni mutatori Si definisce gene mutatore un qualsiasi gene che, una volta mutato, aumenta la frequenza di mutazioni spontanee in altri geni. In una cellula normale, i geni mutatori sono geni che svolgono funzioni fondamentali quali la replicazione del DNA e la riparazione del DNA danneggiato. Mutazioni a carico di questi geni possono influenzare negativamente questi processi in modo significativo e possono rendere la cellula soggetta a errori e all’accumulo di mutazioni. Per illustrare come una mutazione in un gene mutatore possa portare al cancro, prenderemo come esempio il cancro del colon ereditario non poliposico (HNPCC; OMIM 120435). L’HNPCC è un malattia genetica autosomica dominante che causa l’insorgenza precoce di cancro del colon-retto. A differenza della poliposi adenomatosa ereditaria, o familiare (FAP), nel caso di HNPCC non si ha la formazione di adenomi (polipi o tumori benigni). Dal 5 al 15% dei cancri del colon-retto sono del tipo HNPCC. Sono stati identificati quattro geni umani chiamati hMSH2, hMLH1, hPMS1 e hPMS2 ciascuno dei quali, quando è mutato, dà come fenotipo la predisposizione a HNPCC. I primi due insieme sono responsabili di circa il 90% dei casi di HNPCC, mentre gli altri due sono coinvolti in circa il 5% dei casi. Per la formazione del tumore è necessaria una seconda mutazione che inattivi l’allele normale. Perciò, poiché la probabilità che questo evento accada è molto alta, dall’analisi degli alberi genalogici HNPCC sembra dominante. Tutti i quattro geni

Nota chiave I geni mutatori, se mutati, aumentano la frequenza di mutazioni di altri geni. La forma normale di questi geni mutatori è coinvolta in attività cellulari importanti come la replicazione e la riparazione del DNA.

I geni dei microRNA I microRNA (miRNA) sono brevi molecole a singolo filamento di RNA non codificanti, a funzione regolativa (vedi Capitolo 18). Essi negli eucarioti silenziano i geni dopo la trascrizione attraverso il meccanismo di interferenza dell’RNA (iRNA). Il processo di silenziamento consiste nel legame di un miRNA alle sequenze complementari o quasi complementari nelle regioni 3′ non tradotte (UTR) di specifici mRNA bersaglio, con conseguente inibizione della traduzione di questi mRNA e loro degradazione. Oggi è noto che i miRNA hanno ruoli importanti nella regolazione dell’espressione genica collegata a molti processi biologici. Per esempio, i miRNA sono coinvolti nel controllo di molti processi cellulari e fisiologici fondamentali, compresi la proliferazione cellulare e il differenziamento, l’apoptosi, lo sviluppo dei tessuti e degli organi. Per quanto riguarda il cancro, si stanno accumulando prove che i miRNA svolgano un ruolo signifi-

La genetica del cancro

cativo nella trasformazione cellulare e nella cancerogenesi nell’uomo, e questo stimola nuove ricerche nel campo della biologia dei tumori. Per esempio, nei tumori umani studiati, numerosi geni per i miRNA mostrano un alterato profilo di espressione. Più specificamente, ciascuna forma di cancro ha un distinto profilo di espressione di miRNA che differisce da quello dell’equivalente tessuto normale e da quello di altri tipi di cancro. Nei vari tipi di cancro nei quali un certo miRNA mostra un cambiamento di espressione, questo cambiamento è spesso lo stesso – in direzione di un aumento oppure di una diminuzione dell’espressione. Per esempio, il microRNA miR-155 è sovraespresso nel cancro della mammella, del polmone, nel linfoma e nel cancro della tiroide rispetto ai tessuti normali equivalenti. Al contrario, il miRNA let-7 è sottoespresso nel cancro della mammella, del fegato, del polmone e della tiroide. I geni per i miRNA che hanno un aumento di espressione nelle cellule tumorali si comportano come oncogeni. L’azione normale di questi miRNA è il controllo dell’espressione degli mRNA bersaglio che sono i trascritti di particolari geni oncosoppressori e di altri geni coinvolti nel controllo negativo del differenziamento cellulare e dell’apoptosi. La sovraespressione dei geni per i miRNA silenzia i geni bersaglio, rimuovendo i segnali inibitori per la proliferazione cellulare. Per esempio, la sovraespressione dei miRNA miR-372 e miR373 sembra che stimoli la proliferazione cellulare e quindi lo sviluppo di tumori attraverso l’inibizione dell’espressione dell’oncosoppressore LATS2. Come conseguenza di questa inibizione, il blocco mediato da p53 dell’attività di Cdk4 non avviene e la cellula progredisce da G1 verso S. I geni per i miRNA che mostrano una diminuzione di espressione nelle cellule tumorali sono considerati degli oncosoppressori. In una cellula normale questi miRNA aiutano a prevenire lo sviluppo del tumore bloccando la traduzione degli mRNA di particolari proto-oncogeni cellulari e forse di altri geni che controllano il differenziamento e l’apoptosi. Se questi geni per i miRNA sono sottoespressi, i livelli di miRNA capaci di silenziare l’espressione dei loro geni bersaglio saranno insufficienti. Di conseguenza il controllo della proliferazione cellulare è sregolato o perduto. Per esempio, la famiglia dei miRNA let-7 svolge ruoli critici nella programmazione temporale dello sviluppo. In C. elegans, dove è stato scoperto per la prima volta, l’espressione di livelli normali del miRNA let-7 è necessaria per la transizione dal quarto stadio larvale alla forma adulta. In seguito, si è trovato che il gene let-7 è altamente conservato negli animali, dai vermi all’uomo. Nell’uomo il gene let-7 è localizzato in una regione del genoma che spesso è deleta nei tumori. Come detto prima, let-7 è sottoespresso in numerosi tumori, compreso il cancro del polmone. Per confermare l’ipotesi che let-7 è un oncosoppressore i ricercato-

525

ri hanno sovraespresso il gene in cellule in coltura derivate da cancro umano del polmone. Come atteso per un oncosoppressore, questa sovraespressione ha inibito la proliferazione cellulare incontrollata. Un noto bersaglio del miRNA let-7 è l’mRNA trascritto dal proto-oncogene ras. I tessuti di tumore del polmone mostrano livelli significativamente aumentati di proteina Ras in confronto a tessuti polmonari normali. Questo significa che let-7 si comporta come un gene oncosoppressore che esercita la propria azione regolando l’espressione del proto-oncogene ras. In conclusione, i miRNA sono oggetto di grande interesse nella ricerca sul cancro. Gli studi sui miRNA nel cancro stanno stimolando nuove intuizioni sulle cause molecolari del cancro. In più, i profili di espressione peculiari dei miRNA in differenti tipi di tumore hanno un grande potenziale per lo sviluppo di nuovi strumenti diagnostici, e come bersaglio per nuove terapie specifiche che potrebbero essere utilizzate nella prevenzione e nel trattamento del tumore.

Nota chiave I geni per i microRNA (miRNA) codificano brevi molecole di RNA regolatori, non codificanti, a singolo filamento, che silenziano l’espressione di geni a livello post-trascrizionale, legandosi al 3’ UTR di un mRNA bersaglio e quindi indirizzando la molecola verso l’accumulo o la degradazione. Molti miRNA mostrano profili di espressione alterati nei tumori umani; questi profili sono specifici per il tumore e hanno una potenziale utilità nello sviluppo di strumenti per la diagnosi, i trattamenti preventivi e nuove terapie contro il cancro. I geni che codificano i miRNA e che sono sovraespressi nei tumori sono considerati degli oncogeni, mentre quelli che sono sottoespressi nei tumori sono da considerare degli oncosoppressori.

Attività Siete un ricercatore di una clinica per lo studio del cancro e state studiando l’origine di una forma rara di cancro della vescica nell’iAttività Tracking Down the Cause of Cancer (Inseguire le cause del cancro) nel sito web degli studenti.

L’accorciamento dei telomeri, la telomerasi e il cancro umano I telomeri sono le estremità dei cromosomi eucariotici (Capitolo 2). Nella maggior parte degli eucarioti i telomeri sono costituiti da brevi sequenze ripetute; nell’uomo la sequenza è 5′-TTAGGG-3′. Durante i cicli cellula-

MyLab

526

Capitolo 20

ri che si susseguono i telomeri si accorciano perché l’oligonucleotide di innesco richiesto dalla DNA polimerasi per la sintesi di nuovo DNA viene eliminato (Capitolo 3). Questo accorciamento può essere controbilanciato dall’azione della telomerasi, che aggiunge nuove sequenze ripetute telomeriche alle estremità dei cromosomi. In anni recenti il ruolo dell’accorciamento dei telomeri e dell’attività della telomerasi sono stati studiati in relazione allo sviluppo di cancro nell’uomo. Come abbiamo visto nel Capitolo 3, le cellule umane hanno una capacità ridotta di proliferare in coltura. I fibroblasti in coltura, per esempio, sono in grado di effettuare circa 50 cicli di divisioni cellulari. In seguito le cellule smettono di dividersi e normalmente non si divideranno più: esse vanno incontro a senescenza replicativa. La senescenza replicativa è causata da cambiamenti nella struttura dei telomeri. Le cellule umane, cioè, con l’eccezione delle cellule della linea germinale e di alcune cellule staminali, non hanno un’attività di telomerasi significativa, e quindi i loro telomeri si accorciano a ogni ciclo cellulare. Alla fine i telomeri sono così corti che il complesso tra le sequenze telomeriche e le proteine che le legano risulta impossibile e si ha un danno al DNA. Questo danno è simile a quello che innesca l’apoptosi coinvolgendo p53, come discusso in precedenza; pertanto, in una cellula senescente normale, ogni ulteriore divisione cellulare risulta bloccata. Tuttavia, supponiamo che una di queste cellule subisca una mutazione in un gene che controlla l’arresto normale del ciclo cellulare, come TP53; quella cellula si dividerà e prolifererà anche con i telomeri troppo corti. La perdita di p53 determinerà anche un’instabilità cromosomica e l’accumulo di altre mutazioni. È poco probabile però che queste cellule si dividano per molte generazioni a causa dei telomeri troppo corti. Tali cellule possono tuttavia diventare immortali (cioè proliferare in modo illimitato) se la telomerasi è nuovamente attivata, consentendo di riparare le estremità cromosomiche e di stabilizzare i cromosomi. Queste cellule portano già mutazioni che influenzano il ciclo cellulare e di norma accumulano altre mutazioni che le spingono verso lo stato canceroso. Riassumendo, le mutazioni nelle cellule sono la causa principale del cancro. La telomerasi non è presente nella maggior parte delle cellule e dei tessuti normali, ma l’enzima è riattivato come evento secondario in tutti i principali tipi di cancro umano. La telomerasi permette alle cellule tumorali di mantenere la lunghezza dei telomeri, stabilizzando i cromosomi e dando loro la capacità di proliferare in modo indefinito. In alcuni modelli animali di tumori è stato dimostrato che l’inibizione dell’attività della telomerasi nelle cellule tumorali porta all’accorciamento dei telomeri e quindi alla senescenza replicativa e alla morte della cellula. Vi sono delle prospettive potenziali per utilizzare questa strategia nel trattamento del cancro.

La natura multifasica del cancro Lo sviluppo della maggior parte dei tipi di cancro è un processo a tappe, che porta all’accumulo di mutazioni in un certo numero di geni. Sembra che, per l’induzione del cancro, occorrano probabilmente sei o sette mutazioni indipendenti che si accumulano nel corso della vita durante varie decadi. Gli eventi multipli di mutazione coinvolgono sia il cambiamento di proto-oncogeni in oncogeni, sia l’inattivazione di geni oncosoppressori, con il risultato di alterare in modo irreparabile i meccanismi cellulari complessi che regolano la crescita e il differenziamento. Nella Figura 20.11, a titolo di esempio, viene illustrato il modello molecolare, proposto da Bert Vogelstein, delle mutazioni multiple che portano al cancro del colonretto ereditario o FAP (OMIM 175100). I pazienti con FAP ereditano la perdita del gene APC (poliposi adenomatosa del colon), un gene oncosoppressore localizzato sul cromosoma 5. Questo stesso gene può essere perso precocemente durante la cancerogenesi nelle forme sporadiche di questi tumori. Quando entrambi gli alleli di APC vengono persi in una cellula del colon, si ha un aumento della crescita cellulare. Quindi, affinché si sviluppi il cancro, devono mutare altri geni. Quanto segue descrive una delle possibili serie di eventi che possono accadere; occorre però tener presente che il meccanismo molecolare dello sviluppo del cancro del colon-retto è più complicato e deve essere ancora completamente compreso. Se si ha un’ipometilazione (riduzione della metilazione) del DNA, si può sviluppare un tumore benigno detto adenoma di classe I (un piccolo polipo nell’epitelio del colon o del retto). Se una mutazione trasforma il proto-oncogene ras sul cromosoma 12 in oncogene, le cellule possono formare un tumore benigno più grande, detto adenoma di classe II (un polipo più grande). Successivamente, se entrambe le copie del gene oncosoppressore DCC (deleto nel cancro del colon) sul cromosoma 18 vengono perse, le cellule procedono nell’adenoma di classe III (grandi polipi benigni). La perdita di entrambe le copie del gene TP53 sul cromosoma 17 determina la progressione in un carcinoma (cancro epiteliale), e con la perdita di altri geni possono instaurarsi metastasi. È opportuno far rilevare comunque che questa è solo una delle vie attraverso le quali si può sviluppare una poliposi adenomatosa, ma ne sono possibili altre. Tuttavia, in tutte le varianti osservate, la delezione di APC e la mutazione di ras avvengono generalmente prima delle delezioni di DCC e TP53. Si pensa che cambiamenti progressivi nell’ipometilazione del DNA e nella funzione di oncogeni e geni oncosoppressori avvengano anche per altri tipi di cancro. Il Focus sul genoma di questo capitolo esamina più ampiamente il ruolo della metilazione nello sviluppo dei tumori.

La genetica del cancro

Progressione tumorale e metastasi

Nota chiave Lo sviluppo della maggior parte dei tipi di cancro coinvolge l’accumulo di mutazioni in un certo numero di geni durante un lasso di tempo piuttosto lungo. Questa natura a tappe multiple del cancro implica mutazioni che trasformano proto-oncogeni in oncogeni e inattivano geni oncosoppressori, causando l’alterazione dei meccanismi complessi che regolano la crescita e il differenziamento.

Geni oncosoppressori: APC, DCC, p53 Oncogène: ras

Cellule del colon normali Perdita del gene APC

Aumento della crescita cellulare Ipometilazione del DNA

Adenoma di classe I

Mutazione del gene ras

Adenoma di classe II

Perdita del gene DCC

Adenoma di classe III Perdita del gene TP53

Carcinoma

Perdita di altri geni

Metastasi

527

Come è stato sottolineato all’inizio del capitolo, la fase terminale della progressione tumorale, cioè la metastasi, rappresenta l’evento realmente infausto per il malato di cancro. La metastatizzazione del tumore è un processo estremamente complesso e difficile per la cellula, tuttavia realizzabile nel caso in cui la cellula presenti particolari mutazioni che lo favoriscono. Esaminiamo questo processo più in dettaglio. La metastatizzazione comporta il distacco di cellule tumorali dalla massa tumorale primaria, l’intravasazione nel sistema circolatorio sanguigno e linfatico, l’extravasazione e la “colonizzazione” di un nuovo tessuto con crescita e formazione del tumore “secondario”, cioè la metastasi vera e propria. In questo processo la cellula deve acquisire delle proprietà specifiche (e quindi specifiche mutazioni) che le consentano di muoversi, invadere la matrice extracellulare, farsi strada tra le cellule endoteliali che rivestono i vasi, sopravvivere in condizioni di distacco dal substrato durante la fase di “viaggio” nel sangue e, una volta arrivata nella nuova sede tissutale, riprendere contatti con cellule appartenenti a un tessuto diverso e, infine, sopravvivere in una diversa condizione ambientale. Data la rilevanza clinica di questo processo, negli ultimi anni c’è stato un grande sforzo nella ricerca dei meccanismi molecolari che lo regolano, nella speranza di poter trovare nuovi approcci terapeutici. Così come nel processo di oncogenesi abbiamo distinto geni che controllano positivamente la divisione cellulare (oncogeni) da quelli che la inibiscono (oncosoppressori), analogamente nel processo di metastatizzazione possiamo far riferimento a due categorie di prodotti genici: gli induttori di metastasi e i soppressori di metastasi. Nella prima categoria rientrano per esempio le proteine che regolano il movimento cellulare, gli enzimi capaci di degradare la matrice extracellulare, le proteine che permettono di evadere la morte programmata da mancata adesione cellulare alla matrice tissutale (detta anoikis) e ovviamente i repressori trascrizionali di geni soppressori di metastasi. Nella seconda categoria invece possiamo trovare proteine che fanno parte delle adesioni cellula-cellula e cellula-matrice (che mantengono “legata” la cellula all’interno dei tessuti), inibitori del movimento cellulare o degli enzimi degradatori della matrice extracellulare e i repressori trascrizionali dei geni induttori di metastasi. Inoltre, sia i miRNA sia gli enzimi coinvolti nella regolazione epigenetica dell’espressione genica svolgono un ruolo nella metastasi, così come abbiamo visto per l’oncogenesi. Come è evidente da quanto detto, la genetica della metastasi è molto varia e complessa e nuove categorie di geni vengono continuamente individuate.

Figura 20.11 Un modello multifasico degli eventi molecolari per lo sviluppo della poliposi adenomatosa ereditaria (FAP), un cancro del colon-retto.

528

Capitolo 20

Focus sul genoma Metilazione del DNA e cancro Oggi sappiamo che cambiamenti nel pattern di modifiche epigenetiche, in particolare nella metilazione del DNA in corrispondenza delle isole CpG (vedi Capitolo 18), caratterizzano le cellule tumorali e sono alla base della loro espressione genica aberrante. Approcci genomici possono essere applicati allo studio della biologia del cancro. Una ricerca recente si è focalizzata su circa 25 geni, noti per essere regolati negativamente in cellule trasformate. È stato analizzato il pattern di metilazione relativo ai loro promotori; quindi, mediante approcci bioinformatici, è stata cercata l’omologia tra le loro sequenze regolatrici e altri geni umani. La trascrizione dei geni così identificati è stata testata in presenza o assenza di una molecola capace di bloccare la metilazione del DNA. In questo modo sono stati identificati altri 175 geni trascritti in se-

Sostanze chimiche e radiazioni come cancerogeni Molti agenti naturali e artificiali aumentano la frequenza con cui le cellule diventano cancerose. Questi agenti, perlopiù sostanze chimiche e alcuni tipi di radiazioni, vengono detti cancerogeni. Data l’ovvia rilevanza per l’uomo, vi sono molte informazioni sulla cancerogenesi che coprono vari settori della biologia. Di seguito viene presentata solo una breve trattazione generale. Benché sia stata data molta enfasi al ruolo svolto dai virus come agenti cancerogeni, le sostanze chimiche sono di gran lunga maggiormente responsabili dell’insorgenza di cancro nell’uomo. Gli agenti cancerogeni chimici furono scoperti nel diciottesimo secolo da Sir Percival Pott, un chirurgo inglese che correlò l’incidenza del cancro alla pelle dello scroto di alcuni suoi pazienti con la loro esposizione alla polvere di carbone, quando da ragazzi avevano lavorato come spazzacamini. Dall’inizio dello sviluppo industriale nel diciottesimo secolo a oggi i lavoratori dediti a numerose attività sono stati esposti ad agenti cancerogeni e hanno di conseguenza sviluppato forme di cancro collegate al tipo di occupazione svolta. Per esempio, i radiologi che usano raggi X e radio (radiazioni ionizzanti) e gli agricoltori esposti ai raggi ultravioletti (UV) della luce solare (radiazioni non ionizzanti) sono risultati più soggetti allo sviluppo di cancro della pelle, i lavoratori entrati in contatto con l’amianto a quello del cancro dei bronchi e del polmone, mentre i lavoratori della plastica, esposti a cloruro di vinile, hanno sviluppato più di frequente cancro del fegato.

guito a demetilazione. Basandosi sull’ipotesi che promotori regolati allo stesso modo subissero analoghe modifiche epigenetiche, è stato analizzato il pattern di metilazione dei promotori di tutti questi geni in cellule di diversi tipi di tumore (cancro del polmone, della mammella, della prostata, del colonretto e della cervice). Dall’insieme dei geni analizzati sono emersi 28 geni metilati in maniera anormale in una o più linee cellulari tumorali. In precedenza era stato dimostrato che alcuni di questi geni erano in grado di agire come oncosoppressori, ma gli altri non erano mai stati collegati al tumore. Oggi, i geni identificati in questi studi, e i geni che codificano le proteine che aggiungono e rimuovono gruppi metilici alle sequenze CpG, sono possibili candidati per la terapia del cancro.

I cancerogeni chimici Negli Stati Uniti si è stimato che i cancerogeni chimici sono i responsabili del 50-60% delle morti collegate al cancro, insieme al fumo e alla dieta. I cancerogeni chimici comprendono sostanze chimiche naturali e di sintesi. Si riconoscono due classi principali di sostanze chimiche cancerogene. I cancerogeni ad azione diretta sono quei composti che si legano al DNA e fungono da agenti mutageni. Il secondo gruppo comprende i pro-cancerogeni, che devono essere trasformati metabolicamente in derivati attivi o cancerogeni definitivi; la maggior parte di questi cancerogeni a sua volta si lega al DNA e agisce come mutageno. In entrambi i casi le mutazioni generalmente sono mutazioni puntiformi. (La mutagenicità dei cancerogeni può essere dimostrata con vari test, come il test di Ames, che è stato descritto nel Capitolo 7.) Quindi sia i cancerogeni che agiscono direttamente come tali, sia la maggioranza dei cancerogeni definitivi determinano la trasformazione delle cellule e la formazione di tumori legandosi al DNA e causando mutazioni. Tra gli agenti cancerogeni diretti ci sono gli agenti alchilanti. Esempi di procancerogeni sono gli idrocarburi aromatici policiclici (composti organici policiclici che si trovano nei fumi di combustione del legno, del carbone e delle sigarette, per esempio), i coloranti azoici e i metaboliti naturali come l’aflatossina (prodotta per contaminazione fungina di cibi) e le nitrosammine (prodotte dai nitriti presenti nel cibo). La maggior parte delle sostanze chimiche cancerogene è pro-cancerogena. La trasformazione metabolica dei pro-cancerogeni in cancerogeni avviene per azione degli enzimi cellulari

La genetica del cancro

che agiscono in molte vie metaboliche e coinvolgono, per esempio, idrolisi, ossidazione e riduzione.

Le radiazioni Tutti noi siamo comunemente esposti a diversi tipi di radiazioni, provenienti per esempio dal Sole, dai telefoni cellulari, dal gas radioattivo radon, dalle linee elettriche e da alcuni elettrodomestici. Soltanto il 2% di tutti i decessi per cancro è dovuto alle radiazioni e la maggior parte di questi è rappresentata dal melanoma, una forma molto aggressiva di cancro della pelle che può essere indotta per effetto dell’esposizione ai raggi UV del sole. Le radiazioni ionizzanti, quelle emesse per esempio dagli strumenti a raggi X, dal processo di decadimento di materiale radioattivo e dal gas radon possono essere cancerogene, anche se il rischio è generalmente piuttosto basso. Le radiazioni ionizzanti causano in genere leucemia e cancro alla tiroide. Le radiazioni causano mutazioni nel DNA. L’effetto mutageno della luce ultravioletta, dei raggi X e del radon è discusso nel Capitolo 7. Qui considereremo più in dettaglio l’effetto cancerogeno della luce ultravioletta. La luce ultravioletta è emessa dal sole insieme alla luce visibile e a quella a infrarossi. La luce UV che raggiunge la Terra viene suddivisa in due classi: la luce ultravioletta A (UVA), che va dai 320 ai 400 nm di lunghezza d’onda, e la luce ultravioletta B (UVB), che va dai 290 ai 320 nm. L’intensità di UVA e UVB che raggiunge un individuo sulla Terra dipende da numerosi fattori, che comprendono l’ora del giorno, l’altitudine e le

529

particelle presenti nell’atmosfera, come la polvere. In generale il livello ambientale di UVA è circa tre ordini di grandezza superiore a quello di UVB. La luce UV causa vari tipi di cancro della pelle, il più pericoloso dei quali è quello direttamente collegato a una lunga esposizione alle radiazioni UV. Sia UVA sia UVB sono coinvolte nella cancerogenesi. Le scottature solari sono generalmente causate da UVB, che inducono il cancro della pelle perché le radiazioni di questa lunghezza d’onda sono mutagene (Capitolo 7). Gli UVA hanno un ruolo nel cancro della pelle perché amplificano gli effetti cancerogeni degli UVB. Fortunatamente molti tipi di cancro della pelle possono essere individuati facilmente e rimossi chirurgicamente.

Nota chiave Vari tipi di radiazioni e molte sostanze chimiche aumentano la frequenza con cui le cellule diventano cancerose. Questi agenti sono definiti cancerogeni. Tutti i cancerogeni agiscono provocando danni al genoma delle cellule. Pochi cancerogeni chimici agiscono direttamente sul genoma; la maggior parte di essi invece agisce in modo indiretto. Questi ultimi vengono trasformati metabolicamente in cancerogeni definitivi che si legano al DNA e causano mutazioni. Tutte le radiazioni cancerogene agiscono direttamente sul DNA, inducendo danni fisici e mutazioni.

Sommario l La progressione attraverso il ciclo cellulare è strettamente controllata dall’attività di molti geni. Le molecole chiave per il controllo del ciclo cellulare sono le cicline e le chinasi dipendenti dalle cicline (Cdk). Inoltre, checkpoint in precise fasi del ciclo controllano se la cellula ha danni al DNA o problemi con il meccanismo del ciclo cellulare, e permettono solo alle cellule normali di proseguire. Mentre le cellule normali crescono e si dividono soltanto quando il bilancio di segnali stimolatori e inibitori ricevuti dall’esterno favorisce la proliferazione, la cellula tumorale non risponde a tali segnali normali e si divide senza controllo. Anche la perdita dei checkpoint contribuisce alla trasformazione neoplastica, portando ad accumulo di mutazioni e instabilità genomica. l Le forme mutate di quattro classi di geni – proto-oncogeni, geni oncosoppressori, geni dei microRNA e geni mutatori – possono contribuire alla trasformazione di una cellula verso lo stato tumorale. I prodotti dei proto-oncogeni normalmente stimolano la proliferazione cellulare, i prodotti

dei geni oncosoppressori normalmente inibiscono la proliferazione, i prodotti dei geni dei microRNA normalmente silenziano l’espressione di geni, alcuni dei quali sono coinvolti nel controllo della proliferazione cellulare (compresi proto-oncogeni e oncosoppressori), e i prodotti dei geni mutatori sono coinvolti nella replicazione e nella riparazione del DNA. l Alcuni virus a DNA e alcuni virus a RNA causano tumori. Tutti i virus a RNA che causano tumore sono retrovirus – virus che replicano attraverso un intermedio di DNA – ma non tutti i retrovirus causano tumore. Quando un retrovirus infetta una cellula il genoma a RNA è rilasciato dalla particella virale e viene usato per sintetizzare una copia in cDNA del genoma, chiamata DNA provirale, attraverso l’azione della trascrittasi inversa. Il DNA provirale si integra nel genoma della cellula ospite. Quindi, usando l’apparato trascrizionale dell’ospite, i geni virali vengono trascritti e vengono prodotti RNA virali. La progenie virale si assembla, esce dalla cellula e può così infettare altre cellule.

530

Capitolo 20

l L’induzione di tumore può avvenire dopo l’infezione retrovirale, come conseguenza dell’attività di oncogeni virali (vonc) presenti nel genoma retrovirale. I retrovirus che portano un oncogene sono noti come retrovirus trasducenti. l Le cellule animali normali contengono geni con sequenze di DNA che sono simili a quelle degli oncogeni virali. Questi geni cellulari sono proto-oncogeni che, se mutati, diventano oncogeni cellulari (c-onc) e contribuiscono alla formazione del tumore. l Il modello delle due mutazioni indipendenti per il cancro afferma che sono necessari due eventi mutazionali perché si sviluppi il cancro, uno in ciascuno dei due alleli di un oncosoppressore. Nei cancri familiari (ereditari) una delle due mutazioni viene ereditata, predisponendo la persona al cancro; l’altra mutazione avviene più tardi nelle cellule somatiche. Nel cancro sporadico (non ereditario) entrambe le mutazioni avvengono nelle cellule somatiche. Questo semplice modello si applica a pochissimi tumori; negli altri sono necessarie molte mutazioni in molti geni. l I prodotti normali dei geni oncosoppressori hanno ruoli inibitori sulla crescita e sulla divisione cellulare. Quindi, quando entrambi gli alleli di un oncosoppressore sono inattivati o perduti l’attività inibitoria è persa e può avvenire proliferazione cellulare incontrollata. l I geni dei microRNA codificano per i miRNA, piccole molecole di RNA regolatori non codificanti che silenziano l’espressione dei geni dopo la loro trascrizione. Nei tumori umani, molti miRNA mostrano profili di espressione alterata in relazione al tipo di cancro. I geni dei miRNA sovraespressi in un cancro sono considerati degli oncogeni, mentre i geni dei miRNA sottoespressi nel cancro sono ritenuti degli oncosoppressori.

l I geni mutatori sono geni che, quando mutati, aumentano la frequenza di mutazioni spontanee di altri geni. Nella cellula, le forme normali dei geni mutatori sono coinvolte in attività importanti, come la replicazione e la riparazione del DNA. l Mentre la telomerasi (l’enzima preposto al mantenimento delle estremità dei cromosomi) non è attiva nella maggior parte delle cellule umane normali, questo enzima è generalmente attivo nei tumori umani. La riattivazione della telomerasi non è causa di cancro, ma aiuta le cellule tumorali che hanno i telomeri troppo corti a dividersi indefinitamente, allungando i telomeri e stabilizzando i cromosomi. l Lo sviluppo della maggior parte dei tumori coinvolge l’accumulo di mutazioni in un certo numero di geni lungo un periodo significativo della vita di una persona. Questo processo multifasico coinvolge eventi mutazionali che modificano i proto-oncogeni in oncogeni e inattivano gli oncosoppressori e i geni mutatori, distruggendo i vari meccanismi che salvaguardano la crescita e il differenziamento. l Il processo di metastatizzazione è la fase finale della progressione tumorale. Esso è regolato in modo complesso da diversi geni, la cui mutazione può favorire o sfavorire il processo stesso. l Diversi tipi di radiazioni e molte sostanze chimiche aumentano la frequenza con cui le cellule diventano tumorali. Questi agenti sono chiamati cancerogeni. Praticamente tutti i cancerogeni agiscono causando cambiamenti nel genoma di una cellula. Nel caso dei cancerogeni chimici, pochi agiscono direttamente sul genoma, ma molti agiscono indirettamente essendo convertiti in derivati attivi dagli enzimi cellulari.

Approccio analitico alla soluzione di problemi di genetica D20.1 Un ricercatore ha trovato un retrovirus capace di infettare le cellule nervose umane. Si tratta di un virus completo, in grado di riprodursi autonomamente, e che non contiene oncogeni. Gli individui che ne sono infettati soffrono di encefalite debilitante. Il ricercatore ha dimostrato che, quando infetta cellule nervose in coltura utilizzando il virus intero, le cellule muoiono in seguito alla riproduzione del virus. Tuttavia, se infetta le cellule nervose in coltura con un virus al quale sono stati deleti i geni env o gag, non si ha la morte cellulare. Il ricercatore è interessato a trovare dei modi per far riprendere la crescita alle cellule nervose o per rigenerarle in quei pazienti che hanno subito danni al sistema nervoso. Per esempio, la rigenerazione potrebbe risolvere parzialmente lo stato di paralisi in cui si trova un individuo con una lesione della colonna vertebrale. Il ricercatore ha clonato il gene per il fattore di crescita delle cellule nervose umane e vorrebbe inserirlo nel genoma del retrovirus dal quale ha deleto parti dei geni env o gag. Vorrebbe quindi utilizzare il retrovirus ingegnerizzato per infettare cellule nervose in coltura. Le cellule nervose adulte non producono normalmente grandi quantità del fattore di crescita. Se l’esperimento avesse successo nell’indurre la crescita senza causare morte cellulare, vorrebbe passare a pro-

ve cliniche su pazienti ammalati. Quando il ricercatore sottopone la domanda per ottenere il finanziamento per sostenere questa ricerca, la sua richiesta non viene accettata, con la motivazione che nel suo programma non vi sono adeguate garanzie di sicurezza. Perché questo progetto potrebbe essere pericoloso? R20.1 Nel processo di ingegnerizzazione del retrovirus proposto il ricercatore produrrebbe probabilmente un nuovo virus tumorale, nel quale il fattore di crescita delle cellule nervose clonato costituirebbe l’oncogene. Il fatto che il virus non sia in grado di riprodursi autonomamente è ovviamente un vantaggio, ma sono noti molti virus “selvatici” tumorali difettivi che si riproducono con l’ausilio di altri virus. Se il virus ingegnerizzato infettasse cellule che portano altri virus (per esempio la versione selvatica di quello stesso virus), essi potrebbero fornire le funzioni env e gag e si potrebbe riprodurre e successivamente diffondere un nuovo virus. Potrebbe succedere che l’infezione in vivo di neuroni con il virus ingegnerizzato produca livelli abnormi del fattore di crescita e quindi probabilmente la formazione di tumori del sistema nervoso.

21

Genetica di popolazioni

Come vengono applicati i principi mendeliani per stimare la frequenza dei genotipi e degli alleli in una popolazione?

Qual è il ruolo delle nuove mutazioni nel cambiamento della frequenza allelica nelle popolazioni naturali?

Che cos’è la legge di Hardy-Weinberg e quali assunzioni devono essere poste per poter prevedere come cambiano le frequenze alleliche e genotipiche in una popolazione?

Qual è il ruolo del caso nel cambiamento della frequenza allelica nelle grandi e nelle piccole popolazioni?

In che modo i genetisti applicano la legge di Hardy-Weinberg per dedurre quali forze evolutive causano cambiamenti in una popolazione nel tempo?

In che modo la migrazione cambia le frequenze alleliche tra due popolazioni?

In che modo è possibile verificare se i dati genetici raccolti in una popolazione naturale sono in accordo con le previsioni della legge di Hardy-Weinberg?

In che modo la selezione naturale influenza i cambiamenti delle frequenze alleliche in una popolazione naturale?

Come può essere applicata la legge di HardyWeinberg per stimare la percentuale di individui portatori di un carattere in una popolazione?

In che modo il crossing-over influenza la segregazione degli alleli di loci adiacenti?

Come si misura la variabilità genetica a livello proteico o del DNA in organismi appartenenti a popolazioni naturali?

Attività Poco dopo la riscoperta dei principi di Mendel, i genetisti cominciarono a studiare non solo l’assetto genetico degli individui, ma anche quello delle popolazioni. La genetica di popolazioni consente di stabilire se siano in atto eventi evolutivi in determinati gruppi di individui, e quali siano le forze che portano una popolazione a evolvere. In questo capitolo verrà illustrato come riconoscere le variazioni nell’assetto genetico delle popolazioni, come si misurano tali variazioni e quali sono le loro cause. Quindi, nella iAttività, si studierà la genetica di un tipo di bivalvi che sta rapidamente diffondendosi lungo i corsi d’acqua del Nordamerica.

La scienza della genetica può essere a grandi linee suddivisa in quattro branche principali: la genetica della trasmissione dei caratteri, la genetica molecolare, la genetica quantitativa e la genetica di popolazioni. Ognuna di queste quattro aree è focalizzata su un diverso aspetto dell’ereditarietà. La genetica della trasmissione dei caratteri riguarda principalmente i processi genetici che avvengono negli individui e le modalità con cui i geni

vengono trasmessi da un soggetto all’altro. Pertanto, l’unità di studio della genetica della trasmissione dei caratteri è l’individuo. In genetica molecolare l’interesse principale è rivolto alla natura molecolare dell’ereditarietà, al modo in cui l’informazione genetica viene codificata nel DNA e a come i processi biochimici della cellula traducano l’informazione genetica in un fenotipo; perciò, in genetica molecolare ci si concentra sulla cellula. La genetica di popolazioni, che introduciamo in questo capitolo, applica i principi della genetica classica a grandi gruppi di individui, focalizzandosi sull’ereditarietà di uno o pochi geni. Anche la genetica quantitativa, che sarà il soggetto del Capitolo 22, studia la trasmissione dei caratteri determinati dall’azione simultanea di numerosi geni. Queste ultime due branche della genetica applicano i principi mendeliani e si adattano bene a una trattazione di tipo matematico. In effetti, queste aree ci forniscono gli esempi più antichi e più ricchi di risultati del successo delle teorie matematiche applicate alla biologia. La spinta allo sviluppo di queste aree di ricerca giunse dopo la riscoperta del lavoro di Mendel e delle grandi implicazioni che esso ebbe riguardo alle teorie darwiniane. Infatti, la

532

Capitolo 21

fusione delle teorie mendeliane e di quelle darwiniane viene oggi denominata sintesi neodarwiniana, ed ebbe i suoi sostenitori in Sir Ronald Fisher, Sewall Wright e J.B.S. Haldane (Figura 21.1). La sintesi neodarwiniana è oggi alla base di un’ampia parte della biologia moderna. I genetisti di popolazioni studiano i modelli di variabilità genetica che si riscontrano all’interno di gruppi di individui (la struttura genetica delle popolazioni) e come questi modelli variano nel tempo e nello spazio. In questo tipo di studio la nostra prospettiva si sposta dall’individuo e dalla cellula per concentrarsi invece su un grande insieme di individui, una popolazione mendeliana. Una popolazione mendeliana è rappresentata da un gruppo di individui interfertili, che condividono un insieme comune di geni. I geni condivisi dagli individui di una popolazione mendeliana costituiscono il pool genico. Lo scopo principale della genetica di popolazioni è comprendere la genetica dell’evoluzione, ovvero il cambiamento in una popolazione o in una specie nel corso del tempo. I metodi utilizzati sono finalizzati allo studio del pool genico di una popolazione mendeliana piuttosto che dei genotipi degli individui che la costituiscono. La comprensione della struttura genetica di una popolazione è la chiave per giungere a capire l’importanza delle risorse genetiche e dei geni per la conservazione delle specie e della biodiversità. Le domande che i genetisti di popolazioni si pongono frequentemente sono le seguenti. 1. Quanta variabilità genetica si trova nelle popolazioni naturali, e quali processi in natura controllano la variabilità osservata? 2. Quali sono i processi responsabili della divergenza genetica tra popolazioni? 3. In che modo le caratteristiche biologiche di una popolazione, come il sistema di riproduzione, la fertiliSir Ronald Fisher

tà e la struttura in classi di età, influenzano il suo pool genico? Per rispondere a queste domande, i genetisti di popolazioni a volte fanno delle misurazioni dirette della variabilità genetica all’interno di e tra popolazioni. Spesso però sviluppano dei modelli matematici per descrivere che cosa accade, in varie condizioni, al pool genico di una popolazione. Un esempio di ciò è dato dall’insieme di equazioni che descrivono l’influenza dell’accoppiamento casuale sulle frequenze alleliche e genotipiche di una popolazione infinitamente grande, modello denominato legge di Hardy-Weinberg, che discuteremo successivamente in questo capitolo. È importante notare come, sebbene i modelli siano semplici e basati su numerosi assunti, alcuni dei quali possono sembrare poco realistici, essi siano utili perché riducono un processo alla sua essenza e permettono di saggiare aspetti peculiari di un sistema isolato. Utilizzando tali modelli possiamo esaminare gli effetti prodotti sulla struttura genetica di una popolazione quando le assunzioni vengono violate una dopo l’altra e poi in combinazione tra loro. Una volta compresi i risultati ottenuti con modelli semplici, possiamo includere nelle equazioni delle condizioni più realistiche e utilizzare questi modelli per comprendere i meccanismi evolutivi che hanno prodotto i cambiamenti che noi oggi osserviamo nelle

Nota chiave La genetica di popolazioni esamina le cause della variabilità genetica osservata nelle e tra le popolazioni. Essa utilizza sia metodi empirici, misurando la variabilità nelle popolazioni naturali, sia metodi teorico-statistici, tentando di spiegare la variabilità osservata con modelli quantitativi.

Sewall Wright

Figura 21.1 Sir Ronald A. Fisher, Sewall Wright e J.B.S. Haldane sono considerati i maggiori artefici della teoria neodarwiniana.

John Burdon Sanderson Haldane

Genetica di popolazioni

popolazioni naturali. Alla fine vedremo come molti aspetti della variabilità genetica nelle popolazioni possano essere spiegati da modelli sorprendentemente semplici e come invece siano richiesti modelli più complessi per spiegare altre tipologie di variazione genetica.

La struttura genetica delle popolazioni Frequenze genotipiche Per studiare la composizione di una popolazione mendeliana dal punto di vista genetico, i genetisti di popolazioni devono prima descrivere quantitativamente il pool genico del gruppo. L’operazione viene eseguita calcolando le frequenze genotipiche e le frequenze alleliche all’interno della popolazione. Una frequenza è una proporzione, ed è sempre compresa tra 0 e 1. Se il 43% delle persone di un gruppo ha capelli rossi, la frequenza di capelli rossi nel gruppo è 0,43 e la frequenza delle persone che non hanno capelli rossi è 1 – 0,43 = 0,57 ovvero 57% Per calcolare le frequenze genotipiche a un dato locus, si conta il numero di individui con un dato genotipo e si divide questo numero per il numero totale di individui nella popolazione. Si fa lo stesso per ciascuno dei genotipi per quel locus, e la somma di tutte le frequenze genotipiche deve dare 1. Si consideri un locus che determina il profilo delle chiazze di colore nella falena tigre, Panaxia dominula (Figura 21.2). Nella maggior parte delle popolazioni sono presenti tre genotipi, e ciascun genotipo dà un fenotipo diverso. E.B. Ford raccolse falene in una località dell’Inghilterra e trovò i seguenti numeri per i tre genotipi: 452 BB, 43 Bb e 2 bb, su un totale di 497 falene. Pertanto, le frequenze genotipiche sono:

533

Le frequenze alleliche possono essere calcolate in due modi equivalenti: mediante i numeri dei diversi genotipi osservati a un dato locus o tramite le frequenze genotipiche. Dapprima calcoleremo le frequenze alleliche direttamente dai numeri dei genotipi; con questo metodo contiamo il numero di alleli di un tipo e lo dividiamo per il numero totale di alleli nella popolazione. Questo metodo viene denominato conteggio degli alleli e funziona in molti casi, inclusi quelli dei geni associati al cromosoma X e dei geni mitocondriali. Esprimendo questo metodo di conteggio come formula, nel caso di un gene nucleare con due alleli abbiamo: numero di copie di un dato allele Frequenza allelica = ––––––––––––––––––––– somma di tutti gli alleli nella popolazione Come esempio, immaginiamo una popolazione di 1000 individui diploidi, di cui 353 AA, 494 Aa e 153 aa. Ogni individuo AA possiede due alleli A, mentre ciascun eterozigote Aa possiede soltanto un unico allele A. Pertanto, il numero di alleli A nella popolazione è (2 × numero di omozigoti AA) + (numero di eterozigoti Aa), ovvero (2 × 353) + 494 = 1200. Dato che ogni individuo diploide possiede due alleli per i geni autosomici, il numero totale di alleli nella popolazione sarà pari al doppio del numero di individui, ovvero 2 × 1000. Utilizzando l’equazione data, la frequenza allelica è 1200/2000 = 0,60. Quando a un locus sono presenti due alleli, per calcolare le frequenze alleliche possiamo usare la seguente formula:

f(BB) = 452/497 = 0,909 f(Bb) = 43/497 = 0,087 2/497 = 0,004 f(bb) = (dove f = frequenza).

Frequenze alleliche Sebbene le frequenze genotipiche a un singolo locus siano utili per analizzare gli effetti di certi processi evolutivi sulla popolazione, nella maggior parte dei casi i genetisti utilizzano le frequenze degli alleli per descrivere come un pool genico cambi nel tempo. L’utilizzo delle frequenze alleliche presenta diversi vantaggi rispetto a quello delle frequenze genotipiche. In primo luogo, negli organismi che si riproducono per via sessuata, i genotipi si riducono agli alleli al momento della formazione dei gameti, e sono gli alleli, non i genotipi, a essere trasmessi da una generazione all’altra. Pertanto, soltanto gli alleli hanno una continuità temporale e il pool genico si evolve attraverso variazioni nelle frequenze degli alleli.

Figura 21.2 Panaxia dominula, la falena tigre. Le due falene in alto sono omozigoti normali BB, quelle della seconda e terza fila sono eterozigoti Bb e la falena in basso è il raro omozigote bb.

534

Capitolo 21

(2 × numero degli omozigoti AA) + (numero degli eterozigoti Aa) p = f(A) = –––––––––––––––––––––––––––––– (2 × numero totale degli individui) Il secondo metodo di calcolo delle frequenze alleliche utilizza il calcolo, visto in precedenza, delle frequenze genotipiche. In questo esempio, f(AA) = 0,353, f(Aa) = 0,494 e f(aa) = 0,153. Le frequenze alleliche possono essere allora calcolate come segue: p = f(A) = (frequenza degli omozigoti AA) + (1/2 della frequenza degli eterozigoti Aa) q = f(a) = (frequenza degli omozigoti aa) + (1/2 della frequenza degli eterozigoti Aa) Le frequenze dei due alleli, f(A) e f(a), vengono comunemente simbolizzate da p e q. Le frequenze alleliche a un locus, così come le frequenze genotipiche, devono sempre dare come totale 1, poiché, per un locus che possiede solo due alleli, il 100% degli alleli (ovvero frequenza = 1) è dato dalla somma delle percentuali dei due alleli (p + q = 1). Pertanto, una volta calcolato p, si può facilmente ottenere q per sottrazione: 1 – p = q. Frequenze alleliche nel caso di alleli multipli Supponiamo di avere tre alleli – A1, A2 e A3 – a un locus e di voler determinare le frequenze alleliche. Si utilizzerà la stessa regola che abbiamo applicato nel caso dei due alleli; per ciascun tipo sommiamo il numero di alleli e dividiamo per il numero totale di alleli nella popolazione: (2 × numero di A1A1) + (A1A2) + (A1A3) p = f(A1) = ––––––––––––––––––––––––––––––––– (2 × numero totale degli individui) (2 × numero di A2A2) + (A1A2) + (A2A3) q = f(A2) = –––––––––––––––––––––––––––––––– (2 × numero totale degli individui) (2 × numero di A3A3) + (A1A3) + (A2A3) r = f(A3) = –––––––––––––––––––––––––––––––– (2 × numero totale degli individui) Utilizzeremo i dati di uno studio sulla variabilità genetica negli scarafaggi degli asclepiadi per illustrare il calcolo delle frequenze alleliche quando siano presenti più di due alleli. Walter Eanes e i suoi collaboratori esaminarono le frequenze alleliche a un locus che codifica per l’enzima fosfoglucomutasi (PGM). Trovarono tre alleli per quel locus, e ciascun allele codificava per una diversa variante molecolare dell’enzima. Da un campione di una popolazione furono contati i seguenti genotipi: A1A1 = 4 A1A2 = 41 A2A2 = 84 A1A3 = 25 A2A3 = 88 A3A3 = 32 ––––––––––––– totale = 274

Le frequenze alleliche furono calcolate come segue: (2 × 4) + (41) + (25) p = f(A1) = ––––––––––––––––– = 0,135 (2 × 274) (2 × 84) + (41) + (88) q = f(A2) = –––––––––––––––––– = 0,542 (2 × 274) (2 × 32) + (88) + (25) r = f(A3) = –––––––––––––––––– = 0,323 (2 × 274) Come si vede da questi calcoli, abbiamo sommato due volte il numero degli omozigoti che possiedono l’allele e una volta il numero degli eterozigoti che presentano l’allele. Dividiamo quindi per il doppio del numero totale di individui della popolazione, che rappresenta il numero totale di alleli presenti. Si noti che al numeratore dell’equazione per ciascuna delle frequenze alleliche non si sommano tutti gli eterozigoti, in quanto alcuni di essi non possiedono l’allele; per esempio, nel calcolo della frequenza allelica di A1 non aggiungiamo al numeratore il numero degli eterozigoti A2A3, in quanto non possiedono l’allele A1. Si può utilizzare la stessa procedura per il calcolo delle frequenze alleliche quando siano presenti quattro o più alleli. Anche in questo caso si può utilizzare il metodo di calcolo delle frequenze alleliche a partire dalle frequenze genotipiche. Il calcolo può essere più rapido se abbiamo già calcolato le frequenze dei genotipi. La frequenza dell’omozigote si somma a metà della frequenza dell’eterozigote, in quanto metà degli alleli dell’eterozigote è A e metà è a. Se nella popolazione sono presenti tre alleli (A1, A2 e A3), le frequenze alleliche sono: f(A1A3) f(A1A2) p = f(A1) = f(A1A1) + ––––––– + ––––––– 2 2 f(A2A3) f(A1A2) q = f(A2) = f(A2A2) + ––––––– + ––––––– 2 2 f(A1A3) f(A2A3) r = f(A3) = f(A3A3) + ––––––– + ––––––– 2 2 Nonostante il calcolo delle frequenze alleliche a partire dalle frequenze genotipiche possa essere più rapido che non il calcolo diretto dal numero dei genotipi, quest’ultimo è preferibile in quanto l’errore di arrotondamento è minore. Il calcolo delle frequenze alleliche e genotipiche è illustrato nel Box 21.1, con l’esempio di un locus con tre alleli. Frequenze alleliche a un locus associato al cromosoma X Il calcolo delle frequenze alleliche per un locus associato al cromosoma X (ovvero un locus localizzato sul cromosoma X) risulta lievemente più complicato, in quanto i maschi possiedono un solo allele associato al cromosoma X (per esempio, nei mammiferi e nelle mo-

Genetica di popolazioni

535

Box 21.1 Esempio di calcolo delle frequenze alleliche e genotipiche per le varianti dell’emoglobina nelle popolazioni della Nigeria dove sono presenti alleli multipli Genotipi per l’emoglobina AA AS SS AC SC 2017 783 4 173 14

CC 11

Totale 3002

Calcolo delle frequenze genotipiche numero di individui con il genotipo Frequenza genotipica = –––––––––––––––––––––––––––––––––––– numero totale degli individui 4 f(SS) = –––––– = 0,0013 3002

2017 f(AA) = –––––– = 0,672 3002

173 f(AC) = –––––– = 0,058 3002

783 f(AS) = –––––– = 0,261 3002

14 f(SC) = –––––– = 0,0047 3002

11 f(CC) = –––––– = 0,0037 3002

Calcolo delle frequenze alleliche mediante il numero degli individui con un dato genotipo numero di copie di un dato allele nella popolazione Frequenza allelica = ––––––––––––––––––––––––––––––––––––––––––––––––––– totale degli alleli nella popolazione (2 × numero di individui SS) + (numero di individui AS) + (numero di individui SC) f(S) = ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– (2 × numero totale degli individui) (2 × 4) + 783 + 14 805 f(S) = –––––––––––––––––– = ––––– = 0,134 (2 × 3002) 6004 (2 × numero di individui AA) + (numero di individui AS) + (numero di individui AC) f(A) = –––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– (2 × numero totale degli individui) (2 × 2017) + 783 + 173 4990 f(A) = ––––––––––––––––––––– = –––––– = 0,831 (2 × 3002) 6004 (2 × numero di individui CC) + (numero di individui AC) + (numero di individui SC) f(C) = ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– (2 × numero totale degli individui) (2 × 11) + 173 + 14 209 f(C) = –––––––––––––––––– = ––––– = 0,035 (2 × 3002) 6004 Calcolo delle frequenze alleliche mediante le frequenze genotipiche f(S) = f(SS) + 1/2f(AS) + 1/2f(SC) f(S) = 0,0013 + (1/2 × 0,261) + (1/2 × 0,0047) = 0,134 f(A) = f(A) + 1/2f(AS) + 1/2f(AC) f(A) = 0,672 + (1/2 × 0,261) + (1/2 × 0,058) = 0,831

sche). Si possono applicare, peraltro, gli stessi principi che abbiamo usato per i loci autosomici. Si ricordi che ogni femmina omozigote presenta due alleli associati al cromosoma X mentre le femmine eterozigoti possiedono una copia soltanto di quel particolare allele. Per calcolare il numero di alleli per un locus associato al cromosoma X, si moltiplica il numero di femmine omozigoti per

f(C) = f(CC) + 1/2f(SC) + 1/2f(AC) f(C) = 0,0037 + (1/2 × 0,0047) + (1/2 × 0,058) = 0,035

2, aggiungendo quindi il numero delle femmine eterozigoti e quello dei maschi emizigoti per quell’allele. Si divide, poi, per il numero totale di alleli nella popolazione. Per stabilire quest’ultimo, sommiamo il doppio del numero delle femmine (dato che ciascuna femmina possiede due alleli associati al cromosoma X) al numero dei maschi (che possiedono un unico allele). Con questo ra-

536

Capitolo 21

gionamento, le frequenze di due alleli a un locus associato al cromosoma X (XA e Xa) risultano determinate dalle equazioni seguenti: (2 × femmine XAXA) + (femmine XAXa) + (maschi XAY) p = f(XA) = –––––––––––––––––––––––––––––––– (2 × numero delle femmine) + (numero dei maschi) (2 × femmine XaXa) + (femmine XAXa) + (maschi XaY) q = f(Xa) = –––––––––––––––––––––––––––––––– (2 × numero delle femmine) + (numero dei maschi)

Nota chiave La struttura genetica di una popolazione è determinata dall’insieme degli alleli (il pool genico). Nel caso di individui diploidi che si riproducono per via sessuata, la struttura viene anche caratterizzata dal modo in cui gli alleli sono distribuiti nei genotipi. La struttura genetica può essere descritta in termini di frequenze alleliche e genotipiche. Eccetto che per rari eventi di mutazione, gli individui nascono e muoiono con lo stesso corredo di geni; ciò che varia col tempo dal punto di vista genetico (si evolve) è il complesso dei geni ereditato da un gruppo di individui, connessi dal punto di vista riproduttivo di generazione in generazione come una popolazione mendeliana.

Se la popolazione è composta da maschi e femmine in ugual numero, le frequenze alleliche per un locus associato al cromosoma X (distribuite in modo proporzionale tra i sessi) possono venire stimate dalle frequenze genotipiche come segue: p = f(XA) = 2/3[f(XAXA) + 1/2f(XAXa)] + 1/3f(XAY) q = f(Xa) = 2/3[f(XaXa) + 1/2f(XAXa)] + 1/3f(XaY) Questa formula assume che le frequenze genotipiche vengano calcolate separatamente tra i sessi, in modo che f(XAY) + f(XaY) = 1. Assicuratevi di avere compreso la logica che sta alla base di questi semplici calcoli, senza limitarvi a memorizzare le formule. Se avrete compreso appieno la base dei calcoli, non avrete bisogno di ricordare l’equazione esatta, e sarete in grado di determinare le frequenze alleliche in qualsiasi situazione.

La legge di Hardy-Weinberg La legge di Hardy-Weinberg è alla base della genetica di popolazioni, in quanto chiarisce il modo in cui il principio mendeliano della segregazione spieghi anche le frequenze alleliche e genotipiche di una popolazione. La legge di Hardy-Weinberg prende il nome dai due studiosi che indipendentemente la scoprirono nei primi anni del 1900 (Box 21.2). Inizieremo la nostra discussione della legge di Hardy-Weinberg semplicemente enunciando che cosa essa afferma riguardo il pool genico di una popolazione. Esploreremo, quindi, quali siano le implicazioni di questa legge, e discuteremo brevemente la sua origine. Alla fine presenteremo alcune applicazioni

Box 21.2 Hardy, Weinberg e la storia del loro contributo alla genetica di popolazioni Godfrey H. Hardy (1877-1947), matematico dell’Università di Cambridge, si incontrava spesso al circolo della facoltà con R.C. Punnett, genetista mendeliano. Un giorno del 1908, Punnett pose a Hardy un problema sulla genetica che egli attribuiva a G.U. Yule, un forte critico delle idee mendeliane (Yule in seguito negò di avere sollevato il problema). Secondo Punnett, Yule avrebbe detto che, se l’allele per dita corte (brachidattilia) fosse stato dominante (come in effetti è) e l’allele per dita di lunghezza normale fosse stato recessivo, allora le dita corte avrebbero dovuto diventare più frequenti a ogni generazione finché, col tempo, chiunque in Gran Bretagna avrebbe posseduto dita corte. Punnett riteneva che l’argomento non fosse corretto, ma non poté provarlo. Hardy fu in grado di scrivere alcune equazioni secondo le quali, data una particolare frequenza allelica per dita corte e dita normali in una popolazio-

ne, i relativi valori di individui con dita corte e con dita normali sarebbero rimasti gli stessi, generazione dopo generazione, se non fosse esistita selezione naturale a favore di un fenotipo o dell’altro in rapporto alla produzione di progenie. Hardy pubblicò un breve lavoro che descriveva la relazione tra i genotipi e i fenotipi nelle popolazioni, ed entro poche settimane fu pubblicato un lavoro di Wilhelm Weinberg (1862-1937), un medico di Stoccarda, che stabiliva in modo chiaro la stessa relazione. La legge di Hardy-Weinberg segnò l’inizio della moderna genetica di popolazioni. Per completezza, dovremmo notare che il primo a riconoscere la relazione tra frequenze alleliche e genotipi fu, nel 1903, il genetista americano W.E. Castle dell’Università di Harvard, anche se solo Hardy e Weinberg descrissero chiaramente questa relazione in termini matematici. Molto raramente la relazione viene definita legge di Castle-Hardy-Weinberg.

Genetica di popolazioni

della legge di Hardy-Weinberg e studieremo una popolazione per stabilire se i genotipi si trovano in equilibrio di Hardy-Weinberg. La legge di Hardy-Weinberg è divisa in tre parti – un insieme di assunzioni e due risultati principali. Un semplice enunciato della legge è il seguente. Parte 1 (assunzioni): In una popolazione infinitamente grande a incrocio casuale, sulla quale non agiscano mutazione, migrazione e selezione naturale (si notino le cinque assunzioni), Parte 2 (risultato 1): le frequenze alleliche non variano con il tempo, essendo p la frequenza allelica di A e q la frequenza allelica di a; e Parte 3 (risultato 2): le frequenze genotipiche si stabilizzano nelle proporzioni p2 (frequenza di AA), 2pq (frequenza di Aa) e q2 (frequenza di aa). La somma delle frequenze genotipiche deve essere uguale a 1 (ovvero, p2 + 2pq + q2 = 1). In breve, la legge di Hardy-Weinberg descrive che cosa avviene alle frequenze alleliche e genotipiche di una popolazione quando gli alleli vengono trasmessi di generazione in generazione in assenza di processi evolutivi. In altre parole, se le assunzioni riportate nella parte 1 sono rispettate, ci si attende che gli alleli si combinino nei diversi genotipi seguendo le semplici regole di probabilità descritte dalla legge di Hardy-Weinberg; si avrà, quindi, che la popolazione sarà in equilibrio di Hardy-Weinberg, e le frequenze genotipiche potranno essere previste a partire da quelle alleliche.

Assunzioni della legge di Hardy-Weinberg La prima parte della legge di Hardy-Weinberg presenta certe condizioni, o assunzioni, che devono essere rispettate affinché la legge possa venire applicata. Come primo punto, la legge indica che la popolazione deve essere infinitamente grande: se una popolazione è di dimensioni ridotte, le deviazioni casuali dai rapporti attesi possono produrre variazioni nelle frequenze alleliche, un fenomeno denominato deriva genetica (discusso più avanti). È vero che l’assunzione della parte 1 di una dimensione infinita non è realistica, in quanto nessuna popolazione comprende un numero infinito di individui. Tuttavia, statisticamente, popolazioni grandi si comportano in modo molto simile a popolazioni in teoria infinitamente grandi (discuteremo in seguito questo fenomeno, quando esamineremo la deriva genetica in maggiore dettaglio). A questo punto, vogliamo semplicemente sottolineare che la popolazione non deve essere necessariamente infinitamente grande affinché la legge di Hardy-Weinberg fornisca comunque delle eccellenti stime delle frequenze genotipiche. In effetti, piccoli scostamenti dalle assunzioni della legge di HardyWeinberg determinano soltanto scostamenti minimi ri-

537

spetto alle proporzioni stabilite dalla legge stessa. Vedremo successivamente come occorra effettuare un test statistico per verificare la bontà dell’adattamento delle frequenze osservate alle proporzioni attese. Vedremo, inoltre, come popolazioni finite, con basso tasso di mutazione, scarso numero di migranti e debole selezione si discostino solo in minima parte dalle proporzioni di Hardy-Weinberg, dalle quali potremo riscontrare deviazioni rilevanti solo quando ci scosteremo molto dalle assunzioni o quando il campione diverrà molto piccolo. Una seconda condizione della legge di Hardy-Weinberg è che l’incrocio sia casuale. Il termine incrocio casuale (random mating) definisce la condizione in cui gli incroci tra genotipi avvengono con la stessa proporzione della frequenza dei genotipi nella popolazione. Più nello specifico, la probabilità che due genotipi si incrocino tra loro è uguale al prodotto delle due frequenze genotipiche. Per illustrare l’incrocio casuale, si consideri il gruppo sanguigno M N nell’uomo, già discusso nel Capitolo 13. Il gruppo sanguigno M N è determinato da un locus con due alleli codominanti, LM ed LN. In una popolazione di eschimesi le frequenze dei tre genotipi M N sono: LM/LM = 0,835, LM/LN = 0,156 e LN/LN = 0,009. Se gli eschimesi si riproducono in maniera casuale, la probabilità di un accoppiamento tra un maschio LM/LM e una femmina LM/LM è pari alla frequenza degli LM/LM moltiplicata per se stessa = 0,835 × 0,835 = 0,697. Allo stesso modo, le probabilità degli altri incroci possibili, quando avvengono in modo casuale, sono pari al prodotto delle frequenze genotipiche. Spesso la necessità di accoppiamento casuale per la legge di Hardy-Weinberg viene male interpretata: molti studenti ritengono in modo scorretto che, affinché valga la legge di Hardy-Weinberg, la popolazione debba mostrare incrocio casuale per tutti i caratteri. Se ciò fosse vero, le popolazioni umane non obbedirebbero in nessun caso alla legge di Hardy-Weinberg, in quanto gli esseri umani non si incrociano in modo casuale, ma preferenzialmente per alcuni caratteri come la statura, il quoziente di intelligenza, il colore della pelle, la condizione socio-economica e altri. Tuttavia, mentre l’accoppiamento può non essere casuale per alcuni caratteri, la maggior parte degli esseri umani si incrocia casualmente per quel che riguarda il gruppo M N: molti di noi non conoscono nemmeno quale sia il proprio gruppo M N. I principi della legge di Hardy-Weinberg si applicano a tutti quei loci per i quali l’incrocio avviene in modo casuale, anche se ciò non si verifica per altri loci. Infine, affinché la legge di Hardy-Weinberg abbia valore, sulla popolazione non devono agire mutazione, migrazione e selezione naturale (che verranno discusse in dettaglio in seguito). In altri termini, il pool genico non deve subire né aggiunte né perdite di alleli, in quan-

Capitolo 21

to siamo interessati a sapere come le frequenze alleliche e genotipiche siano correlate partendo dalle semplici regole della meiosi e della riproduzione sessuata. Si ricordi ancora una volta che le assunzioni della legge di Hardy-Weinberg si applicano solo al locus in esame: una popolazione può essere sottoposta a processi evolutivi che agiscono su alcuni tratti e rispettare le assunzioni della legge di Hardy-Weinberg per altri loci.

Previsioni della legge di Hardy-Weinberg Se vengono rispettate le condizioni della legge di Hardy-Weinberg, la popolazione si trova in equilibrio e si attendono due risultati. Primo, le frequenze alleliche non cambiano al trascorrere delle generazioni. Secondo, le frequenze genotipiche si troveranno nelle proporzioni p2, 2pq e q2 dopo una generazione di incrocio casuale e resteranno in queste proporzioni sino a che saranno rispettate le condizioni richieste dalla legge di Hardy-Weinberg. Quando i genotipi si trovano in queste proporzioni, si dice che la popolazione è in equilibrio di Hardy-Weinberg. Un’importante utilizzazione della legge di Hardy-Weinberg deriva dal fatto che essa fornisce un mezzo per stabilire le frequenze genotipiche, a partire dalle frequenze alleliche, quando la popolazione è all’equilibrio. Se le proporzioni osservate tra i genotipi fossero diverse da quelle attese, sapremmo che una o più assunzioni di Hardy-Weinberg sono state violate. Riassumendo, la legge di Hardy-Weinberg è in grado di stabilire diverse previsioni riguardo alle frequenze alleliche e genotipiche di una popolazione, quando certe assunzioni risultino soddisfatte. Le condizioni necessarie sono che la popolazione sia grande, a incrocio casuale e non sottoposta a mutazione, migrazione e selezione naturale. Quando si verificano queste condizioni, la legge di Hardy-Weinberg asserisce che le frequenze alleliche non cambieranno da una generazione all’altra e che le frequenze genotipiche saranno determinate dalle frequenze alleliche, nelle proporzioni p2, 2pq e q2.

Da che cosa deriva la legge di Hardy-Weinberg La legge di Hardy-Weinberg stabilisce che, quando una popolazione è in equilibrio, le frequenze genotipiche si troveranno nelle proporzioni p2, 2pq e q2. Per comprenderne i motivi, si consideri una popolazione ipotetica nella quale la frequenza dell’allele A sia p e la frequenza dell’allele a sia q. Nella formazione dei gameti, ognuno dei genotipi trasmette con frequenza uguale entrambi gli alleli che possiede, pertanto anche nei gameti le frequenze di A e a sono p e q. Se si pensa ai gameti come ai componenti di un pool, la formazione casuale di uno zigote equivale a estrarre a caso due gameti dal pool. Dopo aver effet-

Tabella 21.1 Possibili combinazioni dei gameti A e a dal pool gametico di una popolazione

Gameti femminili

538

Gameti maschili A(p) a(q) A(p)

AA (p2)

Aa (pq)

a(q)

Aa (pq)

aa (q2)

In totale, p2 (AA) + 2pq (Aa) + q2 (aa) = 1,00

tuato più volte il sorteggio casuale di due gameti, i genotipi che si formeranno mostreranno le frequenze previste sulla base delle probabilità di estrarre i gameti che portano quel particolare allele (si veda la regola del prodotto delle probabilità nel Capitolo 11). La Tabella 21.1 mostra le possibili combinazioni dei gameti quando l’incrocio è casuale, illustrando così la relazione tra le frequenze alleliche e le frequenze genotipiche che sta alla base della legge di Hardy-Weinberg. Osserviamo che, quando i gameti si appaiano a caso, i genotipi risultanti saranno nelle proporzioni p2 (AA), 2pq (Aa) e q2 (aa): queste proporzioni sono il risultato dello sviluppo del quadrato del binomio delle frequenze alleliche (p + q)2 = p2 + 2pq + q2, e i genotipi raggiungono tali proporzioni dopo una generazione di incrocio casuale. La legge di Hardy-Weinberg stabilisce inoltre che, se la popolazione rimane grande, a incrocio casuale e senza subire l’effetto dei processi della mutazione, della migrazione e della selezione naturale (le forze dell’evoluzione), le frequenze alleliche e genotipiche rimangono costanti, generazione dopo generazione. Questo risultato può essere dimostrato considerando una popolazione ipotetica a incrocio casuale, come illustrato nella Tabella 21.2, dove sono mostrati tutti i possibili incroci. Per definizione, accoppiamento casuale significa che la frequenza di un incrocio tra due genotipi sarà uguale al prodotto delle rispettive frequenze genotipiche. Per esempio, la frequenza di un incrocio AA × AA sarà pari a p2 (la frequenza di AA) × p2 (la frequenza di AA) = p4. Nella Tabella 21.2 sono presentate anche le frequenze della progenie prodotta da ciascuno degli incroci. Notiamo che la somma delle probabilità degli incroci AA × Aa (ovvero 2p3q) e Aa × AA (ovvero 2p3q) è 4p3q, e, poiché sappiamo dalla genetica mendeliana che questi incroci producono progenie 1/2 AA e 1/2 Aa, la probabilità di ottenere progenie AA da questi incroci è 4p3q × 1/2 = 2p3q. Le frequenze della progenie prodotta da ciascun tipo di incrocio sono riportate nel centro della Tabella 21.2. Al fondo della tabella si ha la frequenza totale di ciascun genotipo. Come possiamo vedere, dopo

Genetica di popolazioni

539

Tabella 21.2 Schema algebrico dell’equilibrio genetico in una popolazione a incrocio casuale, per un locus genico con due alleli Frequenze della progenie ottenuta da un dato incrocio nella generazione successiva Tipo di incrocio

Frequenza dell’incrocio

AA

Aa

aa

p2 (AA) × p2 (AA)

p4

p4





4p3q

2p3q

2p3q



2p2q2



2p2q2



2pq (Aa) × 2pq (Aa)

4p2q2

p2q2

2p2q2

p2q2

2pq (Aa) × q2 (aa) q2 (aa) × 2pq (Aa)

4pq3



2pq3

2pq3

q4





q4

(p2 + 2pq + q2)2 = 1

p2(p2 + 2pq + q2) = p2

2pq(p2 + 2pq + q2) = 2pq

q2(p2 + 2pq + q2) = q2

p2 (AA) × 2pq (Aa) a 2pq (Aa) × p2 (AA)

}

p2 (AA) × q2 (aa) q2 (aa) × p2 (AA)

q2 (aa) × q2 (aa) Totali

} }

Frequenze genotipiche = (p + q)2 = p2 + 2pq + q2 = 1 in ogni generazione successiva Frequenze alleliche = p (A) + q (a) = 1 in ogni generazione successiva a Per esempio, gli incroci tra AA e Aa avverranno con frequenza pari a p2 × 2pq = 2p3q per AA × Aa e pari a 2pq × p2 = 2p3q per Aa × AA, per un totale di 4p3q. Da questi incroci risultano due tipi di progenie, AA e Aa, in ugual proporzione. Pertanto, le frequenze della progenie sono 2p3q (cioè 1/2 di 4p3q) per AA e Aa.

accoppiamento casuale le frequenze genotipiche sono ancora p2, 2pq e q2 e le frequenze alleliche rimangono p e q. Pertanto la popolazione può venire rappresentata negli stadi zigotici e gametici come segue:

Frequenza dell’allele A nella popolazione (valore di p) 1,0 0,5 0,3 0 1,0

Gameti –––––––––– p (A) + q (a)

Ciascuna generazione di zigoti produce gameti A e a nelle proporzioni p e q, i gameti si uniscono a formare zigoti AA, Aa e aa nelle proporzioni p2, 2pq, q2, e il ciclo viene ripetuto indefinitamente fino a quando permangono le assunzioni della legge di Hardy-Weinberg. Questa succinta dimostrazione fornisce le basi teoriche della legge di Hardy-Weinberg. Essa indica che, all’equilibrio, le frequenze genotipiche dipendono dalle frequenze alleliche. Questa relazione tra frequenze alleliche e genotipiche è rappresentata in Figura 21.3 per un locus con due alleli. Diversi aspetti di questa relazione meritano di essere messi in evidenza: (1) la frequenza massima dell’eterozigote è 0,5, e questo valore massimo è raggiunto solo quando sia la frequenza di A sia quella di a sono 0,5; (2) se le frequenze alleliche si trovano tra 0,33 e 0,66, l’eterozigote rappresenta il genotipo più numeroso; (3) quando la frequenza di un allele è minore di 0,33, il più raro dei tre genotipi è l’omozigote per quell’allele.

Frequenza di AA nella popolazione (p2) Frequenza dei genotipi

Zigoti ––––––––––––––––––––––– p2 (AA) + 2pq (Aa) + q2 (aa)

Nell’uomo si può riscontrare questo fenomeno dalla distribuzione delle malattie di origine genetica, che so-

Frequenza di aa nella popolazione (q2)

Frequenza di Aa nella popolazione (2pq) 0,5

0 0 0,5 0,7 1,0 Frequenza dell’allele a nella popolazione (valore di q)

Figura 21.3 Relazione tra le frequenze dei genotipi AA, Aa e aa e le frequenze degli alleli A e a (in termini dei rispettivi valori p [ascissa superiore] e q [ascissa inferiore]) in una popolazione che rispetti le assunzioni della legge di Hardy-Weinberg. Ogni singola popolazione è definita da una linea verticale, come quella indicata in figura, caratterizzata da p = 0,3 e q = 0,7.

540

Capitolo 21

no sovente rare e recessive. La frequenza di un gene che causa un carattere raro e recessivo sarà molto più alta della frequenza del carattere stesso, dato che molti degli alleli rari si trovano negli eterozigoti (portatori sani) che non presentano la malattia. Un esempio nell’uomo di una condizione rara e recessiva è rappresentato dall’albinismo: una forma di albinismo è l’albinismo da mancanza di tirosinasi. Gli individui che ne sono affetti non possiedono l’attività tirosinasica richiesta per la normale produzione del pigmento melanina. La frequenza dell’albinismo da mancanza di tirosinasi tra gli individui bianchi nordamericani è all’incirca di 1 su 40 000, ovvero 0,000025. Dal momento che l’albinismo è una condizione recessiva, il genotipo degli individui affetti è aa. Se assumiamo che la popolazione rispetti le condizioni della legge di Hardy-Weinberg, la frequenza dei genotipi aa sarà pari a q2. Se q2 = 0,000025, allora q = 0,005 e p = 1 – q = 0,995; la frequenza dell’eterozigote è pertanto 2pq = 2(0,995) (0,005) = 0,00995 (quasi l’1%). Così, mentre la frequenza di individui albini è bassa (1 su 40 000), gli eterozigoti per l’albinismo sono molto più comuni (quasi 1 su 100). Quando un allele è raro, quasi tutte le copie di esso si trovano allo stato eterozigote, e in tal caso i fenotipi recessivi sono spesso molto rari.

Nota chiave La legge di Hardy-Weinberg descrive che cosa accade alle frequenze alleliche e genotipiche di una grande popolazione quando i gameti si incontrano in maniera casuale e non sono presenti mutazione, migrazione e selezione naturale. Se queste condizioni sono soddisfatte, le frequenze alleliche non variano di generazione in generazione, e le frequenze genotipiche si stabilizzano dopo una generazione in base alle proporzioni p2, 2pq e q2, dove p e q sono le frequenze alleliche nella popolazione. Se vengono rispettate queste condizioni, la popolazione è in equilibrio di Hardy-Weinberg.

Applicazione della legge di Hardy-Weinberg per loci con più di due alleli Quando a un locus sono presenti due alleli, la legge di Hardy-Weinberg stabilisce che all’equilibrio le frequenze genotipiche sono p2, 2pq e q2, ovvero uguali al quadrato delle frequenze alleliche (p + q)2. Ciò rappresenta un semplice sviluppo di un binomio e questo principio della teoria della probabilità può essere esteso a qualsiasi numero di alleli che vengano campionati a due a due in uno zigote diploide. Se sono presenti tre alleli, per esempio A, B e C, con frequenze uguali a p, q ed r, le frequenze dei genotipi all’equilibrio saranno ancora date dal

quadrato del trinomio costituito dalla somma delle frequenze alleliche: (p + q + r)2 = p2 (AA) + 2pq (AB) + + q2 (BB) + 2pr (AC) + 2qr (BC) + r2 (CC) Nel mitilo blu, che si trova lungo le coste atlantiche dell’America del Nord, al locus che codifica per l’enzima leucina amminopeptidasi (LAP) si trovano tre alleli. Studiando una popolazione di mitili che vive nello Stretto di Long Island (che sarà ancora discussa in seguito, vedi Figura 21.6), Richard K. Koehn e colleghi stabilirono le seguenti frequenze dei tre alleli: Allele

Frequenza

LAP98 LAP96 LAP94

p = 0,52 q = 0,31 r = 0,17

Se la popolazione fosse in equilibrio di Hardy-Weinberg, le frequenze genotipiche attese sarebbero: Genotipo

Frequenza attesa

LAP98/LAP98 LAP98/LAP96 LAP96/LAP96 LAP96/LAP94 LAP94/LAP98 LAP94/LAP94

p2 = (0,52)2 = 0,27 2pq = 2(0,52)(0,31) = 0,32 q2 = (0,31)2 = 0,10 2qr = 2(0,31)(0,17) = 0,11 2pr = 2(0,52)(0,17) = 0,18 r2 = (0,17)2 = 0,03

Il quadrato delle frequenze alleliche può essere utilizzato allo stesso modo per stimare le frequenze attese dei genotipi quando a un locus sono presenti quattro o più alleli.

Applicazione della legge di Hardy-Weinberg per alleli legati al sesso Nelle specie come quella umana, nelle quali le femmine sono XX e i maschi XY, la legge di Hardy-Weinberg deve essere leggermente modificata. Se gli alleli sono associati al cromosoma X, le femmine possono essere omozigoti o eterozigoti, mentre i maschi possiedono solamente un singolo allele per ciascun locus associato al cromosoma X. Nelle femmine, le frequenze di HardyWeinberg per gli alleli associati al cromosoma X sono le stesse che per i loci autosomici: p2 (XAXA), 2pq (XAXa) e q2 (XaXa). Nei maschi, tuttavia, le frequenze genotipiche saranno p (XAY) e q (XaY), ovvero le stesse delle frequenze alleliche nella popolazione. Per questo motivo, i caratteri recessivi associati al cromosoma X sono più frequenti tra i maschi che non tra le femmine. Per chiarire questo concetto, si consideri la cecità per il rosso e il verde (daltonismo), che è un carattere recessivo associato al cromosoma X. In realtà sappiamo che sono molti e diversi gli alleli difettosi che causano la cecità per il rosso e il verde, ma per comodità li considereremo

541

Genetica di popolazioni

Test statistico delle proporzioni di Hardy-Weinberg Se estraiamo un campione da una popolazione e stimiamo le frequenze genotipiche, raramente esse saranno esattamente uguali a quelle previste dalla legge di HardyWeinberg. Per verificare se lo scostamento sia accettabile, la domanda da porsi è: “Con quale probabilità avremmo potuto ottenere uno scostamento di tale entità per il solo effetto del caso?”. Se la struttura genetica osservata non è in accordo con quella attesa in base alla legge, possiamo cominciare a chiederci quale delle assunzioni risulti violata. Per stabilire se i genotipi di una popolazione siano in accordo con le proporzioni di Hardy-Weinberg, come prima operazione calcoliamo le frequenze alleliche dalle frequenze genotipiche osservate. (Nota: è importante non calcolare le frequenze alleliche estraendo la radice quadrata delle frequenze degli omozigoti, perché ciò vorrebbe dire assumere in partenza che la popolazione si trovi all’equilibrio. Pertanto, le frequenze alleliche devono essere calcolate con il metodo del conteggio degli alleli.) Una volta calcolate le frequenze alleliche, possiamo ottenere le frequenze genotipiche attese (p2, 2pq e q2) e confrontarle con quelle effettivamente osservate mediante il test del chi-quadrato, χ2 (descritto nel Capitolo 11). Il test del χ2 ci fornisce la probabilità di quanto sia dovuta al caso la differenza tra quanto da noi osservato e quanto atteso in base alla legge di Hardy-Weinberg. Per illustrare il procedi-

1,0 Frequenza del gene associato al cromosoma X

un unico allele. La frequenza dell’allele per il daltonismo varia tra i gruppi etnici umani, la frequenza tra gli afroamericani è 0,039. All’equilibrio la frequenza attesa dei maschi daltonici in questo gruppo è q = 0,039, mentre la frequenza delle femmine daltoniche è soltanto q2 = (0,039)2 = 0,0015. Quando, in una popolazione, si ha accoppiamento casuale, le frequenze genotipiche all’equilibrio vengono raggiunte in una sola generazione; tuttavia, se gli alleli sono associati al cromosoma X e i sessi hanno frequenze alleliche diverse, le frequenze all’equilibrio vengono raggiunte dopo diverse generazioni, in quanto i maschi ricevono il cromosoma X soltanto dalla madre, mentre le femmine ricevono un X sia dalla madre sia dal padre. Di conseguenza, la frequenza di un allele associato al cromosoma X nei maschi sarà la stessa di quell’allele nelle madri, mentre la frequenza nelle femmine sarà una media tra quelle delle madri e dei padri. Con incrocio casuale, le frequenze alleliche nei due sessi si alterneranno a ciascuna generazione, e la differenza nella frequenza allelica tra i due sessi si dimezzerà a ogni generazione, come mostrato in Figura 21.4. Quando le frequenze alleliche saranno uguali nei maschi e nelle femmine, le frequenze genotipiche si troveranno nelle proporzioni di Hardy-Weinberg dopo un’ulteriore generazione di incrocio casuale.

0,8 0,6 0,4 0,2

1

2

3

4 5 Generazioni

6

7

8

9

Figura 21.4 Rappresentazione dell’avvicinamento graduale all’equilibrio di un gene associato al cromosoma X con una frequenza iniziale di 1 nelle femmine e 0 nei maschi.

mento si consideri il locus che codifica per la transferrina (una proteina del sangue) nell’arvicola dalla schiena rossa, Clethrionomys gapperi. Al locus della transferrina si trovano tre genotipi: MM, MJ e JJ. In una popolazione di arvicole catturate nel 1976 nei Territori del Nord-Ovest, in Canada, si trovarono 12 individui MM, 53 MJ e 12 JJ. Per stabilire se i genotipi si trovino nelle proporzioni di Hardy-Weinberg, calcoliamo dapprima le frequenze alleliche della popolazione usando l’ormai familiare formula: (2 × numero degli omozigoti) + (numero degli eterozigoti) p = –––––––––––––––––––––––––––––– (2 × numero totale degli individui) Pertanto: (2 × 12) + (53) p = f(M) = –––––––––––– = 0,5 (2 × 77) q = f(J) = 1 – p = 0,5 Utilizzando p e q calcolate dai genotipi osservati, si possono ora determinare le proporzioni attese per i genotipi conformemente alla legge di Hardy-Weinberg: f(MM) = p2 = (0,5)2 = 0,25; f(MJ) = 2pq = 2(0,5)(0,5) = 0,5; f(JJ) = q2 = (0,5)2 = 0,25. Tuttavia, per utilizzare il test del χ2 occorrono i numeri reali degli individui e non le loro proporzioni. Per ottenere i numeri attesi si moltiplica semplicemente ciascuna delle proporzioni attese per il numero totale degli individui (N), come segue:

f(MM) = p2 × N = 0,25 × 77 = f(MJ) = 2pq × N = 0,5 × 77 = f(JJ) = q2 × N = 0,25 × 77 =

Attesi

Osservati

19,3 38,5 19,3

12 53 12

Utilizzando i valori degli osservati e degli attesi, possiamo calcolare il valore del χ2 per stabilire la probabilità che le differenze tra i valori osservati e quelli attesi possano essere dovute al caso. Il χ2 viene calcolato usando la medesima formula che abbiamo impiegato per l’analisi degli incroci genetici. Si calcola la deviazione d per ogni classe (osservati-attesi), quindi d2, il quadrato della de-

542

Capitolo 21

viazione, viene diviso per il numero a degli attesi per ogni classe e il valore del χ2 viene calcolato come somma di tutti i valori d2/a. In questo esempio, χ2 = 10,98. Bisogna, a questo punto, trovare il valore in una tavola delle probabilità del χ2 (vedi Tabella 11.5) per il numero appropriato di gradi di libertà. A differenza della precedente analisi del χ2, qui vengono persi due gradi di libertà, uno per ogni parametro (in questo caso p) che dev’essere ricavato dai dati e un secondo perché si parte da un numero fisso di individui. Quindi con tre classi di genotipi (MM, MJ e JJ) si perdono due gradi di libertà, lasciandone solamente uno. Nella tabella del χ2, sotto la colonna per un grado di libertà, il valore di 10,98 indica un valore di P (probabilità) inferiore a 0,01. Pertanto la probabilità che le differenze tra l’osservato e l’atteso siano casuali è molto bassa, meno dell’1%. Possiamo concludere che i numeri osservati dei genotipi non sono simili a quelli attesi in base alla legge di Hardy-Weinberg; il dato non è coerente con le attese di un accoppiamento casuale in una popolazione grande e devia dai risultati attesi in relazione all’equilibrio di Hardy-Weinberg.

Utilizzo della legge di Hardy-Weinberg per la stima delle frequenze alleliche Un’importante applicazione della legge di Hardy-Weinberg è costituita dal calcolo delle frequenze alleliche quando uno o più alleli sono recessivi. Per esempio, abbiamo visto come l’albinismo nell’uomo sia il risultato di un gene autosomico recessivo. Normalmente questo carattere è raro, ma l’albinismo è piuttosto comune tra gli indiani hopi dell’Arizona. Charles M. Woolf e Frank C. Dukepoo visitarono nel 1969 i villaggi hopi e osservarono 26 casi di albinismo in una popolazione di circa 6000 individui (Figura 21.5). Il dato forniva una frequenza per il carattere di 26/6000 = 0,0043, che è molto più alta della frequenza dell’albinismo nella maggior parte delle popolazioni. Nonostante si sia calcolata la frequenza per il carattere, non possiamo stabilire direttamente la frequenza del gene mutato, dal momento che non possiamo distinguere tra gli individui eterozigoti e quelli omozigoti per l’allele normale. Si ricordi che i nostri calcoli per la frequenza allelica richiedono che si conti il numero degli alleli:

legge di Hardy-Weinberg. Se la popolazione è in equilibrio di Hardy-Weinberg, la frequenza del genotipo omozigote recessivo è q2: per l’albinismo tra gli hopi q2 = 0,0043 e q può essere ricavato estraendo la radice quadrata della frequenza del genotipo affetto. Pertanto, q = √0,0043 = 0,065 e p = 1 – q = 0,935. Seguendo la legge di Hardy-Weinberg, la frequenza di eterozigoti nella popolazione è 2pq = 2 × 0,935 × 0,065 = 0,122. In media, un hopi su otto è portatore dell’allele per l’albinismo! Non dobbiamo però dimenticare che questo metodo per calcolare le frequenze alleliche si basa sull’assunzione che la popolazione si trovi all’equilibrio previsto dalla legge di Hardy-Weinberg. Nel caso appena esposto, ci sono delle ragioni valide per attendersi deviazioni, poiché gli hopi albini subiscono forti pressioni sociali che portano alla violazione dell’assunzione di incrocio casuale. Se le condizioni della legge di Hardy-Weinberg non vengono rispettate, le nostre stime delle frequenze alleliche non saranno accurate. Inoltre, una volta calcolate le frequenze alleliche in base a queste assunzioni, non possiamo poi saggiare la popolazione per stabilire se le frequenze genotipiche si trovino nelle proporzioni attese in base alla legge di Hardy-Weinberg. Ciò rappresenterebbe una tautologia dato che, per calcolare le frequenze alleliche, fin dall’inizio abbiamo dato per scontate le proporzioni di Hardy-Weinberg. Prima di studiare come il modello possa aiutarci a capire quali siano le cause per cui le popolazioni osservate possono deviare dall’equilibrio di Hardy-Weinberg, prenderemo in esame la struttura genetica di alcune popolazioni reali.

La variabilità genetica nello spazio e nel tempo La struttura genetica delle popolazioni può variare nello spazio e nel tempo. Ciò implica che le frequenze degli al-

(2 × numero degli omozigoti) + (numero degli eterozigoti) p = ––––––––––––––––––––––––––––– (2 × numero totale degli individui) D’altra parte, poiché gli eterozigoti non possono essere fenotipicamente identificati per un carattere recessivo come l’albinismo, la determinazione del numero degli alleli non è praticabile mediante questo metodo. Nondimeno, se assumiamo che la popolazione sia in equilibrio, si possono stabilire le frequenze alleliche a partire dalla

Figura 21.5 Tre bambine hopi, fotografate attorno al 1900. La bambina al centro è albina, una anomalia autosomica recessiva che è presente con alta frequenza tra gli indiani hopi dell’Arizona.

Genetica di popolazioni

leli e la loro distribuzione possano variare tra campioni della stessa specie, ma di differenti aree geografiche, o tra campioni della stessa area, ma raccolti in diversi tempi generazionali. La Figura 21.6 mostra come la variabilità delle frequenze di tre alleli al locus che codifica per l’enzima leucina amminopeptidasi vari gradualmente in una serie di campioni di mitilo blu distribuiti lungo la costa orientale degli Stati Uniti. Molte specie di piante e animali caratterizzate da una vasta distribuzione geografica presentano differenze di questo tipo nelle frequenze alleliche delle popolazioni di aree geografiche diverse. In alcuni casi, in una certa area geografica, la variabilità spaziale presenta degli andamenti chiaramente definiti. Quando le frequenze alleliche variano in modo sistematico in un transetto geografico si parla di cline. Spesso ai clini sono associati cambiamenti nelle caratteristiche fisiche dell’ambiente, come la temperatura o la disponibilità

543

idrica. Nel caso mostrato nella Figura 21.6 è evidente un cline termico. Nonostante clini di questo tipo suggeriscano che la distribuzione geografica sia dovuta a una selezione differenziale per i diversi alleli, sono richiesti studi aggiuntivi per poter escludere altre alternative e provare questa ipotesi. Inoltre, così come la composizione genetica di una specie può variare nello spazio, anche la struttura genetica di una singola popolazione può variare nel tempo, come mostrato nella Figura 21.7. Data l’importanza della variabilità geografica sulle frequenze alleliche, i genetisti di popolazioni hanno sviluppato diversi strumenti statistici per quantificare i modelli spaziali di variabilità genetica. Un metodo tra i più semplici utilizza la ripartizione della varianza genetica nelle sue componenti. Possiamo semplicemente immaginare che una frazione della varianza totale sia dovuta alle differenze entro ciascuna delle popolazioni locali, e

Boston

New York Philadelphia

LAP 94 LAP 96

LAP 98

Figura 21.6 Variazione geografica delle frequenze alleliche di LAP 94, LAP 96 e LAP 98 al locus codificante per la leucina amminopeptidasi (LAP) nel mitilo blu.

544

Capitolo 21 1,0

0,9

Frequenza del gene Est-4F

0,8

0,7

0,6

0,5

0,4

0,3 Popolazione Popolazione Popolazione Popolazione

0,2

A B C D

0,1 N 1970

G

M

M

L 1971

S

N

G

M

M

L 1972

S

N

G

M

M 1973

L

Figura 21.7 Variazione temporale nel locus codificante per l’enzima esterasi 4F nell’arvicola Microtus ochrogaster. Le quattro popolazioni sono vicine l’una all’altra, nei dintorni di Lawrence, nel Kansas.

che un’altra frazione della varianza genetica sia invece dovuta a differenze tra le singole popolazioni locali. Per esempio, con misurazioni di questo tipo si trova che soltanto il 12-13% della varianza genetica nell’uomo è dovuto a differenze tra popolazioni, mentre l’87-88% è presente entro le popolazioni. I modelli geografici di variabilità genetica rivestono anche un’immensa importanza nella conservazione delle specie. Per valutare il potenziale evolutivo di una specie e la conservazione delle risorse genetiche presenti all’interno della stessa, occorre prestare particolare attenzione alla componente spaziale della variabilità genetica fra popolazioni reali. La conservazione della diversità genetica richiede quindi metodi di indagine quantitativi che descrivano modelli geografici di variabilità.

Nota chiave La struttura genetica di una specie può variare in funzione sia dell’area geografica occupata sia del tempo.

La variabilità genetica nelle popolazioni naturali Una delle domande più rilevanti della genetica di popolazioni è quanta variabilità genetica esista entro le popolazioni naturali. Il dato è importante per svariati motivi: innanzitutto, esso determina il potenziale per il cambia-

mento evolutivo e l’adattamento. Inoltre, ci fornisce indizi significativi circa l’importanza relativa dei vari processi evolutivi, poiché alcuni di essi aumentano la variabilità e altri la diminuiscono. Le modalità mediante le quali hanno origine nuove specie e contemporaneamente le popolazioni si estinguono possono dipendere dalla variabilità genetica all’interno delle popolazioni. Inoltre, la capacità di una popolazione di mantenersi nel tempo può essere influenzata dal grado di diversità genetica disponibile nel caso in cui vi siano variazioni delle condizioni ambientali. Per tutte queste ragioni i genetisti di popolazioni sono interessati alla stima della variabilità genetica, nel tentativo di comprendere i processi evolutivi che la influenzano e in che modo essa possa essere perturbata dagli effetti antropici.

Misura della variabilità genetica a livello proteico I genetisti di popolazioni furono per molti anni in difficoltà nello stabilire quanta variabilità esistesse nell’ambito delle popolazioni naturali. I naturalisti riconobbero che, in natura, sia le piante sia gli animali sono frequentemente diversi per quanto riguarda il fenotipo, ma la base genetica di molti caratteri è troppo complessa per permettere di assegnare un genotipo specifico a ogni individuo. Alcuni caratteri e alleli che si manifestavano con un’ereditarietà di tipo mendeliano, come il profilo delle macchie colorate sulle ali nelle farfalle e il colore della conchiglia nelle chiocciole, fornivano una variabi-

Genetica di popolazioni

lità genetica osservabile, ma si trattava di casi troppo isolati per fornire una stima generale della variabilità genetica. Nel 1966 Richard Lewontin e John Hubby pubblicarono un lavoro in cui l’elettroforesi delle proteine veniva applicata allo studio del polimorfismo nelle popolazioni naturali. Come nel caso della separazione elettroforetica delle molecole di DNA, l’elettroforesi delle proteine separa le proteine che migrano in un gel e che poi vengono evidenziate come bande con un colorante specifico. Un tipo comune di elettroforesi separa le proteine sulla base di una combinazione tra la carica (che varia a seconda della composizione amminoacidica) e la configurazione tridimensionale delle stesse. Questo procedimento implica che si possano separare proteine con carica diversa codificate da alleli diversi dello stesso gene. L’elettroforesi delle proteine fornisce ai genetisti di popolazioni una tecnica in grado di stabilire velocemente il genotipo di molti individui per molti loci. Questa procedura utilizzata per esaminare la variabilità genetica in centinaia di specie animali e vegetali, insieme alla successiva applicazione del sequenziamento del DNA, rappresenta una metodologia utile allo studio della variabilità genetica. La variabilità genetica all’interno di una popolazione è stata misurata di solito mediante due parametri, la proporzione di loci polimorfici e l’eterozigosità. Un locus polimorfico è un qualsiasi locus che presenti più di un allele all’interno di una popolazione. La proporzione di loci polimorfici (P) viene calcolata dividendo il numero di loci polimorfici per il totale dei loci analizzati. Per esempio, supponiamo di esaminare 33 loci in una popolazione di raganelle e di trovare che 18 sono polimorfici. La proporzione di loci polimorfici è 18/33 = 0,55. È importante notare che la proporzione di loci polimorfici dipende dalla tecnica usata per individuare il polimorfismo stesso e dalle dimensioni del campione. L’eterozigosità è la proporzione media degli individui di una popolazione eterozigoti per molti loci. Quando si considera un singolo locus in una popolazione naturale, l’eterozigosità osservata (Ho) è il numero degli individui che sono eterozigoti per quel locus e l’eterozigosità attesa (He) è il numero degli eterozigoti attesi se la popolazione è in equilibrio di Hardy-Weinberg. Supponiamo di aver analizzato il genotipo degli individui di una popolazione delle nostre raganelle per il locus dell’esterasi e di aver trovato che la frequenza degli eterozigoti (2pq) è 0,09. Ho per questo locus sarebbe allora 0,09. Facendo una media di questo dato con quelli trovati per altri loci, si ottiene una stima dell’eterozigosità media osservata nella popolazione. Si noti che l’elettroforesi delle proteine non riesce a mettere in evidenza tutta la variabilità che risulta dalla determinazione della sequenza di quel gene, in quanto le mutazioni silenti o sinonime presenti a livello del DNA non lasciano traccia a livello proteico. Ciò significa che le stime dell’eterozigosità e della

545

proporzione di loci polimorfici sono differenti dalle stime basate sulla variazione della sequenza nucleotidica per lo stesso gene. La Tabella 21.3 mostra le stime, basate sull’elettroforesi delle proteine, della proporzione di loci polimorfici e dell’eterozigosità per molte specie. I risultati di questi studi non lasciano adito a dubbi: la maggior parte delle specie possiede a livello proteico una notevole variabilità. Quando queste stime sono comparse per la prima volta, negli anni sessanta e settanta del secolo scorso, risultarono piuttosto sorprendenti, poiché smentivano il modello classico sulla variabilità genetica che era stato principalmente costruito sulla base del lavoro di laboratorio dei genetisti. In base a quel modello, la maggior parte delle popolazioni naturali ha un allele “wild-type” con rari mutanti all’interno della popolazione stessa. La notevole variabilità genetica osservata nelle popolazioni naturali pone il seguente quesito: se il modello classico è erroneo, che cosa mantiene i livelli di variabilità così elevati nelle popolazioni? Inizialmente si ritenne che una grande percentuale di variabilità genetica fosse dovuta a qualche forma di selezione naturale, cioè che risultasse vantaggioso per le popolazioni mantenere tale variabilità. Nel 1968 Motoo Kimura propose che la maggior parte dei cambiamenti evolutivi nelle molecole proteiche potesse essere spiegata da forze quali la mutazione e la deriva genetica casuale. Questo modello fu anche applicato ai livelli di variabilità entro le popolazioni, e inizialmente molte previsioni basate su questo modello mostrarono un buon adattamento statistico ai dati sperimentali. Grazie al potere esplicativo del modello, Kimura lo denominò teoria neutrale. Questa teoria riconosce la presenza di un’ampia variabilità genetica nelle proteine, ma propone che la maggior parte di essa sia neutrale rispetto alla selezione naturale. Ciò non significa che le proteine analizzate per elettroforesi non siano funzionali, ma piuttosto che le differenti forme proteiche, che sono evidenziate su gel e correlabili a genotipi differenti, siano fisiologicamente equivalenti. Pertanto, poiché la selezione naturale non è in grado di agire sugli alleli neutrali, sono fattori casuali, come la mutazione e la deriva genetica, a determinare gran parte della variabilità genetica che si osserva nelle popolazioni naturali. Secondo questa teoria, solo una piccola proporzione di nuove mutazioni ha un effetto sull’adattamento e, poiché la selezione naturale causa una rapida fissazione o una perdita degli alleli alternativi a specifici loci, la maggior parte della variabilità genetica presente in ogni momento è effettivamente neutrale e non sottoposta alla selezione naturale. Il modello neutralistico è stato uno dei più importanti progressi nella comprensione delle cause della presenza di così tanta variabilità genetica nelle popolazioni naturali. Esso è stato molto dibattuto nella biologia evoluzionistica tra chi credeva che la maggior parte della variabilità genetica fosse mantenuta a questi loci dalla selezione

546

Capitolo 21

Tabella 21.3 Variabilità genica in alcuni dei principali gruppi di animali e piante Proporzione media dei loci Numero di specie

Numero medio di loci esaminati per specie

Polimorfici per popolazione

Eterozigoti per individuo

Insetti Drosophila Altri Vespe aplodiploidi

28 4 6

24 28 15

0,529 ± 0,030a 0,531 0,243 ± 0,039

0,150 ± 0,010 0,151 0,062 ± 0,007

Invertebrati marini

9

26

0,587 ± 0,084

0,147 ± 0,019

Chiocciole Terrestri Marine

5 5

18 17

0,437 0,175

0,150 0,083

Pesci

14

21

0,306 ± 0,047

0,078 ± 0,012

Anfibi

11

22

0,336 ± 0,034

0,082 ± 0,008

Rettili

9

21

0,231 ± 0,032

0,047 ± 0,008

Uccelli

4

19

0,145

0,042

26

26

0,202 ± 0,015

0,054 ± 0,005

Grandi mammiferib

4

40

0,233

0,037

Piantec

8

8

0,464 ± 0,064

0,170 ± 0,031

Gruppo

Roditori

a

I valori sono riportati come media ± l'errore standard. Uomo, scimpanzé, macaco ed elefante marino australe. c Specie prevalentemente a fecondazione incrociata; la diversità genica media è 0,233 ± 0,029. b

naturale e chi credeva che essa fosse selettivamente neutrale. Con i progressi ottenuti in seguito al sequenziamento del DNA e l’utilizzo di test statistici più raffinati per studiare l’influenza di mutazione, deriva genetica e sele-

Nota chiave Nella genetica di popolazioni si incontrano diversi modelli che cercano di spiegare la variabilità presente nelle popolazioni naturali. Negli anni venti e trenta del secolo scorso, il modello classico prevedeva l’esistenza di un “tipo selvatico” originario (wild-type) e che la stragrande maggioranza degli alleli fosse di questo tipo, con poche varianti mutanti nelle popolazioni. Negli anni sessanta e settanta, l’elettroforesi delle proteine rivelò una cospicua quantità di variabilità genetica all’interno delle popolazioni naturali, smentendo così il modello classico e ponendo il quesito su che cosa mantenesse così tanta variabilità genetica al loro interno. La teoria neutrale propone che la variabilità genetica rilevata mediante elettroforesi sia neutrale rispetto alla selezione naturale. Ora sappiamo che esistono complesse interazioni tra mutazione, deriva genetica e migrazione che determinano i livelli di variabilità genetica nelle popolazioni naturali.

zione naturale, ora sappiamo che è una complessa interazione tra queste forze a determinare i livelli di variabilità genetica nelle popolazioni naturali. Infatti, attualmente le più importanti ricerche nella genetica di popolazioni sperimentale si pongono l’obiettivo di determinare come gli impatti relativi di mutazione, deriva genetica, selezione naturale e migrazione interagiscano, in base a modalità complesse, nel determinare i livelli di variabilità genetica che osserviamo nelle popolazioni naturali.

Attività Utilizzate l’elettroforesi delle proteine per misurare la variabilità genetica in popolazioni di mitilo nella iAttività Measuring Genetic Variation (Misura della variabilità genetica) nel sito dedicato agli studenti.

Misura della variabilità genetica a livello del DNA Lo sviluppo della reazione a catena della polimerasi (PCR; vedi Capitolo 9) ha reso semplice per i genetisti di popolazioni ottenere grandi quantità di copie di frammenti di geni da molti individui. I frammenti possono essere separati direttamente su gel per individuare differenze

MyLab

Genetica di popolazioni

nelle loro dimensioni, tagliati con enzimi di restrizione per rivelare differenze nei siti di restrizione, o possono essere sequenziati direttamente. Per illustrare la quantificazione della variabilità genetica a livello del DNA e per poter stimare l’eterozigosità, utilizziamo come esempio la ricerca di un polimorfismo nucleotidico mediante un saggio con endonucleasi di restrizione (una tecnica storicamente importante). Oggi molto più comunemente si utilizzano come metodi di indagine il sequenziamento automatico del DNA o la ricerca del polimorfismo di singoli nucleotidi (SNP), che verrà ripreso in seguito nel capitolo. Supponiamo che due individui differiscano per uno o più nucleotidi in una data sequenza di DNA e che le differenze si manifestino in un sito di riconoscimento per un enzima di restrizione. Uno degli individui possiede una molecola di DNA che contiene il sito di restrizione, mentre l’altro individuo no, in quanto la sequenza nucleotidica del DNA è diversa. Se si digerisce il DNA di questi due individui con l’enzima di restrizione e si separano su gel i frammenti risultanti, i due individui producono profili diversi dei frammenti. Questi profili su gel sono denominati Restriction Fragment Length Polymorphisms o RFLP (polimorfismi della lunghezza dei frammenti generati mediante digestione con enzimi di restrizione;

1/1

547

Capitolo 10) e indicano che le sequenze di DNA dei due individui sono diverse. Gli RFLP vengono ereditati allo stesso modo degli alleli che codificano per altri caratteri, con la differenza che gli RFLP non producono un fenotipo visibile all’esterno; i loro fenotipi sono i profili dei frammenti prodotti su di un gel quando il DNA è digerito dall’enzima di restrizione. Allo scopo di illustrare l’uso degli RFLP per stimare la variabilità genetica, supponiamo di isolare il DNA da 5 topi selvatici e di amplificare mediante PCR, usando primer oligonucleotidici complementari a ciascuna delle estremità, la regione polimorfica di DNA che vogliamo saggiare. Quindi tagliamo il DNA amplificato con l’enzima di restrizione BamHI e separiamo i frammenti con l’elettroforesi su gel di agarosio. In Figura 21.8 sono riportati i profili di restrizione che si potrebbero ottenere. Un topo potrebbe essere 1/1 (il sito di restrizione intermedio è presente su entrambi i cromosomi), 1/2 (il sito di restrizione è presente su uno dei cromosomi e assente sull’altro) oppure 2/2 (il sito di restrizione è assente su entrambi i cromosomi). Dei dieci cromosomi presenti in questi cinque topolini, quattro possiedono il sito di restrizione e sei no. L’eterozigosità a livello nucleotidico può essere stimata a partire dai pattern dei siti di restrizione.

2/2

2/2

1/2

1/2

2/2

2/2

1/2

1/2

Segmenti di DNA da cromosomi omologhi

Siti di restrizione

1/1

Sito di restrizione



+ 1/1

2/2

Figura 21.8 Profili di restrizione da cinque topi. I profili sono diversi a causa della presenza (1) o dell’assenza (2) di un sito di restrizione. Ciascun topo possiede due cromosomi omologhi, ognuno dei quali potrebbe presentare il sito di restrizione. Pertanto, un topo può essere 1/1 (se possiede il sito di restrizione su entrambi i cromosomi), 1/2 (se possiede il sito di

2/2

1/2

1/2

restrizione su un cromosoma) o 2/2 (se non possiede il sito di restrizione su alcuno dei cromosomi). Quando il sito di restrizione è presente, il DNA viene tagliato, mediante digestione con l’enzima di restrizione, in due frammenti che saranno poi separati mediante elettroforesi.

548

Capitolo 21

Tabella 21.4 Stima dell’eterozigosità nucleotidica per alcune sequenze di DNA Sequenza di DNA

Organismo

Hnuc

Geni β-globinici

Uomo

0,002

Gene per l’ormone della crescita

Uomo

0,002

Gene per l’alcol deidrogenasi

Drosophila

0,006

DNA mitocondriale

Uomo

0,004

Regione del gene H4

Riccio di mare

0,019

L’eterozigosità a livello dei nucleotidi è stata studiata in un gran numero di organismi; alcuni esempi sono riportati in Tabella 21.4. L’eterozigosità a livello dei nucleotidi varia in genere negli organismi eucarioti tra 0,001 e 0,02. Stime recenti, condotte sull’intero genoma umano, danno una media attorno a 0,0008. Ciò significa che un individuo è eterozigote (contiene nucleotidi diversi sui due cromosomi omologhi) all’incirca in uno ogni 1000 nucleotidi. Variabilità delle sequenze di DNA Abbiamo già visto come l’elettroforesi delle proteine non sia in grado di rivelare quelle differenze genetiche che non fanno variare la carica o la conformazione della proteina. Il metodo migliore per identificare tutta la variabilità genetica esistente è ottenere la sequenza di DNA di un dato gene da ciascun individuo. Nel primo studio che utilizzò questo approccio, Martin Kreitman sequenziò 11 copie (ottenute da moscerini diversi) di un frammento di 2659 coppie di basi del gene che codifica per l’alcol deidrogenasi (Adh) di Drosophila melanogaster, trovando differenze nucleotidiche in 43 posizioni all’interno del frammento. Inoltre, soltanto 3 delle 11 copie erano identiche per tutti i nucleotidi analizzati, e pertanto vi erano 8 alleli diversi (a livello nucleotidico) su 11 copie di questo gene! Ciò suggerisce che le popolazioni posseggano a livello delle loro sequenze di DNA un’immensa variabilità genetica. Apparentemente, regioni distinte di un gene sono sottoposte a processi evolutivi diversi, e ciò si riflette nei differenti livelli di diversità nucleotidica. La Tabella 21.5 riporta stime della diversità nucleotidica osservata per distinte regioni del gene Adh in Drosophila. Nella maggior parte dei geni funzionali, il grado maggiore di diversità si osserva per quei siti che non cambiano la sequenza amminoacidica della proteina codificata e che quindi determinano variazioni sinonime. La diversità nucleotidica sinonima è più elevata di quella osservata per quei nucleotidi che invece alterano la sequenza amminoacidica della proteina determinando variazioni non sinonime. L’alto tasso di diversità nucleotidica osservato nelle posizioni sinonime non risulta inatteso, poiché queste variazioni non influiscono sulla funzionalità della proteina. All’incirca i 3/4 dei siti in un gene sono non si-

nonimi, perciò anche i 3/4 delle mutazioni casuali dovrebbero essere non sinonime, invece il livello di variazione osservato è molto più frequentemente sinonimo. Per esempio, nello studio di Martin Kreitman, c’erano 13 siti sinonimi variati: se le mutazioni non sinonime fossero state presenti con la stessa frequenza, allora avremmo dovuto osservare il triplo di questo numero di siti non sinonimi, vale a dire 39. Al contrario, Kreitman trovò un unico polimorfismo non sinonimo, per cui la conclusione è una soltanto: la maggior parte delle mutazioni non sinonime è esposta alla selezione naturale e viene eliminata dalla popolazione, lasciando in tal modo l’eccesso di siti sinonimi variati. Come nel caso della teoria neutrale, lo sviluppo di metodi statistici più raffinati e di tecnologie più avanzate che permettevano di sequenziare rapidamente ampie regioni genomiche ha rivelato che i meccanismi che determinano i livelli di variabilità genetica del DNA sono più complessi di quanto supposto all’inizio. Per esempio, oggi sappiamo che c’è una preferenza nell’uso dei codoni per amminoacidi che sottopone quelli che sembrano essere codoni sinonimi a una debole selezione naturale, che può anche influire sulla variabilità nella terza posizione dei codoni. Inoltre, la ricombinazione che avviene durante il crossing-over nella meiosi altera in modo consistente la variabilità della sequenza di DNA lungo i cromosomi. Poiché le nuove mutazioni possono insorgere in qualsiasi punto della sequenza di DNA, un allele vantaggioso o deleterio, che è quindi un bersaglio della selezione naturale, può rapidamente essere fissato o essere perso nella popolazione. Durante questo processo, le varianti che sono neutrali o quasi da un punto di vista selettivo, e sono localizzate sul cromosoma nelle vicinanze della nuova mutazione, possono essere trainate verso lo stesso destino dell’allele mutato, e cioè fissate o perse. Questo evento viene chiamato hitchhiking genetico (l’“autostoppista” genetico) e ha un forte effetto di ridistribuzione della variabilità del DNA lungo il genoma e all’interno di specifici geni. L’estensione della regione in Tabella 21.5 Numero di nucleotidi variati e stima della diversità in cinque regioni diverse del gene per l’alcol deidrogenasi (Adh) di Drosophila melanogaster Siti variabili

Siti totali

Diversità

Regioni fiancheggianti al 5’ e al 3’

3

335

0,002

Esoni Sinonimo Non sinonimo

3 1

192 576

0,013 0,001

18 5

789 767

0,004 0,003

Regioni del gene

Introni Non trascritto al 3’

Genetica di popolazioni

cui la selezione di una nuova mutazione influenza gli alleli adiacenti è determinata dalla frequenza del crossingover che provoca rotture in quella regione cromosomica, rendendola meno soggetta all’hitchhiking genetico. I modelli teorici e gli studi empirici nella moderna genetica di popolazioni si pongono l’obiettivo di identificare precisamente come queste forze interagiscano nelle popolazioni naturali e determinino i livelli e le componenti della variabilità che si osservano in natura nei genomi degli organismi. Polimorfismi di singoli nucleotidi (SNP) Il rapido progresso della tecnologia sviluppata per studiare la sequenza del DNA permette di stabilire molto rapidamente e con costi relativamente contenuti le frequenze alleliche di molti polimorfismi a livello nucleotidico, sparsi in ampie regioni genomiche. I polimorfismi di singoli nucleotidi (SNP) possono essere identificati usando metodi ad alta efficienza che comprendono reazioni basate sull’estensione della singola base (SBE, Single Base Extention) e altre tecniche che si avvalgono di strumenti, come i chip a DNA, che permettono di studiare migliaia di SNP in pochissimo tempo. Queste tecnologie sono state usate per catalogare milioni di SNP nel genoma umano e stimare le loro frequenze alleliche nelle popolazioni di differenti origini etniche. Questi dati sono accessibili al pubblico

549

per scopi di ricerca e sono il risultato del lavoro di un consorzio di scienziati che ha permesso la costruzione di mappe di aplotipi del genoma umano (vedi Capitolo 8). La motivazione principale che ha spinto alla catalogazione degli SNP lungo il genoma umano riguarda la possibilità del loro utilizzo in studi di linkage e di associazione finalizzati all’identificazione di geni che determinano patologie nell’uomo. I dati archiviati offrono però anche l’eccezionale opportunità di esplorare la struttura genetica e la storia evolutiva delle popolazioni umane utilizzando modelli di genetica di popolazioni. Gli scienziati stanno attualmente lavorando alla catalogazione di tutti gli SNP del genoma umano per estendere ulteriormente la mappa degli aplotipi, un argomento esaminato nel Focus sul genoma di questo capitolo. Uno degli scopi dei genetisti di popolazioni è distinguere gli effetti della selezione naturale da quelli dovuti a migrazione, deriva genetica e mutazione, che hanno lasciato le loro tracce sulla variabilità genetica che oggi osserviamo nelle popolazioni naturali. Poiché la migrazione e la deriva genetica hanno effetti sul polimorfismo dei loci lungo tutto il genoma, le stime di questi effetti possono essere usate come uno schema su cui sovrapporre e confrontare i pattern di variabilità genetica che si osserva a specifici loci e che possono essere stati bersaglio della selezione naturale. La similarità dei pattern di variabilità

Focus sul genoma Il progetto dei 1000 genomi Dopo che la sequenza del genoma umano è stata completata, gli scienziati si sono posti un altro obiettivo molto ambizioso. I ricercatori hanno capito che, da quando il sequenziamento del enoma è diventato più veloce ed economico, questo sistema può essere utilizzato per studiare la variabilità genetica presente nelle popolazioni umane, così hanno progettato il sequenziamento di 1000 genomi umani. Il progetto è iniziato alla fine del 2008 con attese molto alte e un costo atteso tra 50 e 500 milioni di dollari, sostanzialmente meno di quanto è stato speso per sequenziare il primo genoma umano. I genomi da sequenziare sono stati selezionati da diverse popolazioni umane, includendo gruppi africani, asiatici ed europei e i nativi del continente americano, per essere sicuri di determinare la maggior diversità possibile nelle varie popolazioni umane. Nel 2010 sono stati presentati i risultati della fase pilota del progetto. Sono stati descritti posizione, frequenza allelica e struttura degli aplotipi per circa 15 milioni di SNP, 1 milione di piccole inserzioni e delezioni e 20 000 varianti strutturali, la maggior

parte precedentemente sconosciuta. Una volta che il sequenziamento sarà completato ci permetterà una più profonda comprensione di quanto le popolazioni umane differiscano l’una dall’altra. I ricercatori prevedono di identificare tutti gli alleli più comuni presenti nell’uomo. In questo caso per comuni si intendono gli alleli che hanno una frequenza maggiore di 0,5-1%. Gli alleli più rari potrebbero non essere presenti nel campione in studio. Anche se il progetto non ci permetterà di acquisire sufficienti informazioni per conoscere completamente la distribuzione allelica in ogni popolazione, potremo iniziare a capire non solo quanta variabilità sia presente in alcune delle più grandi popolazioni umane, ma anche come ogni popolazione sia correlata all’altra. Potremmo, per esempio, confermare le prime osservazioni relative alla maggiore variabilità nelle popolazioni africane rispetto a quelle europee o asiatiche, a supporto della teoria che la specie umana si sia evoluta in Africa e che poi, migrando, abbia colonizzato il mondo.

550

Capitolo 21

genetica di un locus particolare con quelli degli altri loci lungo il genoma suggerirebbe che la variabilità a tale locus non sia stata influenzata dalla selezione naturale. Diversamente, le differenze nei pattern di variabilità genetica a uno specifico locus comparata con quella degli altri loci del genoma suggerirebbero che tale locus possa essere stato influenzato dalla selezione naturale nel passato o nel presente. Il database di SNP ci fornisce dati sui polimorfismi a così larga scala che noi possiamo usarlo per dedurre storia demografica (migrazione e deriva genetica), mutazione e selezione di specifici loci. Studi recenti si sono avvalsi di metodologie ad alta efficienza per l’identificazione di SNP, per seguire le variazioni di frequenze alleliche nelle popolazioni umane migrate dall’Africa circa 200 000 anni fa verso altre aree geografiche della Terra. Un simile approccio allo studio degli SNP ha dimostrato che nelle popolazioni europee ci sono più mutazioni deleterie che in quelle ancestrali africane. Questa situazione è probabilmente dovuta all’effetto collo di bottiglia (descritto più avanti), successivo alla migrazione dall’Africa, che ha favorito gli alleli deleteri. Polimorfismi di lunghezza del DNA e microsatelliti Oltre all’evoluzione delle sequenze nucleotidiche attraverso le sostituzioni, spesso la variabilità si ritrova nel numero di nucleotidi di un gene. Questo tipo di variazione viene definito polimorfismo di lunghezza del DNA, ed è dovuto a delezioni e inserzioni di brevi sequenze nucleotidiche. Polimorfismi di lunghezza del DNA sono stati per esempio osservati nel gene per l’alcol deidrogenasi di Drosophila melanogaster. Oltre alle notevoli variazioni della sequenza nucleotidica, Kreitman trovò, nelle 11 copie del gene esaminate, 6 tra inserzioni e delezioni, tutte limitate agli introni e alle sequenze fiancheggianti, nessuna negli esoni. Infatti, inserzioni e delezioni all’interno degli esoni alterano la fase di lettura e pertanto sono selezionate contro; ne risulta che inserzioni e delezioni sono più comuni a livello delle regioni non codificanti del DNA, anche se in alcuni geni sono state comunque trovate anche nelle regioni codificanti. Un’altra classe di polimorfismi di lunghezza del DNA riguarda le variazioni del numero di copie di un dato gene, come nel caso dei geni per gli rRNA, in cui il numero di copie varia in modo considerevole tra individui diversi di Drosophila. Un tipo di polimorfismo particolarmente utile, comune a quasi tutti gli organismi, è costituito dai microsatelliti, detti anche Short Tandem Repeats, o STR. Gli STR sono sequenze di DNA di 2-6 coppie di basi ripetute in tandem da 5 fino a un centinaio di volte (vedi Capitolo 10). Nel genoma umano sono stati mappati più di 8000 microsatelliti e il loro uso nella mappatura genetica dell’uomo e del topo è stato essenziale per la scoperta di molti geni associati a malattie genetiche (vedi Capitolo 14). Nella genetica della conservazione ci si trova spesso a cercare informazioni sulla variabilità genetica di organi-

smi mai studiati in precedenza a livello di sequenza del DNA; in questo caso i microsatelliti sono la scelta di elezione per misurare il grado e la distribuzione della variabilità genetica.

Nota chiave La variabilità genetica è misurabile mediante lo studio dei polimorfismi del DNA (di singoli nucleotidi o SNP, e di lunghezza come i microsatelliti) che segregano in modo mendeliano. Anche per questi loci è applicabile la legge di Hardy-Weinberg purché siano verificate le condizioni di equilibrio.

Forze che cambiano le frequenze alleliche nelle popolazioni Abbiamo descritto i molti metodi mediante i quali si può quantificare la variabilità genetica nelle popolazioni naturali e siamo giunti alla conclusione che le popolazioni possiedono elevatissimi livelli di variabilità. Abbiamo anche menzionato alcune delle forze evolutive che possono causare una così grande variabilità genetica. È ora giunto il momento di chiederci che cosa mantenga questa variabilità e di introdurre alcuni dei modelli formali che i genetisti di popolazioni utilizzano per dedurre quali forze ne siano responsabili. Quando la popolazione è grande, a incrocio casuale e non soggetta a migrazione, mutazione e selezione, qualunque tipo di variabilità esista in essa rimarrà allo stesso livello per sempre. Questa è la legge di Hardy-Weinberg. Tuttavia, le condizioni richieste dalla legge di Hardy-Weinberg in molte popolazioni non sussistono, poiché le popolazioni sono frequentemente piccole, l’incrocio può non essere casuale e possono verificarsi mutazione, migrazione e selezione naturale. In queste circostanze, le frequenze alleliche cambiano e il pool genico della popolazione evolve come risposta all’azione incrociata di diversi fattori evolutivi. Da un certo punto di vista la legge di Hardy-Weinberg rappresenta un modello nullo che però possiamo utilizzare per distinguere quali forze possano causare le deviazioni dalla previsione iniziale e quindi determinare un processo evolutivo nelle popolazioni naturali. Nei paragrafi che seguono discuteremo il ruolo di quattro processi evolutivi – mutazione, deriva genetica, migrazione e selezione naturale – nel variare le frequenze alleliche di una popolazione. Discuteremo, inoltre, gli effetti dell’incrocio non casuale sulle frequenze genotipiche. Considereremo dapprima le eccezioni alle assunzioni dell’equilibrio di Hardy-Weinberg prese singolarmente, e poi diversi casi in cui due delle assunzioni vengono violate contemporaneamente. Analizzeremo anche brevemente in che modo l’equilibrio di HardyWeinberg venga alterato da due o più loci che non segregano indipendentemente. È importante ricordare che nel-

Genetica di popolazioni

le popolazioni reali tutte le assunzioni della legge di Hardy-Weinberg possono essere violate simultaneamente. Tuttavia, considerando situazioni più semplici, in cui agiscano una o due violazioni contemporaneamente, si favorisce una migliore comprensione dei loro effetti.

Nota chiave Mutazione, deriva genetica casuale, migrazione, incrocio non casuale e selezione naturale sono forze che possono alterare le frequenze alleliche di una popolazione.

Mutazione Uno dei processi in grado di alterare le frequenze alleliche in una popolazione è la mutazione. Come discusso nel Capitolo 7, le mutazioni geniche sono rappresentate da cambiamenti ereditabili nel DNA che avvengono all’interno di un dato locus. Di solito, una mutazione converte una forma allelica di un gene in un’altra. Il tasso con il quale avvengono le mutazioni è generalmente basso, ma varia tra loci e tra specie (Tabella 21.6). Certi geni influenzano il tasso generale di mutazione, e molti fattori ambientali, come agenti chimici, radiazioni e agenti infettivi, possono aumentare il numero di mutazioni. Il concetto di fondo è che la mutazione è la fonte di tutta la nuova variabilità genetica; mediante la ricombinazione possono insorgere nuove combinazioni di alleli, ma i nuovi alleli si generano soltanto per effetto della mutazione. Pertanto, la mutazione fornisce il materiale genetico grezzo sul quale agisce l’evoluzione. Alcune mutazioni sono del tutto neutrali e non hanno effetto sulla capacità riproduttiva degli organismi. Altre mutazioni sono dannose e vengono eliminate dalla popolazione. Tuttavia, alcune mutazioni portano dei vantaggi agli individui che le possiedono e si diffondono nella popolazione. Il fatto che una mutazione sia neutrale, dannosa o favorevole dipende dall’ambiente specifico e, se l’ambiente cambia, mutazioni sfavorevoli o neutrali possono diventare vantaggiose. Per esempio, dopo l’uso massiccio dell’insetticida DDT, gli insetti con mutazioni che conferivano resistenza al DDT erano in grado di sopravvivere e di riprodursi; a causa di questo vantaggio, le mutazioni si diffusero e molte popolazioni di insetti svilupparono rapidamente la resistenza al DDT. Le mutazioni sono di fondamentale importanza per il processo di evoluzione, dato che forniscono la variabilità genetica sulla quale agiscono gli altri processi evolutivi. In genere i tassi di mutazione sono così bassi che, una volta che un allele mutante compare in una popolazione, il destino della mutazione stessa sarà determinato unicamente da forze non mutazionali. Per dimostrarlo, consideriamo un modello in cui la mutazione sia la sola forza che agisce sulla popolazione. La mutazione da A ad a vie-

551

ne detta mutazione in avanti (più semplicemente mutazione). Per la maggior parte dei geni, le mutazioni avvengono anche nella direzione opposta: a può mutare ad A. Queste mutazioni sono chiamate reversioni e avvengono solitamente con frequenza minore delle mutazioni in avanti. Il tasso di mutazione (la frequenza con la quale A muta ad a: ADa) viene indicato con il simbolo u; il tasso di reversione (la frequenza con la quale a muta ad A: AEa) si indica con il simbolo v. Si consideri una popolazione ipotetica nella quale la frequenza di A sia p e la frequenza di a sia q. Assumiamo che la popolazione sia grande e che non ci sia selezione per nessuno degli alleli: a ogni generazione, una frazione u di tutti gli alleli A muta ad a. Il numero effettivo di alleli che mutano dipende sia da u sia dalla frequenza degli alleli A. Supponiamo, per esempio, che la popolazione sia formata da 100 000 alleli; se u è pari a 10–4, un allele ogni 10 000 da A muta ad a. Quando p = 1,0, tutti i 100 000 alleli della popolazione sono A e liberi di mutare ad a, pertanto si ha 10–4 × 100 000 = 10 alleli A che potrebbero mutare ad a. Tuttavia, se p = 0,10, soltanto 10 000 alleli sono A e liberi di mutare ad a. Pertanto, con un tasso di mutazione di 10–4, soltanto 1 allele A andrà incontro a mutazione. La diminuzione della frequenza di A che risulta dalla mutazione ADa è pari a up; l’aumento della frequenza dovuto ad AEa è pari a vq. Come risultato della mutazione, la quantità di cui A decresce in una generazione è uguale all’incremento di alleli A dovuto a reversione meno la diminuzione degli alleli A dovuta a mutazione. Dato che il tasso di mutazione aumenta la frequenza di a e il tasso di reversione la diminuisce, è intuitivo che, a un certo momento, la popolazione raggiunga un equilibrio per il quale il numero di alleli che subiscono mutazione è esattamente uguale a quello degli alleli che vanno incontro a reversione. A questo punto, non avvengono ulteriori variazioni nelle frequenze alleliche, nonostante mutazione e reversione continuino ad avvenire. La teoria della genetica di popolazioni dimostra, con alcune semplici formule algebriche, che la frequenza all’equilibrio per a è: u Ÿ q = ––––– u+v e dunque Ÿ p=1–Ÿ q Si consideri ora quanto lentamente questo processo, basato soltanto sulla mutazione, possa far variare le frequenze alleliche. Data una popolazione in cui le frequenze alleliche iniziali siano p = 0,9 e q = 0,1 e i tassi di mutazione e reversione siano u = 5 × 10–5 e v = 2 × 10–5, nella prima generazione la variazione delle frequenze alleliche è: Δp = vq – up = (2 × 10–5 × 0,1) – (5 × 10–5 × 0,9) Δp = –0,000043

552

Capitolo 21

Tabella 21.6 Frequenze di mutazione spontanea a loci specifici in diversi organismia Mutazioni ogni 100 000 gametib

Organismo

Carattere

Batteriofago T2 (virus)

Verso lisi rapida (r+Dr) Verso nuova specificità di ospite (h+Dh)

7 0,001

E. coli K12 (batterio)

Verso resistenza alla streptomicina Verso resistenza al fago T1 Verso prototrofia per leucina Verso prototrofia per arginina Verso prototrofia per triptofano Verso auxotrofia per arabinoso

0,00004 0,003 0,00007 0,0004 0,006 0,2

Salmonella typhimurium (batterio)

Verso resistenza alla treonina Verso auxotrofia per istidina Verso prototrofia per triptofano

0,41 0,2 0,005

Diplococcus pneumoniae (batterio)

Verso resistenza alla penicillina

0,01

Neurospora crassa

Verso prototrofia per adenina Verso prototrofia per inositolo (un allele inos, JH5202)

0,0008-0,029 0,001-0,010 1,5

Drosophila melanogaster (maschi)

Da y+ a yellow Da bw+ a brown Da e+ a ebony Da ey+ a eyeless

12 3 2 6

Mais

Da Wx a waxy Da Sh a shrunken Da C a colorless Da Su a sugary Da Pr a purple Da I a i Da Rr a rr

0,00 0,12 0,23 0,24 1,10 10,60 49,20

Topo

Da a+ a non agouti Da b+ a brown Da c+ a albino Da d+ a dilute Da ln+ a leaden Reversione per i geni sopracitati

2,97 0,39 1,02 1,25 0,80 0,27

Coltura di cellule somatiche di hamster cinese

Verso resistenza all’azaguanina Verso prototrofia per glutammina

0,0015 0,014

Uomo

Acondroplasia Aniridia Distrofia miotonica Epiloia Corea di Huntington Poliposi intestinale Neurofibromatosi Osteogenesi imperfetta Anomalia di Pelger Retinoblastoma

0,6-1,3 0,3-0,5 0,8-1,1 0,4-1 0,5 1,3 5-10 0,7-1,3 1,7-2,7 0,5-1,2

a Le mutazioni per indipendenza da sostanze nutritive sono da intendersi come mutazioni dalla condizione di auxotrofia (per es. leu) a quella di prototrofia (per es. leu+). b I tassi stimati di mutazione per i virus, i batteri, Neurospora e le cellule somatiche di hamster sono basati su conteggi a livello di particella o di cellula piuttosto che di gameti.

La frequenza di A diminuisce soltanto di quattro millesimi dell’1%. Dato che i tassi di mutazione sono così bassi, la variazione delle frequenze alleliche dovuta alla mutazione è estremamente lenta. Per cambiare la frequenza da 0,5 a 0,49 sarebbero richieste 2000 generazioni, e per

cambiarla da 0,1 a 0,09 sarebbero richieste 10 000 generazioni. Se si considera anche il tasso di reversione, la velocità della variazione è ancora più lenta. In pratica, la mutazione di per sé fa variare le frequenze alleliche a un tasso talmente ridotto che le popolazioni si trovano rara-

Genetica di popolazioni

mente in un equilibrio mutazionale. Altri processi cambiano le frequenze alleliche più profondamente, e raramente è la mutazione soltanto a determinare le frequenze alleliche di una popolazione. Per esempio, il nanismo acondroplasico è un carattere autosomico dominante nell’uomo che insorge per mutazione ricorrente. Tuttavia la frequenza di questa patologia nelle popolazioni umane è dovuta a un’interazione fra mutazione e selezione naturale.

Nota chiave Studiando che cosa accade quando le assunzioni dell’equilibrio di Hardy-Weinberg vengono violate, abbiamo visto come la mutazione sia l’unico modo in cui una specie può acquisire nuovo materale genetico. Più ampia è la popolazione, maggiore sarà la probabilità che avvengano nuove mutazioni; tuttavia, l’effetto della sola mutazione sulle frequenze alleliche è quasi trascurabile.

Deriva genetica casuale Una delle assunzioni principali della legge di HardyWeinberg è che la popolazione sia infinitamente grande. Le popolazioni reali hanno dimensioni finite, ma sono frequentemente ampie abbastanza da far sì che i fattori casuali non abbiano effetti significativi sulle frequenze alleliche. Tuttavia, alcune popolazioni sono piccole e in questo caso i fattori casuali possono produrre ampie variazioni nelle frequenze alleliche. La variazione nelle frequenze alleliche dovuta al caso viene detta deriva genetica casuale o, più semplicemente, deriva genetica. Ronald Fisher e Sewall Wright (Figura 21.1), brillanti genetisti di popolazioni che posero le fondamenta teoriche di questa disciplina, furono i primi a descrivere in che modo la deriva genetica influenzi l’evoluzione delle popolazioni. Le variazioni casuali nelle frequenze alleliche possono rappresentare un importante processo evolutivo nelle piccole popolazioni. Inoltre, queste variazioni possono avere importanti conseguenze per la conservazione di specie rare o minacciate. Per capire come il caso possa assumere un ruolo importante nel modificare la struttura genetica di una popolazione, si immagini un piccolo insediamento umano che abiti in un’isola del Pacifico del Sud e che questa popolazione sia costituita da 10 individui soltanto, cinque dei quali abbiano occhi verdi e cinque occhi castani. Per comodità assumeremo che il colore degli occhi sia determinato da un singolo locus (in realtà, il colore degli occhi è controllato da più geni) e che l’allele per occhi verdi sia recessivo rispetto a quello per occhi castani (BB e Bb codificano per occhi castani e bb per occhi verdi). La frequenza dell’allele per occhi verdi nella popolazione isolana è 0,6. Un tifone colpisce l’isola, ucci-

553

dendo il 50% della popolazione: tutti coloro che muoiono hanno gli occhi castani. Il colore degli occhi non ha effetto alcuno sulle capacità di sopravvivenza; il fatto che solo individui con gli occhi verdi siano vivi è esclusivamente il risultato di un evento casuale. Dopo il tifone, la frequenza allelica per gli occhi verdi è passata da 0,6 a 1 semplicemente come risultato del caso. Ora, si immagini lo stesso scenario, ma questa volta con una popolazione di 1000 individui: come in precedenza, il 50% della popolazione ha occhi verdi e il 50% ha occhi castani. Un tifone colpisce l’isola e uccide metà della popolazione. Quanto è probabile che, per puro caso, tutti i 500 individui che periscono abbiano gli occhi castani? In una popolazione di 1000 individui, la probabilità che questo avvenga per caso è estremamente remota. Questo esempio illustra un’importante caratteristica della deriva genetica: è probabile che i fattori casuali producano variazioni rapide nelle frequenze alleliche solamente in piccole popolazioni. Fattori casuali di mortalità nelle popolazioni naturali, come i tifoni degli esempi precedenti, rappresentano soltanto uno dei numerosi modi attraverso i quali la deriva genetica ha effetto. Anche le deviazioni casuali dai rapporti attesi di gameti e zigoti producono deriva genetica. Nei capitoli precedenti abbiamo visto l’importanza delle deviazioni casuali dai rapporti attesi negli incroci genetici: per esempio, quando incrociamo un eterozigote con un omozigote (Aa × aa) ci attendiamo che il 50% della progenie sia eterozigote e il 50% omozigote. Tuttavia, non ci attendiamo di ottenere esattamente il 50% ogni volta e, se il numero della progenie è piccolo, il rapporto osservato può essere considerevolmente diverso dall’atteso. Si ricordi che la legge di Hardy-Weinberg è basata sull’incrocio casuale e sulle frequenze attese nella progenie di ciascun tipo di incrocio (Tabella 21.2). Se, per caso, il numero reale della progenie è differente dai rapporti attesi, i genotipi potrebbero non essere nelle proporzioni di Hardy-Weinberg. Deviazioni casuali dalle frequenze attese sono il risultato di un fenomeno generale definito errore di campionamento. Si immagini che una popolazione produca un insieme infinitamente grande di gameti, con gli alleli che hanno le frequenze p e q. Se vi è incrocio casuale e tutti i gameti si uniscono a formare degli zigoti vitali, le proporzioni dei genotipi saranno uguali a p2, 2pq e q2, e le frequenze alleliche in questi zigoti saranno p e q. Se il numero della progenie è tuttavia limitato, i gameti che si uniscono a formare la progenie costituiranno un campione dell’insieme infinito di gameti potenziali. Semplicemente per caso, o per “errore”, questo campione può deviare rispetto all’insieme più grande; più piccolo è il campione, più grande sarà lo scostamento potenziale. Il lancio di una moneta è analogo a una situazione in cui avviene un errore di campionamento. Quando lanciamo una moneta, ci attendiamo un 50% di teste e un 50%

554

Capitolo 21

di croci: se lanciamo la moneta 1000 volte, ci troveremo molto vicini al rapporto atteso cinquanta-cinquanta. Ma, se lanciassimo la moneta quattro volte soltanto, non saremmo sorpresi se per caso ottenessimo 3 teste e una croce, o anche tutte croci. Quando il campione, in questo caso il numero di lanci, è ridotto, l’errore di campionamento può essere grande. Tutti i casi di deriva genetica sono il risultato di tale errore. I matematici hanno calcolato la probabilità esatta di ottenere per esempio 499 teste e 501 croci, basandosi su quella che viene detta distribuzione binomiale. Per i nostri scopi, l’importante è notare che una popolazione, che possieda una frequenza p di alleli A a una data generazione, determina gli alleli per la generazione successiva, e che la frequenza attesa alla generazione successiva è ancora p, ma che esiste una variabilità intorno a p dovuta alla deriva. Infatti la varianza di campionamento per le frequenze alleliche è data da pq/2N, dove N è il numero di individui della popolazione. In questo modo si comprende come a popolazioni piccole sia associata una varianza di campionamento maggiore che non a popolazioni più grandi in cui la deriva agisce più lentamente. La dimensione effettiva della popolazione La deriva genetica è casuale e pertanto non possiamo prevedere quali frequenze alleliche ne conseguiranno. Tuttavia, dato che l’errore di campionamento è correlato alle dimensioni della popolazione, possiamo prevedere la grandezza dell’effetto di deriva genetica. Spesso gli ecologi misurano le dimensioni di una popolazione contando il numero degli individui, ma non tutti gli individui danno un contributo gametico alla generazione successiva. Per stabilire la grandezza della deriva genetica, dobbiamo conoscere la dimensione effettiva della popolazione, che è pari al numero equivalente di adulti che forniscono gameti alla generazione successiva. Se i sessi sono in numero uguale e tutti gli individui hanno uguale probabilità di procreare, la dimensione effettiva della popolazione è pari al numero di adulti che si riproducono nella popolazione. Tuttavia, quando maschi e femmine non sono presenti in numero uguale, la dimensione effettiva della popolazione (Ne) è: 4 × Nf × Nm Ne = ––––––––––– Nf + Nm dove Nf è il numero di femmine in età riproduttiva e Nm quello dei maschi. Non è difficile capire perché la dimensione effettiva della popolazione non sia semplicemente equivalente al numero di adulti in età riproduttiva. La ragione è che i maschi, come gruppo, contribuiscono per metà di tutti i geni della generazione successiva e le femmine, come gruppo, per l’altra metà. Pertanto, in una popolazione di 70 femmine e 2 maschi, i due maschi non sono equivalenti, dal punto di vista genetico, a due femmine; ciascun

maschio fornisce 1/2 × 1/2 = 0,25 dei geni alla generazione successiva, mentre ciascuna femmina fornisce 1/2 × 1/70 = 0,007 di tutti i geni. Il piccolo numero di maschi ha un effetto sproporzionato sulla determinazione degli alleli nella generazione successiva. Usando l’equazione precedente, la dimensione effettiva della popolazione è Ne = (4 × 70 × 2)/(70 + 2) = 7,8, ossia all’incirca 8 adulti capaci di riprodursi. Ciò significa che, in una popolazione di 70 femmine e 2 maschi, la deriva genetica avrà luogo come se la popolazione fosse composta da soltanto 4 maschi e 4 femmine in grado di riprodursi. Pertanto, la deriva genetica avrà un effetto molto più grande in questa popolazione che in una con 72 individui in grado di riprodursi equamente distribuiti tra maschi e femmine. Altri fattori possono ridurre ulteriormente la dimensione effettiva di una popolazione, come la produzione differenziale di progenie, una dimensione non fissa della popolazione e generazioni che tendono a sovrapporsi. In genere, questi fattori determinano una riduzione della dimensione effettiva rispetto al numero di adulti presenti. Effetto del fondatore ed effetto collo di bottiglia Tutti i casi di deriva genetica derivano da errore di campionamento, ma esistono diversi modi in cui in popolazioni naturali esso può verificarsi. In primo luogo, come abbiamo già descritto, si ha deriva genetica quando la dimensione della popolazione rimane costantemente piccola per un periodo di tempo prolungato: questa situazione è senza dubbio frequente, in special modo dove le popolazioni occupano habitat marginali o quando la competizione per le risorse limita la crescita della popolazione. In tali casi la deriva genetica svolge un ruolo importante nell’evoluzione delle frequenze alleliche. Molte specie sono distribuite su un vasto areale geografico, e da ciò può conseguire che una specie sia composta da molte popolazioni di dimensioni ridotte, ciascuna delle quali può essere soggetta a deriva in modo indipendente dalle altre. Inoltre gli interventi antropici, come il taglio delle foreste, possono condurre alla frammentazione una popolazione originariamente grande e continua. L’effetto della deriva genetica causata dalle piccole dimensioni della popolazione è visibile in un classico esperimento condotto in laboratorio da P. Buri con Drosophila melanogaster. Buri esaminò le frequenze di due alleli, bw75 e bw, a un locus che determina il colore dell’occhio nei moscerini della frutta. Egli partì da 107 popolazioni, in ognuna delle quali la frequenza di bw75 era 0,5; i moscerini erano liberi di incrociarsi casualmente in ogni popolazione e, a ogni generazione, Buri scelse a caso 8 maschi e 8 femmine come genitori per la generazione successiva. Pertanto, la dimensione effettiva della popolazione era sempre di 16 individui. La distribuzione delle frequenze alleliche nelle 107 popolazioni è riportata in Figura 21.9. Si noti che le frequenze alleliche erano raggruppate intorno allo 0,5 nelle prime generazioni,

555

Genetica di popolazioni

mentre in seguito la deriva genetica causò una divergenza nelle frequenze alleliche delle popolazioni. Alla generazione 19, la frequenza di bw75 era 0 o 1 nella maggior parte delle popolazioni. L’aspetto più elegante di questo esperimento risiede nel fatto che i risultati concordano appieno con gli effetti teorici attesi della deriva previsti da Fisher e Wright. Il modello di Fisher e Wright considera le variazioni della frequenza allelica da una generazione all’altra come l’effetto del campionamento da una distribuzione binomiale, i cui parametri (le frequenze alleliche), però, cambiano a causa della variazione delle frequenze alleliche stesse. Questo elegante modello si adatta molto bene ai dati di Buri, tenendo conto anche delle dimensioni effettive della popolazione (che erano inferiori a 16). Un altro modo con cui si può avere deriva genetica è mediante l’effetto del fondatore: esso si verifica quando una popolazione viene inizialmente costituita a partire da un piccolo numero di individui che si incrociano tra di loro. Sebbene la popolazione possa in seguito accrescersi di numero e infine essere costituita da molti individui, il suo pool genico è sempre quello derivato dai geni presenti negli individui fondatori. Il caso può giocare un ruolo importante nello stabilire quali fossero i geni presenti tra i fondatori, e ciò ha effetti profondi sul pool genico delle generazioni seguenti. L’effetto del fondatore è stato richiamato di frequente per spiegare l’evoluzione di nuove specie, ma la sua importanza relativa al processo di speciazione è tuttora oggetto di intenso studio e dibattito. Nello studio delle popolazioni umane si trovano molti esempi eccellenti dell’effetto del fondatore: si considerino gli abitanti di Tristan da Cunha, una piccola isola sperduta nell’Atlantico del Sud. Quest’isola venne colonizzata in modo permanente per la prima volta da William Glass, uno scozzese, e dalla sua famiglia nel 1817 (molti tentativi precedenti di stabilire un insediamento erano falliti). Essi vennero raggiunti da pochi altri coloni, alcuni marinai naufragati e alcune donne dalla lontana isola di S. Elena, ma perlopiù l’isola rimase isolata dal punto di vista genetico. Nel 1961 un vulcano di Tristan da Cunha eruttò e la popolazione, di quasi 300 abitanti, fu evacuata in Inghilterra dove, durante una permanenza di due anni, i genetisti studiarono gli isolani e ricostruirono la storia genetica della popolazione. Questi studi rivelarono che il pool genico di Tristan da Cunha aveva subito una forte deriva genetica. Tre forme diverse di deriva genetica avevano avuto luogo durante l’evoluzione della popolazione dell’isola. In primo luogo, l’effetto del fondatore al tempo dell’insediamento iniziale. Nel 1855 la popolazione di Tristan da Cunha contava circa 100 individui, ma il 26% dei geni della popolazione era stato fornito da William Glass e dalla moglie. Perfino nel 1961 i due coloni originali contribuivano con il 14% a tutti i geni dei 300 individui della popolazione. I geni di Glass e degli altri coloni origi-

Generazione: 1 2 3 4 5 6 7 8 9 10 11 12 13

14

15

16

17

18

19 0

0,5 Frequenza dell’allele bw75

1,0

Figura 21.9 Risultati degli studi di Buri sulla deriva genetica in 107 popolazioni di Drosophila melanogaster. Sono mostrate le distribuzioni delle frequenze dell’allele bw75 tra popolazioni in 19 generazioni consecutive. Ciascuna popolazione è formata da 16 individui.

nali avevano influenzato in modo notevole il susseguente pool genico della popolazione. In secondo luogo, la dimensione della popolazione era rimasta piccola durante tutta la storia dell’insediamento, pertanto si era continuamente verificato un errore di campionamento. Infine, un terzo fenomeno di deriva genetica ebbe un ruolo importante nella popolazione di Tristan da Cunha: l’effetto collo di bottiglia. Questo effetto ha luogo quando una popolazione subisce una drastica riduzione delle dimensioni. Durante tale riduzione, alcuni geni possono venire persi dal pool genico per puro effetto del caso: si

556

Capitolo 21

ricordi l’esempio precedente della popolazione di 10 individui che abitavano su un’isola del Pacifico del Sud. Quando il tifone colpì l’isola, la dimensione della popolazione fu ridotta di 5 e, per caso, tutti gli individui con occhi castani erano periti nella tempesta, variando la frequenza dell’allele per occhi verdi da 0,6 a 1; un esempio di effetto collo di bottiglia. Tale fenomeno può anche essere considerato come una sorta di effetto del fondatore, dato che la popolazione viene rifondata a partire da quei pochi individui che sono sopravvissuti alla riduzione. Nella storia di Tristan da Cunha erano avvenuti due importanti colli di bottiglia; il primo ebbe luogo intorno al 1856 e fu dovuto a due eventi: la morte di William Glass e l’arrivo di un missionario che incoraggiò gli abitanti a lasciare l’isola. A quell’epoca, molti abitanti emigrarono in America e in Sudafrica, e la popolazione crollò dai 103 individui della fine del 1855 ai 33 del 1857. Un secondo collo di bottiglia avvenne nel 1885: l’isola di Tristan da Cunha non possiede porti naturali e gli isolani, per commerciare, andavano incontro alle navi di passaggio su piccole barche a remi. Il 28 di novembre del 1885, quindici dei maschi adulti dell’isola salirono su una piccola imbarcazione per raggiungere una nave in transito. Sotto gli occhi dell’intera comunità dell’isola, la barca si rovesciò e tutti i quindici uomini annegarono. In seguito a questo disastro, sull’isola rimasero soltanto quattro maschi adulti, dei quali uno era pazzo e due erano anziani. Negli anni successivi molte delle vedove e le loro famiglie lasciarono l’isola, e le dimensioni della popolazione scesero da 106 a 59. Entrambi i colli di bottiglia ebbero un grosso effetto sul pool genico della popolazione. Tutti i geni di molti dei coloni furono perduti, e i contributi relativi degli altri furono alterati da questi eventi. In sintesi, il pool genico di Tristan da Cunha fu influenzato dalla deriva genetica mediante l’effetto del fondatore, la piccola dimensione della popolazione e l’effetto collo di bottiglia. Come vedremo in seguito, quando si discuterà di migrazione, il flusso genico tra le popolazioni aumenta la dimensione effettiva di una popolazione e riduce gli effetti della deriva genetica. Piccole unità riproduttive in cui il flusso genico è assente risultano geneticamente isolate da altri gruppi e spesso subiscono una notevole deriva genetica, anche quando sono attorniate da popolazioni molto

più grandi. Un buon esempio è costituito da una setta religiosa nella Pennsylvania orientale, i cui esponenti sono conosciuti come Dunkers. Tra il 1719 e il 1729 cinquanta famiglie Dunkers emigrarono dalla Germania e si stabilirono negli Stati Uniti. I Dunkers da allora sono rimasti un gruppo isolato, i cui individui raramente contraggono matrimonio al di fuori della setta, e il numero di persone nelle loro comunità è sempre stato ridotto. Dopo il 1950 i genetisti iniziarono a studiare una delle comunità Dunkers originali nella contea di Franklin, in Pennsylvania. All’epoca in cui questo studio venne condotto, questa popolazione contava circa 300 membri, e le sue dimensioni erano rimaste relativamente costanti per molte generazioni. Gli studiosi scoprirono che alcune delle frequenze alleliche dei Dunkers erano molto diverse da quelle riscontrate in generale nella popolazione degli Stati Uniti e si diversificavano anche da quelle della popolazione della Germania occidentale da cui discendevano. La Tabella 21.7 riporta alcune delle frequenze alleliche al locus per il gruppo sanguigno AB0: le frequenze alleliche per AB0 tra i Dunkers non sono le stesse trovate negli Stati Uniti né nella Germania occidentale. Le frequenze dei Dunkers non sono neppure intermedie tra quelle degli Stati Uniti e quelle della Germania (si potrebbero attendere frequenze intermedie se fosse avvenuto un rimescolamento tra i Dunkers e gli statunitensi). La spiegazione più probabile per le singolari frequenze alleliche osservate tra i Dunkers è che la deriva genetica abbia causato una variazione casuale nel pool genico. L’effetto del fondatore si era probabilmente verificato quando le 50 famiglie originarie si erano trasferite dalla Germania, e la deriva genetica ha probabilmente continuato a influenzare le frequenze alleliche a ogni generazione a partire dal 1729, dato che, da allora, le dimensioni della popolazione sono rimaste piccole.

Effetti della deriva genetica La deriva genetica produce variazioni delle frequenze alleliche, e questi cambiamenti hanno diversi effetti sulla struttura genetica delle popolazioni. In primo luogo, la deriva genetica fa sì che le frequenze alleliche di una popolazione cambino con il tempo, come illustrato in Figura 21.10. Le diverse linee rappresentano le frequenze alleliche in quattro popolazioni su un arco di numerose generazioni. Sebbene tutte le popolazioni partano da una frequenza allelica pari a Tabella 21.7 Frequenze degli alleli che controllano il sistema del gruppo sanguigno 0,5, in seguito le frequenze AB0 in tre popolazioni umane variano a causa dell’errore Frequenze fenotipiche di campionamento. La freFrequenze alleliche (gruppo sanguigno) quenza allelica può aumenPopolazione IA IB i A B AB 0 tare o diminuire in ciascuna generazione, e con l’andare Dunkers 0,38 0,03 0,59 0,593 0,036 0,023 0,348 del tempo può vagare caStati Uniti 0,26 0,04 0,70 0,431 0,058 0,021 0,490 sualmente, andare alla deriGermania occidentale 0,29 0,07 0,64 0,455 0,095 0,041 0,410 va (da cui il termine deriva

Genetica di popolazioni

557

0,8

0,6 q

0,4

0,2

0 0

5

10

15 20 Generazione

25

30

Figura 21.10 L’effetto della deriva genetica sulla frequenza (q) dell’allele A2 in quattro popolazioni. Ogni popolazione comincia con q pari a 0,5 e una dimensione effettiva pari a 20. La frequenza media per le quattro popolazioni dell’allele A2 è indicata dalla linea color magenta. Questi risultati sono stati ottenuti mediante simulazione al computer.

genetica). Alcune volte, per puro caso e prima della trentesima generazione, la frequenza allelica raggiunge il valore 0 oppure 1: a questo punto uno degli alleli viene perso dalla popolazione e si dice che la popolazione è fissata per l’allele rimasto, nel caso di un locus con due alleli. Quando un allele raggiunge la condizione di fissazione, non potrà più avvenire alcuna variazione nelle frequenze alleliche, a meno che l’altro allele non venga reintrodotto per mutazione o per migrazione. La probabilità che un allele si fissi aumenta con il passare del tempo, come dimostrato per via teorica da Motoo Kimura (Figura 21.11): se le frequenze alleliche iniziali sono uguali, quale degli alleli si fissi è solo dovuto al caso. Se, d’altro canto, le frequenze alleliche di partenza non sono uguali, è più probabile che venga perso l’allele raro. Durante il processo di deriva genetica e fissazione, anche il numero di eterozigoti nella popolazione diminuisce e, raggiunta la fissazione, l’eterozigosità della popolazione è zero; pertanto, il secondo effetto della deriva genetica è quello di portare a una riduzione della variabilità genetica all’interno delle popolazioni. La probabilità di fissazione di un allele per deriva genetica è uguale alla frequenza dell’allele stesso. Dal momento che la deriva genetica produce variazioni casuali nelle frequenze alleliche, in popolazioni individuali e separate le frequenze alleliche non variano nella stessa direzione. Pertanto, attraverso la deriva genetica, le frequenze alleliche di popolazioni diverse tendono a divergere. Questo principio viene illustrato nelle Figure 21.9 e 21.10, in cui tutte le popolazioni partono con p e q pari a 0,5. Dopo poche generazioni, le frequenze alleliche delle popolazioni iniziano a divergere, e la divergenza aumenta con il passare delle generazioni. Il massimo della divergenza per le frequenze alleliche vie-

Tempo medio che deve trascorrere (espresso in unità per N generazioni) per la fissazione o la perdita

3N 1,0

2,5N

2N

1,5N

1N

0,5N

0 0

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Frequenza allelica iniziale (p0)

Figura 21.11 Il tempo medio necessario per la fissazione o la perdita di un allele da una popolazione, espresso in funzione delle dimensioni della popolazione e della frequenza allelica iniziale, come previsto da Kimura. Per esempio, se la frequenza allelica iniziale è pari a 0,3 e la dimensione della popolazione è pari a 10, occorrerebbero in media poco meno di 2,5 × 10 generazioni perché l’allele si fissi o venga perduto.

ne raggiunto quando tutte le popolazioni sono fissate per l’uno o per l’altro allele: se le frequenze alleliche iniziali sono pari a 0,5, all’incirca metà delle popolazioni risulterà fissata per un allele e metà per l’altro. Dato che la deriva genetica conduce a divergenze da un punto di vista genetico ed è maggiore in popolazioni piccole, ci attendiamo di trovare una variabilità tra le frequenze alleliche maggiore in piccole popolazioni che in grandi popolazioni; tale relazione è stata in effetti osservata in studi di popolazioni naturali. Robert K. Selander, per esempio, studiò la variabilità genetica in popolazioni di topi domestici che vivevano nei fienili del Texas. Mediante cattura sistematica, fu in grado di stimare le dimensioni della popolazione e con l’elettroforesi esaminò la varianza delle frequenze alleliche a due loci: un locus codificante per l’enzima esterasi (Est-3) e uno codificante per l’emoglobina (Hbb). Selander trovò che la varianza della frequenza allelica nelle popolazioni piccole era parecchie volte maggiore di quella in popolazioni più grandi (Tabella 21.8), un’osservazione in accordo con le nostre conoscenze su come la deriva genetica determini divergenza tra popolazioni. L’equilibrio tra mutazione e deriva genetica Abbiamo osservato come la mutazione introduca continuamente nuove varianti in una popolazione, mentre l’effetto della deriva genetica casuale sia quello di rimuovere questa variabilità. Sappiamo che molti organismi, oggi e

558

Capitolo 21

numero di nuove mutazioni introdotte nella popolazione a ogni generazione è Varianza direttamente proporzionale della frequenza allelica alle sue dimensioni. La b 8 Figura 21.12 riporta l’anEst-3 Hbb damento dell’eterozigosità 0,051 0,188 in funzione di una gamma 0,013 0,008 di valori di Neμ e mostra come livelli plausibili di dimensioni della popolazione e di tassi di mutazione diano anche valori plausibili di eterozigosità. Un problema del modello, come sottolineato da John Gillespie, è che, mentre in organismi diversi le dimensioni delle popolazioni possono variare anche di molti ordini di grandezza, i tassi di mutazione variano solo di poco tra loro. Ci si attenderebbe pertanto che specie caratterizzate da popolazioni più grandi abbiano livelli più elevati di eterozigosità. Esistono notevoli eccezioni a questa previsione, il che lascia supporre che il semplice equilibrio mutazione-deriva non sia in grado di spiegare tutto.

Tabella 21.8 Varianza della frequenza allelica tra popolazioni in funzione Frequenza allelica media Tipo di popolazione

Numero di popolazioni

Est-3b

Hbb8

Piccola (N < 50)

29

0,418

0,849

Grande (N > 50)

13

0,372

0,843

nel passato, formano piccole popolazioni, quindi sia la mutazione sia la deriva genetica sono state importanti meccanismi che hanno determinato la frequenza allelica di molti geni del loro genoma. Che cosa accade se consideriamo contemporaneamente queste due forze, la mutazione e la deriva? Si raggiungerà un equilibrio in cui l’aumento di variabilità dovuto alla mutazione sarà esattamente corrispondente alla perdita di variabilità dovuta alla fissazione casuale degli alleli per deriva? Sono stati proposti diversi modelli per dare una risposta a questo interrogativo; uno dei più semplici è il cosiddetto modello degli alleli infiniti. Secondo questo modello, ogni mutazione in un gene genera un nuovo allele che non si è mai riscontrato in precedenza. Se immaginiamo un gene molto grande, attorno alle 10 000 coppie di basi, la probabilità che due mutazioni producano lo stesso allele è davvero molto piccola, rendendo l’assunzione del modello piuttosto ragionevole. Il modello inoltre prevede che esista deriva genetica dovuta al campionamento ripetuto descritto in precedenza: in tale situazione, le forze della mutazione e della deriva si bilanciano l’una con l’altra producendo un curioso “stato stazionario” in cui nuove mutazioni sono generate di continuo, ma anche gli alleli vengono continuamente persi, generazione dopo generazione. In questo stato stazionario il numero di alleli cambia di poco in ogni generazione, ma tende a non allontanarsi troppo dal valore all’equilibrio. L’eterozigosità del locus, che è interpretabile come la frequenza degli eterozigoti nella popolazione, ovvero la probabilità di estrarre a caso due alleli che siano fra loro diversi, è: 4Ne μ H = —–——— 4Ne μ + 1 Questa equazione è molto importante per molti modelli in genetica di popolazioni: il ruolo della mutazione neutrale e quello delle dimensioni della popolazione si combinano in un unico valore, 4Neμ (si ricordi che Ne è la dimensione effettiva della popolazione). Ciò implica che, se una popolazione avesse dimensioni doppie di un’altra, ma tasso di mutazione pari alla metà, le due popolazioni avrebbero gli stessi livelli di eterozigosità. È piuttosto semplice comprendere il ruolo reciproco della mutazione e delle dimensioni della popolazione: il tasso al quale una popolazione perde variabilità a causa della deriva è inversamente proporzionale alle sue dimensioni, mentre il

Nota chiave La deriva genetica, ovvero le variazioni casuali delle frequenze alleliche dovute all’errore di campionamento, può avere importanti implicazioni riguardo alla sopravvivenza e all’evoluzione di popolazioni piccole. La deriva genetica conduce alla perdita di variabilità genetica entro le popolazioni, a divergenza genetica tra popolazioni e, nel corso del tempo, a fluttuazioni casuali delle frequenze alleliche di una popolazione. La deriva genetica può inoltre spiegare in che modo in specie diverse determinate molecole accumulino differenze su di una base apparentemente regolare, costituendo così la base della teoria neutrale dell’evoluzione molecolare.

0,9 0,8 0,7 Eterozigosità

delle dimensioni della popolazione

0,6 0,5 0,4 0,3 0,2 0,1 0 0

5 4Ne m

10

Figura 21.12 Relazione tra il parametro neutrale q = 4Nem e l’eterozigosità attesa in base al modello degli alleli infiniti per il quale si ha un equilibrio tra mutazione e deriva genetica.

Genetica di popolazioni Pool genico prima della migrazione

Migrazione Una delle assunzioni della legge di Hardy-Weinberg è che la popolazione sia isolata e non influenzata da altre popolazioni. Tuttavia, molte popolazioni non sono completamente isolate e scambiano geni con altre popolazioni della stessa specie. Individui che migrino in una popolazione possono introdurre nuovi alleli nel pool genico, alterando le frequenze degli alleli esistenti; pertanto, la migrazione può alterare l’equilibrio di Hardy-Weinberg e influenzare l’evoluzione delle frequenze alleliche entro le popolazioni. Il termine migrazione implica di solito movimento di organismi, mentre in genetica di popolazioni siamo interessati al movimento dei geni, che può verificarsi o meno quando gli organismi migrano. Il movimento dei geni ha luogo solo quando gli organismi o i gameti migrano e contribuiscono con i loro geni al pool genico della popolazione ricevente. Il processo viene definito flusso genico e ha due effetti principali sulle popolazioni. In primo luogo, introduce nuovi alleli nella popolazione; dato che la mutazione è in genere un evento raro, un allele mutante specifico può insorgere in una popolazione e non in un’altra. Il flusso genico diffonde i nuovi alleli in altre popolazioni e, come la mutazione, è una fonte di variabilità genetica per le popolazioni riceventi. In secondo luogo, quando le frequenze alleliche dei migranti e della popolazione ricevente sono diverse, il flusso genico cambia anche le frequenze alleliche all’interno della popolazione ricevente. Mediante lo scambio di geni, popolazioni differenti divengono simili e così la migrazione è una forza unificante che tende a prevenire l’accumulo di differenze genetiche tra le popolazioni. Per illustrare gli effetti della migrazione sulle frequenze alleliche, considereremo un modello semplificato nel quale il flusso genico “scorra” in una sola direzione, dalla popolazione x alla popolazione y. Supponiamo che la frequenza dell’allele A nella popolazione x (px) sia 0,8 e che la frequenza di A nella popolazione y (py) sia 0,5. A ogni generazione alcuni individui migrano dalla popolazione x alla popolazione y, e questi migranti rappresentano un campione casuale dei genotipi della popolazione x. Dopo la migrazione, la popolazione y consta di due gruppi di individui: i migranti, con px = 0,8, e i residenti, con py = 0,5. I migranti ora rappresentano una proporzione, che chiameremo m, della popolazione y. Dopo la migrazione, la frequenza dell’allele A nella popolazione y (p′y) è: p′y = mpx + (1 – m)py Notiamo che la frequenza di A, dopo la migrazione, è determinata dalla proporzione di alleli A nei due gruppi che ora compongono la popolazione y. Il primo termine, mpx, rappresenta gli alleli A nei migranti ed è composto

559

Pool genico dopo la migrazione

Migranti dalla popolazione I f (A) = px

Proporzioni della popolazione finale m f (A) = px

Residenti della popolazione II f (A) = py

1–m f (A) = py

f (A) = mpx + (1 – m)py

Figura 21.13 Modello teorico che illustra l’effetto della migrazione sul pool genico di una popolazione. Dopo la migrazione, la popolazione y consta di due gruppi: i migranti con frequenza allelica px e i residenti originali con frequenza allelica py.

dalla proporzione della popolazione costituita dai migranti (m) moltiplicata per la frequenza allelica dei migranti (px). Il secondo rappresenta gli alleli A dei residenti ed è pari alla proporzione della popolazione formata dai residenti (1 – m) moltiplicata per la frequenza allelica dei residenti (py). La somma di questi due termini ci fornisce la frequenza allelica di A nella popolazione y dopo la migrazione. Questo modello di flusso genico è schematizzato in Figura 21.13. La variazione nella frequenza allelica della popolazione y dovuta alla migrazione (Δp) è pari alla frequenza di A dopo la migrazione meno la frequenza originale di A: Δp = p′y – py Nell’equazione precedente abbiamo trovato che p′y è uguale a mpx + (1 – m)py, pertanto la variazione della frequenza allelica può venire scritta come: Δp = mpx + (1 – m)py – py Sviluppando il termine (1 – m)py otteniamo: Δp = mpx + py – mpy – py Δp = mpx – mpy Δp = m(px – py) L’equazione finale ci mostra che la variazione nella frequenza allelica dovuta alla migrazione dipende da due fattori: la proporzione dei migranti nella popolazione finale e la differenza nelle frequenze alleliche tra i migranti e i residenti. Se tra le frequenze alleliche dei migranti e dei residenti non esiste alcuna differenza (px – py = 0), allora la variazione della frequenza allelica è zero. Affinché la migrazione abbia effetto sulla composizione del pool genico, occorre che le frequenze alleliche delle popolazioni siano diverse. Con una migrazione continua, px e py diventano sempre più simili e, come risultato, la

560

Capitolo 21

variazione della frequenza allelica dovuta alla migrazione diminuisce. A lungo andare, le frequenze alleliche delle due popolazioni diventano uguali e non avviene più alcun cambiamento. Ciò, tuttavia, è vero solamente se non esistono altri fattori, oltre alla migrazione, che influenzino le frequenze alleliche. Gli effetti del flusso genico hanno importanti conseguenze non solo per l’evoluzione delle specie, ma anche per la conservazione delle stesse. Come discusso in precedenza, molte specie che coprono un vasto areale geografico presentano variabilità per la struttura genetica all’interno dell’areale stesso. Parte della struttura genetica di una specie potrebbe includere una suddivisione in popolazioni in cui popolazioni diverse sono in contatto l’una con l’altra mediante flusso genico. Dal momento che il flusso genico ha importanti conseguenze circa il mantenimento della diversità genetica, questa caratteristica della struttura genetica di una popolazione deve essere tenuta presente da coloro che sono interessati alla conservazione dell’identità genetica di una specie.

Nota chiave La migrazione di individui in una popolazione può alterare la composizione del suo pool genico, se le frequenze alleliche dei migranti sono diverse da quelle dei residenti. La migrazione, cioè il flusso genico, tende a ridurre le divergenze genetiche tra le popolazioni e aumenta le loro dimensioni effettive. Il tasso di migrazione tra popolazioni della stessa specie determina quanto esse siano strutturate geneticamente e se diverse popolazioni della stessa specie possano diventare geneticamente diverse l’una dall’altra.

Selezione naturale

MyLab

Abbiamo finora esaminato tre dei principali processi evolutivi in grado di alterare le frequenze alleliche e di contribuire all’evoluzione: la mutazione, la deriva genetica e la migrazione. Insieme, nimazione queste forze introducono nuova variabilità (mutazione) e alterano Selezione le frequenze alleliche (deriva genaturale netica e migrazione) all’interno del pool genico delle popolazioni. Tuttavia, nessuna di esse favorisce l’adattamento: con il termine adattamento si intende la tendenza che hanno piante e animali a essere particolarmente adatti agli ambienti in cui vivono. La selezione naturale è il processo mediante il quale i caratteri evolvono a dare organismi sempre più adattati all’ambiente circostante: questi caratteri aumentano le possibilità di un organismo di sopravvivere e di riprodursi. La selezione naturale è responsabile di molti dei carat-

teri più straordinari espressi in natura – ali che permettono al colibrì di volare all’indietro, foglie di nepente che catturano e divorano gli insetti, cervelli che permettono agli esseri umani di parlare, leggere e amare. Questi, e innumerevoli altri mirabili caratteri, sono il risultato dell’adattamento (Figura 21.14). Deriva genetica, mutazione e migrazione influenzano il meccanismo di adattamento ma l’adattamento si origina dalla selezione naturale. La selezione naturale è la forza responsabile dell’adattamento di tutti gli organismi e ha plasmato molta della variabilità fenotipica presente in natura. Charles Darwin e Alfred Russel Wallace (Figura 21.15) svilupparono indipendentemente il concetto di selezione naturale verso la metà del XIX secolo, nonostante alcuni naturalisti avessero avuto in precedenza idee simili. Nel 1858 la teoria di Darwin e Wallace fu presentata alla Linnaean Society di Londra e venne accolta in modo entusiastico da altri scienziati. Darwin più di Wallace sviluppò la teoria dell’evoluzione, raccogliendo a sostegno centinaia di osservazioni e pubblicando le proprie idee in un libro intitolato On the Origin of Species (L’origine delle specie) nel 1859. Per i suoi moltissimi contributi alla comprensione della selezione naturale, Darwin viene spesso considerato come il “padre” della teoria evoluzionistica. L’aspetto più sorprendente di questa teoria è che Darwin non aveva nessuna idea sul modo in cui funzionasse la trasmissione genetica dei caratteri: gli bastò il fatto che la progenie in qualche modo assomigliasse ai genitori. La conoscenza delle modalità di trasmissione dei caratteri rende la teoria molto più profonda e ricca e dà la possibilità di interessanti verifiche sperimentali dei cambiamenti evolutivi a livello genetico. La selezione naturale può essere definita come la riproduzione differenziale dei genotipi: ciò semplicemente significa che gli individui che possiedono certi genotipi producono una progenie più numerosa di altri; pertanto quei genotipi aumentano la loro frequenza nella generazione successiva, come discusso nel Capitolo 22.

Figura 21.14 La lucertola spinosa (genere Sceloporus), la cui colorazione le permette di mimetizzarsi nel suo ambiente e sfuggire ai predatori, è un prodotto della selezione naturale.

Genetica di popolazioni Charles Darwin

Alfred Russell Wallace

Tramite selezione naturale, i caratteri che contribuiscono alla sopravvivenza e alla riproduzione aumentano con il tempo: ciò permette agli organismi di adattarsi all’ambiente che li circonda. La selezione nelle popolazioni naturali Un classico esempio di selezione nelle popolazioni naturali è rappresentato dall’evoluzione di forme melaniche (scure) di falena in relazione all’inquinamento ambientale dovuto alle industrie, un fenomeno conosciuto come melanismo industriale. Fenotipi melanici sono apparsi in numerose specie di falena che si ritrovano nelle regioni industriali dell’Europa continentale, dell’Inghilterra e del Nordamerica. Uno dei casi più studiati è quello della falena screziata, Biston betularia: il fenotipo comune di questa specie, denominato forma tipica, è un colore bianco sporco con variegature più scure sul corpo e sulle ali. Prima del 1848 tutte le falene screziate raccolte in Inghilterra possedevano questo fenotipo tipico, ma nel 1848 presso Manchester venne trovata una singola falena nera. Questo nuovo fenotipo, denominato carbonaria, emerso presumibilmente per mutazione, aumentò rapidamente in frequenza nei dintorni di Manchester e in altre a) Falene screziate su un tronco di un albero coperto da licheni

Figura 21.16 Biston betularia, la falena screziata, e la sua forma scura, carbonaria, sul tronco di un albero coperto di licheni nella campagna non inquinata e sul tronco di un albero con

561

Figura 21.15 Charles Darwin e Alfred Russell Wallace, che hanno in modo indipendente sviluppato la teoria dell’evoluzione mediante selezione naturale.

regioni industriali: nel 1900 il fenotipo carbonaria aveva raggiunto in numerose popolazioni una frequenza superiore al 90%. Alte frequenze di carbonaria venivano riscontrate in regioni industriali, mentre il fenotipo tipico rimaneva comune in molti distretti rurali. Studi condotti nei laboratori di diversi scienziati, tra cui E.B. Ford e R. Goldschmidt, dimostrarono che il fenotipo carbonaria era dominante sul fenotipo tipico. Venne scoperto anche un terzo fenotipo, in un certo modo intermedio tra tipico e carbonaria; questo fenotipo, insularia, era prodotto da un allele dominante a un diverso locus. H.B.D. Kettlewell studiò il polimorfismo per il colore nella falena screziata, dimostrando che, nei boschi inquinati, l’aumento del fenotipo carbonaria era avvenuto come risultato di una forte selezione contro il fenotipo tipico. Le falene screziate sono notturne e durante il giorno riposano stando immobili sul tronco di alberi coperti di licheni. Gli uccelli spesso durante il giorno si nutrono di falene, ma, dal momento che i licheni che coprono i tronchi sono naturalmente di colore grigio, la forma tipica della falena screziata risulta ben mimetizzata su questo sfondo (Figura 21.16a). Tuttavia, nelle aree industrializzate, il notevole inquinamento dovuto alla rivoluzione industriale attorno alla metà del 1800 aveva ucciso gran parte dei licheni e coperto i tronchi degli alberi di fuliggine nera. Su questo sfondo nero il fenotipo tipico risultava evidente e facilmente predato dagli uccelli; al contrario, la forma carbonaria era ben mascherata sugli alb) Falene screziate su un tronco di un albero scuro

corteccia annerita. La forma scura è chiaramente visibile sul tronco chiaro, mentre la forma chiara risulta ben camuffata. Sull’albero scuro è la forma scura a essere ben mimetizzata.

562

Capitolo 21

beri divenuti scuri e presentava nelle aree inquinate un tasso di sopravvivenza più elevato che non il fenotipo tipico (Figura 21.16b). Dal momento che carbonaria sopravviveva meglio nei boschi inquinati, alla generazione successiva venivano trasmessi più geni carbonaria e così nelle aree industriali aumentava la frequenza del fenotipo carbonaria. Nelle aree rurali, dove l’inquinamento era assente, il fenotipo carbonaria risultava evidente e quello tipico mimetizzato, per cui rimaneva elevata la frequenza della forma tipica. Kettlewell dimostrò che la selezione influenzava le frequenze dei due fenotipi, conducendo una serie di esperimenti di cattura, contrassegno e ricattura delle falene chiare e scure nella fumosa, industriale Birmingham e nel rurale Dorset. Come previsto, il fenotipo tipico era favorito nel Dorset, mentre carbonaria era favorito a Birmingham. La fitness e il coefficiente di selezione Darwin descrisse la selezione naturale principalmente in termini di sopravvivenza e ancora oggi comunemente si pensa alla selezione come a una lotta per l’esistenza. Tuttavia, ciò che è più importante nel processo di selezione naturale è il numero relativo di geni che vengono forniti alle generazioni successive. Sicuramente la capacità di sopravvivenza è un punto importante, ma la sopravvivenza da sola non assicura che i geni vengano trasmessi: deve anche avvenire la riproduzione. Pertanto, la selezione naturale si misura stabilendo il tasso di riproduzione in termini di fitness darwiniana, o adattabilità, che viene definita come la capacità riproduttiva relativa di un genotipo. La fitness darwiniana viene spesso indicata da w. Dal momento che essa è una misura della capacità riproduttiva relativa, i genetisti di popolazioni assegnano di solito una fitness w = 1 al genotipo che produce la progenie più numerosa e le fitness degli altri genotipi vengono assegnate relativamente a tale valore. Per esempio, supponiamo che il genotipo G1G1 produca in media una progenie pari a 8, G1G2 una progenie pari a 4 e G2G2 una

progenie pari a 2. Il genotipo G1G1 possiede la più elevata efficienza dal punto di vista riproduttivo, pertanto la sua fitness è 1 (w11 = 1). Il genotipo G1G2 produce in media 4 individui di progenie rispetto agli 8 prodotti dal genotipo più adattato, pertanto la fitness di G1G2 (w12) è 4/8 = 0,5. Allo stesso modo, G2G2 produce 2 individui di progenie, pertanto la fitness di G2G2 (w22) è 2/8 = 0,25. La Tabella 21.9 illustra i calcoli per la stima dei valori di fitness relativa. I valori di fitness dei genotipi devono essere stimati con grande attenzione. Per esempio, uguagliare la fitness al numero di progenie prodotta è una semplificazione eccessiva, perché dovremmo conoscere anche la probabilità di sopravvivenza della progenie. David Lack trovò che nei nidi di scriccioli ci doveva essere un certo numero di uova per assicurare un corretto sviluppo della progenie. Se gli scriccioli avessero deposto troppe uova, avrebbero prodotto un minor numero di pulcini capaci di giungere alla maturità. Attribuire un valore di fitness più elevato a quegli uccelli che deponevano il maggior numero di uova sarebbe stato pertanto scorretto. Considerare un solo momento della vita di un organismo rende molto difficile l’assegnazione della fitness a un genotipo: un genotipo che abbia un’alta probabilità di sopravvivenza potrebbe anche avere una progenie inferiore alla media. Singoli geni possono avere effetti su diversi aspetti del ciclo vitale che influenzano la fitness: tali effetti pleiotropici producono grandi differenze nella fitness dei genotipi. Nondimeno, la fitness darwiniana ci dice quanto bene si comporti, in termini di selezione naturale, un dato genotipo. Una misura collegata alla fitness è il coefficiente di selezione, che è una misura dell’intensità relativa di selezione contro un genotipo. Il coefficiente di selezione è indicato da s ed è uguale a 1 – w. Nel nostro esempio, i coefficienti di selezione sono s = 0 per G1G1, s = 0,5 per G1G2 ed s = 0,75 per G2G2. Effetti della selezione sulle frequenze alleliche La selezione naturale produce numerosi e diversi effetti.

Tabella 21.9 Calcolo dei valori di fitness e coefficienti di selezione di tre genotipi Genotipi G1G1

G1G2

G2G2

Numero di adulti in età di procreare in una generazione

16

10

20

Numero della progenie prodotta da tutti gli adulti con un dato genotipo nella generazione successiva

128

40

40

128/16 = 8

40/10 = 4

40/20 = 2

Numero medio di progenie prodotta per adulto in età di procreare Fitness w (numero relativo di progenie prodotta) Coefficiente di selezione (s = 1 – w)

8/8 = 1

4/8 = 0,5

2/8 = 0,25

1–1 = 0

1 – 0,5 = 0,5

1 – 0,25 = 0,75

Genetica di popolazioni

563

Tabella 21.10 Metodo generale per la determinazione della variazione della frequenza allelica in seguito a selezione naturale Genotipi A1A1

A1A2

A2A2

Frequenze genotipiche iniziali

p2

2pq

q2

Fitnessa

w11

w12

w22

Frequenza dopo selezione

p2w11

2pqw12

q2w22

Frequenza genotipica relativa dopo selezioneb

–– p2w 11 P’ = –––––– –– w

–– 2pqw 12 H’ = ––––––– –– w

–– q2w 22 Q’ = –––––– –– w

Frequenza allelica dopo selezione p’ = P’ + 1/2(H’) q’ = 1 – p’ Variazione della frequenza allelica dovuta alla selezione Δp = p’ – p a

Per semplicità, in questo esempio si considera che la fitness sia la probabilità di sopravvivenza. Allo stesso modo, è calcolata la variazione della frequenza allelica dovuta alla differenza nel numero di progenie prodotta dai diversi genotipi. –– b w = p2w11 + 2pqw12 + q2w22

Alcune volte elimina la variabilità genetica, altre volte la mantiene; può modificare le frequenze alleliche o fare in modo che esse non cambino; può produrre divergenza genetica tra popolazioni o mantenere uniformità. Il verificarsi di ognuno di questi effetti dipende principalmente dalle fitness relative dei genotipi e dalle frequenze alleliche nella popolazione. La variazione nelle frequenze alleliche che risulta dalla selezione naturale può essere calcolata costruendo una tabella come la Tabella 21.10. Questo “metodo della tabella” può essere usato per qualsiasi tipo di carattere monogenico: dominante, codominante o recessivo. Per utilizzare questo metodo si comincia col riportare i genotipi (A1A1, A1A2 e A2A2) e le loro frequenze iniziali. Se si è appena avuto incrocio casuale, i genotipi sono nelle proporzioni di Hardy-Weinberg e le frequenze iniziali sono p2, 2pq e q2. Riportiamo le fitness per i tre genotipi, w11, w12 e w22. Ora supponiamo che si verifichi selezione: il contributo di ciascun genotipo alla generazione successiva sarà uguale alla frequenza iniziale del genotipo moltiplicata per la relativa fitness. Per A1A1 esso è uguale a p2 × w11. Si noti che la somma dei contributi dei tre genotipi non è uguale a 1. Si calcoli ora il contributo relativo di ogni genotipo dividendo ciascuno di essi per la fitness media della popolazione. La fitness media della popolazione equivale a p2w11 + 2pqw12 + – ed è costituita dalla media delle fitness degli q2w22 = w individui di una popolazione. Dopo aver diviso i contributi relativi di ogni genotipo per la fitness media, otteniamo la frequenza dei genotipi dopo la selezione, dove P′ è la frequenza del genotipo A1A1, H′ del genotipo A1A2 e Q′ del genotipo A2A2. Calcoliamo, quindi, la nuova frequenza allelica (p′) a partire dai genotipi dopo se-

lezione utilizzando la familiare formula p′ = (frequenza di A1A1) + (1/2 × frequenza di A1A2). Alla fine, la variazione nella frequenza allelica risultante dalla selezione è data da p′ – p. In Tabella 21.11 viene presentato un esempio di calcolo basato su frequenze alleliche e valori di fitness reali. Si può comprendere l’ampia gamma degli effetti della selezione naturale discussi in precedenza utilizzando le formule della Tabella 21.10. Ricordando ancora che arbitrariamente attribuiremo il valore 1 al genotipo con la fitness più elevata, possiamo ottenere vari tipi di selezione naturale, ciascuno caratterizzato da effetti diversi, considerando tutte le possibili relazioni tra i valori di fitness dei genotipi. Esse includono: 1. w11 = w12 = w22 = 1. I valori delle fitness sono tutti uguali, pertanto non c’è selezione; 2. w11 = w12 < 1 e w22 = 1. L’eterozigote possiede valore adattativo pari a quello di uno degli omozigoti, ma inferiore al valore adattativo migliore posseduto dall’altro omozigote. La selezione naturale sta operando contro l’allele dominante A1; 3. w11 = w12 = 1 e w22 < 1. L’eterozigote e uno degli omozigoti possiedono il miglior valore adattativo, maggiore di quello dell’altro omozigote. La selezione naturale sta operando contro l’allele recessivo A2; 4. w11 < w12 < w22 e w22 = 1. L’eterozigote ha un valore adattativo intermedio. La selezione naturale sta operando contro A1 in assenza di effetti di dominanza; 5. w11 e w22 < 1 e w12 = 1. L’eterozigote mostra il miglior valore di fitness, e i due omozigoti ne presentano uno inferiore, che può o meno essere lo stesso valore. La selezione naturale sta favorendo l’eterozigote;

564

Capitolo 21

Tabella 21.11 Metodo generale per la determinazione della variazione della frequenza allelica in seguito a selezione naturale quando le frequenze alleliche iniziali sono p = 0,6 e q = 0,4 Genotipi A1A1

A1A2

A2A2

Frequenze genotipiche iniziali

p2 (0,6)2 = 0,36

2pq 2(0,6)(0,4) = 0,48

q2 (0,4)2 = 0,16

Fitness

w11 = 0

w12 = 0,4

w22 = 1

Frequenza dopo selezione

p2w11 = (0,36)(0) = 0

2pqw12 = (0,48)(0,4) = 0,19

q2w22 = (0,16)(1) = 0,16

p2w11 P’ = –––––– –– w P’ = 0/0,35 = 0

2pqw12 H’ = ––––––– –– w H’ = 0,19/0,35 = 0,54

q2w22 Q’ = –––––– –– w Q’ = 0,16/0,35 = 0,46

Frequenza genotipica relativa dopo selezionea

Frequenza allelica dopo selezione p’ = P’ + 1/2(H’) p’ = 0 + 1/2(0,54) = 0,27 q’ = 1 – p’ = 1 – 0,27 = 0,73 Variazione della frequenza allelica dovuta alla selezione = Δp = p’ – p Δp = 0,27 – 0,6 = –0,33 a

–– w = p2w11 + 2pqw12 + q2w22 –– w = 0 + 0,19 + 0,16 –– w = 0,35

6. w12 < w11 e w22 = 1. L’eterozigote ha fitness minore di ciascuno dei due omozigoti. La selezione naturale favorisce gli omozigoti poiché è sufficiente che uno solo degli omozigoti presenti valore 1 per la fitness. Ciascuno dei cinque casi di selezione naturale ha come risultato una variazione caratteristica della struttura genetica di una popolazione. I casi 2, 3 e 4 appartengono allo stesso tipo di selezione naturale, definito selezione direzionale, e determinano l’eliminazione o perlomeno la drastica riduzione di uno degli alleli. Il caso 5 è molto diverso e produce uno stato di equilibrio stabile, una volta raggiunto il quale non c’è più evoluzione; invece il caso 6 appare simile a un caso di variazione direzionale delle frequenze alleliche, nel quale però l’allele che viene selezionato a sfavore dipende dalle frequenze alleliche iniziali. Consideriamo ora in che modo alcuni di questi casi abbiano effetto sulla struttura genetica di una popolazione. Selezione contro un carattere recessivo I casi 2, 3 e 4 esposti in precedenza sono simili, in quanto hanno come risultato un cambiamento direzionale delle frequenze alleliche di una popolazione. Questo effetto direzionale è quello che viene più di frequente associato con la selezione naturale: il caso di Biston betularia, prima discusso, ricade nella categoria della selezione contro un allele recessivo. Discuteremo uno di questi casi più in dettaglio, perché la maggior parte delle nuove mutazioni è recessiva e possiede una fitness ridotta. Quando un carattere è completamente recessivo (caso 3), sia l’eterozigote sia l’omo-

zigote dominante hanno fitness pari a 1, mentre l’omozigote recessivo possiede fitness ridotta. Rappresentando s come l’intensità della selezione, si ha uno schema come il seguente: Genotipo AA Aa aa

Fitness 1 1 1–s

Se i genotipi inizialmente rispettano le proporzioni di Hardy-Weinberg, il contributo di ciascun genotipo alla generazione successiva è dato dalla frequenza moltiplicata per la fitness. AA Aa aa

p2 × 1 = p2 2pq × 1 = 2pq q2 × (1 – s) = q2 – sq2

La fitness media della popolazione è p2 + 2pq + q2 – sq2. Dal momento che p2 + 2pq + q2 = 1, la fitness media diventa 1 – sq2 e le frequenze genotipiche normalizzate dopo selezione sono: AA

p2 –––––– 1 – sq2

Aa

2pq –––––– 1 – sq2

aa

q2 – sq2 –––––– 1 – sq2

565

Genetica di popolazioni

Per ottenere q′, la frequenza dell’allele a dopo la selezione, sommiamo la frequenza dell’omozigote aa a metà della frequenza dell’eterozigote. q2 – sq2 1 2pq q′ = ––––––– + –– × ––––-– 1 – sq2 2 1 – sq2 Sviluppando l’equazione e ricordando che (p + q) = 1, si ha q – sq2 q′ = –––––– 1 – sq2 Pertanto, la variazione della frequenza di a dopo una generazione di selezione è: Δq = q′ – q che con un po’ di semplificazioni algebriche si riduce a: Δq = –spq2/(1 – sq2) Quando Δq = 0 non avviene più alcuna variazione delle frequenze alleliche ed è stato raggiunto un equilibrio. Si noti che nell’equazione esiste un segno meno alla sinistra di spq2; dato che i valori di s, p e q sono sempre positivi oppure uguali a zero, Δq è negativo oppure uguale a zero, quindi il valore di q diminuisce con la selezione. La selezione dipende anche dalle frequenze alleliche nella popolazione, perché le proporzioni relative degli individui Aa e aa alle diverse frequenze dell’allele a influiscono su quanto la selezione possa effettivamente ridurre un carattere recessivo dannoso. Quando la frequenza di un gene recessivo dannoso è alta, nella popolazione sono presenti molti omozigoti recessivi, che avranno una fitness bassa, causando così una notevole variazione della frequenza allelica. Tuttavia, quando la frequenza allelica è bassa, il genotipo omozigote recessivo è raro e si verifica una piccola variazione della frequenza allelica. Infatti, quando un allele recessivo dannoso non è letale può segregare in una popolazione per

molte generazioni, il che spiega come mai molte malattie genetiche continuino a essere presenti nelle popolazioni umane con una frequenza molto bassa. La segregazione dell’allele può anche essere il risultato di un equilibrio raggiunto tra mutazione e selezione naturale. La Figura 21.17 mostra la grandezza della variazione nella frequenza allelica a ogni generazione in tre popolazioni con diverse frequenze alleliche iniziali. La popolazione 1 parte con una frequenza allelica q pari a 0,9, la popolazione 2 con q pari a 0,5 e la popolazione 3 con q uguale a 0,1. In questo esempio il genotipo omozigote recessivo (aa) possiede fitness 0, mentre gli altri due genotipi (AA e Aa) hanno fitness uguale a 1 (condizione di letalità del recessivo). Quando la frequenza q è alta, come nella popolazione 1, la variazione della frequenza allelica è grande; alla prima generazione, q scende da 0,9 a 0,47. Quando q è piccola, tuttavia, come nella popolazione 3, la variazione di q è molto minore; in questo caso q scende soltanto da 0,1 a 0,091 alla prima generazione. Pertanto, al diminuire di q, diminuisce anche la sua variazione. A causa di questa diminuzione nella variazione della frequenza, risulta pressoché impossibile eliminare completamente un carattere recessivo dalla popolazione. Si può comprendere ciò anche considerando che gli ultimi alleli recessivi della popolazione si troveranno quasi esclusivamente nel genotipo eterozigote. Questo risultato, però, si applica soltanto a caratteri completamente recessivi; se anche la fitness dell’eterozigote è ridotta (caso 4), la variazione della frequenza allelica sarà più rapida, perché in questo caso la selezione agisce, oltre che sull’omozigote, anche contro l’eterozigote. L’effetto della dominanza sulle variazioni delle frequenze alleliche dovute alla selezione è illustrato in Figura 21.18. Abbiamo discusso a lungo gli effetti della selezione su un carattere recessivo per illustrare in che modo la formula per la variazione delle frequenze alleliche derivi dal “metodo della tabella” della variazione delle fre0,5

0,9 0,8

Popolazione 1 2 3

0,6

0,4 Frequenza allelica

Frequenza allelica

0,7

0,5 0,4

0,3 0,2 Recessivo

0,1

0,3

Additivo

0,2

Dominante

0,0

0,1 0

0

0

1

2 3 Generazione

4

5

Figura 21.17 Efficacia della selezione contro un genotipo letale recessivo per frequenze alleliche iniziali diverse. Le tre popolazioni hanno frequenze iniziali pari a 0,9, 0,5 e 0,1.

5 Generazione

10

Figura 21.18 I valori di fitness dei genotipi AA, Aa e aa sono 1, 0,5 e 0,5 nel caso dominante, 1, 0,75 e 0,5 per il caso additivo e 1, 1 e 0,5 per il caso recessivo. Nel grafico è riportata la frequenza dell’allele a.

566

Capitolo 21

Tabella 21.12 Formule per il calcolo della variazione della frequenza allelica dopo una generazione di selezione Fitness dei genotipi Calcolo della variazione della frequenza allelica

Tipo di selezione

A1A1

A1A2

A2A2

Selezione contro l’omozigote recessivo

1

1

1–s

– spq2 Δq = –––––– 1 – sq2

Selezione contro un allele dominante

1–s

1–s

1

– spq2 Δq = ––––––––– 1 – s + sq2

Selezione in assenza di dominanza

1

(1 – s/2)

1–s

– spq/2 Δq = ––––––– 1 – sq

Selezione a favore dell’eterozigote (sovradominanza)

1–s

1

1–t

pq(sp – tp) Δq = ––––––––––– 1 – sp2 + tq2

Selezione contro l’eterozigote

1

1–s

1

spq(q – p) Δq = –––––––––– 1 – 2spq

Formula generalea

w11

w12

w22

pq[p(w11 – w12) – q(w22 – w12)] Δq = ––––––––––––––––––––––––––––– –– w

a

–– Nota: per il calcolo di w vedi Tabella 21.10.

quenze alleliche sottoposte a selezione. Derivazioni simili possono venire effettuate per caratteri dominanti e codominanti (casi 2 e 4). Non presenteremo in questa sede le derivazioni, ma le formule appropriate per il calcolo della variazione delle frequenze alleliche per diversi tipi di dominanza sono schematizzate in Tabella 21.12. Tuttavia, mediante l’utilizzo del metodo della tabella è possibile calcolare le variazioni nelle frequenze alleliche per qualsiasi tipo di carattere. Vantaggio dell’eterozigote La selezione naturale non produce sempre una variazione direzionale delle frequenze alleliche e una diminuzione della variabilità genetica. Infatti, alcuni tipi di selezione determinano un mantenimento della variabilità genetica e stanno alla base del modello bilanciato della variabilità genetica discusso in precedenza. Il caso più semplice di selezione bilanciata è definito eterosi, sovradominanza, o vantaggio dell’eterozigote. La selezione bilanciata è un esempio di selezione naturale che agisce mantenendo polimorfismi genici (alleli multipli di un gene) all’interno di una popolazione. Si raggiunge un equilibrio delle frequenze alleliche quando l’eterozigote ha fitness maggiore di entrambi gli omozigoti. In questa circostanza (caso 5), entrambi gli alleli vengono mantenuti nella popolazione, in quanto ambedue risultano favoriti nel genotipo eterozigote. Le frequenze alleliche cambieranno per effetto della selezione finché si raggiungerà un equilibrio, e a quel punto rimarranno stabili. Le frequenze alleliche alle quali la popolazione raggiungerà l’equilibrio dipendono dalle fitness relative dei due omozigoti: se il

coefficiente di selezione per AA è s e quello per aa è t, si può dimostrare algebricamente che all’equilibrio si ha: Ÿ p = f(A) = t/(s + t) e Ÿ q = f(a) = s/(s + t) Si noti che, se la selezione contro i due omozigoti è la stessa (ovvero s = t), allora la frequenza allelica all’equilibrio è 0,5. Man mano che la selezione contro gli omozigoti diventa meno simmetrica, la frequenza allelica all’equilibrio si sposta nella direzione dell’omozigote più adattato. L’esempio più famoso di vantaggio dell’eterozigote in natura è rappresentato dall’anemia falciforme nell’uomo: essa è il risultato di una mutazione nel gene che codifica per la β-emoglobina. In alcune popolazioni esistono tre genotipi per l’emoglobina: Hb-A/Hb-A, HbA/Hb-S e Hb-S/Hb-S. Gli individui di genotipo HbA/Hb-A hanno globuli rossi perfettamente normali; gli individui Hb-S/Hb-S hanno l’anemia falciforme, gli individui Hb-A/Hb-S possiedono il tratto falcemico, una lieve forma di anemia falciforme. In ambiente malarico, gli eterozigoti hanno un vantaggio selettivo rispetto a entrambi gli omozigoti. Infatti, la lieve forma anemica sperimentata dagli eterozigoti è sufficiente per inibire la crescita e la riproduzione del parassita della malaria. Pertanto, gli eterozigoti possiedono una maggiore resistenza alla malaria e quindi una fitness più elevata di quella degli individui Hb-A/Hb-A, mentre gli individui Hb-S/Hb-S si trovano in grave svantaggio dal punto di vista selettivo in quanto affetti da anemia falciforme. Il

Genetica di popolazioni

567

Figura 21.19 La distribuzione della malaria dovuta al parassita Plasmodium falciparum coincide con la distribuzione dell’allele Hb-S per l’anemia falciforme. La frequenza di Hb-S è elevata nelle aree dove la malaria è comune, dato che gli eterozigoti Hb-A/Hb-S sono resistenti all’infezione malarica.

Distribuzione della malaria causata da Plasmodium falciparum

L’equilibrio tra mutazione e selezione

Abbiamo già considerato due esempi nei quali le assunzioni della legge di Hardy-Weinberg Distribuzione delle frequenze dell’allele Hb-S in percentuale sono state violate più di una per 1-5 volta: la combinazione di deriva e 5-10 mutazione e quella di deriva e migrazione. Abbiamo notato come 10-15 la mutazione, la migrazione e le 15-20 piccole dimensioni di una popolazione interagiscano nel determirisultato è che, nelle regioni malariche nelle quali sia narne la struttura genetica, quando gli alleli siano neutrali presente anche il gene Hb-S, si stabilisce uno stato di dal punto di vista della selezione. La teoria della genetica equilibrio per cui si trova un numero significativo di al- di popolazioni è stata estesa anche a considerare la violaleli Hb-S presenti allo stato eterozigote, come risultato zione simultanea di più assunzioni; questo approccio ci ha del vantaggio selettivo di questo genotipo. Le distribu- consentito di migliorare le nostre conoscenze. Ora consizioni geografiche della malaria e dell’allele Hb-S sono dereremo gli effetti contemporanei di mutazione e seleillustrate in Figura 21.19. In sintesi, nonostante i proble- zione naturale. mi cui vanno incontro gli omozigoti Hb-S, la selezione Come abbiamo visto, la selezione naturale può ridurnaturale non può eliminare l’allele sfavorevole dalla po- re la frequenza di un allele recessivo deleterio: al dimipolazione in quanto, allo stato eterozigote, ha effetti be- nuire della frequenza di quest’ultimo, anche la variazionefici. Di conseguenza, l’allele viene stabilizzato e la ne in frequenza a ogni generazione si riduce. Quando sua frequenza nella popolazione può assumere valori l’allele è raro, la variazione della frequenza è molto lieapprezzabili (maggiori dell’1%). Questa condizione è ve. In opposizione alla riduzione della frequenza allelica detta polimorfismo bilanciato. dovuta alla selezione vi è la pressione della mutazione che, a ogni generazione, produce continuamente nuovi alleli e tende ad aumentarne la frequenza. Alla fine si Nota chiave raggiunge un equilibrio in cui l’ingresso di nuovi alleli dovuto alla mutazione ricorrente risulta essere controbiLa selezione naturale implica la riproduzione diffelanciato dalla perdita di alleli dovuta alla selezione naturenziale dei genotipi e viene misurata in termini di rale. Una volta ottenuto l’equilibrio, la frequenza dell’alfitness darwiniana, il contributo relativo alla riprodulele rimane stabile, sebbene la selezione e la mutazione zione di un dato genotipo. Gli effetti della selezione continuino, a meno che l’equilibrio non venga perturbadipendono dalle fitness relative dei diversi genotipi. to da altri processi evolutivi. La selezione direzionale modifica le frequenze alleliSi consideri una popolazione in cui vi sia selezione che in modo da eliminare l’allele sfavorevole dalla contro un allele recessivo deleterio, a. Come abbiamo vipopolazione nel caso sia dominante o codominante, sto in precedenza, la variazione della frequenza di a domentre lo mantiene con bassa frequenza nella popopo una generazione di selezione è: lazione se recessivo e perciò nascosto allo stato eterozigote. In entrambi i casi, la selezione direzionale diminuisce la variabilità genetica in una popolazione. La selezione bilanciata, esemplificata dal vantaggio dell’eterozigote, determina il mantenimento di variabilità genetica nella popolazione.

Δq = –spq2/(1 – sq2) Per un allele recessivo raro, q2 sarà prossimo allo zero, pertanto il denominatore dell’equazione, 1 – sq2, sarà approssimativamente 1, quindi la diminuzione in frequenza dovuta alla selezione è data da:

568

Capitolo 21

Δq = –spq2 Contemporaneamente, la frequenza dell’allele a aumenta come effetto della mutazione da A ad a. Quando la frequenza di a è bassa, la reversione da a ad A può venire praticamente ignorata. Si ha equilibrio tra selezione e mutazione quando la diminuzione della frequenza allelica dovuta alla selezione è la stessa dell’aumento prodotto dalla mutazione: spq2 = up Possiamo prevedere quale sarà la frequenza all’equiliŸ brio di a (q ) riarrangiando questa equazione: sq2 = u q2 = u/s e Ÿ q = √u/s Se l’omozigote recessivo è letale (s = 1), l’equazione diventa: Ÿ q= u



Come esempio del bilanciamento tra mutazione e selezione, si consideri un gene recessivo per il quale il tasso di mutazione sia 10–6 ed s sia 0,1. All’equilibrio, la freŸ quenza del gene sarà q = √10–6/0,1 = 0,0032. La maggior parte dei caratteri recessivi dannosi rimane a bassa frequenza in una popolazione a causa dell’equilibrio tra mutazione e selezione. Per un allele dominante A, la frequenza all’equilibrio Ÿ (p ) è: Ÿ p = u/s Se il tasso di mutazione è 10–6 e s è 0,1, come nell’esempio precedente, la frequenza all’equilibrio del gene dominante sarà 10–6/0,1 = 0,00001, il che è considerevolmente inferiore della frequenza all’equilibrio per un allele recessivo con la stessa fitness e lo stesso tasso di mutazione. Ciò avviene perché la selezione non può agire su un allele recessivo allo stato eterozigote, mentre, per un allele dominante, sia l’omozigote sia l’eterozigote hanno la stessa fitness ridotta. Per questo motivo gli alleli dominanti deleteri sono generalmente meno comuni di quelli recessivi.

Scostamento dall’incrocio casuale Uno degli assunti fondamentali della legge di HardyWeinberg è che i membri della popolazione si incrocino in modo casuale relativamente al gene studiato; molte popolazioni, però, per alcuni caratteri non presentano incrocio casuale e, quando ciò avviene, i genotipi non si presentano nelle proporzioni previste dalla legge di HardyWeinberg. Un caso di incrocio non casuale è costituito

dall’incrocio per assortimento positivo, che avviene quando si ha l’accoppiamento preferenziale di individui dal fenotipo simile. L’incrocio per assortimento positivo è comune nelle popolazioni naturali: per esempio, gli uomini si incrociano in modo assortito per la statura; uomini alti sposano più di frequente donne alte e uomini bassi sposano più di frequente donne basse rispetto a quanto ci si attenderebbe se si sposassero a caso. L’incrocio per assortimento negativo avviene quando individui dal fenotipo differente si accoppiano tra loro più spesso che non con individui presi a caso. Se gli uomini presentassero questo tipo di assortimento per la statura, uomini alti sposerebbero preferenzialmente donne basse e lo stesso avverrebbe per uomini bassi e donne alte. L’incrocio per assortimento positivo non influenza le frequenze alleliche di una popolazione, ma influenzerà le frequenze genotipiche dei geni che controllano il carattere, se i fenotipi interessati sono determinati geneticamente. L’incrocio per assortimento negativo può avere effetto sia sulle frequenze alleliche sia su quelle genotipiche di questi geni, in quanto tipi rari nella popolazione potrebbero incrociarsi con una frequenza maggiore rispetto a quella dei tipi più comuni. Questi effetti possono verificarsi in piccole popolazioni in cui agisce la selezione naturale come, per esempio, nel caso della selezione sessuale per cui l’incrocio tra individui con specifici fenotipi non è casuale.

Inincrocio (inbreeding) Un altro importante scostamento dall’incrocio casuale è l’inincrocio. L’inincrocio (o inbreeding) consiste nell’incrocio preferenziale tra consanguinei. In popolazioni molto piccole, anche se la scelta del compagno fosse determinata casualmente, probabilmente gli individui risulterebbero essere comunque imparentati. In questo senso le popolazioni piccole soffrono delle conseguenze dell’inincrocio, anche se non esiste una scelta preferenziale dei parenti come compagni. L’inincrocio viene spesso misurato tramite l’utilizzo del coefficiente di inbreeding (FIS, o semplicemente F). Maggiore è FIS, maggiore è la riduzione dell’eterozigosità rispetto ai valori attesi dalla legge di Hardy-Weinberg. Per definizione: – – He – Ho FIS = ––––––– – He – dove He è l’eterozigosità media attesa nella sottopopola– zione e Ho è l’eterozigosità media osservata negli individui entro la sottopopolazione. Se i genotipi sono nelle proporzioni di Hardy-Weinberg, FIS = 0, dal momento che l’eterozigosità attesa e quella osservata sono uguali. Vi sono, peraltro, dei sistemi in cui l’inbreeding è una condizione usuale, in termini di autofecondazione, incroci tra fratelli e incroci tra primi cugini. In tali casi, dopo una generazione di inincrocio, FIS avrebbe il valore rispettivamente di 0,5, 0,25 e 0,06.

Genetica di popolazioni

569

Il caso più estremo di inincrocio è Tabella 21.13 Distribuzione relativa dei genotipi in seguito a numerose l’autofecondazione, che avviene in generazioni di autofecondazione partendo da un individuo Aa molte piante e in alcuni animali, tra Frequenze di genotipi cui le chiocciole. Gli effetti dell’autofecondazione sono riportati in Generazione AA Aa aa Tabella 21.13. Si assuma di avere 0 1 0 all’inizio una popolazione che con- 0 sista esclusivamente di eterozigoti 1 1/4 1/2 1/4 Aa e nella quale tutti gli individui si 1/4 + 1/8 = 3/8 1/4 1/4 + 1/8 = 3/8 riproducano per autofecondazione. 2 Dopo una generazione di autofe- 3 3/8 + 1/16 = 7/16 1/8 3/8 + 1/16 = 7/16 condazione, la progenie sarà costi7/16 + 1/32 = 15/32 1/16 7/16 + 1/32 = 15/32 tuita di 1/4 AA, 1/2 Aa e 1/4 aa; a 4 questo punto solo metà della popo- 5 15/32 + 1/64 = 31/64 1/32 15/32 + 1/64 = 31/64 lazione sarà formata da eterozigoti. n [1 – (1/2)n]/2 (1/2)n [1 – (1/2)n]/2 Quando questa generazione si ri1/2 0 1/2 produrrà mediante autofecondazio- • ne, gli omozigoti AA forniranno solo progenie AA e gli omozigoti aa solo progenie aa, mentre, per quanto riguarda gli eterozigoti, soltanto metà del- Riassunto degli effetti dei processi la loro progenie sarà eterozigote come i genitori e l’altra evolutivi sulla struttura genetica metà sarà omozigote (1/4 AA e 1/4 aa). Ciò significa che, di una popolazione per ogni generazione di autofecondazione, la percentuale di eterozigoti diminuirà del 50%. Dopo un gran numero di Passiamo ora in rassegna gli effetti principali dei diversi generazioni, non ci saranno più eterozigoti e la popolazio- processi evolutivi su: (1) variazioni nelle frequenze allene sarà equamente suddivisa tra i due genotipi omozigoti. liche all’interno di una popolazione; (2) divergenza geSi noti che la popolazione presentava le proporzioni di netica tra popolazioni; (3) aumento e diminuzione della Hardy-Weinberg alla prima generazione dopo l’autofe- variabilità genetica entro le popolazioni. condazione, mentre, dopo ulteriori cicli, la proporzione di omozigoti è divenuta maggiore di quella prevista dalla Variazioni nelle frequenze alleliche legge di Hardy-Weinberg. È da notare che l’inbreeding in popolazioni piccole ha all’interno di una popolazione effetti molto simili a quelli della deriva genetica. In en- La mutazione, la migrazione, la deriva genetica e la setrambi i fenomeni, l’eterozigosi decresce e l’omozigosi lezione sono in grado di modificare nel corso del tempo aumenta. Nel caso di inincrocio in popolazioni grandi, tut- le frequenze alleliche di una popolazione. La mutaziotavia, all’aumentare dell’omozigosi le frequenze alleliche ne, tuttavia, avviene generalmente a un tasso talmente rimangono le stesse; invece, in condizioni di deriva, men- ridotto che la variazione risultante è di solito trascuratre l’omozigosi incrementa, le frequenze alleliche cam- bile. La deriva genetica produce cambiamenti sostanbiano. Mentre la deriva causa piccoli scostamenti dall’e- ziali nelle frequenze alleliche solo quando le dimensioquilibrio di Hardy-Weinberg, quelli dovuti all’inincrocio ni della popolazione sono ridotte. Inoltre, la mutazione, possono essere notevoli. la migrazione e la selezione possono condurre a un Il risultato di una continua autofecondazione è l’au- equilibrio, raggiunto il quale questi processi continuamento dell’omozigosi a scapito dell’eterozigosi. Le fre- no ad agire senza che si verifichi un’ulteriore variazioquenze degli alleli A e a rimangono costanti, mentre le ne delle frequenze alleliche. Mentre l’incrocio per asfrequenze dei tre genotipi variano in modo significativo. sortimento negativo può determinare variazioni delle Quando l’inincrocio è meno intenso, si verificano effetti frequenze alleliche, altri tipi di incrocio non casuale simili, ma meno pronunciati. non modificano le frequenze alleliche, però hanno comunque effetto sulle frequenze genotipiche di una popolazione. L’inincrocio conduce a un aumento dell’oNota chiave mozigosi e, se nella popolazione esistono alleli dannoL’inincrocio consiste nell’incrocio preferenziale tra si recessivi (come spesso accade), produce una riduzioindividui imparentati. Un continuo inincrocio aune della fitness definita depressione da inincrocio. menta l’omozigosi all’interno di una popolazione, e nella maggior parte delle specie determina una riduzione della fitness.

Divergenza genetica tra popolazioni Diversi processi evolutivi conducono a una divergenza genetica tra le po-

570

Capitolo 21

polazioni. Dal momento che la deriva genetica è un processo casuale, le frequenze alleliche in popolazioni diverse possono fluttuare in direzioni differenti, a volte aumentano e a volte diminuiscono; pertanto, la deriva genetica può portare le popolazioni a divergere da un punto di vista genetico. Il flusso genico tra popolazioni ha l’effetto esattamente opposto: aumentando le dimensioni effettive delle popolazioni tende a livellarne le differenze nelle frequenze alleliche. Se le dimensioni delle popolazioni sono piccole, in popolazioni diverse possono insorgere mutazioni dissimili, e pertanto la mutazione può contribuire al differenziamento delle popolazioni. La selezione naturale può incrementare le differenze genetiche tra popolazioni favorendo alleli diversi in popolazioni diverse, ovvero può prevenire la divergenza mantenendo uniformi le frequenze alleliche tra popolazioni. L’incrocio non casuale, di per sé, non è in grado di generare variabilità genetica tra popolazioni, sebbene possa contribuire all’azione di altre forze.

Aumento e diminuzione della variabilità genetica entro le popolazioni La migrazione e la mutazione, introducendo nuovi alleli nel pool genico, tendono ad aumentare la variabilità genetica entro le popolazioni. La deriva genetica causa l’effetto opposto, riducendo la variabilità genetica all’interno di piccole popolazioni mediante la perdita di alleli. Anche l’inincrocio, dato che porta a un aumento dell’omozigosi, riduce la variabilità genetica entro le popolazioni; d’altro canto l’outbreeding, aumentando l’eterozigosi, aumenta la variabilità genetica. La selezione naturale può sia aumentare sia ridurre la variabilità genetica: se un dato allele è favorito, la frequenza di altri alleli diminuisce, e, per selezione, essi possono venire eliminati dalla popolazione; oppure la selezione naturale può aumentare la variabilità genetica entro le popolazioni mediante la sovradominanza e altri tipi di selezione bilanciata. Questi processi evolutivi non agiscono mai isolatamente, ma si combinano e interagiscono in modi complessi. Nella maggior parte delle popolazioni naturali, gli effetti combinati di queste forze e la loro interazione determinano il profilo di variabilità genetica osservata nel corso del tempo a livello di pool genico.

Gli effetti del crossing-over sulla variabilità genetica Negli anni ottanta del secolo scorso i genetisti di popolazione cominciarono a considerare gli effetti del crossingover sulla variabilità genetica. Il crossing-over può avvenire in qualsiasi regione cromosomica e nella maggior parte dei casi porta a ricombinare due cromosomi omologhi, come abbiamo discusso nei Capitoli 12 e 14. Ciò avviene durante il processo meiotico ed è essenziale per la

costruzione delle mappe genetiche. Nella meiosi, il numero di eventi di ricombinazione fra due loci è una misura della loro distanza genetica, definita in centimorgan o unità di mappa. Se consideriamo la variabilità genetica a due differenti loci in una popolazione naturale, può capitare di osservare che i due loci sono in equilibrio di HardyWeinberg ma non segregano indipendentemente, non soddisfacendo così la legge di Mendel relativa all’assortimento indipendente. Questo fatto si può verificare per due motivi. Innanzitutto, i due loci possono essere così vicini sul cromosoma che, quando il locus A viene trasmesso alla progenie, contestualmente avviene lo stesso per il locus B, e si ha un esempio di linkage (associazione). La frequenza di “rottura” del linkage tra il locus A e il locus B, così che si trovino a segregare indipendentemente, dipende da quanto spesso avviene l’evento di crossing-over tra i due loci. Il secondo motivo, per cui può accadere che gli alleli segreghino insieme, è che fenomeni come deriva genetica e migrazione possono causare deviazioni da quanto atteso per loci che segregano indipendentemente. Questo fenomeno viene definito disequilibrio gametico e decadrà nel tempo dopo eventi come l’effetto collo di bottiglia o la migrazione. Se osserviamo due loci che sembrano essere in equilibrio di Hardy-Weinberg, ma non segregano indipendentemente, potremmo in prima battuta ritenere che i loci siano molto vicini sul cromosoma. Tuttavia, se sappiamo che i loci sono lontani e indipendenti, perché sono già stati fisicamente o geneticamente mappati, oppure se sappiamo che molte coppie di loci non segregano indipendentemente, possiamo sospettare un recente collo di bottiglia nella popolazione o una migrazione. Queste deviazioni da eventi attesi di assortimento indipendente e di equilibrio di Hardy-Weinberg, causate o da associazione fisica o da variazioni demografiche, ricadono in un’unica fenomenologia definita linkage disequilibrium. Il linkage disequilibrium può rappresentare un modello per predire quali fattori siano in grado di causare le deviazioni che osserviamo nelle popolazioni naturali. Il parametro che misura il linkage disequilibrium è D = gABgab – gAbgaB, dove g è la frequenza di un gamete a ogni locus: così, per esempio, gAb è un gamete che presenta un allele A al locus A e un allele b al locus B. Nel caso particolare, un valore alto di D ricavato da un campione di individui di una determinata popolazione significa che gli alleli A e b segregano insieme durante la meiosi e ciò avviene più spesso che per effetto del caso. Nel tempo, D tenderà sempre a zero. Questa tendenza può essere descritta dalla relazione Dt = t(1 – r)D0, dove D0 è la generazione parentale, Dt è la generazione 1 per t = 1, la generazione 2 per t = 2 e così via, ed r è l’indice di ricombinazione in seguito al crossing-over tra i due loci. Se r è molto alto il linkage disequilibrium arriverà a zero in poche generazioni, ma se r è molto basso (se i loci sono molto vicini sul cromosoma) il linkage disequili-

Genetica di popolazioni

brium impiegherà molte generazioni per arrivare a zero. Si ricordi che a ogni singolo locus è richiesta solo una generazione di incroci casuali per produrre le proporzioni genotipiche di Hardy-Weinberg. Quindi l’azzeramento di D dipende dal particolare rapporto tra due o più loci presi in esame. Studi recenti hanno mostrato che l’indice di ricombinazione varia considerevolmente lungo il genoma della maggior parte degli organismi diploidi e che in alcune specie, come l’uomo e il lievito, il genoma è costellato da punti caldi in cui la ricombinazione avviene più frequentemente. Inoltre, sembra che l’indice di ricombinazione a livello di specifiche regioni del genoma sia ereditabile e quindi soggetto all’azione della selezione naturale. Questa reciproca e dinamica azione fra deriva genetica, selezione naturale, mutazione, migrazione e ricombinazione è un interessante oggetto di studio della ricerca che promette sviluppi sostanziali nello studio delle forze evolutive responsabili dei livelli e dei modelli di variabilità genetica nel genoma degli organismi eucarioti.

Il ruolo della genetica nella biologia della conservazione Il tasso attuale di estinzione delle specie è il più alto che si sia mai documentato nella storia. È stato stimato che esistono approssimativamente 2 milioni di specie note e perlomeno altri 30 milioni di specie che devono ancora essere descritte. Di pari passo con le modifiche ambientali che attuiamo e con la riduzione degli habitat adatti per le diverse specie, il loro numero diminuisce. È importante considerare le conseguenze sui pool genici di queste specie, in quanto la variabilità del pool genico ha effetti sulle probabilità di sopravvivenza a lungo termine delle specie stesse. Molti dei principi genetici e dei processi che sono stati descritti in questo capitolo sono collegati al problema della conservazione: come abbiamo visto, le popolazioni possiedono una struttura genetica, al mantenimento della quale deve essere data la massima attenzione. Per esempio, le tecniche di analisi di vitalità delle popolazioni stimano, con un certo grado di attendibilità, quanto grande debba essere una popolazione per evitare che si estingua in un certo periodo di tempo. Se si vuole essere sicuri che la popolazione possieda il potenziale per evolversi in un lungo lasso di tempo, bisogna mantenere un adeguato pool genico. Chiaramente, stabilire la struttura genetica di una popolazione e come la variabilità genetica all’interno della popolazione abbia effetti sulla probabilità di estinzione è un problema che richiede un intenso studio. La questione è particolarmente grave e sentita per le specie rare e già minacciate. Gli effetti indesiderati dell’inbreeding negli zoo e nei programmi di gestione della caccia si stanno riducendo grazie all’utilizzo dei principi della genetica di popolazioni che vengono impiegati in maniera sempre più accurata

571

nella gestione delle risorse genetiche delle popolazioni. Abbiamo visto che l’inbreeding, la deriva genetica e la selezione possono ridurre la variabilità genetica; pertanto, le popolazioni devono essere mantenute a dimensioni effettive adeguate per assicurare che rimanga un elevato tasso di variabilità genetica. Fortunatamente abbiamo ora a disposizione strumenti che ci consentono di ottenere una stima quantitativa delle relazioni tra popolazioni geograficamente distinte e del grado di variabilità presente in ciascuna di esse. Dati di questo tipo forniscono informazioni essenziali per decidere le politiche gestionali. Esistono, tuttavia, delle controversie circa l’utilità dell’informazione genetica in biologia della conservazione: il problema centrale è infatti rappresentato in molti casi dalla perdita degli habitat e, a meno che questa non venga rallentata, gli sforzi per gestire la struttura genetica delle popolazioni potrebbero essere inutili. Nondimeno, le informazioni provenienti dall’ecologia e dalla genetica di popolazioni sono necessarie per una migliore comprensione di quali siano le azioni più adatte per il mantenimento della diversità degli esseri viventi nei nostri ecosistemi.

Nota chiave Le specie rare e in pericolo rischiano di perdere la loro variabilità genetica e con essa la loro capacità di adattarsi a mutate condizioni ambientali. Nel tentativo di mantenere la diversità genetica vengono applicate pratiche gestionali basate sul mantenimento di dimensioni adeguate delle popolazioni e sulla riduzione dell’inincrocio.

Speciazione Abbiamo finora considerato, nella nostra discussione sui principi di base della genetica di popolazioni, soltanto quei processi in grado di far variare le frequenze alleliche all’interno di popolazioni di individui interfecondi. La suddivisione all’interno di una popolazione può essere quasi inesistente, oppure spinta a tal punto che due sottopopolazioni non si incrocino mai. Se ciò accade per un lungo periodo di tempo, ci si attende che alla fine possa verificarsi la fissazione di alleli diversi nelle sottopopolazioni, al punto che, se esse si dovessero incontrare di nuovo, gli individui non sarebbero in grado di accoppiarsi, oppure gli ibridi avrebbero una bassa fitness. Recentemente sono stati compiuti grandi passi avanti nell’identificazione di quei geni che svolgono un ruolo nell’isolamento riproduttivo di specie strettamente collegate. Prima di esaminare in dettaglio quali siano i mezzi forniti dalla genetica per comprendere le basi dell’isolamento riproduttivo, facciamo un passo indietro a considerare alcuni principi generali sulla speciazione.

572

Capitolo 21

Barriere al flusso genico Se una specie è un gruppo di organismi compatibili da un punto di vista riproduttivo, allora il processo di speciazione è equivalente alla costruzione di barriere al flusso genico. Alla fine, popolazioni geograficamente isolate tenderanno a divergere, sotto la spinta congiunta di deriva e selezione naturale, fino al punto di non potersi più riprodurre l’una con l’altra. Le barriere al flusso genico appartengono a due categorie principali: quelle che causano una bassa fitness della progenie ibrida (barriere postzigotiche) e quelle che impediscono addirittura alle due specie di accoppiarsi tra loro (barriere prezigotiche). Negli animali sembra che mutazioni in molti geni causino infertilità, specialmente maschile. Per questa ragione i primi cambiamenti genetici nelle nostre due sottopopolazioni isolate renderanno sterile la progenie ibrida. Gli adulti delle due sottopopolazioni sono ancora in grado di riconoscersi e accoppiarsi, ma la progenie è un binario morto da un punto di vista genetico. In genere i meccanismi di isolamento postzigotici appaiono per primi: l’isolamento postzigotico può includere la sterilità dell’ibrido, la non vitalità dell’ibrido (una fitness ridotta dell’ibrido), e la totale disfunzione dell’ibrido. Di fronte a una barriera postriproduttiva, gli adulti in grado di riprodursi potrebbero aumentare la loro fitness se fossero in grado di riconoscere la specie “sbagliata” e quindi di evitare questi incroci sterili. Se nella popolazione esiste variabilità genetica per la scelta del partner, allora aumenterà la frequenza di quegli alleli che consentono agli adulti una scelta coronata da successo riproduttivo. Questo semplice modello (chiamato rafforzamento) fornisce un meccanismo per cui l’isolamento postzigotico porta a isolamento prezigotico. I geni che controllano l’isolamento prezigotico possono mantenere le specie distinte in molti modi diversi, tra cui: 1. isolamento temporale. Cambiando la stagione di accoppiamento o i periodi di attività circadiani in modo che non si sovrappongano più, viene esclusa la possibilità di incrocio; 2. isolamento ecologico. Se la nicchia ecologica delle due specie è distinta in modo tale che, per esempio, le scelte alimentari delle due specie le tengano geograficamente separate, anche su una scala spaziale ridotta, di nuovo l’incrocio viene reso impossibile. Si considerino ora i casi in cui le due specie si sovrappongano liberamente e abbiano ampia possibilità di incrociarsi. Ci sono altre modalità genetiche che impediscono la formazione di zigoti, tra cui: 1. incompatibilità comportamentale. Se le due specie si riconoscono estranee ed evitano di accoppiarsi, non vi è opportunità di riproduzione;

2. isolamento meccanico. Le due specie potrebbero non essere in grado di discriminarsi l’una con l’altra, ma se i loro organi genitali non sono compatibili lo zigote non può formarsi; 3. isolamento gametico. Anche se gli individui si accoppiano e i gameti entrano in contatto fra di loro, rimane ancora da compiersi il complesso processo della fusione gametica. Nelle piante, spesso accade che il polline di una specie sbagliata cada sullo stigma: se la comunicazione chimica tra il polline (o il tubetto pollinico) e il complesso stigma-stilo non viene portata a termine correttamente il polline non riesce a germinare oppure il tubetto pollinico non riesce a crescere. Una volta che si sia raggiunto anche parzialmente l’isolamento prezigotico, si ha un effetto valanga che conduce a un’accelerazione del tasso di divergenza. Quegli individui che partecipano a incroci interspecifici ne risultano sempre più svantaggiati, finché alla fine la barriera al flusso genico è totale. La speciazione per isolamento geografico è suffragata da solide evidenze sperimentali, mentre gli altri meccanismi sono ancora controversi. Lo studio delle basi genetiche dell’isolamento tra specie e dei meccanismi della speciazione è tuttora un settore molto attivo.

Le basi genetiche della speciazione Dato che si ritiene che le specie più recenti tendano ad avvalersi maggiormente dell’isolamento postzigotico, esse vengono studiate dai genetisti evoluzionistici per comprendere la natura di quei geni che determinano in parte l’isolamento tra specie. Gli ibridi maschi sono spesso sterili, mentre le femmine ibride sono fertili. Ciò è particolarmente vero quando i maschi sono il sesso eterogametico (producono due tipi diversi di gameti, gli spermatozoi che portano un cromosoma X e quelli che portano un Y) e le femmine quello omogametico (producono soltanto uova con un cromosoma X). Negli uccelli e nelle farfalle il maschio è omogametico e la femmina eterogametica, perciò la regola è invertita. Questo modello è così generale che fu notato da J.B.S. Haldane, da cui il nome di regola di Haldane. L’osservazione della regola di Haldane suscita una domanda immediata: qual è la base genetica della sterilità degli ibridi maschi? Per molte specie di Drosophila, come D. simulans e D. mauritiana, le femmine F1 sono vitali e fertili, mentre i maschi F1 sono sterili. Se reincrociamo le femmine F1 con D. simulans, alcuni dei maschi della progenie del reincrocio (che sono all’incirca per 3/4 D. simulans) sono nuovamente fertili. Con trucchi come questi, o introducendo marcatori o parti del genoma della specie sbagliata, i genetisti di popolazioni di Drosophila hanno capito che esistono molti geni coinvolti nella fertilità degli ibridi maschi.

Genetica di popolazioni

Un altro interessante esempio di isolamento prezigotico si rinviene in alcune specie di abalone, un gasteropode marino che rilascia i gameti nell’acqua del mare. Uova e spermatozoi di specie diverse possono trovarsi insieme (anche se alcune specie manifestano isolamento temporale ed ecologico), per cui l’unico modo per evitare incroci interspecifici è per le uova quello di consentire l’ingresso solo allo sperma cospecifico. Questo processo avviene grazie alla presenza di molecole particolari nelle uova e negli spermatozoi: la pro-

573

teina dello sperma lisina è in grado di disaggregare la glicoproteina VERL dell’uovo in modo specie-specifico. Dato che le molecole di riconoscimento dello sperma e delle uova devono adeguarsi continuamente l’una all’altra e dato che devono essere in grado di rispondere rapidamente nel caso venissero in contatto con nuove specie, queste molecole stanno andando incontro a una rapida evoluzione adattativa. L’evoluzione adattativa delle proteine sarà discussa in maggiore dettaglio nel Capitolo 23.

Sommario l La genetica di popolazioni cerca di comprendere le basi genetiche dei cambiamenti evolutivi identificando i meccanismi che stanno alla base dei profili di variabilità genetica entro e fra popolazioni naturali. Questo campo di studio comprende un approccio sia sperimentale sia teorico per verificare le ipotesi sul ruolo dei processi evolutivi nella modificazione delle frequenze geniche. l La struttura genetica di una popolazione viene descritta dal numero e dalla frequenza degli alleli a un dato locus entro e fra popolazioni. Il pool genico di una popolazione è costituito dal totale degli alleli entro la popolazione ed è descritto in termini di frequenze alleliche e genotipiche. Il pool genico è la fonte di informazione genetica di una popolazione che viene trasmessa da una generazione alla successiva. l La legge di Hardy-Weinberg stabilisce che in una grande popolazione ad accoppiamento casuale, per la quale si assume siano nulle mutazione, migrazione e selezione naturale, le frequenze alleliche non cambiano e le frequenze genotipiche si stabilizzano dopo una generazione. l Quando una popolazione è in equilibrio di Hardy-Weinberg, le frequenze alleliche non variano da una generazione alla successiva e le frequenze genotipiche si stabilizzano dopo una generazione di incrocio casuale, nelle proporzioni p2, 2pq e q2, dove p e q sono le frequenze alleliche della popolazione. l I tre modelli evolutivi classico, bilanciato e della teoria neutrale hanno prodotto ipotesi sperimentabili che aiutano a spiegare quanta variabilità genetica esista entro le popolazioni naturali e quali processi siano responsabili dell’origine e del mantenimento di tale variabilità. l La mutazione è la fonte di tutta la variabilità di una popolazione. Produce una variazione delle frequenze alleliche in modo estremamente lento, così lento che quasi tutte le altre forze annullano gli effetti della mutazione ricorrente sulle frequenze alleliche. Quindi, sebbene sia la fonte iniziale di tutta la variabilità genetica, altre forze predominano nel determinare i cambiamenti di frequenza una volta che la mutazione è stata introdotta. l La deriva genetica è una variazione casuale delle frequenze alleliche che ha origine dal campionamento casuale dei gameti che avviene in ogni generazione. La deriva genetica porta a una perdita di variabilità genetica entro la popolazio-

l l

l

l

l

l

ne, a una divergenza genetica fra popolazioni e a cambiamenti casuali della frequenza allelica all’interno della popolazione. Poiché è determinata dal caso, ha un effetto maggiore sulle frequenze alleliche nelle piccole popolazioni. La migrazione, o flusso genico, consiste nel trasferimento di alleli fra popolazioni, altera le frequenze alleliche entro le popolazioni e riduce le divergenze genetiche tra popolazioni. La selezione naturale è la riproduzione differenziale dei genotipi. Il contributo riproduttivo relativo dei genotipi viene misurato in termini di fitness darwiniana. Gli effetti della selezione naturale dipendono dalle fitness dei genotipi, dal grado di dominanza e dalle frequenze alleliche della popolazione. L’incrocio non casuale modifica le dimensioni effettive di una popolazione e le frequenze genotipiche della popolazione stessa; le frequenze alleliche non sono influenzate a eccezione di alcuni casi di incrocio per assortimento negativo. Gli incroci per assortimento positivo diminuiscono l’eterozigosi anche se solo per un singolo locus. Un tipo particolare di incrocio non casuale, l’inincrocio o inbreeding, produce un aumento dell’omozigosi. Nuove tecniche di genetica molecolare, tra cui l’analisi dei polimorfismi della lunghezza dei frammenti generati da enzimi di restrizione e il sequenziamento del DNA, hanno avvalorato le ipotesi sui processi evolutivi derivate dall’analisi delle proteine, e hanno fornito nuove prove sul ruolo che hanno la dimensione della popolazione, la mutazione, la migrazione, la selezione e la ricombinazione sui processi evolutivi nelle popolazioni naturali. La ricerca ha appurato che regioni diverse di un gene possiedono livelli di polimorfismo differenti; le regioni del gene che hanno gli effetti minori sulla fitness sembrano essere quelle che si evolvono a un tasso maggiore. Ciò suggerisce che la selezione naturale tenda a rimuovere le mutazioni dannose. Le eccezioni sono rappresentate da quei geni in cui è vantaggioso mantenere livelli di variabilità elevati. I principi della genetica di popolazioni possono fornirci informazioni sulla nostra eredità genetica e possono anche essere applicati allo studio sulla conservazione delle specie rare a rischio di estinzione. La variabilità genetica è mantenuta al meglio in una popolazione con fondatori adeguati che la amplino rapidamente evitando l’inincrocio.

574

Capitolo 21

Approccio analitico alla soluzione di problemi di genetica D.21.1 In una popolazione di 2000 vipere del Gabon esiste una differenza genetica relativa a un singolo locus per il veleno. Gli alleli mostrano dominanza incompleta. La popolazione possiede 100 individui omozigoti per l’allele t (genotipo tt, innocuo), 800 eterozigoti (genotipo Tt, poco velenoso) e 1100 omozigoti per l’allele T (genotipo TT, mortale). a. Qual è la frequenza dell’allele t nella popolazione? b. I genotipi sono in equilibrio di Hardy-Weinberg? R.21.1 Questa domanda fa riferimento alle conoscenze di base sul calcolo delle frequenze alleliche e sulla loro relazione con le frequenze genotipiche attese di una popolazione in equilibrio di Hardy-Weinberg. a. La frequenza di t può venire calcolata dalle informazioni fornite, dato che il carattere mostra dominanza incompleta. Nella popolazione studiata ci sono 2000 individui, il che significa un totale di 4000 alleli al locus T/t. Il numero di alleli t è dato da: (2 × omozigoti tt) + (1 × eterozigoti Tt) = (2 × 100) + (1 × 800) = 1000 Questo calcolo è diretto, dato che entrambi gli alleli dei serpenti non velenosi sono t, mentre soltanto uno dei due alleli dei serpenti poco velenosi è t. Dal momento che il numero totale di alleli studiati è 4000, la frequenza degli alleli t è 1000/4000 = 0,25. Questo è un sistema a due alleli, pertanto la frequenza di T deve essere 0,75. b. Affinché i genotipi siano in equilibrio di Hardy-Weinberg, la distribuzione dei genotipi deve essere p2 (TT) + 2pq (Tt) + q2 (tt), dove p è la frequenza dell’allele T e q quella dell’allele t. Nella parte a del problema abbiamo stabilito che la frequenza di T è 0,75 e quella di t è 0,25. Pertanto, p = 0,75 e q = 0,25: con questi valori possiamo determinare le frequenze genotipiche attese, se questa popolazione fosse in equilibrio di Hardy-Weinberg: (0,75)2 TT + 2(0,75)(0,25) Tt + (0,25)2 tt Questa espressione dà 0,5625 TT + 0,3750 Tt + 0,0625 tt. Quindi, per una popolazione di 2000 individui ci attenderemmo 1125 TT, 750 Tt e 125 tt. Questi valori sono prossimi ai valori forniti nella domanda, e ciò suggerisce che la popolazione sia in effetti in equilibrio genetico. Per verificare questo risultato, dovremmo effettuare un’analisi del chi-quadrato, χ2, utilizzando i numeri (non le frequenze) dati per i tre genotipi come i valori osservati e i numeri calcolati come i valori attesi. L’analisi del χ2, dove d = (osservati – attesi), è la seguente: Genotipo Osservati

Attesi

d

d2

d2/e

TT Tt tt Totali

1125 750 125 2000

–25 +50 –25 0

625 2500 625

0,556 3,334 5,000 8,890

1100 800 100 2000

Quindi, il valore del χ2 (cioè la somma di tutti i valori d2/e) è 8,89. Per gli stessi motivi discussi nel testo con un esempio simile, esiste un solo grado di libertà. Cercando questo valore nella tabella del χ2 (Tabella 11.5), troviamo un valore di P di circa 0,0025. Pertanto ci aspetteremmo, per solo effetto del caso, deviazioni dell’entità osservata circa 25 volte su 10 000: in altre parole, la nostra ipotesi che la popolazione sia in equilibrio di Hardy-Weinberg non è corroborata dal test. Nondimeno, la popolazione non si discosta di molto da uno stato di equilibrio. D.21.2 In ciascuna generazione umana, circa 1 allele normale su 30 000 muta all’allele recessivo (associato al cromosoma X) per l’emofilia. Si assuma, per gli scopi di questo problema, che 1 allele h su 300 000 muti all’allele normale per generazione (si noti che, in realtà, è difficile misurare nell’uomo la reversione di un allele recessivo tendenzialmente letale, come lo è l’allele per l’emofilia). Le frequenze di mutazione sono indicate nello schema seguente: u h+

h

v dove u = 10v. Quali frequenze alleliche prevarranno all’equilibrio in queste condizioni, assumendo che sulla popolazione agisca soltanto la mutazione? R.21.2 Questa domanda mette alla prova la nostra comprensione degli effetti della mutazione sulle frequenze alleliche. Nel capitolo abbiamo discusso le conseguenze della pressione mutazionale concludendo che, se A muta ad a con una frequenza n volte superiore a quella con la quale a reverte ad A, Ÿ Ÿ allora all’equilibrio il valore di q sarà q = u/(u + v) ovvero q = nv/(n + 1)v. Applicando questa derivazione generale a questo problema particolare, utilizziamo semplicemente i valori riportati. Sappiamo che il tasso di mutazione è 10 volte il tasso di reversione, ovvero u = 10v. All’equilibrio il valore di q sarà Ÿ Ÿ q = u/(u + v). Dato che u = 10v, questa equazione diventa q = 10v/11v, da cui q = 10/11 = 0,909. Pertanto, all’equilibrio a cui si perviene per mutazione, la frequenza di h (l’allele per l’emofilia) sarà 0,909 e la frequenza di h+ (l’allele normale) sarà Ÿ Ÿ p , cioè (1 – q ) = (1 – 0,909) = 0,091.

22

Genetica quantitativa

Che cosa causa la distribuzione continua dei fenotipi, caratteristica dei caratteri quantitativi?

Che cos’è l’ereditabilità e come si misura?

In che modo può essere utilizzata la statistica per descrivere e analizzare i caratteri quantitativi?

In che modo possono essere identificati i singoli loci che determinano variabilità quantitativa?

Attività Proprio come i fiocchi di neve, non esistono due impronte digitali identiche, neanche quelle dei gemelli omozigoti, anche se la ricerca ha dimostrato che i dermoglifi (i disegni dei rilievi sulla pelle) presenti sulle nostre mani si ereditano. Quali fattori contribuiscono a produrre una così ampia varietà di fenotipi? Il carattere è codificato da più di un locus? Sono coinvolti fattori ambientali? Esiste una relazione tra le impronte digitali di una persona e un altro carattere, come il colore dei capelli o il gruppo sanguigno? In questo capitolo verranno date le risposte a queste e ad altre domande. Quindi potrete, nella iAttività, applicare quanto appreso per cercare di scoprire se esiste una relazione tra impronte digitali e pressione arteriosa.

ni e il carattere rimane di tipo semplice. Abbiamo visto nel Capitolo 13 come la relazione tra genotipo e fenotipo non sia sempre così semplice: esistono fenomeni variabili come la penetranza e l’espressività, oppure la pleiotropia e l’epistasi, che possono stabilire una relazione complessa tra genotipo e fenotipo. Inoltre, uno stesso genotipo può dare origine a un’intera gamma di fenotipi, poiché esso interagisce con fattori ambientali mutevoli durante lo sviluppo, producendo una norma di reazione. Come risultato di questi e altri fattori, non esistono tanti caratteri i cui fenotipi ricadano in categorie ben distinte. Molti caratteri (probabilmente la maggioranza), come il peso alla nascita (vedi Figura 22.2) e la statura nell’adulto, il contenuto proteico nel mais e il numero di uova deposte da Drosophila, mostrano un’ampia varietà di pos-

La natura dei caratteri continui 60

50 Percentuale del totale

Isolando dei mutanti fenotipici, incrociandoli e confrontando i mutanti con il fenotipo selvatico, Mendel fu in grado di descrivere per la prima volta le leggi di base dell’ereditarietà e, in seguito, grazie alla genetica siamo stati in grado di comprendere le basi molecolari di un fenotipo mutante. Le mutazioni utilizzate in questi studi e, in realtà, molti dei caratteri discussi finora, sono caratterizzati dalla presenza di pochi fenotipi ben distinti. Per esempio, gli involucri dei semi delle piante di pisello erano grigi o bianchi, i baccelli gialli o verdi e le piante erano alte o basse. Per ciascun carattere i fenotipi erano chiaramente distinti e facilmente distiguibili da tutti gli altri. Caratteri come questi, con solo pochi fenotipi distinti (Figura 22.1), sono definiti caratteri discontinui. Di solito, per i caratteri discontinui esiste una relazione semplice tra il genotipo e il fenotipo. Nella maggior parte dei casi, gli effetti di una variazione allelica a singolo locus sono osservabili a livello dell’organismo, così dal fenotipo si può rapidamente determinare il genotipo. Quando esiste dominanza, lo stesso fenotipo può essere il prodotto di due genotipi diversi, ma la relazione tra i ge-

40

30

20

10

0 Marrone

Rosa

Giallo

Colore della conchiglia

Figura 22.1 Distribuzione discontinua per il colore della conchiglia in una popolazione di chiocciole Cepaea nemoralus in Inghilterra.

576

Capitolo 22

160

Tuttavia, quando esaminiamo caratteri quantitativi, gli individui differiscono nella quantità del carattere; pertanto, non ha senso chiedersi qual è la probabilità di ereditare un carattere continuo, come avveniva invece per i caratteri discontinui semplici. Di seguito vengono elencate le problematiche più comuni della genetica quantitativa.

140

Numero di bambini

120 100 80 60 40 20 0

0

2

4

6

8

10

12

Peso (in libbre)

Figura 22.2 Distribuzione per il peso alla nascita dei bambini (maschi e femmine) nati da madri minorenni nel 1992 a Portland, nell’Oregon.

sibili fenotipi. Caratteri come questi, che presentano una distribuzione continua di fenotipi, vengono definiti caratteri continui. Dato che i fenotipi dei caratteri continui devono essere descritti in termini quantitativi, tali caratteri sono anche denominati caratteri quantitativi, e lo studio della loro trasmissione ereditaria costituisce il campo di studi della genetica quantitativa.

Argomenti studiati in genetica quantitativa Esiste una grande variabilità genetica tra individui. La quantità e la distribuzione della variabilità genetica determinano la struttura genetica di una popolazione. In questo capitolo varieremo il nostro punto di vista da una prospettiva puramente genetica fino a considerare la struttura fenotipica di una popolazione, così come la relazione tra struttura genetica e fenotipica. Vedremo come la genetica quantitativa svolga un ruolo importante nella comprensione di evoluzione, conservazione e complessità dei caratteri umani. La genetica quantitativa è particolarmente importante in genetica agraria, in cui caratteri di grande importanza come la produttività delle piante, il tasso di crescita, la produzione di latte e il suo contenuto di grasso sono studiati con la genetica quantitativa. In campo psicologico i metodi della genetica quantitativa vengono applicati per studiare il quoziente di intelligenza (IQ), la capacità di apprendimento e la personalità; inoltre, sempre in genetica umana, vengono utilizzati per studiare caratteri come la pressione arteriosa, il titolo anticorpale, le impronte digitali e il peso alla nascita. In genetica classica è stata frequentemente determinata la probabilità di ereditare un dato fenotipo.

1. Fino a che punto la variabilità osservata nel fenotipo deriva da differenze nel genotipo, e in quale misura tale variabilità riflette invece l’influenza di ambienti diversi? Nello studio dei caratteri discontinui questa domanda era di scarsa rilevanza, dato che si assumeva che le differenze nel fenotipo fossero il risultato soltanto di differenze genotipiche. 2. Quanti geni determinano il fenotipo? Quando sono coinvolti soltanto pochi geni e il carattere è discontinuo, si può spesso stabilire il numero di loci interessati esaminando i rapporti fenotipici in incroci genetici appropriati. Tuttavia, per caratteri complessi di tipo continuo, la determinazione del numero di geni implicati è più complicata. 3. Sono uguali i contributi dei geni che determinano il carattere? Oppure pochi geni hanno effetti maggiori e gli altri si limitano a modificare solo leggermente il fenotipo? 4. Gli effetti degli alleli sono additivi? In quale misura gli alleli di loci differenti interagiscono gli uni con gli altri? 5. Quando la selezione favorisce un particolare fenotipo, quanto rapidamente può variare il carattere? Variano contemporaneamente altri caratteri? 6. Qual è il miglior metodo per selezionare e incrociare gli individui allo scopo di produrre i fenotipi desiderati nella progenie?

La trasmissione ereditaria dei caratteri continui I biologi cominciarono a sviluppare tecniche per lo studio dei caratteri continui verso la fine del diciannovesimo secolo, prima ancora di venire a conoscenza dei principi di Mendel sull’ereditarietà. Francis Galton e il suo collega Karl Pearson studiarono numerosi caratteri continui nell’uomo, come statura, peso e caratteristiche mentali, dimostrando che i caratteri dei genitori e della loro progenie sono statisticamente correlati; da questi risultati essi furono in grado di dedurre che questi caratteri vengono ereditati, ma non seppero stabilire come avvenisse la trasmissione genetica. Anche dopo la riscoperta del lavoro di Mendel, sorsero notevoli controversie sulla trasmissione dei caratteri continui, riguardo alla possibilità che anche essi seguissero i principi di Mendel o piuttosto venissero ereditati in modo diverso.

Genetica quantitativa

L’ipotesi poligenica per l’ereditarietà quantitativa

L’ipotesi poligenica per il colore della cariosside di grano

MyLab

Si può far risalire l’ipotesi poligenica al 1909 e al lavoro classico di Hermann Nilsson-Ehle, che studiò il colore della cariosside di grano. Come Mendel, Nilsson-Ehle ininimazione ziò incrociando tra loro linee L’ipotesi pure di piante con cariossidi poligenica rosse e linee pure con cariossiper il colore di bianche. La F1 aveva cadella cariosside riossidi che presentavano tutte di grano la stessa sfumatura di colore intermedio tra il rosso e il bianco. Quando Nilsson-Ehle incrociò tra di loro le F1, le cariossidi della progenie F2 si mostrarono bianche e rosse, con molte sfumature di rosso, con un rapporto approssimativo di 15 rosse (con tutte le sfumature) : 1 bianca; ciò era evidentemente una deviazione dall’atteso 3:1 per l’incrocio di un monoibrido, tuttavia Nilsson-Ehle riconobbe quattro ben definite sfumature di rosso nella progenie. Quando contò il numero relativo di ciascuna classe trovò un rapporto fenotipico 1:4:6:4:1 di cariossidi rosso scuro, rosso brillante, rosso medio, rosso chiaro e bianco. Come possono essere interpretati questi dati in termini genetici? Si ricordi dal Capitolo 13 (Approccio analitico alla soluzione di problemi di genetica, Risposta alla Domanda 13.3c) che un rapporto 15:1 di due fenotipi alternativi è il risultato dell’interazione dei prodotti di due geni, ognuno avente effetto sullo stesso carattere. Ipotizziamo che esistano due loci che segregano in modo indipendente e controllano la produzione del pigmento

rosso: il locus rosso con gli alleli R e r e il locus cremisi con gli alleli C e c. Si possono indicare i genotipi parentali e della F1 di Nilsson-Ehle nel modo seguente: × RR CC (rosso scuro)

P

D

Un carattere può mostrare una gamma di fenotipi diversi perché su di esso influiscono i fattori ambientali. Lo stesso genotipo può dare origine a più fenotipi (la norma di reazione) oppure più genotipi possono determinare lo stesso fenotipo. Quale fenotipo risulti espresso dipende sia dal genotipo sia dall’ambiente specifico in cui il genotipo si esprime. Nel 1903 Wilhelm Johannsen pubblicò uno studio in cui dimostrò che la variazione quantitativa del peso del seme di fagiolo era determinata da fattori sia ambientali sia genetici. Riconoscere che alcuni caratteri quantitativi sono influenzati sia dal genotipo sia dall’ambiente rappresentò una pietra miliare della genetica: tali caratteri furono definiti caratteri multifattoriali. Dato che l’ereditarietà dei caratteri quantitativi non può essere spiegata dall’azione di un singolo locus, l’alternativa più semplice è che essi siano controllati da molti geni: questa spiegazione, nota come ipotesi poligenica (o multigenica) per l’ereditarietà quantitativa, rappresenta un fondamento del pensiero genetico.

577

F1

rr cc (bianco)

Rr Cc (rosso medio)

Quando le F1 sono incrociate tra loro, la distribuzione dei genotipi nella F2 è quella tipica dell’ereditarietà di un diibrido, ovvero 1/16 RR CC + 2/16 Rr CC + 1/16 rr CC + 2/16 RR Cc + 4/16 Rr Cc + 2/16 rr Cc + 1/16 RR cc + 2/16 Rr cc + 1/16 rr cc. Se R e C sono dominanti rispetto a r e c, dovrebbe risultare il rapporto fenotipico 9:3:3:1 tipico dell’ereditarietà di un diibrido. Quindi, per il colore della cariosside di grano, la dominanza non è la risposta adeguata, dato che i rapporti fenotipici osservati presentano 5 classi che si approssimano a 1:4:6:4:1. Si noti che i numeri dei rapporti fenotipici corrispondono ai coefficienti dello sviluppo del binomio (a + b)4. I calcoli che trovate di seguito dimostrano come si possano ottenere i coefficienti delle incognite. Essenzialmente si moltiplica (a + b) × (a + b), quindi si moltiplica il prodotto per (a + b) e così via: a + b × a + b = a2 + ab + ab = a2 + 2ab × a + b = a3 + 2a2b + a2b 3 = a + 3a2b × a + b = a4 + 3a3b + a3b 4 = a + 4a3b

+ +

b2 b2

+ ab2 + + 2ab2 + b3 + 3ab2 + b3

che equivale ad (a + b)2

che equivale ad (a + b)3

+ 3a2b2 + ab3 + 3a2b2 + 3ab3 + b4 + 6a2b2 + 4ab3 + b4 che equivale ad (a + b)4

Una spiegazione alternativa è che gli alleli possono essere classificati o come funzionali (che contribuiscono al fenotipo, ossia additivi) o come non funzionali (che non contribuiscono al fenotipo) rispetto alla produzione di pigmento, e che ciascun allele che contribuisce permette la sintesi (additiva) di una determinata quantità di pigmento. Pertanto, in base a questa ipotesi, l’intensità della colorazione rossa della cariosside è una funzione del numero di alleli R e C presenti nel genotipo: RR CC (il termine a4 nello sviluppo del binomio) sarebbe rosso scuro e rr cc (il termine b4 nello sviluppo del binomio) sarebbe bianco. La Tabella 22.1 mostra come questa ipotesi spieghi le cinque classi fenotipiche osservate. Nilsson-Ehle concluse che l’ereditarietà del colore rosso della cariosside di grano rappresenta un esempio

578

Capitolo 22

Tabella 22.1 Spiegazione genetica del numero e delle proporzioni dei fenotipi della F2 per il carattere quantitativo colore rosso della cariosside di grano Numero di alleli additivi per il colore rosso

Fenotipo

Frazione della F2

RR CC

4

Rosso scuro

1/16

RR Cc o Rr CC

3

Rosso brillante

4/16

RR cc o rr CC o Rr Cc

2

Rosso medio

6/16

rr Cc o Rr cc

1

Rosso chiaro

4/16

rr cc

0

Bianco

1/16

Genotipo

di una serie poligenica di due loci, che presentano fino a quattro alleli additivi. Bisogna essere cauti, tuttavia, nell’estendere questa spiegazione della base genetica per questo carattere particolare ad altre situazioni. Alcune popolazioni F2 mostrano soltanto tre classi fenotipiche con un rapporto rosso : bianco di 3:1, mentre altre popolazioni F2 mostrano un rapporto 63:1 con classi discrete di colore tra il rosso scuro e il bianco. Questi risultati suggeriscono che esista, per i loci che contribuiscono al colore della cariosside, un certo grado di variabilità nella segregazione della progenie, in modo tale che un locus non sempre contribuisce alla variazione quantitativa in un dato incrocio. L’ipotesi multigenica, che si adatta così bene all’esempio del colore della cariosside di grano, è stata estesa ad altri esempi di ereditarietà quantitativa. Nella sua enunciazione di base, l’ipotesi multigenica propone che l’ereditarietà di tipo quantitativo possa venir spiegata dall’azione e dalla segregazione di coppie alleliche a un certo numero di loci definiti poligeni, ciascuno con un piccolo effetto additivo sul fenotipo. Come ipotesi di lavoro per interpretare molti caratteri quantitativi, l’ipotesi

Nota chiave I caratteri discontinui mostrano soltanto pochi distinti fenotipi e possono essere descritti in termini qualitativi. I caratteri continui, invece, mostrano una gamma di fenotipi e devono essere descritti in termini quantitativi. L’ipotesi multigenica assume che loci multipli contribuiscano a un fenotipo di tipo quantitativo e, proporzionalmente all’incremento del numero di alleli, si abbia un effetto additivo (talvolta moltiplicativo) sul fenotipo. La relazione tra genotipo e fenotipo per un carattere quantitativo può essere complessa, poiché alleli multipli a loci multipli determinano molti genotipi e la risposta genotipica ai fattori ambientali può modulare un’ampia gamma di fenotipi.

poligenica risulta in larga misura soddisfacente. Il quadro completo dei caratteri quantitativi è, però, più complicato. Per esempio, mentre risulta affascinante l’ipotesi che alcuni alleli agiscano ciascuno a produrre una certa dose di pigmento, che cosa significa questa ipotesi a livello molecolare? Come è regolato il prodotto? Quanti processi biochimichi sono controllati in una grande serie poligenica? L’ereditarietà poligenica fornisce una spiegazione compatibile con le leggi di Mendel per l’ereditarietà dei caratteri continui e, come vedremo in seguito in questo capitolo, grazie all’applicazione di tecniche molecolari stiamo a poco a poco comprendendo la natura dei geni coinvolti.

Metodi statistici Quando geni multipli e fattori ambientali influiscono su un carattere, le relazioni tra i singoli loci e il loro contributo al fenotipo possono essere poco chiari. Le stesse regole di trasmissione genetica e di funzione del gene sono sempre valide, ma riuscire a definire l’effetto di un singolo locus presuppone la capacità di determinare i genotipi di molti individui per vari loci sparsi nel genoma. Prima dell’avvento delle moderne tecniche di genotipizzazione molecolare (e tuttora, in sistemi in cui non si possano applicare tali strumenti) era pressoché impossibile cercare di comprendere il ruolo e l’attività di ciascun singolo gene, pertanto i genetisti quantitativi applicavano procedure statistiche e analitiche per comprendere l’effetto globale dei geni sui caratteri continui. Come discusso in precedenza, uno dei problemi principali in genetica quantitativa è stabilire quanta della variabilità di un carattere tra gli individui di una popolazione sia determinata geneticamente e quanta invece sia di origine ambientale. Questa domanda riveste fondamentale importanza in quanto in molte occasioni, per poter effettuare scelte informate, è necessario comprendere quale sia il contributo relativo dei due fattori, genetico e ambientale. Per esempio, in un esperimento di resa produttiva in campo agrario, potremmo voler individuare delle linee di qualità superiore (genotipo) di frumento a partire da dati raccolti in molti campi (ambiente). Pertanto, il nocciolo della genetica quantitativa (l’unica branca di tutte le scienze che affronti direttamente questo problema) è l’eterno dilemma “natura o ambiente” (nature versus nurture), ovvero quale sia il ruolo di geni e ambiente nel determinarsi delle variazioni fenotipiche. Si noti come la formulazione tradizionale dell’alternativa consideri geni e ambiente come antagonisti, implicando che si escludano reciprocamente. Questa eccessiva semplificazione del problema ha dato origine a molta cattiva scienza e a inutili discussioni. Dal punto di vista della genetica quantitativa possiamo riformulare l’alternativa in termini di variabilità dovuta a queste due componenti: quanta variabilità per un dato

579

Genetica quantitativa

aspetto fenotipico (VF) deriva dalla variabilità genetica (VG) e quanta dalla variabilità ambientale (environmental, VE)? Questa relazione può venire espressa come: VF = VG + VE Per poter lavorare su questa equazione dobbiamo imparare come misurare la variabilità fenotipica e come ripartirla nelle sue componenti genetica e ambientale. Quindi dobbiamo apprendere alcune metodologie statistiche, molte delle quali furono sviluppate proprio per studiare questa branca della genetica.

fossero insolitamente pesanti, la nostra stima del peso medio alla nascita di tutti i neonati non sarebbe molto accurata. Il campione deve inoltre rappresentare un sottoinsieme casuale della popolazione. Se tutti i bambini del nostro campione provenissero dall’Ospedale Hope per neonati prematuri, allora sottostimeremmo in maniera grossolana il vero peso medio alla nascita della popolazione. Nonostante questi concetti possano apparire ovvi, moltissimi errori avvengono a causa di dati non raccolti in modo casuale.

Distribuzioni Campioni e popolazioni Supponiamo di voler descrivere un aspetto di un carattere in un grande gruppo di individui. Per esempio, potremmo essere interessati al peso medio alla nascita dei bambini nati a New York nel 1987. Un metodo potrebbe consistere nel raccogliere informazioni sul peso di ciascuno delle migliaia di bambini che nascono ogni anno a New York. Un metodo alternativo, e meno laborioso, potrebbe essere quello di raccogliere informazioni su un sottoinsieme del gruppo, come i pesi alla nascita di 100 neonati durante il 1987, e quindi usare la media ottenuta come una stima della media per l’intera città. Gli scienziati impiegano comunemente questa procedura di campionamento nella raccolta dei dati. Il gruppo di interesse primario (nel nostro esempio, tutti i bambini nati a New York nel 1987) viene definito popolazione, e il sottoinsieme utilizzato per stimare la popolazione (il gruppo di 100 neonati) viene definito campione. Per essere attendibile, un campione deve essere sufficientemente grande, in modo tale che le differenze casuali tra campione e popolazione non siano fuorvianti. Se il nostro campione consistesse di soli pochi neonati ed essi

Nota chiave Per descrivere e studiare un vasto gruppo di individui, gli scienziati frequentemente esaminano un sottoinsieme del gruppo. Questo sottoinsieme viene definito campione e fornisce le stime rispetto al gruppo più numeroso definito popolazione. Il campione deve essere di dimensioni adeguate e deve rappresentare un sottoinsieme casuale del gruppo più grande per poter fornire informazioni accurate riguardo la popolazione.

Nello studio dei caratteri discontinui (Capitoli 11, 12 e 13), abbiamo definito i fenotipi alternativi osservati all’interno di un gruppo di individui specificando la proporzione di individui per ciascuna classe fenotipica. Dal momento che i caratteri continui mostrano una gamma di fenotipi, risulta più complesso descrivere un gruppo di individui. Un metodo per riassumere i fenotipi di un carattere continuo è rappresentato dalla distribuzione di frequenza, che è la sintesi di un gruppo in termini di proporzione di individui che ricadono in un dato intervallo fenotipico (vedi Figura 22.2). Per determinare una distribuzione di frequenza innanzitutto si configurano delle classi che includono gli individui in uno specifico intervallo di misura fenotipica, quindi si conta il numero degli individui per ciascuna classe. La Tabella 22.2 presenta i dati dello studio di Johannsen sull’ereditarietà del peso del seme del fagiolo Phaseolus vulgaris. Come mostrato in tabella, Johannsen pesò 5494 fagioli della progenie F2 di un incrocio e li suddivise in nove classi, ognuna delle quali copriva un intervallo di peso di 100 milligrammi. Tali dati di frequenza possono essere rappresentati graficamente con un istogramma di frequenza, come mostrato nella Figura 22.3. Nell’istogramma le classi fenotipiche sono indicate in ascissa e il numero di individui per ogni classe è riportato in ordinata. Esistono alcuni modelli di distribuzioni di frequenza che corrispondono a distribuzioni di probabilità note e descritte matematicamente. Per esempio, molti caratteri continui presentano una distribuzione simmetrica, a campana, simile alla curva sovraimposta ai dati nella Figura 22.3 (vedi anche Figura 22.2) e che viene definita distribuzione normale. I dati conformi a una distribuzione normale possono venire accuratamente descritti da pochi parametri statistici, ossia la media e la varianza, spiegate

Tabella 22.2 Peso di 5494 fagioli (semi di Phaseolus vulgaris) della F2 – osservazioni di Johannsen nel 1903 Peso (mg) (Punto medio dell’intervallo) Numero di fagioli

50-150 150-250

450-550

550-650

650-750

(100)

(200)

250-350 350-450 (300)

(400)

(500)

(600)

(700)

750-850 850-950 (800)

(900)

5

38

370

1676

2255

928

187

33

2

580

Capitolo 22 0,9

Istogramma di frequenza

Numero di fagioli

2000 Curva normale

1500 1000 500 0

0 100 200 300 400 500 600 700 800 900 Peso dei fagioli (mg)

Figura 22.3 Istogramma di frequenza per il peso del seme di fagiolo, Phaseolus vulgaris, ottenuto con i dati della Tabella 22.2. Una curva normale è stata adattata ai dati ed è sovraimposta all’istogramma di frequenza.

di seguito. Inoltre, dati distribuiti normalmente ci consentono assunzioni che semplificano analisi complicate.

La media La distribuzione di frequenza di un carattere fenotipico, distribuito in modo normale, può essere descritta mediante due parametri statistici, la media e la varianza. La – media del campione (x ) è localizzata nel centro della distribuzione dei fenotipi. La media del campione si calcola semplicemente sommando tutte le singole misurazioni (x1, x2, x3, …, xn) e dividendo per il numero totale di misurazioni (n). La media viene utilizzata di frequente in genetica quantitativa per caratterizzare i fenotipi di un gruppo di individui. Per esempio, in uno dei primi studi sulla variazione continua, Edward M. East studiò l’ereditarietà della lunghezza del fiore della pianta del tabacco, incrociando una linea a fiori corti con una linea a fiori lunghi. All’interno di ciascuna linea la lunghezza della corolla variava, così East rilevò che il fenotipo medio della linea a fiore corto era di 40,4 mm, e che il fenotipo medio della linea a fiore lungo era di 93,1 mm. La lunghezza media del fiore nella progenie F1, composta di 173 piante, era di 63,5 mm. In tal caso, la media fornisce un metodo conveniente per caratterizzare in modo rapido e confrontare tra loro i fenotipi parentali e della progenie.

La varianza e la deviazione standard Il secondo parametro statistico che fornisce informazioni fondamentali sulla distribuzione è la varianza. La varianza è la misura di quanto i valori dei singoli individui si disperdono attorno alla media – ovvero di quanto variabili sono i valori degli individui e le loro misurazioni. Due distribuzioni possono avere la stessa media, ma quando hanno varianze diverse, come mostrato nella Figura 22.4, le distribuzioni differiscono marcatamente. Una curva bassa e larga è indice di un’alta variabilità per

Altezza della distribuzione normale

2500

0,8 s 2 = 0,25

0,7 0,6 0,5 0,4 0,3

s 2 = 1,0

0,2

s 2 = 4,0

0,1 0 5

6

7

8

9

10

11

12

13

14

15

2

s del fenotipo

Figura 22.4 Grafico che mostra tre distribuzioni con la stessa media ma con varianze diverse.

la quantità misurata e di una corrispondente elevata varianza, mentre una curva alta e stretta, al contrario, indica che la quantità misurata presenta minore variabilità e una altrettanto ridotta varianza. La varianza del campione, indicata con s2, viene definita come la media delle deviazioni al quadrato dei valori considerati rispetto alla loro media. ∑(xi – x–)2 Varianza = s2 = –––––––––– n–1 Viene calcolata sottraendo dapprima la media del campione da ogni misura singola: ogni valore ottenuto da questa operazione viene quindi elevato al quadrato (in modo tale che la varianza definisca la distanza dalla media senza considerarne la direzione) e si sommano tutti i quadrati. La somma ottenuta viene infine divisa per il numero delle misure originali meno 1 (per ragioni matematiche che non saranno discusse in questa sede, la varianza del campione si ottiene dividendo per n – 1, anziché per n). La deviazione standard è spesso preferita alla varianza in quanto è espressa nelle stesse unità di misura dei valori originali, mentre la varianza è espressa nelle unità di misura al quadrato. La deviazione standard di un campione non è altro che la radice quadrata della varianza di quel campione. Deviazione standard = s = √s2 Una distribuzione normale teorica risulta completamente determinata dalla media e dalla deviazione standard. Ha sempre la forma indicata nella Figura 22.5, in cui il 66% delle singole osservazioni mostra valori compresi entro 1 deviazione standard (± 1s) al di sopra o al di sotto della media della distribuzione, circa il 95% dei valori è situato entro 2 deviazioni standard (± 2s) dalla media e più del 99% si trova entro 3 deviazioni standard (± 3s). Nella Tabella 22.3 sono riportati i valori di lunghezza del

Genetica quantitativa 99%

media per la lunghezza del fiore di 63,5 mm, intermedia tra i fenotipi parentali. Quando incrociò tra loro le piante della F1, la media per la lunghezza del fiore nella progenie F2 era di 68,8 mm, all’incirca la stessa della F1. Tuttavia, la progenie F2 era diversa dalla F1 per un’importante proprietà che non sarebbe evidente se esaminassimo solamente le medie dei fenotipi: le F2 presentavano un fenotipo più variabile che non le F1. La varianza per la lunghezza del fiore nella F2 era di 42,4 mm2, mentre la varianza nella F1 era solo di 8,6 mm2. Pertanto, la media e la varianza sono entrambe necessarie per una descrizione completa della distribuzione dei fenotipi in un gruppo di individui e, utilizzando questi parametri statistici, possiamo ricavare molte informazioni dai nostri dati ed esperimenti.

95% 66% Media ( x– )

–1s

+1s

–2s

+2s +3s

–3s

Figura 22.5 Curva di distribuzione normale che mostra le percentuali dei dati della distribuzione compresi entro determinati multipli della deviazione standard.

corpo di 10 salamandre maculate della Contea di Penobscot, nel Maine, con i calcoli di media del campione, varianza e deviazione standard relative ai dati. La varianza e la deviazione standard ci possono fornire utili informazioni sui fenotipi di un gruppo di individui. Nella nostra discussione sulla media abbiamo osservato come East usò la media per descrivere la lunghezza della corolla del fiore nei genitori e nella progenie in incroci tra piante di tabacco. Quando East incrociò una li– nea di tabacco a fiore corto (x = 40,4 mm) con una linea – a fiore lungo (x = 93,1 mm), la progenie F1 mostrava una Tabella 22.3 Esempio di calcolo di media, varianza e deviazione standard relative alla lunghezza del corpo di 10 salamandre maculate della Contea di Penobscot, Maine Lunghezza del corpo (xi) (mm) 65 54 56 60 56 55 53 55 58 59 Σxi = 571

(xi – x–) (65 – 57,1) = (54 – 57,1) = (56 – 57,1) = (60 – 57,1) = (56 – 57,1) = (55 – 57,1) = (53 – 57,1) = (55 – 57,1) = (58 – 57,1) = (59 – 57,1) =

(xi – x–)2 7,9 – 3,1 – 1,1 2,9 – 1,1 – 2,1 – 4,1 – 2,1 0,9 1,9

7,92 = 62,41 – 3,12 = 9,61 – 1,12 = 1,2 2,92 = 8,41 1,12 = 1,21 2,12 = 4,41 – 4,12 = 16,81 – 2,12 = 4,41 0,92 = 0,81 1,92 = 3,61 Σ(xi – x–)2 = 112,9

Σxi 571 Media = x– = –––– = –––– = 57,1 n 10 Σ(xi – x–)2 112,9 Varianza = sx2 = ––––––––– = –––––– = 12,54 n–1 9 Deviazione standard = sx = √12,54 = 3,54

581

Correlazione Quando si considera la complessità fenotipica di un organismo, isolare dei caratteri dal loro contesto e studiarli singolarmente può apparire alquanto artificiale. Gli organismi sono composti da numerosissimi caratteri, e alcuni di questi possono essere a loro volta parte di caratteri più generali, come nel caso di peso e statura che possono rappresentare due aspetti dello stesso carattere, cioè le dimensioni corporee. È ragionevole pensare che geni e fattori ambientali, che influenzano lo sviluppo, possano avere effetti pleiotropici su entrambi i caratteri, statura e peso. In altri termini, i valori di due o più caratteri sono spesso correlati. Ciò significa che, se un carattere subisce un cambiamento, sarà probabile che anche l’altro vari. Per esempio, nell’uomo e in molti animali la lunghezza degli arti superiori e quella degli arti inferiori sono correlate: individui con arti superiori più lunghi hanno corrispondentemente arti inferiori più lunghi e viceversa. Il coefficiente di correlazione è un parametro statistico che misura la forza di associazione tra due variabili nella stessa unità sperimentale che, in genetica, è solitamente un individuo. Si supponga di avere due variabili, x che rappresenta la lunghezza degli arti superiori e y la lunghezza degli arti inferiori. Per calcolare la correlazione tra le due variabili, cominciamo con l’ottenere la covarianza di x e y, che è la misura della variabilità comune a entrambi i caratteri. La covarianza si calcola a partire dalle stesse deviazioni dalla media che abbiamo usato per il calcolo della varianza per ogni carattere, x e y, ma, invece di elevare al quadrato questi valori come abbiamo fatto per la varianza, si prende il prodotto delle deviazioni per ciascuna coppia di valori di x e y, e si sommano i prodotti. La somma viene poi divisa per n – 1, dove n è uguale al numero di coppie xy, per cui si ha che la covarianza di x e y è: ∑(xi – x–)(yi – y–) covxy = –––––––––––––––– n–1

582

Capitolo 22

Un’equazione algebricamente equivalente, ma più semplice per il calcolo, è: –– ∑xiyi – nxy covxy = ––––––––––– n–1 dove ∑xiyi rappresenta la somma di ciascun valore di x – – moltiplicato per il corrispondente valore di y e x e y sono le medie del campione. Il coefficiente di correlazione r può essere ottenuto dividendo la covarianza per il prodotto delle deviazioni standard di x e y. covxy Coefficiente di correlazione = r = ––––– sxsy dove sx è uguale alla deviazione standard di x e sy è uguale alla deviazione standard di y. La Tabella 22.4 presenta un esempio di calcolo del coefficiente di correlazione tra due variabili. Quando la covarianza è divisa per il prodotto delle due deviazioni standard, il coefficiente di correlazione che ne risulta è adimensionale e standardizzato e il suo valore è compreso tra –1 e +1. Come discusso preceden-

temente, il coefficiente di correlazione misura l’associazione tra due variabili fra gli individui di un campione. Il segno del coefficiente di correlazione indica la direzione della correlazione: se esso è positivo, allora un incremento di una variabile tenderà a essere associato a un incremento dell’altra variabile. Se, per esempio, in una specie vegetale il numero di semi e il numero di fiori sono correlati positivamente, piante con più fiori tenderanno anche a produrre un maggior numero di semi. Correlazioni positive sono illustrate nella Figura 22.6b, c, d ed f. Un coefficiente di correlazione negativo indica che l’incremento di una variabile è associato a una diminuzione dell’altra. Se le dimensioni del seme e il numero dei semi sono correlati negativamente, per esempio, piante con grossi semi tenderanno in media a produrre meno semi che non piante con semi più piccoli. La Figura 22.6e presenta una correlazione negativa. Il valore assoluto del coefficiente di correlazione (la sua grandezza ignorando il segno) fornisce informazioni sulla forza della associazione. Quando il coefficiente di correlazione è prossimo a –1 o +1, la correlazione è forte, poiché un cambiamento in una delle variabili è quasi sempre associato a una variazione corrispondente nell’altra va-

Tabella 22.4 Esempio di calcolo del coefficiente di correlazione per la lunghezza del corpo e la larghezza della testa nella salamandra tigre Lunghezza del corpo (mm) xi xi – x– 72,00 62,00 86,00 76,00 64,00 82,00 71,00 96,00 87,00 103,00 86,00 74,00 Σxi = 959,00

– 7,92 – 17,92 6,08 – 3,92 – 15,92 2,08 – 8,92 16,08 7,08 23,08 6,08 – 5,92

(xi – x–)2

Larghezza della testa (mm) yi

62,67 321,01 37,01 15,34 253,34 4,34 79,51 258,67 50,17 532,84 37,01 35,01 Σ(xi – x–)2 = 1686,92

17,00 14,00 20,00 14,00 15,00 20,00 15,00 21,00 19,00 23,00 18,00 17,00 Σyi = 213,00

x– = Σxi /n = 959/12 = 79,92 y– = Σyi /n = 213/12 = 17,75 Varianza di x = sx2 = Σ(xi – x–)2/n – 1 = 1686,92/11 = 153,35 Deviazione standard di x = sx = √ sx2 = √ 153,35 = 12,38 Varianza di y = sy2 = Σ(yi – y–)2/n – 1 = 94,25/11 = 8,57 Deviazione standard di y = sy = √ sy2 = √ 8,57 = 2,93 Covarianza = covxy = [Σxiyi – 1/n (Σxi Σyi)]/n – 1 [17 385 – 1/12 (959 × 213)] covxy = ––––––––––––––––––––––––– 12 – 1 covxy = 32,97 Coefficiente di correlazione = r = covxy /(s xs y) = 32,97/(12,38 × 2,93) r = 0,91

yi – y– – 0,75 – 3,75 2,25 – 3,75 2,75 2,25 – 2,75 3,25 1,25 5,25 0,25 – 0,75

(yi – y–)2 0,56 14,06 5,06 14,06 7,56 5,06 7,56 10,56 1,56 27,56 0,06 0,56 Σ(yi – y–)2 = 94,25

xiyi 1224 868 1720 1064 960 1640 1065 2016 1653 2369 1548 1258 Σxiyi = 17 385

Genetica quantitativa a)

b) r=0

c) r = 0,3

r = 0,5

y

x

d)

x

e) r = 0,7

x

583

Figura 22.6 Diagrammi a dispersione che mostrano la correlazione delle variabili x e y. I diagrammi b, c, d ed f mostrano correlazioni positive, mentre il diagramma e mostra una correlazione negativa. Il valore assoluto del coefficiente di correlazione r indica la forza della relazione. Per esempio, il diagramma f mostra una correlazione forte e il diagramma b una debole. Nel diagramma a le variabili x e y non sono correlate.

f) r = – 0 ,7

r = 0,9

y

x

x

riabile. Per esempio, le variabili x e y della Figura 22.6f sono fortemente associate e hanno un coefficiente di correlazione pari a 0,9. D’altro canto, un coefficiente di correlazione vicino allo 0 indica che esiste solo una debole relazione, o anche nessuna relazione, tra le variabili, come mostrato nella Figura 22.6b. A questo punto è necessario evidenziare diversi importanti aspetti del coefficiente di correlazione. Innanzitutto, l’esistenza di una correlazione tra variabili significa solo che vi è una associazione tra variabili: la correlazione non implica che esista una relazione di causa-effetto. L’esempio classico di una correlazione non causale tra due variabili è la correlazione positiva tra il numero di ministri di culto e il consumo di liquori in città le cui popolazioni superino i 10 000 abitanti. Da questa correlazione non si dovrebbe concludere che i ministri di culto sono direttamente o indirettamente causa di un incremento del consumo di alcol. Il consumo di alcol e il numero di ministri di culto risultano associati perché entrambi positivamente correlati con un terzo fattore, il numero degli abitanti; città più grandi hanno più ministri di culto e anche un consumo di alcol più elevato. Assumere che esista una relazione causale tra due fattori perché sono correlati può condurre spesso a conclusioni erronee. Un altro aspetto importante è il fatto che, dato che il coefficiente di correlazione è adimensionale, correlazione significa solo che il cambiamento in una variabile è associato con un cambiamento corrispondente nell’altra variabile: due variabili possono essere strettamente correlate e tuttavia avere valori molto differenti. Per esempio, la statura e l’altezza al ginocchio delle donne messicane anziane sono strettamente correlate; d’altra parte,

x

l’altezza al ginocchio è sempre inferiore rispetto alla statura di una persona. È, dunque, importante ricordare che la correlazione indica soltanto l’andamento congiunto di due variabili.

Nota chiave Il coefficiente di correlazione è la misura di quanto fortemente due variabili sono associate. Un coefficiente di correlazione positivo indica che due variabili cambiano nella stessa direzione: l’incremento di una è di solito accompagnato da un aumento corrispondente dell’altra variabile. Quando il coefficiente di correlazione è negativo, l’incremento di una delle variabili è molto spesso associato a una diminuzione dell’altra. Il valore assoluto del coefficiente di correlazione fornisce informazioni sulla forza della relazione. L’esistenza di una correlazione anche molto stretta non implica che vi sia una relazione di tipo causa-effetto tra le due variabili.

Regressione Il coefficiente di correlazione esprime la forza di una associazione tra due variabili e indica se la relazione è positiva o negativa, ma non fornisce alcuna informazione riguardo la relazione quantitativa precisa che esiste tra le variabili. Per esempio, se sapessimo che esiste una correlazione tra le stature di padre e figlio, potremmo chiederci: “Se un padre è alto 1,82 m, quale sarà la statura più probabile del figlio?”. Per rispondere a questa domanda si utilizza l’analisi della regressione.

584

Capitolo 22 80

Statura del figlio (in pollici)

Pendenze delle rette di regressione

76

Pendenza = 0,4

72

y

Pendenza = 0,2

68 Pendenza = 1

64 64

68

72

76

80 x

Statura del padre (in pollici)

Figura 22.7 Regressione della statura del figlio rispetto a quella del padre. Ciascun punto rappresenta una coppia di dati per la statura di un padre e di suo figlio. L’equazione di regressione è y = 36,05 + 0,49x.

Figura 22.8 Rette di regressione con pendenze diverse. La pendenza indica in che misura una variazione della variabile y è associata a una variazione della variabile x.

La relazione tra due variabili può venire espressa sotto forma di una retta di regressione, come mostrato nella Figura 22.7 per la relazione tra le stature di padre e figlio. Ciascun punto del grafico rappresenta la statura di un padre (il valore sull’asse delle x) e quella di suo figlio (il valore sull’asse delle y). La retta di regressione è quella retta che fornisce il miglior adattamento ai punti in base al metodo dei minimi quadrati: ciò significa che è resa minima la distanza ortogonale, elevata al quadrato, dei punti dalla retta di regressione. La retta di regressione può essere rappresentata dall’equazione:

ticamente, come descritto successivamente nel paragrafo sull’ereditabilità.

y = a + bx dove x e y rappresentano i valori delle due variabili (nella Figura 22.7, rispettivamente le altezze di padre e figlio), b rappresenta la pendenza, definita anche coefficiente di regressione, e a è l’intercetta sull’asse delle y. La pendenza può essere calcolata dalla covarianza di x e y e dalla varianza di x nel modo seguente: covxy pendenza = b = –––––– sx2 La pendenza indica la variazione del valore atteso della variabile dipendente y per un incremento unitario della variabile indipendente x. Per esempio, una pendenza di 0,5 per la regressione della statura di padre e figlio indicherebbe che, per ogni incremento di un centimetro nella statura del padre, la statura attesa del figlio aumenterebbe di mezzo centimetro. L’intercetta sull’asse delle y rappresenta il valore atteso di y quando x è pari a zero (il punto di intersezione della retta di regressione con l’asse delle y). Nella Figura 22.8 sono presentati esempi di rette di regressione con pendenze diverse. L’analisi di regressione rappresenta un metodo comunemente usato per misurare quanto la variazione di un carattere sia determinata gene-

Analisi della varianza L’ultima tecnica statistica sulla quale ci soffermeremo brevemente è l’analisi della varianza, o ANOVA (ANalysis Of VAriance). L’analisi della varianza è una potente procedura statistica per determinare se differenze tra medie siano significative (maggiori di quanto ci attenderemmo per solo effetto del caso) e per suddividere la varianza nelle sue componenti. Potremmo, per esempio, essere interessati a sapere se i maschi di cariotipo XYY (vedi Capitolo 12) abbiano statura diversa dai maschi con normale cariotipo XY. Dapprima procederemo calcolando la statura media di un campione di maschi XYY e la statura media di un campione di maschi XY. Supponiamo di aver trovato che la statura media del campione di maschi XYY sia pari a 187 cm e quella del campione di maschi XY sia pari a 178 cm. Le medie appaiono diverse e l’ANOVA può indicare quanto sia probabile che la differenza delle medie dei due campioni sia dovuta al caso. Per esempio, la nostra analisi potrebbe stabilire che esiste una probabilità inferiore all’1% (spesso espressa come p < 0,01) che la differenza osservata tra le medie delle stature sia dovuta al caso. In questo caso, la nostra conclusione sarebbe probabilmente che la differenza tra la statura media dei maschi XYY e quella dei maschi XY non sia dovuta a differenze casuali nei due campioni, ma sia il risultato di qualche fattore significativo associato ai cromosomi (cioè, del cariotipo). Sempre in relazione alla comprensione del grado di influenza genetica su caratteri come la statura, l’ANOVA può essere utilizzata per stabilire quanta parte della variabilità nel carattere sia associata a differenze nel cariotipo. Se raccogliessimo ulteriori dati su dieta, esercizio

Genetica quantitativa

fisico, altre distinzioni genetiche e così via, potremmo scoprire che la differenza nei cariotipi rappresenta il 40% della variabilità complessiva per la statura tra gli individui dei nostri campioni. Oltre alla diversità nel numero di cromosomi Y, altri fattori (come geni su altri cromosomi, dieta e cure mediche) sarebbero responsabili dell’altro 60% di variabilità. La trattazione dei calcoli richiesti per l’ANOVA non rientra negli obiettivi di questo testo, ma il concetto di suddividere la varianza in componenti – scomposizione della varianza – è fondamentale in genetica quantitativa. Per esempio, spesso è importante determinare quanta della variabilità in un carattere sia associata a differenze genetiche tra individui e quanta a fattori ambientali. Supponiamo di voler aumentare la produzione di latte in una mandria di vacche. Si potrebbe utilizzare l’ANOVA per stabilire quanta della variabilità nella produzione di latte tra le vacche sia dovuta a differenze ambientali e quanta, invece, a differenze genetiche. Se fosse preponderante la differenza di tipo genetico, potremmo incrementare la produzione di latte mediante incroci selettivi. D’altro canto, se la maggior parte della variabilità fosse di origine ambientale, l’incrocio selettivo non sarebbe molto efficace nell’aumentare la produzione di latte e, per conseguire tale risultato, dovremmo dirigere i nostri sforzi verso l’ottenimento di un ambiente migliore.

Analisi genetica quantitativa I caratteri quantitativi richiedono un tipo diverso di analisi rispetto ai caratteri qualitativi discontinui. In questo paragrafo verrà illustrato tale tipo di analisi.

Ereditarietà della lunghezza della pannocchia di mais Avendo ora un certo background in statistica, possiamo esaminare in che modo in genetica quantitativa si applichino questi metodi nello studio dei caratteri multifattoriali. Un organismo che rappresenta da molti anni il soggetto di studi citologici e genetici è il mais, Zea mays. La lunghezza della pannocchia è uno dei caratteri della pianta di mais esaminati in uno studio classico che utilizzò tecniche statistiche per dimostrare le basi genetiche per un carattere quantitativo. Nello studio, pubblicato nel 1913, Rollins Emerson ed Edward M. East iniziarono il loro esperimento con due linee pure di mais, ognuna delle quali mostrava poca variabilità nella lunghezza della pannocchia. Le due varietà erano la black Mexican, mais dolce (con pannocchie corte dalla lunghezza media di 6,63 cm), e la Tom Thumb, mais da popcorn (con pannocchie lunghe dalla lunghezza media di 16,80 cm). Emerson ed East incrociarono le due linee e quindi incrociarono tra di loro le piante della F1. Le piante parentali erano linee pure, pertanto possiamo assumere che

585

ciascuna fosse omozigote per i geni che controllano la lunghezza della pannocchia. Le piante della F1 erano eterozigoti per tutti i geni, e tutte dovevano avere lo stesso genotipo. I riquadri superiori della Figura 22.9 presentano i fenotipi delle linee pure e delle piante della F1 in fotografia e mediante istogrammi. La gamma di fenotipi diversi per la lunghezza della pannocchia presente sia nei genitori sia nelle piante della F1 deve presumibilmente essere dovuta ad altri fattori, anziché a differenze genetiche, e questi fattori sono probabilmente ambientali, dato che è impossibile far crescere delle piante esattamente nelle medesime condizioni. Nella F2 la lunghezza media della pannocchia, 12,89 cm, era circa la stessa della media della popolazione F1, ma la popolazione F2 aveva una variabilità attorno alla media maggiore che non la popolazione F1. Questa variabilità è facilmente intuibile guardando la Figura 22.9b e può anche essere dimostrata calcolando la deviazione standard (s). La deviazione standard per il genitore a pannocchia lunga è 1,887, e quella per il genitore a pannocchia corta è 0,816. Nella F1, s = 1,519, e nella F2, s = 2,252: ciò conferma che la F2 ha variabilità maggiore. La chiave per comprendere questo esperimento consiste nell’esaminare i modelli di variabilità. La variabilità osservata nella F2 è unicamente il prodotto di fattori ambientali? Se assumiamo che l’ambiente sia il responsabile della variabilità nei genitori e nella F1, abbiamo certamente tutte le ragioni per credere che l’ambiente abbia un effetto simile nella F2. Tuttavia, non abbiamo motivo di supporre che l’ambiente possa avere un effetto maggiore sulla F2 che non sulle altre due generazioni, pertanto deve esistere un’altra spiegazione per la maggiore variabilità nella lunghezza della pannocchia nella generazione F2. Un’ipotesi ragionevole è che l’aumentata variabilità della F2 derivi dalla presenza di una maggiore variabilità genetica in questa generazione, che deve essere stata ereditata dai genitori. Lasciando da parte per il momento l’influenza dell’ambiente, dai dati si ricavano quattro osservazioni che possono essere applicate in generale a studi sull’ereditarietà di tipo quantitativo che includano incroci tra individui o popolazioni geneticamente differenziati: 1. il valore medio di un carattere quantitativo nella F1 è di solito intermedio tra le medie delle due linee pure parentali; 2. il valore medio del carattere nella F2 è di solito approssimativamente uguale alla media della popolazione F1; 3. la F2 quasi sempre presenta una maggiore variabilità attorno alla media che non la F1; 4. i valori estremi per il carattere quantitativo nella F2 tendono a sovrapporsi ai valori parentali più di quanto avvenga per i valori estremi della F1 e talvolta possono superarli.

586

Capitolo 22 b)

P

x–

P

x–

Frequenza

a)

Corta

Lunga

F1

Frequenza

F1

x–

F2

Frequenza

F2

x–

4

Figura 22.9 Ereditarietà della lunghezza della pannocchia di mais. (a) Pannocchie di mais rappresentative delle generazioni parentali, della F1 e della F2 in un esperimento nel quale furono incrociate due linee pure di mais che differivano per la lunghezza della pannocchia e, in seguito, furono

Nota chiave Per un carattere quantitativo, la progenie F1 di un incrocio tra due linee pure fenotipicamente distinte presenta solitamente un fenotipo intermedio rispetto ai fenotipi parentali. La F2 mostra maggiore variabilità della F1, con un fenotipo medio vicino a quello della F1. I fenotipi estremi della F2 si estendono ben al di là dell’intervallo di valori della F1, mentre sono all’interno della gamma di valori dei genitori. Queste situazioni si originano dall’eterozigosi della F1 e dalle diverse combinazioni degli alleli parentali nella F2, create dall’assortimento indipendente.

Ereditabilità L’ereditabilità è la proporzione di variabilità fenotipica di una popolazione attribuibile a fattori genetici. Come abbiamo appena appreso, i caratteri continui sono influenzati sia da più geni sia da fattori ambientali. Gli allevatori di piante e di animali, per esempio, per poter prendere decisioni gestionali con consapevolezza, devono conoscere il contributo genetico di caratteri quali l’aumento del peso nei bovini, il numero di uova deposte dalle galline e la quantità di lana prodotta dalle pecore. Inoltre, molti caratteri importanti da un punto di vista ecologico, come la variabilità delle dimensioni corporee, della fecondità e del tasso di crescita, sono poligenici e il

6

8 10 12 14 16 18 Lunghezza della pannocchia (cm)

20

22

incrociate tra di loro le piante della F1. (b) Istogrammi delle distribuzioni della lunghezza delle pannocchie di mais (in cm) nell’esperimento descritto in a; gli assi verticali rappresentano le percentuali osservate per ogni classe di lunghezza della pannocchia nelle tre diverse popolazioni.

contributo genetico a tale variabilità è importante per capire come si evolvano le popolazioni naturali. Nondimeno, il concetto di ereditabilità viene spesso compreso male, e il termine viene frequentemente usato in modo erroneo oppure utilizzato senza basi scientifiche. Per esempio nell’uomo, quando gli individui di una famiglia si assomigliano per taluni aspetti del fenotipo, che possono essere la statura o l’intelligenza, si ritiene di solito che alla base di questa somiglianza vi siano fattori genetici. Ma la somiglianza tra membri di una stessa famiglia potrebbe benissimo essere dovuta alla condivisione dello stesso ambiente piuttosto che degli stessi geni. L’unico modo per distinguere tra queste due alternative, in tutti gli organismi che si vogliono studiare, consiste nell’utilizzare esperimenti di genetica quantitativa accuratamente pianificati. Per valutare l’ereditabilità dobbiamo dapprima misurare la variabilità di un carattere e quindi scomporne la varianza nelle componenti attribuibili alle varie fonti.

Componenti della varianza fenotipica La varianza tra individui può essere suddivisa in diverse componenti così come per analogia un bastone si può dividere in vari pezzi. La varianza fenotipica, rappresentata con VF, è una misura della variabilità complessiva di un carattere (nell’analogia l’intero bastone) ed è la somma delle deviazioni dalla media elevate al quadrato per tutti gli individui (vedi paragrafo “Metodi statistici”).

Genetica quantitativa

Parte delle differenze dalla media di ciascun individuo può derivare da differenze genetiche tra individui (genotipi diversi all’interno del gruppo); in alternativa, parte delle differenze dalla media può avere origine dai diversi ambienti sperimentati dagli individui. Il contributo genetico alla variabilità fenotipica è definito varianza genetica ed è rappresentato dal simbolo VG. La Figura 22.10a mostra una situazione in cui tutta la variabilità è dovuta al genotipo. Come si è detto, un’ulteriore variabilità deriva spesso dalle differenze ambientali sperimentate dagli individui. La varianza ambientale ha come simbolo VE e, per definizione, include qualsiasi fonte di variabilità che non sia genetica. Evidenti esempi di fattori ambientali che possono determinare differenze tra gli individui durante lo sviluppo sono la temperatura, la nutrizione e le cure parentali. La Figura 22.10b mostra una situazione in cui tutta la variabilità è dovuta all’ambiente e la Figura 22.10c una situazione in cui sia i geni sia l’ambiente contribuiscono alla variabilità. Siamo giunti, pertanto, ad avere le due componenti (i due pezzi del bastone) che corrispondono all’equazione di base tra natura e ambiente discussa in precedenza:

tà fenotipica, in quanto le due varianze potrebbero covariare. Per esempio, supponiamo che la produzione di latte delle vacche sia influenzata dai geni, ma anche dalla quantità di cibo che viene fornita dall’allevatore. Quest’ultimo conosce i suoi animali e nutre meglio la progenie delle vacche a produzione più elevata che non quella degli animali meno produttivi. Dato che gli individui di qualità genetica superiore alla media ricevono risorse superiori alla media, ecco che si produce una covarianza tra genotipo e ambiente. In questo modo, la varianza della produzione di latte risulta essere più elevata di quella attesa se geni e ambiente operassero indipendentemente. Per spiegare situazioni come queste dobbiamo introdurre un nuovo termine, COVG,E. Esiste un’altra fonte di varianza fenotipica, l’interazione genotipo-ambiente, ossia G × E. La varianza prodotta da G × E si ha quando gli effetti relativi del genotipo sono diversi in base all’ambiente. Per esempio, supponiamo che in un ambiente freddo le piante di genotipo AA abbiano un’altezza media di 40 cm e quelle aa un’altezza media di 35 cm. Tuttavia, spostando questi genotipi in un clima caldo, il genotipo aa raggiunge in media i 60 cm, mentre il genotipo AA raggiunge in media i 50 cm. In questo esempio, entrambi i genotipi crescono maggiormente nell’ambiente caldo, pertanto vi è un effetto ambientale sulla varianza. Esiste anche un effetto genetico, ma esso dipende dall’ambiente in quanto l’azione relativa dei genotipi cambia nei due ambienti. Quindi, mentre le differenze ambientali (temperatura) e quelle genetiche (genotipo) contribuiscono alla varianza

VF = VG + VE Il cento per cento della variabilità tra individui è spiegato da influenze genetiche e ambientali, tuttavia la scomposizione della varianza fenotipica risulta spesso alquanto complessa. La somma delle varianze di origine genetica e ambientale potrebbe non spiegare tutta la variabilia)

587

G2 G1

15

20

25

G1, G2

Altezza delle piante (cm)

Altezza delle piante (cm)

b)

30

15

Temperatura (°C)

20

25

30

Temperatura (°C)

c)

G2 G1

15

20

25

Temperatura (°C)

30

Altezza delle piante (cm)

Altezza delle piante (cm)

d)

G2

G1

15

20

25

Temperatura (°C)

30

Figura 22.10 Esempio ipotetico degli effetti dei geni e dell’ambiente sull’altezza delle piante. In ogni grafico i punti rappresentano le medie di ciascun genotipo. I punti rossi rappresentano il genotipo 1 (G1), i punti blu il genotipo 2 (G2) e i punti verdi indicano una sovrapposizione dei due. (a) La variazione dell’altezza delle piante è influenzata dal genotipo. Gli individui di genotipo G2 hanno un’altezza in media maggiore rispetto a quelli di genotipo G1, e l’altezza delle piante non è influenzata dalla temperatura alla quale sono cresciute. (b) Tutta la variazione in questo caso è di origine ambientale e i due genotipi sono indistinguibili in tutto l’intervallo delle temperature testate. (c) Sia il genotipo sia l’ambiente esercitano un effetto additivo sull’altezza. (d) Sia il genotipo sia l’ambiente esercitano un’influenza, ma gli effetti relativi ai due genotipi dipendono dall’ambiente: si tratta di un esempio di interazione genotipo-ambiente.

588

Capitolo 22

fenotipica, gli effetti di genotipo e ambiente non possono venire semplicemente sommati: bisogna tener conto di una componente addizionale che spieghi come essi interagiscono, e tale componente è VG×E. La Figura 22.10d illustra una interazione significativa di G × E. La varianza fenotipica, composta dalle differenze che derivano dalla variabilità genetica, da quella ambientale, dalla covariazione genotipo-ambiente e dall’interazione genotipo-ambiente, può essere descritta mediante l’equazione seguente: VF = VG + VE + 2COVG,E + VG×E È importante notare che si potrebbero verificare situazioni nelle quali alcune delle componenti di questa equazione sono uguali a zero, in base alla composizione genetica della popolazione, all’ambiente specifico e al modo in cui i geni interagiscono con l’ambiente.

Nota chiave La variabilità tra individui può essere ripartita nelle componenti genetica, ambientale e di interazione tra di esse. Dato che i genotipi potrebbero non essere distribuiti a caso nei vari ambienti e potrebbero comportarsi in modo diverso nei vari ambienti, l’identificazione del peso dei loro rispettivi contributi deve essere condotta con cautela.

rianza fenotipica che deriva dagli effetti additivi dei geni è la varianza genetica additiva. L’additività tra gli alleli di un locus non è l’unico caso possibile. Altri geni possono mostrare dominanza, e ciò è fonte di varianza da dominanza (VD). Quando esiste dominanza, i singoli effetti degli alleli non sono rigorosamente additivi; occorrerà dunque considerare come i genotipi contribuiscano alla variazione fenotipica. Un locus che mostra dominanza contribuirà a VF solo quando nella popolazione sono presenti sia gli omozigoti recessivi, sia gli eterozigoti o gli omozigoti dominanti. In tali condizioni, per esempio per una F2 o un reincrocio con un genitore recessivo, i loci che mostrano dominanza aumentano la variabilità. Nel caso invece di un reincrocio con un genitore omozigote dominante, i loci con alleli dominanti non produrrebbero variazione fenotipica. Infine, tra gli alleli di loci differenti possono avvenire interazioni di tipo epistatico: si ricordi che, nell’epistasi, il fenotipo è determinato dall’interazione di alleli di loci diversi. Potremmo avere, pertanto, tre genotipi a un locus, ma la loro penetranza potrebbe essere controllata dalla variabilità di altri loci. La presenza dell’epistasi fornisce un’altra fonte di variabilità genetica, definita varianza da interazione (VI) o epistatica. Possiamo, dunque, scomporre la varianza genetica come segue: VG = VA + VD + VI e la varianza fenotipica totale, a questo punto, può venire scritta come:

Le componenti della variabilità genetica e ambientale possono essere ulteriormente scomposte per individuare più precisamente la loro influenza causale. La varianza genetica, VG, può venire scomposta in componenti che derivano dai diversi tipi di azioni dei geni e di interazione tra di essi. Parte della varianza genetica è il risultato degli effetti additivi dei diversi alleli sul fenotipo. Per esempio, un allele g potrebbe, in media, contribuire all’altezza di una pianta per 2 cm, e l’allele G per 4 cm. In questo caso, l’omozigote gg contribuirebbe all’altezza per 2 + 2 = 4 cm, l’eterozigote Gg per 2 + 4 = 6 cm e l’omozigote GG per 4 + 4 = 8 cm. Per stabilire il contributo genetico all’altezza, aggiungeremmo allora gli effetti degli alleli di questo locus agli effetti di alleli di altri loci che potrebbero avere influenza sul fenotipo. Si dice che tali geni hanno effetti additivi e il tipo di variabilità genetica che risulta da questo tipo di azione genica è definito varianza genetica additiva, VA. Ricorderete che sotto questo aspetto i geni studiati da Nilsson-Ehle per il colore della cariosside di grano sono rigorosamente additivi. Alcuni alleli contribuiscono al pigmento della cariosside mentre altri non danno alcun contributo; i singoli effetti sommati di tutti gli alleli che contribuiscono determinano il fenotipo della cariosside. Così, i genotipi AA bb, aa BB e Aa Bb produrranno tutti il medesimo fenotipo, dato che ciascun genotipo ha due alleli che contribuiscono. La va-

VF = VA + VD + VI + VE + 2COVG,E + VG×E Proprio come abbiamo scomposto la componente genetica della varianza in tre parti, possiamo scomporre anche la componente ambientale. Per esempio, gli individui di una popolazione potrebbero essere esposti a temperature diverse o a condizioni nutrizionali diverse durante lo sviluppo, che produrrebbero differenze perlopiù irreversibili tra gli individui stessi definite effetti ambientali generali (VEg). Così, per esempio, un individuo cresciuto in un ambiente povero da un punto di vista nutrizionale può avere ridotte dimensioni corporee. Altre variazioni ambientali producono effetti immediati e transitori sul fenotipo, come una differenza di pigmentazione della pelle dopo l’esposizione al sole: essi sono definiti effetti ambientali speciali (VEs). Infine, gli effetti ambientali possono essere condivisi da tutti i membri di una famiglia, e vengono definiti effetti ambientali familiari (VEcf). Essi sono in special modo importanti, in quanto contribuiscono alle differenze tra famiglie e possono essere confusi con influenze di tipo genetico. Per esempio, molti insetti depositano le uova su specifiche piante ospiti in modo che le larve se ne nutrano durante lo sviluppo. Le singole piante possono differire tra loro per quanto riguarda le qualità nutritive e il livello di tossine presenti. Il risultato è che quegli

Genetica quantitativa

insetti che assorbono composti dalla pianta per utilizzarli come propria difesa, come le farfalle monarca e la falena Utetheisa, possono mostrare differenze tra famiglie che dipendono solamente dalla pianta su cui sono cresciute le larve e che possono essere interpretate erroneamente come variabilità genetica. Una categoria speciale di effetti ambientali familiari, definiti effetti materni (VEm), è così diffusa che merita una menzione particolare. Per esempio, la variabilità delle dimensioni dei mammiferi alla nascita ha una componente genetica e una ambientale. La componente genetica è dovuta a specifiche differenze genotipiche tra i cuccioli, il cui ambiente fino alla nascita è l’utero della madre e, dal momento che esiste variabilità tra le madri per quanto concerne le dimensioni della cucciolata, il periodo di gestazione e così via, ciò rappresenta gli effetti materni. Essi possono continuare anche dopo la nascita: nei mammiferi buona parte della crescita infantile è determinata dalla quantità e dalla qualità del latte materno. Quantità e qualità del latte rappresentano ulteriori influenze materne sulla progenie che possono incrementare la variabilità fenotipica. A questo punto, la scomposizione della nostra equazione natura vs ambiente comprende molte piccole componenti ed è la seguente: VF = VA + VD + VI + VEg + VEs + + VEcf + VEm + 2COVG,E + VG×E Scomporre la varianza fenotipica in queste componenti risulta utile per comprendere i contributi di fattori diversi alla variabilità fenotipica. Risulta difficile pianificare esperimenti che possano analizzare tutte queste componenti simultaneamente, pertanto bisogna spesso ricorrere ad assunzioni. Per esempio, spesso si assume che non vi sia covarianza genotipo-ambiente (2COVG,E) o varianza G×E, ma il genetista esperto ricorderà sempre che i risultati di tali esperimenti devono essere presentati e discussi con la giusta prudenza.

Ereditabilità in senso lato e in senso stretto Uno dei maggiori problemi per i genetisti che si occupano di caratteri quantitativi è stabilire fino a che punto le variazioni tra individui siano prodotte da differenze genetiche. Quindi, essi sono interessati a capire quanta parte della varianza fenotipica, VF, possa venire attribuita alla varianza genetica, VG. Questa quantità viene definita ereditabilità in senso lato ed è il rapporto tra varianza genetica e varianza fenotipica: VG Ereditabilità in senso lato = H B2 = ––– VF (La “B” nella formula deriva da broad, che significa “ampio”). L’ereditabilità per un carattere può variare da 0 a 1. Un’ereditabilità in senso lato pari a 0 indica che

589

nessun aspetto della variabilità fenotipica tra individui deriva da differenze genetiche, mentre un’ereditabilità pari a 1 suggerisce che tutta la varianza fenotipica ha base genetica. L’ereditabilità in senso lato ignora la scomposizione della varianza genetica in additiva, dovuta alla dominanza o alle componenti interattive, e assume che l’interazione genotipo-ambiente (espressa da VG×E) non sia importante. Più di frequente, siamo maggiormente interessati alla proporzione di variazione fenotipica che risulta soltanto da effetti genetici additivi, poiché vi è un’importante relazione tra variazione genetica additiva e selezione sia artificiale sia naturale. Per comprendere le ragioni di ciò, si ricordi che il genotipo di un individuo può essere determinato senza ambiguità a partire dal fenotipo solo nel caso che tra gli alleli esistano relazioni di tipo additivo. In presenza sia di dominanza sia di epistasi, bisogna o conoscere i genotipi parentali o ricorrere al reincrocio di prova per cercare di ricostruire il genotipo di un individuo. Pertanto, solo l’aspetto additivo della variabilità genetica consente di effettuare predizioni accurate sul fenotipo medio di una progenie a partire da quello di un individuo. Sia la dominanza sia l’epistasi rappresentano una complicazione e un aumento delle spese nei programmi di miglioramento genetico di piante e animali, e possono ostacolare l’evoluzione mediante selezione naturale quando è presente una selezione direzionale su un carattere. Poiché la varianza genetica additiva consente previsioni accurate sul grado di somiglianza tra genitori e progenie, i genetisti quantitativi usano stabilire l’ereditabilità in senso stretto, ossia la proporzione di varianza fenotipica che risulta solo da varianza genetica additiva. L’ereditabilità in senso stretto viene espressa dal rapporto tra varianza genetica additiva e varianza fenotipica. VA Ereditabilità in senso stretto = H N2 = ––– VF (La “N” della formula deriva da narrow, che significa “stretto”). Dato che la varianza genetica additiva determina il grado di somiglianza tra le generazioni in modo predittivo, essa rappresenta anche quella parte di variabilità che risponde in modo prevedibile alla selezione. Per questo motivo l’ereditabilità in senso stretto fornisce utili informazioni sul modo in cui un carattere si evolve se sottoposto a selezione naturale o su come potrà essere modificato mediante selezione artificiale.

Comprendere l’ereditabilità Nonostante la loro utilità, le stime di ereditabilità presentano molte significative limitazioni che, sfortunatamente, vengono spesso ignorate: ciò rende l’ereditabilità uno dei concetti meno compresi e di cui si abusa maggiormente in genetica. Prima di discutere del modo in cui l’ereditabilità viene determinata e utilizzata, è importante

590

Capitolo 22

elencare alcune delle più importanti caratteristiche e delle maggiori limitazioni di questo concetto. 1. L’ereditabilità in senso lato non definisce la completa base genetica di un carattere. Ciò che l’ereditabilità in senso lato misura è la proporzione di varianza fenotipica che deriva da differenze genetiche tra individui di una specifica popolazione. Le stime di ereditabilità in senso lato per una popolazione dipendono dalla variabilità genetica, che può essere o non essere presente. Quando un carattere non presenta variabilità, come il numero di occhi o di orecchie nell’uomo, non possiamo stimarne l’ereditabilità, ma il carattere è comunque determinato dai geni. Se tutti gli individui di una popolazione possiedono gli stessi alleli ai loci che controllano il carattere, la varianza genetica è pari a zero (VG = 0). Nonostante in questo caso l’ereditabilità sia zero, sarebbe scorretto assumere che i geni non abbiano alcun ruolo nello sviluppo del carattere. Allo stesso modo, un alto valore di ereditabilità non nega l’importanza dei fattori ambientali per quel carattere; un’elevata ereditabilità potrebbe semplicemente significare che i fattori ambientali che influenzano il carattere sono uniformi tra gli individui studiati. 2. L’ereditabilità non indica quanta percentuale del fenotipo di un individuo sia genetica. Dato che è basata sulla varianza, il cui calcolo è possibile solo per un gruppo di individui, l’ereditabilità è una proprietà di un carattere di una popolazione. Un individuo non presenta ereditabilità, piuttosto è il carattere all’interno di una popolazione che mostra ereditabilità. 3. L’ereditabilità per un carattere non è fissa. Il valore di ereditabilità per un carattere dipende dalla composizione genetica della popolazione e dal suo ambiente specifico. Per illustrare questo punto, supponiamo di calcolare l’ereditabilità in senso lato per la statura di un gruppo di individui adulti che vivono in una piccola città del New England, e di ottenere un valore di 0,7. Ciò indicherebbe che il 70% della variabilità nella statura di questi individui è di origine genetica. L’ereditabilità potrebbe non essere la stessa nel caso di altre popolazioni, anche assumendo che tutte le popolazioni siano sufficientemente grandi da evitare effetti dovuti alle dimensioni del campione. Per esempio, i residenti di San Francisco potrebbero essere più eterogenei dal punto di vista etnico che non gli abitanti della piccola città del New England, pertanto la popolazione di San Francisco avrebbe una maggiore variabilità genetica per la statura. Se assumiamo che le varianze ambientali delle due popolazioni siano simili, ma la varianza genetica fosse più elevata a San Francisco, allora anche l’ereditabilità stimata per la statura dei residenti di San Francisco dovrebbe essere maggiore.

I geni non sono gli unici fattori che influenzano la statura nell’uomo: anche il tipo di dieta, un effetto ambientale, è un importante fattore determinante la statura. Dato che probabilmente la maggior parte degli individui della nostra cittadina del New England riceve una dieta adeguata, perlomeno in termini calorici, la varianza ambientale per la statura non dovrebbe essere elevata. In una nazione in via di sviluppo, tuttavia, alcuni individui potrebbero ricevere un’alimentazione adeguata, mentre la dieta di altri potrebbe essere gravemente deficiente. Dal momento che esistono grandi differenze nella dieta, la varianza ambientale per la statura sarebbe più elevata, pertanto l’ereditabilità per la statura sarebbe inferiore. Così, l’ereditabilità stimata per la statura nell’uomo potrebbe presentare differenze sostanziali tra i residenti della piccola cittadina del New England, quelli di San Francisco e la popolazione di una nazione in via di sviluppo. Questi esempi dimostrano come il concetto di ereditabilità possa venire applicato soltanto a un gruppo specifico di individui in un ambiente specifico. Se la composizione genetica del gruppo è diversa o lo è l’ambiente, le stime dell’ereditabilità non possono essere traslate. Cambiare gruppo oppure ambiente non modifica il modo in cui i geni influenzano il carattere, ma può alterare la quantità di varianza genetica e ambientale per il carattere, che a sua volta varierebbe l’ereditabilità. 4. Un’elevata ereditabilità per un carattere non implica che le differenze tra popolazioni per quel carattere siano determinate geneticamente. Per esempio, supponiamo di avere dei topi che presentino variabilità genetica e di dividerli in due gruppi. Un gruppo viene nutrito con una dieta ricca dal punto di vista nutrizionale, prestando particolare cura nel fornire a ciascuno dei topi esattamente la stessa quantità di cibo, acqua, spazio e altre necessità ambientali. I topi crescono fino a raggiungere grandi dimensioni data la ricca dieta: quando si misura l’ereditabilità per il peso corporeo da adulti si ottiene un valore elevato, 0,93. L’elevata ereditabilità non è sorprendente dato che i topi presentavano variabilità genetica e le differenze ambientali sono state mantenute a un livello minimo. Il secondo gruppo di topi proviene dallo stesso ceppo genetico, ma è nutrito con una dieta povera, carente di calorie e di elementi nutrizionali essenziali; anche in questo caso ogni topo riceve esattamente la stessa quantità di cibo, acqua, spazio e altre necessità. A causa della dieta impoverita, i topi di questo secondo gruppo sono tutti più piccoli di quelli del primo gruppo: quando si calcola l’ereditabilità per il peso da adulti nei topi piccoli, si ottiene di nuovo l’elevato valore di 0,93, perché i topi presentavano variabilità genetica e le dif-

Genetica quantitativa

ferenze ambientali sono state mantenute a un livello minimo. Dato che l’ereditabilità per il peso corporeo è elevata in entrambi i gruppi e che i topi dei due gruppi differiscono nel peso da adulti, si potrebbe suggerire che i due gruppi di topi siano geneticamente diversi rispetto alle dimensioni corporee. Tuttavia, ogni affermazione di questo tipo è chiaramente sbagliata: infatti entrambi i gruppi provenivano dallo stesso ceppo. Il punto fondamentale è che l’ereditabilità non può venire usata per trarre conclusioni riguardo la natura delle differenze tra popolazioni. Se ora tracciamo un’analogia tra questo esempio sulle dimensioni corporee dei topi e l’abilità di lettura nell’uomo, possiamo osservare quanto facile risulti applicare in modo distorto nell’uomo l’approccio genetico quantitativo ad argomenti che hanno una valenza di tipo sociale. A questo proposito, immaginiamo di avere due gruppi di persone e di avere stabilito all’interno di ciascun gruppo che l’abilità di lettura presenta un’elevata ereditabilità. Uno dei gruppi è cresciuto in un ambiente che offriva la possibilità di accedere a molti libri, e la maggior parte delle persone è in grado di leggere bene; l’altro gruppo è cresciuto in un ambiente che non offriva la possibilità di leggere molti libri, e le persone non sono in grado di leggere molto bene. Quali conclusioni potreste trarre riguardo alle differenze genetiche tra le due popolazioni? L’abilità di lettura potrebbe essere migliorata mediante programmi di assistenza sociale, o sarebbe un tentativo inutile perché la capacità di leggere è “genetica”? 5. Caratteri condivisi da membri della stessa famiglia non hanno necessariamente un’elevata ereditabilità. Una caratteristica condivisa dai membri di una famiglia viene definita un carattere familiare. Come menzionato in precedenza, i caratteri familiari possono insorgere perché i membri di una famiglia condividono determinati geni o perché sono esposti

Nota chiave L’ereditabilità in senso lato di un carattere rappresenta la proporzione di varianza fenotipica in un gruppo che deriva da differenze genetiche tra individui. L’ereditabilità in senso stretto misura solo la proporzione di varianza fenotipica che deriva da varianza genetica additiva. L’ereditabilità in senso stretto rappresenta quella parte di varianza fenotipica che risponde in modo prevedibile alla selezione naturale o artificiale e che consente ai genetisti quantitativi di attuare previsioni sulle somiglianze tra genitori e progenie.

591

alle stesse condizioni ambientali. Pertanto, familiarità non è sinonimo di ereditabilità.

Come si calcola l’ereditabilità Sono disponibili parecchi metodi per calcolare l’ereditabilità, basati sul confronto di individui con gradi diversi di parentela. Tutti questi metodi sono basati sulla premessa per cui, se controlliamo l’ambiente e i geni sono importanti per la determinazione della varianza fenotipica, allora individui strettamente imparentati dovrebbero essere anche più simili nel fenotipo, dato che condividono un maggior numero di geni. Al contrario, se è l’ambiente ad avere un ruolo primario nella determinazione delle differenze per un carattere, allora il fenotipo di individui imparentati non dovrebbe essere più simile di quanto non lo sia quello tra individui non imparentati tra loro. Un punto importante da ricordare è che gli individui imparentati che vengono studiati non devono condividere un ambiente maggiormente simile rispetto agli individui non imparentati, in quanto ciò aumenterebbe la covarianza. Nel caso di piante e animali domestici spesso si può agire sui fattori ambientali, e per i membri di una famiglia di una popolazione selvatica possono esservi a disposizione ambienti diversi, fornendo così i requisiti essenziali per condurre esperimenti sull’ereditabilità. Nell’uomo, invece, queste condizioni sono più difficili da ottenere, in quanto le strutture familiari e le lunghe cure parentali creano ambienti comuni per individui imparentati. Se essi condividono anche un ambiente più omogeneo che non gli individui non imparentati, risulta impossibile separare gli effetti genetici da quelli ambientali. Stima dell’ereditabilità mediante regressione genitori-progenie Se la componente genetica additiva della variabilità è importante nel determinare le differenze tra individui, allora ci attendiamo che la progenie assomigli ai genitori. Per quantificare il grado in cui i geni influenzano un carattere, possiamo misurare i fenotipi parentali e della progenie in una serie di famiglie, e poi analizzare statisticamente la relazione tra i fenotipi utilizzando correlazione e regressione. Un parametro importante in questa e altre analisi è il cosiddetto valore medio dei genitori (midparent value), che è la media dei valori fenotipici dei due genitori. Se la variabilità tra i genitori è dovuta completamente alla variabilità genetica additiva, allora il valore medio dei genitori è in grado di predire il fenotipo medio della progenie. Si può rappresentare la relazione tra il fenotipo della progenie e quello dei genitori inserendo in un grafico il valore medio dei genitori e il valore medio del fenotipo della progenie, come illustrato nella Figura 22.11, in cui ciascun punto del grafico rappresenta una famiglia. La pendenza della retta di regressione fornisce un’indicazio-

592

Capitolo 22

Lunghezza media dell’ala della progenie

a)

b)

c)

b = HN2 = 1,0

b = HN2 = 0,0

b = HN2 = 0,5

Lunghezza media dell’ala dei genitori

Figura 22.11 Tre regressioni ipotetiche della lunghezza media dell’ala della progenie rispetto a quella dei genitori in Drosophila. In ciascun caso la pendenza della retta di regressione (b) è uguale all’ereditabilità in senso stretto (HN2). (Si veda il testo per la spiegazione.)

ne del grado di ereditabilità in senso stretto. Se la pendenza della regressione genitori-progenie è pari a 1, come nella Figura 22.11a, il fenotipo medio della progenie è esattamente intermedio tra il fenotipo dei due genitori, e tutte le differenze fenotipiche sono determinate da geni con effetto additivo (assumendo che non esistano fattori ambientali comuni alla progenie e ai genitori che possano avere influenzato il carattere). Se la pendenza, come nella Figura 22.11b, è compresa tra 0 e 1, la variabilità fenotipica potrebbe essere influenzata da geni a effetto additivo, da geni con dominanza o epistasi e da fattori ambientali. Se i punti sono dispersi casualmente sul grafico e la

pendenza è pari a 0, come nella Figura 22.11c, allora anche l’ereditabilità in senso stretto è pari a 0. Quando il fenotipo medio della progenie viene rapportato al fenotipo di uno solo dei genitori, l’ereditabilità in senso stretto è pari al doppio della pendenza, perché la progenie condivide soltanto metà dei propri geni con uno dei genitori. Allo stesso modo, si possono usare altre combinazioni di individui imparentati (fratelli che hanno entrambi i genitori in comune, fratelli che hanno un solo genitore in comune, gemelli omozigoti ed eterozigoti ecc.); in questi casi, il fattore per cui la pendenza deve essere moltiplicata per ottenere una stima dell’ereditabilità aumenta con l’aumentare della distanza nella parentela. I valori di ereditabilità per numerosi caratteri in specie diverse sono riportati nella Tabella 22.5. La maggior parte delle stime dell’ereditabilità presenta errori standard molto grandi e i valori di ereditabilità calcolati per gli stessi caratteri nello stesso organismo spesso variano in modo

Tabella 22.5 Valori di ereditabilità di alcuni caratteri nell’uomo, negli animali domestici e in popolazioni naturalia Organismo

Carattere

Ereditabilità

Uomo

Statura Livello di immunoglobuline (IgG) nel siero

0,65 0,45

Bovini

Produzione di latte Contenuto di grassi nel latte Peso corporeo

0,35 0,40 0,65

Maiali

Spessore del grasso sulla schiena Dimensioni della prole

0,70 0,05

Galline

Peso delle uova Produzione di uova (a 72 settimane) Peso corporeo (a 32 settimane)

0,50 0,10 0,55

Topi

Peso corporeo

0,35

Drosophila

Numero di setole addominali

0,50

Impatiens scapiflora (angiosperme)

Tempo di germinazione

0,29

Coleotteri delle asclepiadi

Lunghezza delle ali (femmine) Fertilità (femmine)

0,87 0,50

Pseudacris crucifer (rana)

Dimensioni al momento della metamorfosi

0,69

Rana sylvatica (rana boschiva)

Tasso di sviluppo (popolazione montana) Dimensioni alla metamorfosi (popolazione montana)

0,31 0,62

a

Le stime fornite in questa tabella si riferiscono a una data popolazione in un determinato ambiente; i valori di ereditabilità per altri individui potrebbero differire.

Genetica quantitativa

notevole. Deve essere, pertanto, adottata particolare cautela specialmente quando si considerino valori di ereditabilità calcolati per caratteri dell’uomo, date le difficoltà nel separare le influenze genetiche da quelle ambientali.

La risposta alla selezione Il miglioramento genetico animale e vegetale e la biologia dell’evoluzione sono due campi di studio nei quali la genetica quantitativa ha svolto un ruolo particolarmente importante. Entrambi i settori sono interessati ai cambiamenti di tipo genetico all’interno di gruppi di organismi, ovvero all’evoluzione. L’evoluzione dovuta alla selezione naturale avviene perché gli individui che presentano determinati caratteri producono un numero più elevato di discendenti di altri. Gli uomini influenzano l’evoluzione delle piante e degli animali domestici mediante il processo analogo della selezione artificiale, nel quale gli individui che presentano caratteri superiori dal punto di vista agrario sono utilizzati per produrre nuove varietà. Se i caratteri selezionati hanno una base genetica, la struttura genetica della popolazione selezionata varierà e si evolverà col tempo. La selezione artificiale può rappresentare un mezzo potente per produrre un rapido cambiamento evolutivo, come risulta evidente dalla grande variabilità che si osserva tra le piante e gli animali domestici. Per esempio, tutte le razze di cani domestici derivano dai lupi. Il grande numero di razze che esistono oggi, e che comprendono una grande varietà di taglie, conformazioni, colori e anche di comportamenti, è stato prodotto mediante selezione artificiale e miglioramento genetico approssimativamente durante gli ultimi 10 000 anni. Sia il processo di selezione naturale sia quello di selezione artificiale dipendono dalla presenza di variabilità genetica. Inoltre, la quantità e il tipo di variabilità genetica presenti sono estremamente importanti nel determinare quanto rapidamente possa avvenire l’evoluzione. Pertanto, sia i biologi evoluzionisti sia coloro che praticano il miglioramento genetico utilizzano la genetica quantitativa per stimare quanta variabilità genetica esista nelle popolazioni e per prevedere la velocità e l’entità del cambiamento genetico.

La stima della risposta alla selezione Quando su di un fenotipo si applica la selezione, naturale o artificiale, il valore medio del fenotipo nella popolazione cambierà da una generazione alla successiva, se nella popolazione è presente variabilità genetica per il carattere. La quantità di variazione di un fenotipo in una generazione è definita risposta alla selezione o R. Per illustrare il concetto di risposta alla selezione, si immagini un genetista che sta lavorando per produrre un ceppo di Drosophila melanogaster di grandi dimensioni corporee. Il genetista inizia con l’esaminare moscerini di

593

popolazioni geneticamente eterogenee e, dopo averne misurato le dimensioni corporee, trova che il peso corporeo medio dei moscerini è 1,3 mg. Supponiamo, a questo punto, che lo studioso divida a caso la popolazione a metà, senza considerarne il peso corporeo. Metà della popolazione viene lasciata libera di riprodursi normalmente, mentre all’interno dell’altra metà il genetista seleziona per la riproduzione solo moscerini che abbiano un corpo di grandi dimensioni (si assuma che il peso corporeo medio dei moscerini selezionati sia 3,0 mg) e li pone in una bottiglia di coltura separata per lasciarli riprodurre. Dopo la nascita della progenie F1 sia dei moscerini non selezionati sia di quelli selezionati, il genetista misura il peso corporeo di entrambe le popolazioni F1. Se alla base della variabilità nelle dimensioni corporee della popolazione originale è presente variabilità genetica, la progenie dei moscerini selezionati dovrebbe assomigliare ai propri genitori e la media delle dimensioni corporee della generazione F1 dovrebbe essere maggiore di quella della F1 della popolazione non selezionata. La risposta alla selezione rispetto alle dimensioni del corpo può essere calcolata come la media delle dimensioni della F1 selezionata meno la media della F1 non selezionata. Se i moscerini della F1 selezionata hanno un peso corporeo medio di 2,0 mg, e quelli della F1 non selezionata di 1,3 mg, come quello osservato nella popolazione originale, allora la risposta alla selezione sarebbe di 0,7 mg. La risposta alla selezione dipende da due fattori: l’ereditabilità in senso stretto e il differenziale di selezione, s. Il differenziale di selezione viene definito come la differenza tra il fenotipo medio dei genitori selezionati e il fenotipo medio della popolazione prima della selezione. Nel nostro esempio sul peso corporeo dei moscerini della frutta, la popolazione originale possedeva un peso medio di 1,3 mg, e il peso medio dei genitori selezionati era 3,0 mg, pertanto il differenziale di selezione è 3,0 mg – 1,3 mg = 1,7 mg. La risposta alla selezione è messa in relazione al differenziale di selezione e all’ereditabilità in senso stretto nella formula seguente, denominata anche equazione del miglioratore: R = H N2 s Dal momento che conosciamo i valori di due dei tre parametri dell’equazione, la risposta alla selezione (0,7 mg) e il differenziale di selezione (1,7 mg), possiamo ricavare l’ereditabilità in senso stretto. Ereditabilità in senso stretto = H N2 = risposta alla selezione/ differenziale di selezione H N2 = R/s = 0,7 mg/ 1,7 mg = 0,41 Esperimenti di selezione di questo tipo forniscono un ulteriore mezzo per determinare l’ereditabilità in senso stretto.

594

Capitolo 22 1

Tabella 22.6 Valori approssimati dell’ereditabilità di alcuni importanti caratteri morfologici e comportamentali nei cani domesticia

3

H2

Dimensioni della cucciolata

0,1-0,2

Profondità del torace

0,5

Larghezza del torace

0,8

Lunghezza del muso

0,5

Displasia dell’anca

0,2-0,5

Irrequietezza

0,5

Capacità venatorie

0,1-0,3

Successo come cane guida

0,5

a

L’ereditabilità di alcuni caratteri dipende dalla razza.

Un carattere continuerà a rispondere alla selezione, generazione dopo generazione, sino a quando all’interno della popolazione rimarrà variabilità genetica ereditabile per quel carattere. Ricordando l’esempio dell’evoluzione per domesticazione del cane, la Tabella 22.6 presenta alcuni valori di ereditabilità per caratteri morfologici e comportamentali del cane. Nella Figura 22.12 sono presentati i risultati di un esperimento reale a lungo termine di selezione per fototassi in Drosophila pseudoobscura. La fototassi è una risposta comportamentale alla luce. In questo studio i moscerini venivano classificati sulla base del numero di volte in cui si spostavano verso la luce su un totale di 15 prove di scelta luce-buio. Furono eseguiti due diversi esperimenti di selezione: in uno fu selezionata l’attrazione verso la luce, e nell’altro fu selezionata la fuga dalla luce. Come si può osservare nella Figura 22.12, i moscerini della frutta risposero per numerose generazioni alla selezione per comportamento fototattico positivo o negativo. A un certo punto, tuttavia, la risposta alla selezione diminuì e alla fine non si ebbe più alcun cambiamento direzionale nel comportamento fototattico. Una delle ragioni possibili per questa mancanza di risposta nelle ultime generazioni è che non esisteva più variabilità genetica per il comportamento fototattico all’interno della popolazione. In altri termini, a quel punto tutti i moscerini erano omozigoti per tutti gli alleli che influenzano il comportamento, e il comportamento fototattico nella popolazione non poteva essere sottoposto a ulteriore evoluzione a meno che non avvenisse l’introduzione di variabilità genetica aggiuntiva. Più sovente, anche dopo che la risposta alla selezione si è stabilizzata, esiste ancora un po’ di variabilità per il carattere, ma la popolazione non risponde alla selezione in quanto i geni per il carattere selezionato hanno effetti negativi su altri caratteri. Questi effetti negativi si verificano a causa delle correlazioni genetiche, che saranno discusse nel prossimo paragrafo.

Punteggio fototattico

5

Fenotipo

Selezionato per fototassi negativa

7 9 11

Selezionato per fototassi positiva

13 15 0

5

10 Generazioni

15

20

Figura 22.12 Selezione per la fototassi in Drosophila pseudoobscura. La parte superiore del grafico si riferisce al ceppo selezionato per la fuga dalla luce, la parte inferiore si riferisce a quello selezionato per l’attrazione per la luce. Il punteggio fototattico è il numero di volte in cui un moscerino si è mosso verso la luce su un totale di 15 scelte luce-buio.

Nota chiave La quantità di variazione di un carattere in una generazione come risultato della selezione per quel carattere viene definita risposta alla selezione. L’entità della risposta alla selezione dipende sia dall’intensità della selezione, definita differenziale di selezione, sia dall’ereditabilità in senso stretto.

Correlazioni genetiche Quando due o più fenotipi sono correlati, i caratteri non variano in modo indipendente. Per esempio, pelle chiara, capelli biondi e occhi azzurri si trovano spesso insieme nello stesso individuo. L’associazione non è perfetta – talvolta si incontrano individui con capelli scuri, pelle chiara e occhi azzurri – ma i caratteri vengono riscontrati insieme con sufficiente regolarità da asserire che sono correlati. La correlazione fenotipica tra due caratteri quantitativi può essere calcolata misurando i due fenotipi in molti individui e quindi calcolando il coefficiente di correlazione per i due caratteri. Una delle spiegazioni della correlazione fenotipica tra caratteri è la pleiotropia, per la quale effetti fenotipici multipli derivano da un singolo locus che determina i caratteri (vedi Capitolo 13). Raramente i geni influenzano un unico carattere, e ciò risulta vero specialmente per i poligeni che influenzano i caratteri continui. È questa la ragione più plausibile per l’associazione, nell’uomo, tra il colore dei capelli, degli occhi e della pelle. Per esempio, i geni che controllano i tassi di crescita nell’uomo influenzano sia il peso sia la statura, che quindi tendono

Genetica quantitativa

a essere correlati. La pleiotropia è uno dei fattori principali che determinano correlazione genetica per i caratteri quantitativi. Un altro significativo fattore di correlazione genetica è l’associazione genica, o linkage. Si ricordi come l’associazione genica rappresenti una violazione della legge di Mendel sull’assortimento indipendente e che, più i loci si trovano vicini sul cromosoma, maggiore sarà la frequenza con cui i loro alleli sono ereditati assieme. Quando una mutazione produce nuovi alleli, essi si trovano a essere associati con gli altri alleli presenti su quel cromosoma, pertanto saranno trasmessi alla progenie assieme a essi determinando così una correlazione genetica; la persistenza della correlazione genetica nel tempo dipenderà a sua volta dal grado di ricombinazione tra i loci. Un’importante distinzione tra associazione genica e pleiotropia come fattori determinanti correlazioni genetiche consiste nel fatto che, nel corso dell’evoluzione, anche i linkage più stretti possono essere rotti dalla ricombinazione con la formazione di nuove associazioni alleliche, mentre nel caso della pleiotropia una correlazione può persistere, in quanto potrebbe risultare impossibile eliminare un vincolo funzionale sulla singola proteina coinvolta. Nella Tabella 22.7 sono presentate alcune correlazioni genetiche individuate in studi di genetica quantitativa. Bisogna prestare attenzione prima di stabilire il valore delle correlazioni perché, oltre all’associazione genica e alla pleiotropia, anche i fattori ambientali sono in grado di influenzare più caratteri contemporaneamente e di produrre associazioni non casuali tra fenotipi. Per esempio, la fertilizzazione del terreno spesso produce piante più alte e con più fiori. Se noi misurassimo l’altezza e contassimo il numero di fiori in molte piante, alcune delle quali fertilizzate e altre che non hanno ricevuto trattamenti, tro-

595

veremmo che i due caratteri sono correlati: le piante fertilizzate sarebbero alte e con molti fiori, mentre quelle non fertilizzate sarebbero basse e con pochi fiori. Questo fenotipo è dovuto all’azione genica, ma la correlazione osservata è determinata da un effetto comune di un fattore ambientale, il fertilizzante, su entrambi i caratteri. Le correlazioni genetiche possono essere positive o negative: una correlazione positiva significa che i geni che causano un incremento della grandezza di un carattere determinano un simultaneo incremento della grandezza dell’altro carattere. Nelle galline, il peso corporeo e il peso dell’uovo hanno una correlazione genetica positiva. Se gli allevatori selezionano galline più pesanti, sia la dimensione del corpo sia il peso medio delle uova prodotte aumentano. L’incremento del peso dell’uovo avviene perché i geni che contribuiscono a produrre galline più pesanti hanno presumibilmente un effetto pleiotropico sul peso dell’uovo. Nel caso di correlazioni genetiche negative, i geni che incrementano un carattere tendono a produrre una diminuzione corrispondente nell’altro carattere. Per esempio, quando gli allevatori selezionano galline che producono uova più grandi, la dimensione media dell’uovo aumenta, ma il numero di uova deposte da ciascuna gallina decresce. Le correlazioni negative tra caratteri spesso rappresentano adattamenti o vincoli genetici che devono essere compensati sotto selezione. Per esempio, una velocità più elevata serve ai serpenti giarrettiera sia per cacciare sia per sfuggire ai predatori. Negli Stati Uniti occidentali, alcuni di questi serpenti si nutrono di tritoni tossici che, nella pelle, producono la neurotossina tetrodotossina. La correlazione genetica negativa tra velocità e resistenza alla tetrodotossina nelle popolazioni di serpenti giarrettiera, riportata nella Figura 22.13, rappresenta ap-

Tabella 22.7 Correlazioni genetiche tra caratteri nell’uomo, negli animali domestici e nelle popolazioni naturalia

Organismo

Caratteri

Uomo

IgG, IgM

Bovini

Contenuto di grassi, produzione di latte

Maiali

Guadagno in peso, spessore del grasso sulla schiena Guadagno in peso, efficienza

Galline

Peso dell’uovo, produzione di uova Peso corporeo, peso dell’uovo Peso corporeo, produzione di uova

Correlazione genetica 0,07 – 0,38 0,13 0,69 – 0,31 0,42 – 0,17

Topi

Peso corporeo, lunghezza della coda

Impatiens scapiflora (angiosperme)

Peso del seme, tempo di germinazione

– 0,81

Coleotteri delle asclepiadi

Lunghezza dell’ala, fertilità

– 0,57

Rana sylvatica (rana boschiva)

Grado di sviluppo, dimensioni alla metamorfosi

– 0,86

Drosophila

Fertilità giovanile, resistenza alla mancanza di cibo

– 0,91

a

0,29

Le stime fornite in questa tabella si riferiscono a una data popolazione in un determinato ambiente; i valori di correlazione genetica per altri individui potrebbero differire.

596

Capitolo 22

Resistenza (percentuale)

100

90

80

70

60 20

25

30

35

40

Velocità (cm/s)

Figura 22.13 Correlazione genetica negativa (r = – 0,45) tra la velocità e la resistenza alla tetrodotossina per valori medi di famiglie di serpenti giarrettiera. La correlazione tra i valori medi delle famiglie è una buona approssimazione della correlazione genetica quando le famiglie sono numerose.

parentemente un vincolo evolutivo. Sebbene la resistenza alla tetrodotossina si sia evoluta indipendentemente almeno due volte, sembra non sia mai avvenuta alcuna mutazione che abbia aumentato la resistenza senza diminuire la velocità. Le correlazioni genetiche negative spesso pongono limitazioni pratiche a chi si occupa del miglioramento genetico di piante e animali. Per esempio, nelle vacche, la produzione di latte e il suo contenuto di grasso presentano una correlazione genetica negativa. Gli stessi geni che determinano un incremento nella produzione di latte comportano una diminuzione del suo contenuto di grasso. Pertanto, quando gli allevatori effettuano selezioni per una maggior produzione di latte, la quantità di latte prodotta dalle vacche aumenta ma contemporaneamente diminuisce il contenuto di grasso. Conoscere la quantità e il tipo di correlazioni genetiche prima di intraprendere un programma di miglioramento genetico risulta essenziale per assicurarne il successo. Anche la capacità di un organismo di adattarsi a un particolare ambiente è fortemente influenzata dalle correlazioni genetiche tra caratteri, come abbiamo visto nell’esempio del serpente giarrettiera; pertanto le correlazioni genetiche risultano di particolare interesse per i biologi evoluzionisti. Per illustrare nuovamente questo concetto, si considerino due caratteri nei girini: il grado di sviluppo e le dimensioni al momento della metamorfosi. La maggior parte dei girini vive in piccole pozze e stagni, dove i pesci (potenziali predatori) sono scarsi e il cibo è abbondante. Uno degli svantaggi maggiori di questo tipo di habitat acquatico è che spesso gli stagni si asciugano, e ciò avviene frequentemente prima che i girini si siano sviluppati a sufficienza per completare il processo di metamorfosi in rane e lasciare l’acqua. Ci si potrebbe, dunque, attendere che la selezione naturale favorisca uno sviluppo molto veloce nei girini, così che possano rapida-

mente compiere la metamorfosi. Tuttavia, molte specie di girini non si sviluppano alla velocità massima possibile, contrariamente a una tale previsione. Una delle ragioni per lo sviluppo più lento è la correlazione genetica negativa tra velocità di sviluppo e dimensioni corporee al momento della metamorfosi. I geni che accelerano lo sviluppo tendono anche a fare avvenire la metamorfosi a dimensioni più ridotte, perlomeno in alcune popolazioni. Così, la selezione per una metamorfosi rapida produrrebbe anche rane più piccole, e le dimensioni sono un fattore estremamente importante nel determinare la sopravvivenza delle giovani rane. Rane piccole tendono a disidratarsi più rapidamente in ambiente terrestre, è più facile che siano catturate dai predatori e incontrano maggiori difficoltà nel procurarsi cibo a sufficienza. La correlazione genetica negativa tra la velocità di sviluppo e le dimensioni corporee al momento della metamorfosi pone dei limiti alla capacità delle rane di svilupparsi rapidamente e raggiungere grandi dimensioni corporee quando si verifica la metamorfosi. La conoscenza di tali correlazioni genetiche è importante per comprendere come gli animali si adattino o meno a un determinato ambiente.

Nota chiave Le correlazioni genetiche sono determinate da pleiotropia o associazione genica tra loci diversi. Quando un carattere viene selezionato, anche tutti i caratteri geneticamente correlati mostrano una risposta selettiva. Pertanto, l’evoluzione di una popolazione mediante selezione artificiale o in risposta alla selezione naturale dipende dall’integrazione simultanea di molti aspetti del fenotipo.

Attività Nella iAttività Your Fate in Your Hands? (Il destino è nelle tue mani?) siete ricercatori che vogliono determinare se i pattern delle impronte digitali possano essere correlati all’ipertensione.

Loci per caratteri quantitativi (QTL) L’approccio statistico nella comprensione dell’ereditarietà quantitativa è stato molto utile nell’analisi delle componenti della variabilità e della risposta alla selezione. Tuttavia, per capire in modo approfondito i caratteri quantitativi, occorre caratterizzare i singoli loci che influenzano questi caratteri. I singoli loci che contribuiscono a un carattere quantitativo sono noti come QTL (Quantitative Trait Loci) e l’insieme dei QTL e le loro interazioni determinanti un carattere sono noti come architettura genetica di un carattere. I recenti sviluppi che uniscono la genotipizzazione molecolare con le metodologie statistiche hanno permesso ai genetisti di iniziare a

MyLab

Genetica quantitativa

svelare i rapporti tra i fenotipi quantitativi e gli specifici QTL che li controllano. L’identificazione dei QTL consiste nel trovare le regioni di genoma associate a differenze fenotipiche tra individui. Essa ha un’efficacia tanto maggiore quanto più la popolazione analizzata è costituita da un gran numero di individui, presenta un’effettiva variabilità fenotipica e una dettagliata mappa genetica. Il metodo consiste nell’incrociare linee inbred (ossia linee pure, omogenee e stabili) selezionate per fenotipi diversi e poi reincrociarle, incrociarle tra di loro per produrre una F2, o incrociarle tra di loro e per autofecondazione per creare una serie di linee inbred ricombinanti. La popolazione viene quindi cresciuta, misurata e genotipizzata. Mentre i metodi analitici utilizzati per determinare quali regioni genomiche siano correlate con la variabilità fenotipica stanno diventando sempre più sofisticati, l’identificazione dei QTL consiste in sostanza nel suddividere gli individui di una popolazione in gruppi sulla base di un genotipo marcatore, e poi verificare se le medie dei gruppi sono simili o differiscono in modo significativo. Infatti, i primi metodi di identificazione dei QTL consistevano nello stabilire i dati genotipici e fenotipici di una popolazione e nell’eseguire un’ANOVA usando ciascun marcatore genetico come fattore e il fenotipo come risposta. Se il locus di un marcatore non è associato ad alcun QTL, al-

597

lora la media del fenotipo sarà la stessa per tutte le classi genotipiche; se invece il locus del marcatore è associato a un QTL, allora i genotipi dovranno differire per il valore medio del fenotipo studiato. La differenza tra le medie fenotipiche per le diverse classi genotipiche dipenderà dall’entità dell’effetto del QTL, e da quanto strettamente associati siano il marcatore e il QTL. Basandoci sui molti studi di identificazione di QTL condotti finora, possiamo cominciare a comprendere non solo quanti QTL controllino questi caratteri, ma anche quali siano l’entità dei loro effetti e la loro distribuzione nel genoma. Alcune delle più significative applicazioni di queste tecniche hanno portato all’identificazione di QTL per importanti caratteri agronomici e di QTL responsabili delle differenze adattative tra specie strettamente imparentate. Per esempio, alcune delle principali differenze tra specie vegetali strettamente imparentate sono quei complessi di caratteri fiorali che attirano gli impollinatori, tra cui il colore, la forma, e la quantità di nettare disponibile. I mimuli si sono separati in specie a impollinazione tramite i colibrì, come Mimulus cardinalis, che presentano colorazione rossa, profondi e generosi ricettacoli del nettare e petali arricciati, e in specie come M. lewisii, che presentano larghi petali, fiori rosa e scarsa disponibilità di nettare, caratteri tipici delle specie a impollinazione tramite api (Figura 22.14). Incroci tra

Figura 22.14 Fiori di Mimulus lewisii (A, C) e di M. cardinalis (B, D). Nelle fotografie A e B i fiori sono visti di fronte, come li vedrebbe un impollinatore in avvicinamento. Nelle viste laterali, C e D, sono evidenti le relative posizioni dello stigma e delle antere.

598

Capitolo 22

Attrazione Antocianine nei petali BL

Carotenoidi nei petali Larghezza della corolla

DC BC

Larghezza del petalo CL

Curva superiore del petalo

GL

Curva laterale del petalo

EL

Area proiettata CC

HC

AL

AC Ricompensa Volume del nettare BL

EL BC

Efficienza Lunghezza dello stame BL

Lunghezza del pistillo

DC BC

Altezza dell’apertura Larghezza dell’apertura EL

CC

HC FC

AL

AC

queste specie hanno dimostrato che le differenze in ciascuno dei caratteri legati all’efficienza nell’attirare gli impollinatori sembrano essere controllate da almeno un QTL che influenza il 25% o più della variabilità fenotipica (Figura 22.15). Questa scoperta, insieme ai dati che mostrano differenze adattative sostanziali tra questi alleli QTL, suggerisce che, almeno in alcuni casi, importanti cambiamenti fenotipici tra specie possano essere avvenuti in seguito a mutazioni in singoli loci. Un altro aspet-

GL

Figura 22.15 Mappe dei QTL per 12 caratteri fiorali nei mimuli. La figura mostra le mappe genetiche per questa specie, in cui le barre rappresentano gruppi di associazione, e le posizioni dei QTL che influenzano i caratteri fiorali. A causa del particolare schema degli incroci in questo esperimento, sono illustrate due mappe per ogni gruppo di associazione (le lettere al deponente, in basso, indicano se il gruppo di associazione corrisponde a genitori M. lewisii o M. cardinalis). I riquadri colorati mostrano la posizione dei marcatori correlati ai caratteri fenotipici (riportati nella lista a sinistra). Riquadri più alti indicano QTL che influenzano almeno il 25% della variabilità fenotipica di un carattere.

to interessante è che molti dei QTL per caratteri diversi sono fisicamente vicini, e ciò suggerisce che le caratteristiche fiorali siano geneticamente correlate. Il passaggio dall’identificazione della regione genomica in cui si trova il QTL alla clonazione del QTL stesso dipende dalla disponibilità di una serie di tecniche molecolari. Alcuni dei migliori esempi di QTL caratterizzati finora provengono da alcune specie modello approfonditamente studiate, come mais, pomodoro (Sola-

Genetica quantitativa

num lycopersicum) e Drosophila melanogaster. Nel mais è stato clonato nel 1997 il QTL teosinte branched 1 (tb1), che controlla la quantità di ramificazioni laterali, un carattere chiave che differenzia il mais coltivato dal suo antenato selvatico, il teosinte, e che ha una notevole importanza evolutiva e commerciale. È stato dimostrato che tb1 è membro di una famiglia di regolatori trascrizionali che si legano al DNA che, nel mais, agiscono bloccando la crescita di tessuti specifici. Le importanti differenze alleliche che apparentemente sono state selezionate durante la domesticazione da teosinte a mais si trovano in una regione non trascritta del gene. Nel pomodoro il QTL fw2.2, che controlla fino al 30% delle differenze nel peso del frutto in incroci tra varietà selvatiche e coltivate, è stato clonato nel 2000. La proteina FW2.2 viene espressa nelle fasi precoci dello sviluppo del frutto e i diversi alleli differiscono nei livelli e nella fase temporale dell’espressione genica, ma non si trovano importanti differenze nella sequenza della proteina. Inoltre, sembra esservi una correlazione genetica causata da un effetto pleiotropico dell’allele per frutto più piccolo: le linee omozigoti per questo allele producono più frutti per pianta delle linee omozigoti per l’allele per frutto più grosso. Un altro approccio per l’identificazione dei QTL implica la verifica di associazioni tra differenze fenotipiche e variazioni alleliche ai loci candidati. Questi ultimi vengono definiti sulla base di una funzione nota o presunta e/o della vicinanza a regioni genomiche coinvolte nello studio dei QTL. Per esempio, esperimenti di mappatura in Drosophila hanno individuato un QTL per il numero delle setole addominali in una regione del genoma che già conteneva un gene chiave per lo sviluppo, hairy (h), i cui mutanti sono stati da tempo caratterizzati per la presenza di setole sovrannumerarie. Studi sulla variabilità naturale del numero di setole e sulle varianti molecolari al locus h hanno dimostrato che h è effettivamente un QTL per il numero di setole nelle popolazioni di laboratorio. È interessante notare che le osservazioni effettuate sulle popolazioni selvatiche non confermano l’effetto di questo QTL, rimarcando il problema che i risultati di molte di queste analisi dipendono dalle popolazioni studiate. L’analisi dei loci candidati non dà, peraltro, sempre risultati utili. Un esperimento volto a determinare se variazioni nei geni strutturali della via metabolica per la biosintesi dei carotenoidi avessero effetto sul colore del frutto maturo nel pomodoro ha mostrato che molti dei QTL non corrispondevano ad alcuno di questi geni. Il continuo perfezionamento nella definizione dei fenotipi e il chiarimento delle vie metaboliche e

599

genetiche, combinati con le nuove tecniche analitiche, saranno cruciali per l’identificazione e l’analisi dei QTL negli anni a venire. I geni che controllano caratteri quantitativi nell’uomo non possono essere studiati mediante l’analisi tradizionale degli alberi genealogici, come avviene per i caratteri discontinui, perché gli effetti ambientali nel corso del tempo e l’azione di altri geni segreganti tendono a oscurare gli effetti dei singoli loci. Tuttavia, mediante studi di associazione si possono identificare importanti regioni del genoma che hanno un ruolo nella variabilità fenotipica. Gli studi di associazione per identificare i QTL si basano su marcatori del DNA (costituiti da sequenze, in particolari localizzazioni del genoma, che variano nella popolazione) ampiamente distribuiti nel genoma umano e sul confronto tra popolazioni che esibiscono un carattere e popolazioni casuali di controllo. I marcatori più utili per questo obiettivo sono gli SNP (vedi Capitolo 8). La metodologia per questi studi è piuttosto simile a quella utilizzata per le popolazioni sperimentali, in cui gli individui sono fenotipizzati e genotipizzati e, quindi, vengono utilizzati metodi statistici per associare QTL e SNP. Il Focus sul genoma di questo capitolo descrive in che modo sono state utilizzate tecniche di genomica per identificare i geni espressi a livelli differenti in moscerini della frutta che mostrano alta o bassa aggressività. Le applicazioni di questi metodi a una serie di caratteri hanno permesso di identificare i geni che contribuiscono alla variabilità umana quantitativa, inclusi caratteri come la capacità di percepire il sapore della feniltiocarbammide (PTC), la statura, la predisposizione a patologie come il diabete. Il recente completamento del Progetto Genoma Umano, insieme allo sforzo di sviluppare ulteriormente le classi di marcatori SNP umani e alla capacità di caratterizzare un grande numero di genotipi, permetterà di identificare, in un futuro assai prossimo, sempre più QTL nell’uomo.

Nota chiave Il metodo della mappatura mediante marcatori può venire usato per evidenziare correlazioni tra regioni genomiche e variabilità fenotipica per i caratteri quantitativi in popolazioni naturali e sperimentali. Gli studi per l’identificazione dei loci che controllano i caratteri quantitativi (QTL) forniscono stime del numero dei geni coinvolti e dell’entità dei loro effetti sulla variabilità dei caratteri continui.

600

Capitolo 22

Focus sul genoma Analisi dei QTL associati al comportamento aggressivo in Drosophila melanogaster Le tecniche di genomica in combinazione con quelle di genetica classica sono state utilizzate da un gruppo di scienziati per stimare il numero di geni coinvolti nell’espressione del comportamento aggressivo nel maschio di Drosophila melanogaster. Il comportamento è chiaramente influenzato da fattori sia ambientali sia genetici, mentre sono stati osservati solo pochi comportamenti attribuibili a una componente genetica semplice; la maggior parte dei comportamenti sembra essere controllata da molti geni, piuttosto che da pochi geni. Gli scienziati volevano stimare quanti geni influenzano il comportamento aggressivo e identificare quanti più geni possibile. Prima di tutto, i ricercatori hanno selezionato moscerini che erano più o meno aggressivi rispetto ai moscerini normali e hanno formato delle popolazioni. Essenzialmente hanno costituito popolazioni di linee pure o quasi pure, sebbene avessero assunto che il cambiamento di comportamento fosse determinato da molti alleli polimorfici, ognuno dei quali giocava da solo un ruolo relativamente minore. Hanno costituito due popolazioni altamente aggressive, due poco aggressive e due popolazioni di controllo. Hanno quindi usato microarray a DNA (vedi Capitolo 9) per studiare in che modo la trascrizione differisse fra le diverse popolazioni. Hanno ricercato trascritti che fossero, per esempio, espressi a più alti livelli nelle popolazioni altamente aggressi-

ve e a bassi livelli nelle popolazioni di controllo o a bassa aggressività. Circa il 10% dei geni nel genoma (approssimativamente 1500 geni) è risultato positivo a questo test e, se consideriamo solo quelli che differiscono tra le popolazioni ad alta e bassa aggressività, abbiamo un gruppo di circa 1000 geni. Quando gli scienziati hanno ricercato la funzione di questi geni, hanno identificato alcuni andamenti interessanti. Molti geni che risultavano sovraespressi nelle popolazioni altamente aggressive erano implicati nell’identificazione e nella risposta a stimoli chimici e biologici, mentre i geni sovraespressi nelle popolazioni a bassa aggressività tendevano a includere geni coinvolti nell’apprendimento, nella memoria e nella risposta difensiva. I ricercatori, quindi, hanno deciso di studiare singolarmente alcuni dei geni identificati in questa prova. Hanno usato le tecniche di genetica classica per trovare nuovi alleli in ognuno dei 19 geni identificati nello screening. Hanno preso i moscerini omozigoti per una di queste 19 nuove mutazioni e hanno confrontato l’aggressività dei moscerini mutanti con quella del gruppo di controllo. In 15 casi la mutazione ha causato un chiaro cambiamento nel comportamento aggressivo dei moscerini mutanti. Questo esperimento mostra che i caratteri multigenici, anche se molto complessi, possono essere scomposti utilizzando gli strumenti a disposizione dei genetisti moderni.

Sommario l I caratteri discontinui mostrano solo pochi fenotipi distinti. I caratteri continui, o quantitativi, mostrano una gamma di fenotipi. l I caratteri continui mostrano una varietà di fenotipi perché molti loci contribuiscono al fenotipo (ereditarietà poligenica) e perché i fattori ambientali influenzano il fenotipo espresso dal genotipo. l I caratteri continui possono essere descritti utilizzando campioni delle popolazioni e parametri statistici come la media e la varianza. l I caratteri continui possono essere analizzati utilizzando metodi statistici come la correlazione, l’analisi di regressione e l’analisi della varianza (ANOVA). l La variabilità tra individui può essere scomposta nelle componenti genetica e ambientale. Tuttavia i genotipi possono rispondere diversamente in distinti contesti ambientali, pertanto deve essere usata la massima cautela quando si pianificano e si interpretano esperimenti finalizzati alla misura-

zione dei contributi genetici e ambientali alla variabilità fenotipica. l L’ereditabilità in senso lato di un carattere è la proporzione di varianza fenotipica che deriva da differenze genetiche fra individui. L’ereditabilità in senso stretto è la proporzione di varianza fenotipica dovuta solo a varianza genetica additiva. Entrambe le misure si basano su una specifica popolazione che vive in uno specifico ambiente. l La quantità per la quale un carattere varia in una generazione, per effetto della selezione sul carattere stesso, è definita risposta alla selezione. L’entità della risposta alla selezione dipende dal differenziale di selezione e dall’ereditabilità in senso stretto. l Le correlazioni genetiche emergono quando due caratteri sono influenzati dagli stessi geni o da geni associati. Quando un carattere viene selezionato, anche i caratteri geneticamente correlati mostrano una risposta alla selezione.

601

Genetica quantitativa l I loci per caratteri quantitativi (QTL) possono essere identificati mediante la mappatura basata sull’utilizzo di marcatori. La mappatura dei QTL fornisce una stima del numero e

della relativa importanza dei geni che influenzano la variabilità genetica quantitativa.

Approccio analitico alla soluzione di problemi di genetica D22.1 Si assuma che i loci A, B, C e D siano membri di una serie di geni multipli che controlla un carattere quantitativo e che ogni gene segreghi indipendentemente. Ognuno degli alleli a ciascuno dei loci A, B, C e D ha un effetto cumulativo per cui contribuisce, se presente, per 3 cm di altezza, mentre gli alleli a, b, c e d non contribuiscono affatto all’altezza dell’organismo. Inoltre il gene L è sempre presente allo stato omozigote, e il genotipo LL contribuisce per un valore costante di 40 cm di altezza. Se ignoriamo le variazioni in altezza dovute a fattori ambientali, un organismo di genotipo AA BB CC DD LL sarà alto 64 cm, e uno di genotipo aa bb cc dd LL sarà alto 40 cm. Si esegue un incrocio AA bb CC DD LL × aa BB cc DD LL, e si produce poi una F2 per autofecondazione della F1. a. Come saranno le dimensioni degli individui F1 in confronto a quelle di ciascuno dei genitori? b. Confrontate la media della F1 con quella della F2, e commentate il risultato. c. Quale proporzione della popolazione F2 mostrerà la stessa altezza del genitore AA bb CC DD LL? d. Quale proporzione della popolazione F2 mostrerà la stessa altezza del genitore aa BB cc DD LL? e. Quale proporzione della popolazione F2 darà progenie pura per l’altezza mostrata dal genitore aa BB cc DD LL? f. Quale proporzione della popolazione F2 darà progenie pura per l’altezza degli individui della F1? R22.1 Questa domanda è volta a esplorare la nostra comprensione della genetica di base coinvolta nelle serie di geni multipli, che controllano un carattere quantitativo. Il nostro metodo sarà essenzialmente lo stesso usato per una serie di geni che segregano indipendentemente e che controllano caratteri distinti. Pertanto, elaboreremo delle previsioni sulla base dei genotipi e metteremo i risultati in relazione ai fenotipi, oppure elaboreremo delle previsioni sulla base dei fenotipi e metteremo i risultati in relazione ai genotipi. a. Ciascun allele indicato con una lettera maiuscola contribuisce per 3 cm all’altezza di base di 40 cm fornita da LL, allo stato omozigote. Pertanto, il genitore AA bb CC DD LL, che ha sei alleli maiuscoli nella serie di geni multipli da A a D, è alto 40 + (6 × 3) = 58 cm. Allo stesso modo, il genitore aa BB cc DD LL ha quattro alleli maiuscoli ed è alto 40 + (4 × 3) = 52 cm. La F1 da un incrocio tra questi due individui sarà eterozigote per i loci A, B e C, e omozigote per D ed L, ovvero Aa Bb Cc DD LL. Questa progenie ha cinque alleli maiuscoli, oltre a LL, così sarà alta 40 + (5 × 3) = 55 cm. b. La F2 è derivata per autofecondazione della F1 Aa Bb Cc DD LL. Tutti gli individui della F2 saranno DD LL, il che li rende alti almeno 40 + 6 = 46 cm. Ora dobbiamo tener presente l’eterozigosi agli altri tre loci. Ciò che dobbiamo calcolare è la frequenza relativa di tutti i possibili genotipi per i tre loci e mettere insieme quelle relative a nessuno, uno, due, tre, quattro, cinque e sei alleli con lettere maiuscole.

Per ciascun locus la probabilità di ottenere un individuo con due alleli maiuscoli è di 1/4, quella di ottenere un individuo con un allele maiuscolo è di 1/2 e quella di ottenere un individuo con nessuno allele maiuscolo è di 1/4. Pertanto, la probabilità di avere un individuo F2 con sei alleli maiuscoli per i loci A, B e C è (1/4)3 = 1/64, ed è la stessa probabilità di avere un individuo senza alleli maiuscoli. L’approccio più semplice per trovare i numeri attesi per genotipi con alleli da una a sei lettere maiuscole consiste nel calcolare i coefficienti dello sviluppo del binomio (a + b)6. Si ricordi che nell’esempio del colore della cariosside di grano si era osservato un rapporto fenotipico 1:4:6:4:1; questi valori sono i coefficienti dello sviluppo del binomio (a + b)4 e corrispondono ai numeri di genotipi diversi con zero, uno, due, tre e quattro alleli che contribuiscono al carattere. Allo stesso modo, lo sviluppo di (a + b)6 dà una distribuzione 1:6:15:20:15:6:1 rispettivamente per zero, uno, due, tre, quattro, cinque e sei alleli maiuscoli. Dal momento che ciascun allele maiuscolo dei geni A, B e C contribuisce per 3 cm all’altezza sopra i 46 cm forniti dal genotipo comune DD LL, gli individui F2 ricadranno nella distribuzione seguente:

Numero di alleli con lettera maiuscola

Altezza aggiunta all’altezza di base di 46 cm fornita dal genotipo comune DD LL (cm)

Altezza degli individui (cm)

Frequenza

6 5 4 3 2 1 0

18 15 12 9 6 3 0

64 61 58 55 52 49 46

1 6 15 20 15 6 1

La distribuzione è chiaramente simmetrica, con una media di 55 cm, la stessa altezza mostrata dagli individui della F1. c. Il genitore AA bb CC DD LL era alto 58 cm, così possiamo leggere direttamente dalla tabella, nella parte b, la proporzione di individui della F2 che mostrano la stessa altezza. La risposta è 15/64. d. Il genitore aa BB cc DD LL era alto 52 cm, e dalla tabella nella parte b la proporzione di individui della F2 che mostrano la stessa altezza è 15/64. e. La domanda chiedeva di stabilire la proporzione della popolazione F2 che avrebbe dato progenie pura per l’altezza mostrata dal genitore aa BB cc DD LL, che era 52 cm. Per essere linea pura, l’organismo deve essere omozigote. Abbiamo anche stabilito che DD LL è il genotipo costante degli

602

Capitolo 22

individui della F2, con un’altezza di base di 46 cm. Quindi, per avere un’altezza di 52 cm, devono essere presenti due alleli maiuscoli aggiuntivi rispetto a quelli dei loci D ed L. Vi sono soltanto tre genotipi che danno un’altezza di 52 cm, rispettando il requisito dell’omozigosi: AA bb cc DD LL, aa BB cc DD LL e aa bb CC DD LL. La probabilità di avere ciascuna combinazione nella F2 è 1/64, così la risposta al problema è 1/64 + 1/64 + 1/64 = 3/64. (Notate che è possibile calcolare la singola probabilità per ciascun genotipo: infatti la probabilità di AA è 1/4, quella di bb è 1/4, quella di cc è 1/4 e quella di DD LL è 1, con una probabilità totale di 1/64 per AA bb cc DD LL). f. La domanda chiedeva di stabilire la proporzione della popolazione F2 che avrebbe dato progenie pura per l’altezza caratteristica degli individui F1. Di nuovo, l’altezza di base data da DD LL è 46 cm. L’altezza della F1 è 55 cm, pertanto devono essere presenti tre alleli maiuscoli in aggiunta a DD LL, dato che (3 × 3) cm = 9 cm, e 9 + 46 = 55 cm. Tuttavia, dato che un individuo deve essere omozigote per dare una progenie pura, la risposta a questa domanda è nessuno, dato che 3 è un numero dispari, il che significa che almeno un locus deve essere eterozigote per poter raggiungere l’altezza di 55 cm. D22.2 Cinque topolini di campagna raccolti nel Texas pesavano 15,5 g, 10,3 g, 11,7 g, 17,9 g e 14,1 g. Cinque topolini raccolti nel Michigan pesavano 20,2 g, 21,2 g, 20,4 g, 22,0 g e 19,7 g. Calcolate la media e la varianza per il peso dei topolini del Texas e per quelli del Michigan. R22.2 Per rispondere a questa domanda, usiamo le formule date nel paragrafo “Metodi statistici” del capitolo. La formula per la media è: ∑xi – x = ––––– n Il simbolo ∑ (sommatoria) significa sommare, e xi rappresenta tutti i valori singoli. Cominciamo a sommare tutti i pesi dei topi del Texas: ∑xi = 15,5 + 10,3 + 11,7 + 17,9 + 14,1 = 69,5 Quindi, dividiamo la somma per n, che rappresenta il numero dei valori sommati. In questo caso abbiamo sommato cinque pesi, quindi n = 5. La media per i topi del Texas è pertanto: ∑xi 69,5 –––– = ––––– = 13,9 n 5

Per calcolare la varianza del peso tra i topi del Texas, utilizziamo la formula: – ∑(xi – x )2 Varianza = s2 = ––––––––– n–1 Dobbiamo prendere il peso di ogni individuo e sottrarre da esso il peso medio del gruppo. Ogni valore così ottenuto viene poi elevato al quadrato, e tutti i quadrati sommati, come mostrato di seguito: 15,1 – 13,9 = 10,3 – 13,9 = 11,7 – 13,9 = 17,9 – 13,9 = 14,1 – 13,9 =

1,6 –3,6 –2,2 4,0 0,2

(1,6)2 (–3,6)2 (–2,2)2 (4,0)2 (0,2)2

= = = = =

2,56 12,96 3,84 16,00 0,04 36,40

La somma di tutti i valori elevati al quadrato è 36,4. Quanto ci resta da fare è dividere questa somma per n – 1, ovvero 5 – 1 = 4. – ∑(xi – x )2 36,4 Varianza = s2 = ––––––––– = ––––– = 9,1 n–1 4 La media e la varianza per i topi del Texas sono 13,9 e 9,1. Ripetiamo queste operazioni per i topi del Michigan. ∑xi = 20,2 + 21,2 + 20,4 + 22,0 + 19,7 = 103,5 ∑xi 103,5 ––– = –––––– = 20,7 n 5 – ∑(xi – x )2 s2 = ––––––––– n–1 20,2 – 20,7 = 21,2 – 20,7 = 20,4 – 20,7 = 22,0 – 20,7 = 19,7 – 20,7 =

–0,5 0,5 –0,3 1,3 –1,0

(–0,5)2 (0,5)2 (–0,3)2 (1,3)2 (–1,0)2

= = = = =

0,25 0,25 0,09 1,69 1,0

3,28 –2 3,28 ∑(xi – x ) s2 = ––––––––– = –––––– = 0,82 n–1 4 La media e la varianza per i topi del Michigan sono 20,7 e 0,82. Ne concludiamo che i topi del Michigan sono considerevolmente più pesanti dei topi del Texas, e anche che i topi del Michigan presentano una minore varianza per il peso.

23

Evoluzione molecolare

Quale effetto viene esercitato dalla selezione naturale sui cambiamenti delle molecole che si osservano nel corso del tempo?

Come si possono utilizzare i dati molecolari per dedurre le relazioni filogenetiche?

Perché alcuni geni accumulano variazioni più velocemente di altri?

Come compaiono proteine con nuove funzioni biologiche?

Quali regioni geniche accumulano variazioni con maggiore rapidità?

Attività In una calda e aspra regione desertica state studiando con attenzione i sedimenti, alla ricerca di fossili. All’improvviso scorgete un frammento di osso. Infine riportate alla luce un osso della gamba e un frammento di mandibola, che analisi di laboratorio mostrano appartenere a un antico ominide. Si tratta del progenitore degli uomini moderni o soltanto di una specie “cugina” che si è estinta centinaia di migliaia di anni fa? Come potreste scoprirlo? In questo capitolo scoprirete come i genetisti di popolazione applichino le tecniche di genetica molecolare allo studio dell’evoluzione delle specie. Nella iAttività avrete l’opportunità di utilizzare alcuni di quegli stessi strumenti e tecniche per stabilire se siamo o no diretti discendenti degli uomini di Neandertal.

Nonostante la selezione naturale interessi i singoli individui, nel corso della storia evolutiva le variazioni interessano i geni e le popolazioni. L’evoluzione molecolare rappresenta l’evoluzione delle sequenze del DNA e delle proteine. Lo studio dell’evoluzione molecolare utilizza i fondamenti teorici della genetica di popolazione per rispondere a due tipi di domande: come evolvono il DNA e le proteine, e come sono collegati tra loro dal punto di vista evolutivo i geni e gli organismi? La genetica di popolazioni e l’evoluzione molecolare differiscono in primo luogo per le loro prospettive temporali. La genetica di popolazioni (vedi Capitolo 21) si concentra sulle variazioni nelle frequenze geniche tra una generazione e l’altra, mentre l’evoluzione molecolare considera tipicamente le finestre temporali molto più ampie associate alla speciazione. Scostamenti minimi dalle condizioni necessarie a mantenere l’equilibrio di Hardy-Weinberg hanno scarsi effetti sulle frequenze geniche nel breve periodo, ma possono assumere un

grande significato sulla scala temporale evolutiva. Inoltre, gli effetti casuali come quelli associati a piccoli errori di campionamento, insieme a differenze molto piccole nella fitness, tendono a diventare il processo predominante di variazione a livello genomico se si accumulano in centinaia o migliaia di generazioni. Il campo dell’evoluzione molecolare è multidisciplinare: riceve apporti continui dalla genetica, dall’ecologia, dalla biologia dell’evoluzione, dalla statistica e dall’informatica. Tuttavia, prima dell’ampia diffusione degli strumenti della biologia molecolare, avvenuta negli anni settanta e ottanta del secolo scorso, i ricercatori interessati a studiare le modalità con cui molecole importanti dal punto di vista biologico si modificano nel tempo disponevano di pochissimi dati adatti per lo studio. La capacità di clonare, sequenziare e ibridare il DNA ha rimosso le barriere tra specie nella genetica di popolazioni. Inoltre, ha aperto una finestra su un mondo percepito fino a quel momento in modo assai vago, dove i geni evolvono grazie all’accumulo di mutazioni (vedi Capitolo 7), trasposizioni (vedi Capitolo 7), duplicazioni (vedi Capitolo 16) e tramite conversione genica (un processo meiotico di variazione diretta in cui un allele dirige la conversione del suo omologo nell’altro cromosoma verso la sua sequenza di DNA). Per la prima volta, gli studi sull’evoluzione avevano a disposizione un’abbondanza di parametri che potevano essere misurati e teorie che potevano essere verificate. Le analisi molecolari hanno chiarito come i genomi siano dei registri storici che possono essere studiati per identificare le dinamiche che sottendono ai processi evolutivi e per ricostruire la cronologia dei cambiamenti. Gli stessi approcci che consentono l’ordinamento e la decifrazione di questi documenti della storia evolutiva hanno facilitato anche la classificazione degli esseri viventi secondo reali relazioni filogenetiche – le relazioni genealogiche ge-

604

Capitolo 23

rarchiche tra popolazioni o specie separate – attraverso le grandi distanze del tempo evolutivo. Relazioni tra gruppi di organismi prima inimmaginabili sono divenute evidenti, e persino i regni della vita alla base della sistematica hanno dovuto essere riarrangiati. In questo capitolo vengono presentati i principi degli studi dell’evoluzione molecolare, vengono mostrate le modalità che danno origine a molecole con nuove funzioni e viene descritto il modo in cui vengono stabilite le relazioni filogenetiche di molecole e organismi.

Tipi e modalità di sostituzione Sostituzioni nucleotidiche nella sequenza del DNA Sostituzioni nelle sequenze del DNA e delle proteine Un aspetto importante nello studio dell’evoluzione è la modalità con la quale i tipi e i tassi di sostituzione nucleotidica differiscono tra parti diverse dello stesso gene. Questo tipo di studi cominciò ad acquisire importanza negli anni settanta e ottanta del secolo scorso, quando si resero disponibili migliori dati molecolari provenienti dalle sequenze amminoacidiche delle proteine. Apparve subito evidente l’importanza dello studio delle differenze di amminoacidi tra proteine omologhe (proteine di specie diverse che possiedono un antenato comune) rispetto a quelle non omologhe. Infatti, in queste proteine, era più probabile che gli amminoacidi venissero sostituiti da altri con caratteristiche chimiche simili (vedi il loro raggruppamento in Figura 6.2) a quelle degli amminoacidi della proteina ancestrale. Questa preferenza nella sostituzione suffragava due principi importanti dal punto di vista evolutivo: (1) le mutazioni sono eventi rari; (2) le alterazioni più drastiche vengono rimosse dal pool genico mediante la selezione naturale. Gli amminoacidi chimicamente simili tendono a essere codificati da codoni simili (vedi Figura 6.7), e sono richiesti minori cambiamenti a livello del DNA per convertirne uno in un altro. Per esempio, un codone per la leucina (come CUU) può essere convertito in uno per l’isoleucina (come AUU) mediante la sostituzione di una singola coppia di basi a livello del DNA. Occorrono invece due sostituzioni per convertirlo in un codone per l’asparagina (come AAU), un amminoacido differente dal punto di vista chimico. I tassi di errore della DNA polimerasi vengono comunemente indicati in termini di errori per milioni o miliardi di nucleotidi replicati. Dato che le variazioni nucleotidiche e amminoacidiche sono rare, gli scenari che si verificano con maggiore probabilità sono quelli che richiedono il minor numero possibile di sostituzioni. Allo stesso tempo la selezione naturale, agendo su molte generazioni, ha prodotto proteine portatrici delle sequenze di amminoacidi che le rendono il più adatte possibile al loro ruolo specifico nell’ambiente attuale. Più il cambiamento a livello della struttu-

ra primaria di una proteina è radicale, più è probabile che il suo effetto sulla funzionalità della proteina sia deleterio e non superi il vaglio della selezione naturale. L’allineamento delle sequenze L’analisi delle variazioni tra due o più sequenze, a livello di amminoacidi e di nucleotidi, inizia con l’allineamento di tutte le sequenze che devono essere studiate. Si possono effettuare manualmente allineamenti a coppie di sequenze brevi, altamente simili, ma per allineamenti più complessi comunemente si utilizzano dei software adeguati. Gli allineamenti equivalgono a ipotesi specifiche circa l’evoluzione di due o più sequenze e il miglior allineamento possibile rispecchia la vera relazione ancestrale per ogni posizione della sequenza di un gene o di una proteina. Per esempio, l’allineamento delle due sequenze: GTACCT G–ATCT può essere interpretato come segue: 1. quattro delle sei posizioni nucleotidiche (la prima, la terza, la quinta e la sesta a partire da sinistra) non hanno subito alcun cambiamento a partire dal loro ultimo antenato comune; 2. è avvenuta una sostituzione in un sito (la quarta posizione da sinistra); 3. in una delle sequenze è avvenuta un’inserzione o una delezione (la seconda posizione). Una divergenza rapida o lunghi periodi di evoluzione spesso lasciano poco in comune tra le due sequenze e possono rendere complessa la procedura di allineamento. Il risultato è che la maggior parte degli studi si basa su approssimazioni dell’allineamento reale, dette allineamenti ottimali, nei quali sono inseriti degli spazi per rendere massima la similarità delle sequenze allineate. Gli spazi sono necessari perché le sequenze dei geni non sono alterate soltanto da cambiamenti di singoli nucleotidi (mutazioni puntiformi), ma anche da eventi meno comuni di inserzione e delezione. Poiché spesso risulta difficile, se non impossibile, distinguere un’inserzione in una sequenza da una delezione in un’altra, tali spazi vengono spesso detti indel. Il numero degli allineamenti possibili tra due o più sequenze, anche di lunghezza ridotta, è enorme: stabilire l’allineamento ottimale è compito di algoritmi informatici, che cercano di rendere massimo il numero di basi o amminoacidi appaiati, riducendo allo stesso tempo al minimo il numero di indel tra le sequenze. Le sostituzioni e il modello di Jukes-Cantor Da quando due sequenze nucleotidiche iniziano a divergere, esse cominciano ad accumulare sostituzioni nucleotidiche in modo indipendente. Il numero di sostituzioni per sito (K) che si osserva nell’allineamento di due sequenze è quasi sempre la variabile singola più importante per le analisi di

Evoluzione molecolare

evoluzione molecolare. Se da un allineamento si deduce che tra le due sequenze sono avvenute poche sostituzioni, allora il semplice conteggio delle sostituzioni è di solito sufficiente per stabilire il numero reale di sostituzioni avvenute. Tuttavia, nel 1969, ancora prima che fossero disponibili per l’analisi le sequenze nucleotidiche di un gene reale, T. Jukes e C. Cantor si resero conto che gli allineamenti tra sequenze molto differenti avrebbero potuto causare una sottostima significativa del numero reale di sostituzioni accumulatesi a partire dall’ultimo antenato comune delle due sequenze. Nei punti in cui le sostituzioni erano frequenti, non esistevano garanzie del fatto che un dato sito non fosse andato incontro a sostituzioni multiple, come quelle riportate nella Figura 23.1. Per ovviare a questa possibilità, Jukes e Cantor ipotizzarono che ciascun nucleotide avesse identica probabilità di mutare in qualunque altro nucleotide: con questo presupposto crearono un modello matematico nel quale il tasso di cambiamento verso uno qualunque dei tre nucleotidi alternativi fosse α, e il tasso complessivo di sostituzione per ogni nucleotide fosse 3α. In questo modello, se una posizione è occupata da una C al tempo 0 (t = 0 nella Figura 23.1), la probabilità (P) che in quella posizione ci sia lo stesso nucleotide al tempo 1 (t = 1) sarà PC(1) = 1 – 3α. A tempi diversi (per esempio a t = 2) bisogna considerare anche la possibilità che avvengano reversioni (retromutazioni) a C. In particolare, se la C originale mutasse in un altro nucleotide (per esempio in una A) in un primo intervallo di tempo, al tempo 2 (t = 2) la probabilità PC(2) sarebbe uguale a (1 – 3α) PC(1) + α[1 – PA(1)]. Espansioni ulteriori del modello hanno suggerito che, in ogni dato tempo (t) nel futuro, la probabilità che in quella posizione ci sia una C è data dall’equazione PC(t) = 1/4 + (3/4) e–4αt A questo punto, i biologi molecolari dovevano soltanto stimare il valore di α, cioè il tasso di sostituzione nucleotidica.

t=0

Scenario 1

Scenario 2

C

C

t=1

A

T

t=2

T

C

Figura 23.1 Due possibili scenari nei quali, a causa di sostituzioni multiple in un singolo sito, la semplice conta delle sostituzioni condurrebbe a una sottostima del numero di sostituzioni avvenute.

605

Quando, 10 anni più tardi, i dati cominciarono ad arrivare, divenne chiaro che il modello di Jukes e Cantor era una semplificazione eccessiva. Per esempio, si osservò che le transizioni (le sostituzioni purina-purina e pirimidina-pirimidina) si accumulavano con un tasso maggiore rispetto alle transversioni (le sostituzioni purina-pirimidina e viceversa). Anche così, il modello di Jukes e Cantor forniva un utile punto di partenza per la stima del numero reale di sostituzioni per sito (K), nel caso di sostituzioni multiple. Rimaneggiando l’equazione del modello di Jukes e Cantor, è possibile stabilire che K può essere calcolata come K = –3/4 ln(1 – 4/3p) dove p rappresenta la frazione di nucleotidi che, tramite semplice conteggio, risultano diversi tra due sequenze. Questa equazione è concorde con l’idea che, quando due sequenze mostrano poche differenze, p è piccola e così anche la probabilità di sostituzioni multiple in un sito (per esempio, quando p per un frammento di 100 nucleotidi è 0,02, anche K = 0,02). Essa suggerisce anche che, se il numero di differenze osservate è elevato, il numero reale di sostituzioni per sito può essere sostanzialmente maggiore di quanto misurato direttamente (per esempio, quando p per un frammento di 100 nucleotidi è 0,5, allora K = 0,82).

Tassi di sostituzione nucleotidica Il numero di sostituzioni alle quali due sequenze sono andate incontro a partire dal loro ultimo antenato comune rappresenta un parametro di fondamentale importanza per quasi tutte le analisi di evoluzione molecolare. Quando K è espresso in termini di numero di sostituzioni per sito ed è associato a un tempo di divergenza (T), esso può essere facilmente convertito in un tasso di sostituzione (r). Poiché si ipotizza che entrambe le sequenze accumulino sostituzioni simultaneamente e in maniera indipendente, il tasso di sostituzione si ottiene semplicemente dividendo il numero di sostituzioni tra due sequenze omologhe per 2T, come mostrato nell’equazione r = K/(2T) Si noti che per stimare i tassi di sostituzione è necessario disporre di dati provenienti da almeno due specie. Il confronto dei tassi di sostituzione intragenici e tra geni diversi può quindi fornire valide indicazioni sui meccanismi implicati nei cambiamenti molecolari. Se i tassi di evoluzione tra diverse specie risultano simili, i tassi di sostituzione possono indicare le coordinate temporali di eventi evolutivi per i quali non sia disponibile altra evidenza concreta. Variabilità dei tassi evolutivi all’interno dei geni Gli studi sulle sequenze nucleotidiche in numerosi geni hanno rivelato che differenti porzioni dei geni evolvono a

606

Capitolo 23

velocità profondamente differenti, che riflettono la misura del loro sottostare alla selezione naturale. Si ricordi dalla genetica molecolare che un gene eucariote tipico è composto da alcuni nucleotidi che codificano per la sequenza di amminoacidi di una proteina (sequenze codificanti) e da altri che non codificano per amminoacidi della proteina (sequenze non codificanti). Queste ultime comprendono gli introni, le regioni leader e trailer (che vengono trascritte ma non tradotte) e le regioni che fiancheggiano le estremità al 5′ e al 3′ che non vengono trascritte. Altre sequenze non codificanti comprendono gli pseudogeni, sequenze nucleotidiche non più in grado di produrre prodotti genici funzionali, in seguito all’accumulo di mutazioni inattivanti. Anche all’interno delle regioni codificanti dei geni funzionali, non tutte le sostituzioni nucleotidiche portano a un cambiamento corrispondente a livello della sequenza di amminoacidi della proteina. In particolare, molte sostituzioni che avvengono a livello del terzo nucleotide di un codone non hanno effetto sulla sequenza di amminoacidi della proteina perché danno spesso origine a codoni sinonimi, che codificano cioè per lo stesso amminoacido (vedi Figura 6.7).

errori nella replicazione del DNA o nei processi di riparazione. Gli enzimi responsabili della replicazione e della riparazione del DNA non sono assolutamente in grado di distinguere tra sostituzioni sinonime e non sinonime. Di conseguenza è probabile che le mutazioni sinonime e non sinonime insorgano con uguale frequenza; tuttavia, le sostituzioni non sinonime che sono prodotte all’interno di sequenze codificanti spesso riducono la fitness e vengono eliminate dalla selezione naturale, mentre le mutazioni sinonime di solito sono meno dannose e, quindi, vengono tollerate. Questo solleva l’interessante problema della sottile distinzione tra l’uso dei termini mutazione e sostituzione negli studi di evoluzione molecolare. Le mutazioni sono cambiamenti della sequenza nucleotidica che avvengono a causa di errori nei processi di replicazione o di riparazione del DNA (vedi Capitolo 7). Le sostituzioni sono mutazioni che sono passate al vaglio almeno di un certo livello di selezione. I tassi di sostituzione sinonima sono probabilmente una buona approssimazione del reale tasso di mutazione presente in un genoma, mentre non si può fare la stessa affermazione per quanto riguarda i tassi di sostituzione non sinonima.

Siti sinonimi e non sinonimi Nella Tabella 23.1 sono riportati i tassi relativi di variazione per diverse parti dei geni dei mammiferi. Si noti che, all’interno dei geni funzionali, i tassi di variazione più elevati comprendono i cambiamenti sinonimi nelle sequenze codificanti. Il tasso di variazione nucleotidica sinonima è all’incirca cinque volte più elevato di quello osservato per le variazioni non sinonime. Le variazioni sinonime non alterano la sequenza di amminoacidi della proteina, perciò l’elevato tasso di variazione osservato sotto il profilo evolutivo non risulta inatteso, poiché queste variazioni non colpiscono la funzionalità della proteina. Consideriamo per un momento in che modo si originano le variazioni nelle sequenze nucleotidiche. Tutte le variazioni devono avere origine o da

Regioni fiancheggianti Elevati tassi di cambiamenti evolutivi si verificano anche a livello delle regioni che fiancheggiano l’estremità al 3′ di geni funzionali (vedi Tabella 23.1). Come le variazioni sinonime, le sequenze delle regioni fiancheggianti al 3′ non hanno effetto sulla sequenza degli amminoacidi della proteina e, di solito, hanno scarso effetto sull’espressione genica. Di conseguenza, molte delle sostituzioni che si verificano in queste regioni vengono tollerate dalla selezione naturale. Anche i tassi di variazione negli introni sono elevati, ma non così alti come quelli delle variazioni sinonime e delle variazioni nelle regioni fiancheggianti al 3′. Nonostante le sequenze negli introni non codifichino per amminoacidi della proteina, devono essere rimosse in modo appropriato affinché l’mRNA venga tradotto in una proteina funzionale. Alcune sequenze all’interno degli introni sono necessarie affinché si verifichi lo splicing: esse includono le sequenze dei punti di giunzione al 5′ e al 3′ e la sequenza al punto di ramificazione dell’introne (vedi Capitolo 5). Inoltre alcuni introni occasionalmente codificano per proteine in alcuni tessuti, ma non in altri, per effetto dello splicing alternativo. Di conseguenza, non tutti i cambiamenti a livello degli introni sfuggono alla selezione naturale, ma il loro tasso di evoluzione complessivo è un po’ inferiore a quello osservato nelle regioni fiancheggianti al 3′ e a livello dei siti non sinonimi all’interno delle sequenze codificanti. Nella regione fiancheggiante al 5′ si osservano tassi evolutivi ancora inferiori. Sebbene questa regione non sia trascritta né tradotta, essa contiene il promotore e altri elementi di regolazione importanti per un gene; pertanto le sequenze nella regione fiancheggiante al 5′ risul-

Tabella 23.1 Tassi relativi dei cambiamenti evolutivi nelle sequenze di DNA dei geni dei mammiferi

Sequenza

Sostituzioni nucleotidiche per sito per anno (μ 10–9)

Geni funzionali Regione fiancheggiante al 5’

2,36

Leader

1,74

Sequenza codificante, sinonima

4,65

Sequenza codificante, non sinonima

0,88

Introne

3,70

Trailer

1,88

Regione fiancheggiante al 3’

4,46

Pseudogeni

4,85

Evoluzione molecolare

tano importanti per l’espressione genica. Anche piccole differenze a livello delle sequenze del promotore, come la TATA box, possono influire notevolmente sulla quantità di proteina prodotta e possono perciò avere effetti deleteri sulla fitness dell’organismo. La selezione naturale di solito elimina queste mutazioni e minimizza i cambiamenti osservabili nelle regioni importanti dal punto di vista funzionale. Le regioni leader e trailer (vedi Tabella 23.1) possiedono tassi alquanto più bassi che non le regioni fiancheggianti al 5′. Le sequenze leader e trailer non sono tradotte, ma vengono trascritte e forniscono segnali importanti per il processamento e la traduzione dell’mRNA. Le sostituzioni in queste regioni sono perciò rare. Le sostituzioni non sinonime nelle regioni codificanti dei geni sono quelle che si verificano con frequenza minore, in particolare quelle che alterano in modo significativo la sequenza di amminoacidi della proteina. Come è stato spiegato in precedenza, la maggior parte delle proteine sembra possedere sequenze di amminoacidi che le rendono adatte al loro ruolo nel loro ambiente specifico e la maggior parte delle sostituzioni che causano un allontanamento da tale sequenza ottimale viene eliminata piuttosto velocemente dalla selezione naturale. Pseudogeni Il tasso di evoluzione più elevato che si osserva nella Tabella 23.1 è quello degli pseudogeni non funzionali. Tra gli pseudogeni della globina umana, per esempio, il tasso di sostituzione nucleotidica è all’incirca 5 volte superiore rispetto a quello osservato in corrispondenza di siti non sinonimi all’interno delle sequenze codificanti dei geni funzionali per la globina. L’elevato tasso evolutivo osservato in queste sequenze dipende dal fatto che gli pseudogeni non codificano più per proteine. Poiché ulteriori variazioni in questi geni non colpiscono la fitness di un individuo, non vengono eliminate mediante il processo di selezione naturale. Riassumendo, di solito si osserva ciò che ha senso anche da un punto di vista intuitivo: maggiori sono i vincoli funzionali su una parte o sulla totalità di una macromolecola, minore sarà il tasso relativo di evoluzione.

Nota chiave I tassi di evoluzione cambiano a seconda della regione del gene considerata. Le sequenze genomiche più importanti dal punto di vista funzionale, come i siti di legame per le proteine all’interno dei promotori o quei nucleotidi la cui variazione porterebbe a una sostituzione dei corrispondenti amminoacidi, evolvono più lentamente. Gli pseudogeni sono versioni inattive dei geni che non sono più limitate dal punto di vista funzionale e pertanto tendono a evolvere più velocemente.

607

Genomica comparativa L’associazione tra bassi tassi di evoluzione ed elevato significato funzionale risulta di particolare utilità nella genomica comparativa, quel campo della genetica che si occupa del confronto delle sequenze di interi genomi di specie diverse. Qualsiasi progetto genoma, come il Progetto Genoma Umano (vedi Capitolo 8), rappresenta un ambizioso tentativo di stabilire una sorta di indirizzario, dove siano elencati tutti i geni di un organismo e la loro localizzazione sui cromosomi. Una lista, o mappa, del genere rappresenta la base di partenza che un giorno potrebbe consentire di riparare i geni difettosi, aggiungendone o rimpiazzandone uno perduto o danneggiato – consentendo così la cura o la prevenzione di malattie genetiche come la fibrosi cistica o anche alcuni tipi di cancro. Tuttavia, possedere l’indirizzario di un grande complesso di uffici non ci dice quale lavoro svolga ciascuno degli impiegati, come (o se) essi lavorino, da soli o in squadra, per raggiungere determinati obiettivi, e se la presenza di un dato lavoratore sia di beneficio o di danno per la compagnia. Molti progetti genoma hanno prodotto grandi quantità di informazioni in termini di sequenze nucleotidiche, ma una grande parte delle sequenze genomiche degli organismi complessi non sembra avere significato funzionale. Di conseguenza, spesso risulta difficile stabilire quali parti di un genoma siano associate a regioni codificanti per proteine e quale sia il ruolo svolto da tali proteine. Il confronto tra genomi sta dimostrando di essere uno dei metodi migliori per comprendere la funzione di sequenze specifiche. La scoperta che una parte del genoma di due specie lontanamente imparentate mostra una similarità di sequenza significativa suggerisce che quella regione possieda un’importanza dal punto di vista funzionale. Per esempio, l’ultimo antenato comune fra uomo e topo risale ad almeno 80-100 milioni di anni fa: dato un tasso di sostituzione nucleotidica per gli pseudogeni di circa 5 × 10–9 sostituzioni per sito per anno, quasi la metà di tutti i nucleotidi privi di restrizioni selettive avrebbe dovuto andare incontro ad almeno una sostituzione da quando l’uomo e il topo hanno cominciato a divergere. Le regioni con restrizioni funzionali, come i siti non sinonimi all’interno di regioni codificanti o i siti di legame per le proteine all’interno dei promotori, accumulano variazioni a una velocità che è cinque volte inferiore, o anche di più, e spesso sono facilmente riconoscibili in confronti tra coppie di sequenze. Le conseguenze funzionali di un enorme numero di variazioni vengono valutate su scale evolutive attraverso il processo della selezione naturale. Di conseguenza, l’analisi di genomica comparativa spesso sostituisce il processo più lungo e laborioso di mutagenesi a saturazione, nel quale si muta ogni posizione all’interno di un gene, valutandone poi le conseguenze in laboratorio. Ancora meglio, la limitazione del numero delle ipotesi circa la funzione di un dato gene all’interno di un organismo relativamente semplice come il lievito e l’iden-

608

Capitolo 23

tificazione successiva dello stesso gene nell’uomo facilitano molto la predizione della funzione del gene umano. La genomica comparativa è uno strumento potente, ma presenta dei limiti. Alcuni geni umani non sembrano possedere una controparte negli organismi più semplici. Si ricordi inoltre che molte proteine possiedono funzioni multiple – non tutte condivise da tutte le forme omologhe. Preferenza nell’uso dei codoni L’effetto che possono avere anche minuscole differenze nella fitness se sottoposte all’azione della selezione naturale nel corso di migliaia o milioni di generazioni è reso evidente dal fenomeno conosciuto come preferenza nell’uso dei codoni. Si noti, nella Tabella 23.1, il tasso di evoluzione leggermente ridotto dei siti sinonimi rispetto a quello degli pseudogeni. Questa osservazione suggerisce che le sostituzioni sinonime non siano completamente neutre dal punto di vista della selezione naturale e che alcuni codoni possano venire favoriti rispetto ad altri. Questa ipotesi è rinforzata dall’evidenza che i codoni sinonimi non vengono utilizzati in modo equo nelle sequenze codificanti di molti organismi. Per esempio, la ridondanza del codice genetico permette che sei codoni diversi codifichino per l’amminoacido leucina (UUA, UUG, CUU, CUC, CUA e CUG), ma il 60% dei codoni per la leucina presenti in Escherichia coli è rappresentato da CUG, e nel lievito l’80% è costituito da UUG. Poiché i codoni sinonimi alternativi codificano per lo stesso amminoacido, è la selezione che favorisce alcuni codoni sinonimi rispetto ad altri, altrimenti tutti i codoni sarebbero usati allo stesso modo. Si ricordi che alcuni codoni sinonimi si appaiano a diversi tRNA che portano lo stesso amminoacido. Pertanto, una mutazione che genera un codone sinonimo non cambia l’amminoacido, ma può far variare il tRNA usato dal ribosoma nella traduzione. Studi sui diversi tRNA hanno rivelato che, all’interno di una cellula, la quantità dei tRNA isoaccettori (i tRNA diversi che accettano lo stesso amminoacido) varia e che i tRNA più abbondanti sono quelli che si appaiano con i codoni usati più frequentemente. La selezione potrebbe favorire un codone sinonimo rispetto a un altro perché il tRNA per quel codone è più abbondante e la traduzione degli mRNA contenenti quel codone è più efficiente (e anche più accurata). Alternativamente, l’energia di legame tra codone e anticodone in codoni sinonimi potrebbe essere leggermente diversa dal momento che si appaiano basi differenti. Queste differenze estremamente sottili nell’efficienza di traduzione e nell’energia di legame sembrano essere soggette alla selezione naturale. Ciò è vero specialmente per quei geni che sono altamente espressi e per quegli organismi con tempi di generazione brevi e popolazioni molto grandi, come batteri, lieviti e Drosophila, in cui l’uso preferenziale dei codoni è estremamente evidente. L’esistenza di preferenze nell’uso dei codoni rappresenta una evidente dimostrazione della forza dei pro-

cessi evolutivi. Le differenze di fitness tra due batteri, identici sotto ogni aspetto tranne che per un unico codone sinonimo (su circa 1 milione di codoni del loro genoma), devono essere infinitesime, ma, per quanto tali, sufficienti a far sì che su una scala temporale evolutiva solo una delle due cellule ancestrali si sia conservata. Ancora, la tendenza all’utilizzo di codoni preferenziali rispetto a quelli usati più raramente è particolarmente evidente nei geni batterici che mostrano i livelli di espressione più elevati. Questo concorda con il fatto che i geni più espressi sono anche quelli più efficienti e meno dispendiosi dal punto di vista energetico. Se una grossa azienda paga un sovrapprezzo dell’1% su un qualcosa che viene acquistato migliaia di volte all’anno, si troverà in una situazione peggiore di quella di un’altra azienda che risparmia l’1% sullo stesso articolo, ma paga un sovrapprezzo del 20% su qualcosa che viene acquistato assai raramente. Infatti il grado di adattamento di un gene alla preferenza nell’uso dei codoni di un dato organismo si è dimostrato uno degli indici più affidabili del livello relativo di espressione del gene durante la vita di quell’organismo. Stando così le cose, ci si dovrebbe aspettare che geni altamente espressi utilizzino, dove possibile, amminoacidi poco costosi dal punto di vista energetico rispetto ad altri più costosi. Il costo energetico di sintesi di ciascuno dei 20 amminoacidi varia enormemente: la glicina richiede un investimento di soli 11,7 equivalenti di adenosina trifosfato (ATP), mentre il triptofano richiede una media di 78,3 equivalenti di ATP. Esistono alcune posizioni della struttura primaria di una proteina in cui sarà necessario avere un triptofano, ma, dove sia possibile sostituirlo con una glicina (o rimuoverlo del tutto), la selezione naturale dovrebbe favorire questo cambiamento, specialmente nei geni altamente espressi per i quali il risparmio energetico avrebbe l’effetto maggiore. L’analisi delle centinaia di genomi procarioti completamente sequenziati suggerisce che le cose stiano realmente così (nella Tabella 23.2 sono mostrati i risultati relativi a tre procarioti).

Nota chiave Anche piccole differenze nella fitness, come quelle associate all’efficienza di lettura dei diversi codoni sinonimi da parte dei ribosomi, possono avere effetti significativi sull’evoluzione delle molecole dopo molte generazioni di selezione.

Variabilità dei tassi evolutivi tra i geni Così come esistono differenze evidenti nei tassi evolutivi quando si confrontano diverse regioni dei geni, anche le differenze nei tassi di evoluzione tra i geni possono essere eclatanti, persino quando si considerino geni del-

609

Evoluzione molecolare Tabella 23.2 Utilizzo degli amminoacidi nel 10% dei geni con i livelli di espressione più elevati e nel 10% dei geni con i livelli di espressione più bassi in tre diversi procariotia Escherichia coli K12

Ammino- Costo acido

Differenza Basso Alto dalla media

Differenza di utilizzo

Streptococcus pneumoniae R6 Basso

Alto

Differenza di utilizzo

Bacillus subtilis subsp. subtilis str. 168 Basso

Alto

Differenza di utilizzo

Gly

11,7

–15,66

6,40

8,16

1,76

6,01

8,30

2,29

6,12

8,11

1,99

Ser

11,7

–15,66

6,65

4,99

–1,67

6,47

4,96

–1,51

6,24

5,84

–0,40

Ala

11,7

–15,66

8,48

9,76

1,27

5,85

9,80

3,95

7,40

8,70

1,29

Asp

12,7

–14,66

4,81

5,95

1,15

4,85

6,04

1,20

5,06

5,42

0,36

Asn

14,7

–12,66

4,45

3,92

–0,52

3,64

4,60

0,96

3,32

4,24

0,92

Glu

15,3

–12,06

5,23

7,10

1,87

6,54

7,91

1,37

6,71

8,11

1,40

Gln

16,3

–11,06

4,48

3,83

–0,66

4,43

3,33

–1,10

3,98

3,46

–0,52

Thr

18,7

–8,66

5,41

5,22

–0,19

4,78

5,97

1,19

4,92

5,82

0,89

Pro

20,3

–7,06

4,22

4,08

–0,15

3,17

3,72

0,55

3,87

3,62

–0,25

Val

23,3

–4,06

6,24

7,64

1,39

6,54

8,13

1,59

6,59

7,94

1,35

Cys

24,7

–2,66

1,50

0,92

–0,57

0,88

0,33

–0,54

1,02

0,52

–0,50

Arg

27,3

–0,06

5,38

5,45

0,07

4,61

4,21

–0,39

4,71

3,99

–0,72

Leu

27,3

–0,06

11,56

8,96

–2,59

12,70

7,97

–4,73

10,85

8,40

–2,45

Lys

30,3

2,94

4,34

5,66

1,32

5,96

7,16

1,19

6,25

7,55

1,30

Ile

32,3

4,94

6,72

6,03

–0,69

7,74

6,41

–1,33

6,79

7,14

0,34

Met

34,3

6,94

2,39

2,70

0,31

2,29

2,07

–0,22

2,65

2,28

–0,37

His

38,3

10,94

2,50

2,05

–0,45

2,21

1,61

–0,60

2,74

1,80

–0,93

Tyr

50

22,64

3,15

2,82

–0,34

4,44

2,96

–1,48

3,94

2,85

–1,09

Phe

52

24,64

4,35

3,71

–0,64

5,76

3,69

–2,07

5,56

3,53

–2,04

Trp

74,3

46,94

1,73

1,05

–0,69

1,13

0,81

–0,32

1,27

0,67

–0,60

a

Gli amminoacidi sono elencati per costo crescente di biosintesi (espresso in termini di numero medio di legami fosfato ad alta energia dell’ATP richiesti per la sintesi). Per ciascun organismo sono riportate le frazioni di amminoacidi nella sequenza del 10% dei geni meno espressi e in quella del 10% di quelli maggiormente espressi. Tabella costruita in base al lavoro di H. Akashi e T. Gojobori, 2002. “Metabolic efficiency and amino acid composition in the proteomes of Escherichia coli and Bacillus subtilis”. Proc. Natl. Acad. Sci. USA, 99: 3695-3700.

la stessa specie. Se anche in questo caso non vengono considerati i fattori stocastici (come quelli derivanti dagli errori di campionamento in popolazioni molto piccole), le differenze possono essere attribuite a uno o a una combinazione di due fattori: (1) le differenze nella frequenza di mutazione; (2) l’intensità della selezione naturale che agisce sul locus. Analisi statistiche rigorose sono in questo caso di aiuto nel distinguere tra cambiamenti adattativi e casuali delle sequenze nucleotidiche. Per esempio, il test di McDonald-Kreitman, sviluppato nel 1991, confronta i modelli di polimorfismo in una specie e di divergenza tra specie a livello dei siti sinonimi e non sinonimi della regione codificante di un gene. Se il rapporto tra sostituzioni non sinonime e sinonime in una specie è lo stesso che tra specie diverse, allora è probabile che tutte le sostituzioni siano neutre. Se i rap-

porti non sono gli stessi, allora è necessario chiamare in causa la selezione naturale – che probabilmente ha favorito mutazioni non sinonime in grado di conferire un vantaggio adattativo, sebbene possa essersi verificata anche una selezione diversificante. Alcune regioni dei genomi sembrano più soggette a variazioni casuali di altre, tuttavia i tassi di sostituzione sinonima al loro interno differiscono raramente per più di un fattore o due. Tale differenza è ben lontana dall’essere sufficiente per spiegare la differenza intorno a mille volte dei tassi di sostituzione non sinonima tra diverse classi di geni dei mammiferi, come mostrato nella Tabella 23.3. Com’era già il caso dei tassi di sostituzione osservati in un gene, le differenze nei tassi di sostituzione tra geni diversi devono essere in gran parte il risultato di differenze nell’intensità della selezione naturale per ciascuno dei loci.

610

Capitolo 23

Tabella 23.3 Tassi relativi dei cambiamenti evolutivi nelle sequenze di DNA di diversi geni dei mammiferia Tasso non sinonimo

Tasso sinonimo

Istone H4

0,004

1,43

Insulina

0,16

5,41

Prolattina

1,29

5,59

α-globina

0,56

3,94

Gene

β-globina

0,87

2,96

Albumina

0,92

6,72

α-fetoproteina

1,21

4,90

MHC

5,10

2,40

Apolipoproteina E

0,98

4,04

a Tutti i tassi sono espressi come sostituzioni nucleotidiche per sito per anno × 10–9.

Gli effetti di livelli diversi di vincoli funzionali sono illustrati dagli esempi specifici di due classi di geni: gli istoni e le apolipoproteine. Gli istoni sono proteine con carica positiva che sono essenziali e legano il DNA in tutti gli eucarioti. Quasi tutti gli amminoacidi di una proteina istonica, come l’istone H4, interagiscono direttamente dal punto di vista chimico con residui specifici del DNA, che è carico negativamente. Dunque, ogni variazione della sequenza di amminoacidi dell’istone H4 ha un effetto sulla sua capacità di interazione con il DNA. Il risultato è che gli istoni sono uno dei gruppi proteici a minor tasso di evoluzione noto, ed è possibile sostituire l’istone H4 del lievito con il suo omologo umano senza riscontrare alcun effetto, nonostante centinaia di milioni di anni di evoluzione indipendente. Le apolipoproteine, al contrario, sono responsabili di interazioni non specifiche con un’enorme varietà di lipidi, che trasportano nel sangue dei vertebrati. I loro domini di legame ai lipidi sono composti soprattutto da amminoacidi idrofobici. Qualunque amminoacido simile, purché idrofobico (per esempio leucina, isoleucina e valina), pare funzionare in queste posizioni altrettanto bene. Un risultato di ciò è che, a livello proteico, esistono dozzine di varianti diverse delle apolipoproteine umane, mentre, sempre nell’uomo, è stata identificata un’unica versione dell’istone H4. Nonostante le sostituzioni di amminoacidi siano in genere deleterie in moltissimi geni, occorre notare che per alcuni geni la selezione naturale favorisce la variabilità all’interno delle popolazioni. Per esempio, per i mammiferi la variabilità dei geni associati al complesso maggiore di istocompatibilità (MHC) risulta vantaggiosa. Il risultato è che il tasso di sostituzione non sinonima per i geni MHC è maggiore di quello per le sostituzioni sinonime (vedi Tabella 23.3). L’MHC è costituito da una grande famiglia multigenica che codifica per pro-

dotti proteici coinvolti nella capacità del sistema immunitario di riconoscere antigeni estranei. All’interno delle popolazioni umane, circa il 90% degli individui riceve dai genitori set di geni MHC diversi, e in un campione di 200 individui ci si possono aspettare da 15 a 30 alleli diversi. Questi livelli così elevati di diversità in questa regione vengono favoriti dalla selezione naturale, perché il numero di individui suscettibili all’infezione da parte di un singolo virus (che non venga riconosciuto dalle proteine MHC) sarà molto minore di quanto avverrebbe se tutti avessero lo stesso sistema immunitario. Mentre le popolazioni ospiti sono spinte a mantenere la diversità del sistema immunitario, i virus sono spinti a evolvere rapidamente. Un tipo di replicazione impreciso associato alla selezione diversificante è la causa del tasso di sostituzione nucleotidica dei geni NS dei virus influenzali, che ha un valore di 1,9 × 10–3 per sito per anno, ovvero circa un milione di volte superiore al tasso di sostituzione nucleotidica sinonima dei geni di mammifero riportato nella Tabella 23.1.

Nota chiave Il tasso di accumulo di variazioni dei geni generalmente riflette il grado di limitazione della loro funzione. Geni sottoposti a una forte selezione naturale presentano quasi sempre tassi di sostituzione sinonima molto più elevati rispetto a quelli di sostituzione non sinonima.

Tassi di evoluzione del DNA mitocondriale I genomi degli organelli sono trasmessi alla progenie in modo diverso da quelli dei geni nucleari e, di conseguenza, anche le dinamiche delle loro sostituzioni sono sostanzialmente diverse. Nel Capitolo 13 sono state prese in considerazione la struttura e la funzione del genoma mitocondriale dei mammiferi. Esso è formato da una molecola di DNA mitocondriale (mtDNA), circolare, a doppio filamento e lunga circa 15 000 bp. L’mtDNA umano è piuttosto tipico ed, essendo circa diecimila volte più piccolo del genoma nucleare, codifica per 2 rRNA, 22 tRNA e 13 proteine. Variazioni delle proteine, dei tRNA e degli rRNA codificati dal genoma mitocondriale sembrano essere meno deleterie per la fitness individuale rispetto alle sostituzioni a livello di proteine, tRNA ed rRNA codificati dai geni nucleari. Di conseguenza, il tasso medio di sostituzione sinonima dei geni mitocondriali dei mammiferi è di circa di 5,7 × 10–8 sostituzioni per sito per anno, circa 10 volte il valore medio corrispondente dei geni nucleari. Le piccole dimensioni dell’mtDNA e la scoperta del suo tasso di sostituzione eccezionalmente elevato hanno stimolato un notevole interesse per lo studio della sua evoluzione.

Evoluzione molecolare

L’mtDNA dei mammiferi si differenzia dal DNA nucleare anche perché la sua stragrande maggioranza viene ereditata in modo praticamente “clonale” dalla madre (vedi Capitolo 13). I mitocondri sono localizzati nel citoplasma ed è la cellula uovo a contribuire alla formazione dello zigote con il maggior contenuto di citoplasma. Di conseguenza, l’mtDNA non va incontro a meiosi e tutta la progenie mantiene il genotipo materno per quanto riguarda le sequenze di mtDNA. Questo tipo di ereditarietà permette di tracciare delle discendenze matriarcali (discendenti da una singola femmina) e in alcune popolazioni fornisce un mezzo per esaminare la struttura familiare. Questo, insieme al rapido e regolare tasso di accumulo di differenze nella sequenza nucleotidica, ha consentito che l’mtDNA diventasse uno strumento valido per porre a confronto linee evolutive strettamente imparentate. Sulla base delle variazioni mitocondriali infatti, possono essere raggruppati individui con specifici aplotipi (vedi Capitolo 8) a formare aplogruppi mitocondriali, utilizzati per studi antropologici ed evolutivi.

Orologi molecolari Come descritto in precedenza, le differenze nei tassi di sostituzione di amminoacidi e di nucleotidi tra i geni nucleari possono essere eclatanti, ma presumibilmente sono, in primo luogo, il risultato di differenze nei valori adattativi di ciascuna proteina. Tuttavia, i tassi di evoluzione molecolare di loci dalle valenze adattative simili possono rimanere abbastanza uniformi su lunghi periodi di tempo.

611

In effetti, i primissimi studi comparativi di sequenze proteiche condotti da Emile Zuckerkandl e Linus Pauling negli anni sessanta del secolo scorso suggerirono che i tassi di sostituzione fossero essenzialmente costanti tra proteine omologhe in un arco di tempo di decine di milioni di anni. In base a queste osservazioni, essi proposero l’ipotesi dell’orologio molecolare, in quanto l’accumulo delle variazioni degli amminoacidi era costante come il battito di un orologio. L’orologio molecolare può battere a velocità diverse per proteine diverse, ma il numero di differenze tra due proteine omologhe sembrava essere molto ben correlato al tempo trascorso dal momento in cui la speciazione le aveva fatte divergere in maniera indipendente, come viene mostrato nella Figura 23.2. Tale osservazione stimolò immediatamente un forte interesse circa l’utilizzo di molecole biologiche negli studi evolutivi. Tassi di variazione costanti tra sequenze omologhe dovrebbero facilitare la determinazione non solo delle relazioni filogenetiche tra le specie, ma anche dei tempi della loro divergenza, in modo molto simile all’utilizzo del decadimento radioattivo per stabilire i tempi geologici. Nonostante le sue grandi promesse, tuttavia, numerosi risultati sperimentali non suffragano l’ipotesi dell’orologio molecolare di Zuckerkandl e Pauling. Gli evoluzionisti classici sostennero che i tempi incostanti dell’evoluzione morfologica non si accordavano con un tasso costante di variazione a livello molecolare. Inoltre, il disaccordo a proposito dei tempi di divergenza ha messo in discussione il concetto di uniformità dei tassi evolutivi che è alla base dell’idea di orologio molecolare.

Vertebrati/ insetti

Carpe/ lamprede

Rettili/pesci

Uccelli/rettili

Separazione dei progenitori di piante e animali

er MA

200

Fibrin opepti biame di nti di ammin oacid ip

180 160 140 120 100

A

lo og

Em

1,1 ca m

Numero di sostituzioni di amminoacidi per 100 residui

220

Mammiferi/ rettili

Mammiferi

240

80

bin ia

a ino m

id ac

m

id

t en

m

8

5,

ca

bia

40

20,0

20

0

100

rM

m

60

0

e ip

200

300

400

500

600

camb

700

c MA romo i per Citoc oacid in m am nti di iame

800

900

1000 1100 1200

Tempo di divergenza, in milioni di anni (MA)

1300 1400

Figura 23.2 L’orologio molecolare batte a velocità diverse in proteine diverse. Una motivazione è che il tasso di sostituzione neutra varia tra proteine. Il fibrinogeno non sembra avere particolari vincoli evolutivi e possiede un tasso di sostituzione neutra elevato, mentre il citocromo c ha un tasso corrispondente più basso e potrebbe essere maggiormente sottoposto a selezione. I dati provengono da un’ampia gamma di organismi.

612

Capitolo 23

Variabilità nei tassi La maggior parte delle date di divergenza usate negli studi di evoluzione molecolare è di accuratezza discutibile, in quanto proveniente da interpretazioni basate su reperti fossili notoriamente incompleti. Attualmente sono disponibili quantità esponenzialmente crescenti di sequenze di DNA da un’ampia varietà di specie per verificare il presupposto dell’ipotesi dell’orologio molecolare, cioè se il tasso di evoluzione di un dato gene sia costante nel tempo in tutte le linee evolutive. I tassi di sostituzione nel ratto e nel topo sono in gran parte identici. Al contrario, la velocità dell’evoluzione molecolare nell’uomo e nelle scimmie antropomorfe sembra sia stata circa la metà di quella riscontrata tra le scimmie del Vecchio Mondo a partire dal momento della loro divergenza. In effetti, le analisi su geni omologhi nel ratto e nell’uomo suggeriscono che i roditori abbiano accumulato sostituzioni con velocità doppia rispetto ai primati, a partire dal loro ultimo antenato comune, durante la radiazione evolutiva dei mammiferi tra 80 e 100 milioni di anni fa. La velocità dell’orologio molecolare varia chiaramente tra gruppi tassonomici diversi, e questi scostamenti della velocità dell’orologio fanno insorgere un problema nell’uso della divergenza molecolare per la datazione degli antenati comuni. Prima di poter procedere in inferenze di questo tipo, è necessario dimostrare che le specie in esame possiedono un orologio costante, come nel caso dei roditori. Diverse possibili spiegazioni sono state proposte per giustificare le differenze nei tassi evolutivi di linee diverse. Per esempio, i tempi di generazione nelle scimmie sono inferiori a quello dell’uomo, e il tempo di generazione dei roditori è ancora più breve. Il numero di replicazioni del DNA nella linea germinale, che avviene una volta per generazione, dovrebbe essere più strettamente correlato al tasso di sostituzione rispetto al semplice tasso di divergenza. Alcune delle differenze potrebbero essere in parte il risultato di numerose altre dissimilarità presenti tra due linee evolutive dal momento della loro divergenza, come l’efficienza media della riparazione del DNA, l’esposizione media ad agenti mutageni e l’opportunità di adattarsi a nuovi ambienti o nicchie ecologiche. La difficoltà associata alla stima della misura nella quale queste variabi-

Nota chiave I test sui tassi di evoluzione relativi indicano che non sempre le sostituzioni si accumulano alla stessa velocità in diverse linee evolutive. I primati, e l’uomo in particolare, sembrano mostrare un tasso di evoluzione più lento a livello molecolare di quello degli altri mammiferi a partire dal momento della loro radiazione, tra gli 80 e i 100 milioni di anni fa. Tassi di variazione più rapida potrebbero essere il risultato di tempi di generazione media più brevi o di numerosi altri fattori.

li abbiano influenzato i tassi evolutivi a volte si può ridurre utilizzando informazioni indipendenti sulla datazione provenienti dai reperti fossili per calibrare gli orologi molecolari di alcune specie all’interno di certi gruppi.

Filogenesi molecolare Poiché l’evoluzione può essere definita come il cambiamento genetico che ha luogo nel tempo, le relazioni genetiche sono di primaria importanza per decifrare le relazioni evolutive. La più grande promessa dell’ipotesi dell’orologio molecolare consiste nella possibilità di utilizzare i dati molecolari per interpretare le relazioni filogenetiche tra gli esseri viventi. Semplicemente, ci si attende che gli organismi con un grado elevato di similarità molecolare siano anche più strettamente imparentati rispetto agli organismi diversi dal punto di vista molecolare. Prima che fossero disponibili le risorse della biologia molecolare per la produzione dei dati per questo tipo di analisi, i biologi evoluzionisti si basavano unicamente sul confronto tra i fenotipi per inferire similarità e differenze genetiche. L’assunzione sottostante era che, se i fenotipi erano simili, anche i geni responsabili degli stessi fenotipi avrebbero dovuto esserlo; se i fenotipi erano diversi, anche i geni lo erano. In origine si studiavano principalmente i fenotipi relativi a evidenti caratteristiche anatomiche. In seguito si studiarono anche caratteristiche biochimiche, ultrastrutturali e comportamentali. I confronti tra questi caratteri ha permesso la costruzione di alberi evolutivi per molti gruppi di piante e animali, ed essi sono ancora oggi alla base di molti studi di tipo evolutivo. Tuttavia, affidarsi allo studio di tali caratteri comporta dei limiti. Talvolta fenotipi simili possono evolvere in organismi che sono lontanamente imparentati, in un processo chiamato evoluzione convergente. Per esempio, se un biologo inesperto cercasse di costruire un albero evolutivo basandosi sulla presenza o meno di ali in un organismo, potrebbe collocare uccelli, pipistrelli e insetti nello stesso gruppo evolutivo, poiché tutti hanno le ali. In questo caso è abbastanza evidente che queste tre classi di organismi non siano strettamente imparentate; esse differiscono per molte caratteristiche al di fuori della presenza delle ali, e le ali stesse hanno una struttura molto diversa. Questo esempio estremo dimostra come i fenotipi possano essere fuorvianti riguardo alle relazioni evolutive e come le somiglianze fenotipiche non riflettano necessariamente similarità genetiche. Un altro problema connesso all’utilizzo dei fenotipi per la determinazione delle relazioni evolutive è costituito dal fatto che molti organismi non possiedono caratteristiche fenotipiche facilmente analizzabili e adatte per dei confronti. Per esempio, lo studio delle relazioni tra i batteri è sempre stato problematico, in quanto i batteri esibiscono pochi caratteri evidenti che siano correlati al loro grado di parentela.

Evoluzione molecolare

Un terzo problema emerge quando si cerca di confrontare organismi lontanamente imparentati. Quali caratteri fenotipici si devono confrontare, per esempio, nell’analisi di batteri e mammiferi, in cui le caratteristiche in comune sono veramente poche? Abbiamo già visto in questo capitolo come gli approcci molecolari possano fornire informazioni utili circa le sequenze di DNA e la loro evoluzione. Anche se la velocità relativa dell’evoluzione molecolare può variare tra linee evolutive, e i tempi di divergenza così stimati devono essere trattati con prudenza, si può essere fiduciosi che i metodi filogenetici basati su dati molecolari portino a un corretto raggruppamento degli organismi. Molti studiosi hanno sostenuto che la filogenesi molecolare sia più affidabile anche quando siano disponibili dati alternativi, poiché gli effetti dell’evoluzione adattativa sono generalmente meno pronunciati a livello di sequenze del DNA. La scoperta di discrepanze tra filogenesi morfologica e molecolare fornisce di solito preziose opportunità per esaminare gli effetti della selezione naturale a livello delle differenze fenotipiche.

Alberi filogenetici

MyLab

Data la lunga storia degli studi evolutivi anche prima che fossero disponibili i dati molecolari, gli approcci generali utilizzati per chiarire le relazioni tra le specie sono piuttosto ben definiti. Un principio centrale di tutte le ricostruzioni nimazione filogenetiche è l’idea di un albeAlberi ro filogenetico in grado di defilogenetici scrivere graficamente le relazioni tra specie diverse. Tutti gli organismi viventi sulla Terra, sia nel presente sia in passato, condividono un unico antenato comune vissuto all’incirca 4 miliardi di anni fa. Ogni albero filogenetico rappresenta almeno una parte di questa genealogia con rami che connettono due (o talvolta più) nodi adiacenti. I nodi terminali rappresentano i taxa dei quali sono disponibili informazioni a livello molecolare utili per l’analisi. I nodi

interni rappresentano antenati comuni prima della ramificazione che ha dato origine a due gruppi di organismi separati. La lunghezza dei rami viene spesso resa proporzionale al grado di divergenza tra i taxa connessi. Quando è possibile distinguere uno dei nodi interni come l’antenato comune a tutti gli altri nodi dell’albero, allora si parla di albero radicato, mentre gli alberi non radicati precisano solo le relazioni tra i nodi senza dare informazioni su quali siano i più antichi. Di solito le radici degli alberi non radicati si possono determinare utilizzando un outgroup. Gli outgroup sono quei taxa che separano in maniera certa i taxa oggetto di studio da quelli più primitivi. Nel caso di uomo e gorilla, utilizzando i babbuini come outgroup, la radice dell’albero può essere posizionata in qualche punto del ramo che connette i babbuini all’antenato comune di uomo e gorilla. Quando si considerano solo tre taxa, vi sono tre possibili alberi radicati, ma solo un albero non radicato (Figura 23.3). Numero degli alberi possibili Il numero di tutti i possibili alberi diventa rapidamente sbalorditivo a mano a mano che si introducono nuovi taxa (Tabella 23.4). Il numero effettivo di possibili alberi radicati (NR) e non radicati (NU) per un numero (n) di taxa è dato dalle seguenti equazioni: NR = (2n – 3)!/[2n–2(n – 2)!] NU = (2n – 5)!/[2n–3(n – 3)!] I valori di n devono essere maggiori o uguali a 2 per la prima equazione e maggiori o uguali a 3 per la seconda, e possono essere molto elevati. In pratica, tuttavia, il valore di n è spesso dell’ordine delle decine o al massimo delle centinaia di taxa o di individui – potendo tutte le loro relazioni filogenetiche essere descritte da un numero inimmaginabile di alberi possibili. Alberi dei geni contro alberi delle specie Un albero filogenetico basato sulla divergenza osservata a livello di un singolo gene omologo viene più correttamente chiamato albero dei geni. Alberi di questo tipo possono rac-

Albero non radicato

Alberi radicati 2

1

613

3

3

1

2

3

2

2

1

1

3 A

A

Figura 23.3 La relazione tra tre taxa (denominati 1, 2 e 3) può essere descritta da tre diversi alberi radicati ma da un solo albero

A

non radicato. La lettera A negli alberi radicati rappresenta il progenitore comune di tutte le tre specie.

614

Capitolo 23

Tabella 23.4 Numero di alberi radicati e non radicati

Polimorfismo condiviso

che descrivono le possibili relazioni tra numeri di taxa differenti

Numero di taxa

Numero di alberi radicati

Numero di alberi non radicati

2

1

1

3

3

1

4

15

3

5

105

15

10

34 459 425

2 027 025

20

8,20 × 1021

2,22 × 1020

30

4,95 × 1038

8,69 × 1036

contare la storia evolutiva di un gene, ma non necessariamente quella delle specie alle quali esso appartiene. Di solito, il miglior modo per ottenere gli alberi delle specie è quello di effettuare analisi utilizzando dati relativi a più geni. Nonostante possa sembrare di non facile intuizione, la divergenza tra i geni di solito avviene prima della divisione delle popolazioni che si verifica con la comparsa di nuove specie. Per il locus considerato nella Figura 23.4, alcuni individui della specie 1 potrebbero essere in realtà più simili agli individui della specie 2 di quanto non lo siano ad altri membri della propria popolazione. Le differenze tra gli alberi dei geni e gli alberi delle specie tendono a diventare particolarmente rilevanti quando si considerano loci per i quali sia vantaggioso mantenere diversità all’interno delle popolazioni, come nel caso del locus del complesso maggiore di istocompatibilità (MHC) descritto in precedenza. Se si utilizzassero soltanto alleli dell’MHC per stabilire un albero delle specie, molti uomini sarebbero raggruppati con i gorilla piuttosto che con altri uomini, poiché il polimorfismo del quale sono portatori è più antico della divisione tra le due linee evolutive. Un secondo vantaggio degli alberi delle specie rispetto agli alberi dei geni è rappresentato dalla minore influenza da parte del trasferimento genico orizzontale (lo spostamento di un gene tra membri di due specie diverse). Questo movimento di geni lungo le linee evolutive delle specie viene discusso più dettagliatamente nel Focus sul genoma di questo capitolo.

Nota chiave I polimorfismi di sequenza spesso precedono gli eventi di speciazione. Di conseguenza, è possibile che gli alberi filogenetici costruiti sulla base di un singolo gene non sempre rispecchino le relazioni tra le specie. Il metodo migliore per costruire gli alberi delle specie è quello di considerare più geni.

Nonostante il numero sbalorditivo di alberi radicati e non radicati che si possono generare anche a partire da

Figura 23.4 L’insorgenza di polimorfismi interspecie, o condivisi, può verificarsi se il progenitore era polimorfico per due o più alleli e se gli alleli sono ancora presenti in entrambe le specie.

un piccolo numero di taxa (vedi Tabella 23.4), solo uno di essi rappresenta le reali relazioni filogenetiche tra i taxa considerati. Dato che il vero albero si può di solito conoscere soltanto mediante simulazioni al computer di dati artificiali, la maggior parte degli alberi prodotti a partire dai dati molecolari ottenuti dagli organismi reali è definita con il termine di alberi stimati. L’individuazione del vero albero tra tutti quelli possibili può costituire un compito scoraggiante e di solito viene affidata a computer ad alta velocità. Gli algoritmi usati per questa ricerca utilizzano di solito uno tra pochi diversi tipi di approcci disponibili: quelli basati sulle matrici di distanza, quelli basati sui criteri di parsimonia, quelli basati sulla massima verosimiglianza e i metodi bayesiani. Una comprensione di base della logica sulla quale si fondano questi approcci aiuterà a comprendere esattamente quale sia l’informazione convogliata dagli alberi filogenetici e quale tipo di dati molecolari sia il più utile per la loro costruzione.

Metodi di ricostruzione Per stabilire le relazioni filogenetiche a partire da dati molecolari si utilizzano comunemente almeno tre approcci fondamentalmente diversi. I metodi basati sulle matrici di distanza si basano su principi statistici che raggruppano gli oggetti in base alla similarità complessiva che essi mostrano gli uni rispetto agli altri. Questo approccio statistico viene usato per molti tipi di analisi dei dati e non solo per quelle di evoluzione molecolare. Al contrario, gli approcci che utilizzano il criterio di parsimonia raggruppano gli organismi in modo da mini-

Evoluzione molecolare

615

Focus sul genoma Il trasferimento genico orizzontale Uno degli eventi che può rendere di gran lunga più difficile la comprensione dell’evoluzione molecolare è il trasferimento genico orizzontale, o trasferimento dei geni tra le specie. Ciò sembra abbastanza comune nei batteri, evidenza non troppo sorprendente poiché è noto da tempo che i batteri di specie diverse si scambiano materiale genetico tramite i processi di coniugazione, trasduzione e trasformazione (vedi Capitolo 15). Per esempio, i plasmidi portatori di geni che conferiscono resistenza a uno o più antibiotici vengono facilmente trasferiti da una specie all’altra. Questo processo è stato descritto per la prima volta nei batteri nel 1959. Il trasferimento orizzontale è stato osservato recentemente in occasione dell’insorgenza di una delle minacce attualmente più preoccupanti per la salute. Alcuni ceppi di Staphylococcus aureus, un batterio comune che vive sulla pelle, sono portatori di un gene codificante per una proteina che neutralizza molti degli antibiotici frequentemente utilizzati. Tali ceppi sono chiamati nel loro complesso MRSA (Staphylococcus aureus resistenti alla meticillina) e provocano infezioni molto difficili da curare, talvolta fatali. Molte infezioni da MRSA si verificano in strutture sanitarie, spesso a causa della sterilizzazione inappropriata delle attrezzature mediche o dell’esposizione di pazienti immunocompromessi a individui affetti. Recentemente si è evidenziato che questo gene è stato trasferito ad altre specie. Il trasferimento orizzontale può creare confusione nella costruzione di alberi filogenetici precisi, poiché farà apparire due specie lontanamente imparentate più vicine dal punto di vista evolutivo di quanto non siano in realtà (e, se il trasferimento è avvenuto abbastanza di recente, i due geni saranno molto simili tra loro). Una stima suggerisce che il 18% del genoma di un ceppo di E. coli si sia generato tramite trasferimento orizzontale negli ultimi 100 milioni di anni. La presenza del trasferimento orizzontale è stata evidenziata anche in alcuni eucarioti, ma esso è apparso come un fenomeno molto meno comune che nei procarioti (e molti degli eventi di trasferimento si verificano tra il genoma dei mitocondri o dei plastidi e il genoma nucleare piuttosto che tra due specie). Il sequenziamento dell’intero genoma di diversi organismi ha confermato che il trasferimento genico orizzontale è un fenomeno relativamente raro tra gli animali e non sarebbe causa di confusio-

ne nella costruzione dei relativi alberi filogenetici, come invece accade nel caso degli alberi dei procarioti. Recentemente un gruppo di scienziati ha scoperto una singolare eccezione, i rotiferi bdelloidei. I rotiferi sono minuscoli animali acquatici dotati di uno o più ciuffi di ciglia vicino alla bocca, in costante movimento. Il nome rotifero si riferisce proprio a questa caratteristica. I rotiferi bdelloidei costituiscono una vera stranezza se confrontati con altri membri del regno animale, poiché sembra che siano incapaci di riprodursi sessualmente. Essi possiedono inoltre genomi ricchi di elementi trasponibili. Un gruppo di scienziati ha analizzato il DNA genomico del rotifero bdelloideo Adineta vaga, scoprendo molti geni che erano quasi certamente il risultato di eventi di trasferimento genico orizzontale. Per la maggior parte di questi geni, la corrispondenza migliore (utilizzando BLASTp, o confronti proteina-proteina, vedi Capitolo 9) risultava coinvolgere un gene batterico o fungino. Parecchi geni non avevano corrispondenti in geni animali. Risultati analoghi sono stati ottenuti in un’altra specie di rotiferi bdelloidei. Sorprendentemente, alcuni geni che sembravano essere derivati dai batteri avevano acquisito i classici introni eucarioti da quando erano entrati nel genoma dei rotiferi, e, dei 22 geni che più probabilmente costituivano il prodotto del trasferimento genico orizzontale, solo 5 sembravano chiaramente pseudogeni, suggerendo che almeno alcuni dei geni trasferiti venissero espressi dall’organismo ospite. (Si ricordi che uno pseudogene è una sequenza un tempo genica che, avendo accumulato numerose mutazioni, è ora non funzionale.) La maggior parte dei geni trasferiti sembra essere raggruppata nelle regioni vicino ai telomeri, povere di geni e ricche di trasposoni. Si stima che circa il 6% del DNA nelle regioni telomeriche derivi da trasferimento genico orizzontale, mentre nel resto del genoma (ricco di geni e povero di trasposoni) forse solo l’1% è il risultato di tale fenomeno. Questo tipo di trasferimento genico può essere limitato solo a questo tipo di animali, poiché essi vivono in pozzanghere e stagni effimeri e si sono adattati a sopravvivere all’essiccamento, condizione che può alterare la permeabilità della cellula, consentendo l’ingresso del DNA estraneo.

616

Capitolo 23

mizzare il numero di sostituzioni che devono essere avvenute a partire dal loro ultimo antenato comune e, generalmente, sono utilizzati solo negli studi di evoluzione molecolare. I metodi di massima verosimiglianza (o bayesiani) hanno una base intrinseca di probabilità/statistica e sono applicabili solo a gruppi di dati tipici, grazie all’aumento della potenza dei computer ottenuto intorno alla fine degli anni novanta del secolo scorso. Approcci basati sulle matrici di distanza per la ricostruzione degli alberi filogenetici Il metodo più antico di matrice di distanza è anche il più semplice dei metodi di ricostruzione filogenetica. Il metodo UPGMA (Unweighted Pair Group Method with Arithmetic Averages) fu proposto originariamente nei primi anni sessanta del secolo scorso per aiutare l’analisi evolutiva dei caratteri morfologici; esso si basa in gran parte sulla statistica e necessita di dati che possano venire condensati per dare una misura di distanza genetica tra tutte le coppie di taxa considerate. Per illustrare la costruzione di un albero filogenetico mediante UPGMA, si consideri un gruppo di quattro taxa, A, B, C e D. Assumiamo inoltre che le distanze fra i taxa presi a due a due siano fornite dalla seguente matrice: Taxa B C D

A dAB dAC dAD

B – dBC dBD

C – – dCD

In questa matrice, dAB rappresenta la distanza (magari stimata secondo il modello di Jukes e Cantor) tra i taxa A e B, dAC quella tra i taxa A e C, e così via. Il metodo UPGMA inizia raggruppando i due taxa separati dalla distanza minore in un unico taxon composito. Assumiamo che nel nostro caso il valore più piccolo nella matrice sia dAB, nel qual caso i taxa A e B sarebbero i primi a venire raggruppati (AB). Dopo il primo raggruppamento, viene calcolata una nuova matrice delle distanze, in cui la distanza tra il nuovo taxon (AB) e i rimanenti C e D è calcolata come d(AB)C = 1/2 (dAC + dBC) e d(AB)D = 1/2 (dAD + dBD). I taxa separati dalla minore distanza nella nuova matrice vengono poi raggruppati a dare un nuovo taxon composito, e il processo viene ripetuto finché tutti i taxa siano stati raggruppati. Se sull’albero si devono utilizzare lunghezze proporzionali dei rami per rappresentare la distanza evolutiva tra i taxa, allora i nodi di ramificazione vengono posti a metà della distanza tra i taxa raggruppati (cioè, a dAB/2 per il primo raggruppamento). Un punto di forza generale dei metodi delle matrici di distanza è che funzionano ugualmente bene con dati morfologici e molecolari, o con combinazioni dei due. Essi sono inoltre in grado di prendere in considerazione tutti i dati disponibili per una particolare analisi, così come i metodi di massima verosimiglianza. Al contrario, i

metodi alternativi basati sul criterio di parsimonia, descritti di seguito, non prendono in considerazione molti siti “non informativi” (descritti oltre). Una debolezza particolare dell’approccio UPGMA è che esso presuppone un tasso costante di evoluzione lungo tutte le linee, cosa che si sa non avvenire sempre. Esistono diversi metodi alternativi all’UPGMA che sono basati sulle matrici di distanza, quali il metodo delle distanze trasformate o il metodo del neighbor-joining, che sono più complicati, ma che sono in grado di prendere in considerazione i diversi tassi evolutivi esistenti tra le diverse linee. Approcci basati sul criterio di parsimonia per la ricostruzione degli alberi filogenetici Mentre i metodi delle matrici di distanza e della massima verosimiglianza per la costruzione degli alberi sono basati sulla statistica, i metodi basati sul criterio di parsimonia hanno la loro ragion d’essere nel principio biologico che le mutazioni sono eventi rari. Lo stesso termine parsimonia significa “avarizia” o “economicità” e si riferisce al fatto che questi metodi tentano di minimizzare il numero degli eventi mutazionali in un albero filogenetico per rendere conto delle sequenze di tutti i taxa considerati. I metodi basati sulla parsimonia assumono che l’albero più semplice (quello che richiede il minor numero di mutazioni) sia il migliore e lo definiscono l’albero di massima parsimonia. Come accennato in precedenza, gli approcci basati sul criterio di parsimonia non prendono in considerazione tutti i siti dei dati molecolari. Piuttosto essi si concentrano solo su quelle posizioni di un allineamento multiplo che favoriscono un albero tra tutti quelli alternativi possibili, sulla base del numero di sostituzioni richieste. Non tutte le posizioni di un allineamento multiplo sono in grado di indicare una preferenza per un albero piuttosto che per un altro secondo una prospettiva di parsimonia. Si consideri il seguente allineamento di quattro sequenze nucleotidiche: 1 Sequenza G G G G

2 C T T T

Sito 3 G G T C

4 A T G C

5* T T C C

6* G G A A

In questo allineamento, solo il quinto e il sesto sito (segnati con un asterisco) rappresentano siti informativi in una prospettiva di parsimonia. Come mostra la Figura 23.5 si possono tracciare soltanto tre alberi non radicati che descrivano le relazioni tra i quattro taxa: l’albero non radicato che raggruppa la prima e la seconda sequenza in un gruppo separato dalla terza e dalla quarta richiederebbe una sola mutazione nel ramo che unisce

Evoluzione molecolare Albero 1 G

G g

Sito 1

C t

G g

A g

T t

G g A

T t

T

T

T

T g

C

G

T

T g

C

G

T

C

t

C

Sito 6*

T

g

G

Sito 5*

G

g

G

Sito 4

G

t C

T

G

A

g

g A

G

Albero 3 G

g

t

T

Sito 3

G

g

G

Sito 2

Albero 2 G

g

G g

G

G

C

T

t

G

T t

T

C

G

G

g T

A

A

C

C

T

T

T

t

G

T

A

G

g

g G

g

Figura 23.5 Tre diversi alberi non radicati descrivono tutte le possibili relazioni tra quattro taxa. Sono mostrati tutti i tre alberi per ciascuno dei sei siti delle sequenze (lettere maiuscole) riportate nel testo. Le barre rosse indicano quei rami lungo i quali devono essere avvenute sostituzioni, e le situazioni ancestrali dedotte sono indicate con lettere minuscole. La sequenza per il sito 1 non richiede alcuna sostituzione qualunque sia l’albero tracciato, il sito 2 richiede una sostituzione per ciascun albero, il sito 3 richiede due sostituzioni per ciascun albero e il sito 4 richiede tre sostituzioni per ciascun albero. Solo i siti 5 e 6 danno origine a un albero che richiede un numero minore di sostituzioni degli alberi alternativi, il che li rende dei siti informativi.

C

t C

g G

g

g

t T

g C

g

617

G

entrambi i gruppi. I due alberi alternativi che raggruppano in modo diverso i taxa richiederebbero due mutazioni ciascuno e pertanto non rappresentano l’arrangiamento delle sequenze più parsimonioso possibile. Invece, tutti e tre gli alberi non radicati possibili per il sito 1 non sono discriminabili in una prospettiva di parsimonia, perché non vi sono mutazioni. Anche il sito 2 non è informativo, perché ciascuno dei tre alberi possibili presenta una mutazione. Il sito 3 non è informativo perché due mutazioni sono richieste per tutti i tre alberi, mentre il sito 4 non lo è perché sarebbero necessarie tre mutazioni per tutti i tre alberi. In generale, perché un sito sia informativo, a prescindere dal numero di sequenze allineate, esso deve presentare almeno due nucleotidi diversi e ciascuno di questi nucleotidi deve essere presente almeno due volte (come nel sito 5 e nel 6). Gli alberi di massima parsimonia sono determinati identificando in primo luogo tutti i siti informativi di un allineamento e quindi stabilendo quale di tutti i possibili alberi non radicati richieda il minor numero di mutazioni per ciascuno di questi siti. L’albero (o gli alberi) più parsimonioso è quello che richiede il minor numero di mutazioni considerando tutti i siti informativi dell’allineamento. Un prodotto collaterale molto utile dell’approccio basato sul criterio di parsimonia è la generazione di sequenze ancestrali dedotte per ciascun nodo dell’albero (vedi Figura 23.5): esse sono oltremodo utili

per far piazza pulita del tristemente famoso “anello mancante” dei reperti fossili e, C se analizzate attentamente, possono fornic re informazioni chiare circa la natura di organismi estinti da molto tempo e persiC no sull’ambiente nel quale vivevano. Naturalmente, l’approccio basato sul criA a terio di parsimonia qui descritto assume che la probabilità di un nucleotide di muA tare sia la stessa verso uno qualunque degli altri tre nucleotidi. Algoritmi più complessi tengono conto anche della differenza delle frequenze di transizione e transversione, anche se nessuno di essi risulta particolarmente affidabile quando i tassi di sostituzione tra i rami di un albero sono molto diversi. Approcci di massima verosimiglianza per la ricostruzione degli alberi filogenetici Un metodo di ricostruzione filogenetica alternativo, basato puramente sulla statistica, è rappresentato dagli approcci di massima verosimiglianza, che stimano la probabilità di ogni singola sostituzione nucleotidica in un gruppo di allineamenti di sequenze. Per esempio, sapendo che il tasso di transizione è circa tre volte quello di transversione, in un allineamento di tre sequenze nel quale in una determinata posizione vi siano una C, una T e una A, si potrebbe ragionevolmente sostenere che è più probabile che le sequenze con la C e la T siano più vicine l’una rispetto all’altra che non alla sequenza con la A (poiché la sostituzione CDT rappresenta una transizione, mentre le sostituzioni CDA o TDA costituiscono delle transversioni). Il calcolo delle probabilità è complicato dal fatto che la sequenza del progenitore comune delle sequenze considerate non è generalmente nota. La determinazione della storia evolutiva verificatasi con maggiore probabilità è ulteriormente complicata dal fatto che in uno o più dei siti considerati possono essere avvenute delle sostituzioni multiple, e che non tutti i siti so-

618

Capitolo 23

no necessariamente indipendenti o equivalenti. Tuttavia, si possono utilizzare criteri oggettivi per calcolare la probabilità per ciascun sito e per ognuno degli alberi possibili che descrivono le relazioni tra le sequenze di un allineamento multiplo. Il numero di alberi possibili anche per un numero modesto di sequenze (vedi Tabella 23.4) rende questo calcolo un’impresa estremamente impegnativa dal punto di vista computazionale, ma l’albero con la probabilità totale più elevata sarà per definizione quello che verosimilmente rappresenta il vero albero filogenetico rispetto al modello di sostituzione nucleotidica proposto. L’aumento colossale della potenza di calcolo dei computer ha cominciato a rendere utilizzabili gli approcci di massima verosimiglianza, tanto che nella letteratura scientifica si trova un numero sempre maggiore di alberi stimati con questo tipo di approccio. Si noti, tuttavia, che non esiste ancora un modello generale di sostituzione nucleotidica che venga universalmente accettato e, poiché modelli diversi possono condurre molto facilmente a conclusioni differenti, quando si utilizza questo approccio si deve valutare e descrivere attentamente il modello utilizzato.

Nota chiave Il numero dei possibili alberi che descrivono le relazioni tra un numero di taxa anche piccolo può essere molto grande. I metodi delle matrici di distanza e della massima verosimiglianza si basano, per il raggruppamento dei taxa, sulle relazioni statistiche che intercorrono tra di essi. Gli approcci basati sulla parsimonia partono dal presupposto che l’albero migliore sia molto probabilmente quello che richiede il minor numero di mutazioni. Nessuno dei metodi garantisce di produrre il vero albero filogenetico, ma quando è improbabile che siano avvenute sostituzioni multiple e i tassi evolutivi tra i rami dell’albero sono all’incirca gli stessi, tutti e tre i metodi si sono dimostrati ugualmente affidabili.

Il metodo bootstrap e l’affidabilità degli alberi Ovviamente, quando si utilizzano i metodi basati sulla parsimonia gli allineamenti di sequenze più lunghe richiedono un tempo di elaborazione maggiore rispetto a sequenze più brevi. Inoltre, data la relazione tra il numero di taxa e il numero di alberi non radicati corrispondente illustrata nella Tabella 23.4, l’aggiunta di più sequenze ha un effetto imponente sul tempo richiesto per trovare l’albero migliore. Quando un insieme di dati comprende 30 o più specie, il numero di alberi possibili è così grande che non è semplicemente possibile esaminarli tutti e stabilire l’adattamento dei dati per ciascuno di essi, anche usando i computer più veloci. In questo caso, nessun

metodo di ricostruzione filogenetica garantisce di fornire l’albero corretto. Sono state suggerite numerose varianti per ciascun approccio e sono state condotte numerose simulazioni per confrontare l’affidabilità statistica di quasi tutti i metodi di ricostruzione degli alberi. I risultati di queste simulazioni si riassumono semplicemente con la considerazione che quei dati che consentono a uno dei metodi di dedurre le relazioni filogenetiche corrette funzionano generalmente altrettanto bene con tutti i metodi diffusi attualmente. Se invece nei dati usati per le simulazioni si sono verificate molte sostituzioni, o si assumono tassi evolutivi molto variabili tra le diverse linee, allora nessuno dei metodi risulta granché affidabile. Come regola generale, se i dati forniscono alberi simili quando vengono analizzati con due o tre diversi metodi di ricostruzione filogenetica, allora possono essere considerati affidabili. È anche possibile determinare delle parti degli alberi stimati con gradi di confidenza variabili. Le procedure bootstrap consentono la quantificazione grossolana di tali valori di confidenza modificando in modo casuale il peso di ciascun sito. L’approccio di base della procedura bootstrap è molto semplice: dai dati originali si costruisce un nuovo gruppo di dati fittizio mediante campionamento (con sostituzione) dei dati originali e questo nuovo gruppo di dati viene usato per stimare l’albero. Per fare un esempio concreto, è come se si stampasse su carta un allineamento multiplo e quindi si ritagliassero le colonne corrispondenti alle singole posizioni e si mescolassero: ogni posizione singola verrebbe poi ricostruita estraendo a caso una delle strisce di carta, copiandola e poi ributtandola nel mucchio. Il procedimento deve essere ripetuto finché non si ottiene un insieme di dati artificiali di lunghezza uguale a quella dell’allineamento originale. Si ripete l’intero processo per generare centinaia o migliaia di dati ricampionati, e quelle regioni dell’albero stimato che presentano lo stesso tipo di ramificazione nella maggior parte degli alberi fittizi così costruiti sono quelle che risultano particolarmente “robuste” rispetto all’intero insieme dei dati originali. Spesso, accanto ai nodi dell’albero filogenetico, vengono posti i valori numerici corrispondenti alla frazione di alberi bootstrap che forniscono lo stesso raggruppamento, per indicare il livello di confidenza attribuito a ogni regione dell’albero. La tecnica bootstrap si è diffusa molto nelle analisi filogenetiche, anche se l’uso di tecniche particolari di ricostruzione la può rendere molto dispendiosa in termini di tempo. Nonostante l’utilizzo spesso disinvolto che se ne fa nella letteratura scientifica, i risultati della procedura bootstrap andrebbero trattati con cautela. In primo luogo, i risultati basati su meno di diverse centinaia di iterazioni (cicli di ricampionamento e generazione di alberi) non sono molto affidabili, specialmente se sono coinvolte molte sequenze. Test di simulazione hanno dimo-

Evoluzione molecolare

strato inoltre che le procedure bootstrap tendono a sottostimare i valori di confidenza elevati e a sovrastimare quelli più bassi. Infine, dato che molti alberi possiedono un numero molto elevato di rami, esiste spesso il rischio significativo di incappare in un “errore da test multiplo”, in quanto alcuni risultati potrebbero sembrare statisticamente significativi solo per effetto del caso, poiché si stanno considerando così tanti raggruppamenti. Comunque, alcuni studi hanno suggerito che le soluzioni comunemente usate per risolvere questi possibili problemi forniscano alberi che risultano essere rappresentazioni del vero albero filogenetico molto più fedeli del singolo albero ottenuto con l’approccio della massima parsimonia.

per le forme di vita l’esistenza di altre classi principali, nei termini dei cinque regni (procarioti, protisti, piante, funghi e animali) proposti nel 1959 da R.H. Whittaker. L’albero della vita A metà degli anni ottanta del secolo scorso, le sequenze di DNA e RNA furono utilizzate per scoprire le linee guida della storia evolutiva di tutti gli organismi. In uno di questi studi, Carl Woese, Norm Pace e i loro collaboratori costruirono un albero evolutivo della vita sulla Terra basato sulle sequenze nucleotidiche dell’rRNA 16S, che tutti gli organismi possiedono, così come i mitocondri e i cloroplasti. Come mostrato nella Figura 23.6, nel loro albero si distinguevano tre gruppi evolutivi principali: i batteri (i procarioti tradizionali insieme ai mitocondri e ai cloroplasti degli eucarioti), gli Archaea (per lo più procarioti estremofili, compresi molti organismi poco noti) e gli eucarioti. I batteri e gli Archaea, nonostante entrambi possano essere definiti procarioti per l’assenza di membrane interne, si sono rivelati geneticamente diversi tanto quanto lo sono i batteri e gli eucarioti. Le profonde differenze evolutive che separano i batteri dagli Archaea non erano evidenti sulla base del fenotipo, e i reperti fossili non aiutavano a risolvere il problema. Queste analisi molecolari sostenevano l’idea dell’esistenza di tre domini evolutivi principali (i batteri, gli Archaea e gli eucarioti) tra gli organismi. Intesi originariamente come una sostituzione dei regni, i domini sono ora considerati un livello superiore di organizzazione, all’interno dei quali gli eucarioti sono divisi in quattro diversi regni (protisti, funghi, piante e animali). Queste classificazioni filogenetiche moleco-

Gli alberi filogenetici su grande scala

Rad

Aq u

ife x

ice

Me tha no ba cocc us ss at em pe ra tur am ar ina

ARCHAEA

s

s inu pr Co

Ho

mo Zea Cryptomonas a Achly ria ta s Co

0,1 sostituzioni/sito

Gia

rdi

ho

m

on

as

or rim a

ph

on ozo

lit ha

cep

i Va

En

m a aru nosom ys Ph Trypa na Eugle leria

EUCARIOTI

a

Tr ic

Naeg

Po rp h Para mec yra ium Babesia Dictyostelium Entamoeba

BATTERI

ma las lobus op g rm haeo e Th Arc Haloferax Me b than pS G assa t ospirillu m em per Py Su L 12 p. 1 atu ba ro lfolo r a s ma di sa rina ct bus tem iu Gp. m pe 1 ra tur a

u te ro op m er ilum Th rmof e Th

ch oc oc lam ydi cus a Chloro bium Leptonema Clostridium Bacillums riu r bacte cte Helio throba r A us us a lex rm tog rof The mo o l er Ch Th Ch

Figura 23.6 Un albero evolutivo della vita sulla Terra ottenuto dal confronto delle sequenze dell’rRNA 16S.

Therm o co cc us Methanobacterium mus Methanother opyrus Methan

rio mitocondyclus doc richia ibrio Rho v che fo o Es esul last D rop clo

ne

Agrobacterium Flex Planctomyc ibac es Fla ter vob act eriu m

Uno dei casi più eclatanti in cui i dati di sequenza ci hanno fornito nuove informazioni circa le relazioni evolutive è quello delle categorie principali alle quali appartengono tutte le forme di vita. Alla fine dell’Ottocento, i biologi dividevano tutte le forme di vita in tre gruppi principali: le piante, gli animali e i protisti (una sorta di categoria polivalente per tutto ciò che non entrava nelle altre due categorie di eucarioti). Man mano che venivano scoperti nuovi organismi e che le loro caratteristiche venivano studiate sempre più nel dettaglio, questa semplice divisione in tre gruppi divenne impraticabile. Successivamente si riconobbe che, sulla base della loro struttura cellulare, gli organismi potevano essere divisi in procarioti ed eucarioti. È stata in seguito riconosciuta

Sy

619

620

Capitolo 23

Box 23.1 La teoria dell’endosimbionte L’albero della vita mostrato nella Figura 23.6 suggerisce che le differenze tra batteri, eucarioti e Archaea derivino dall’evoluzione indipendente che ha avuto luogo ben prima che le linee evolutive di piante e animali divergessero a loro volta (almeno 1,5 miliardi di anni fa). Questo tipo di analisi ha anche fatto luce sul problema a lungo dibattuto di come l’organizzazione in compartimenti delle cellule eucariote si sia potuta evolvere a partire dalla situazione estremamente più semplice che troviamo ancora oggi nei procarioti. L’indizio più importante per una risposta soddisfacente risiede nel fatto che il DNA ribosomale 16S nucleare, mitocondriale e dei cloroplasti si stava già evolvendo in modo indipendente ancora prima che apparissero i primi eucarioti. Infatti, oggi il parente vivente più stretto dei mitocondri sembra effettivamente essere il batterio Rickettsia prowazekii, l’agente del tifo epidemico. La deduzione logica è che i mitocondri e i cloroplasti fossero degli organismi indipendenti che in un qualche momento del passato sono stati incorporati da un organismo simil-procariote. L’arrangiamento endosimbiotico (dove endo significa “interno” e simbiotico si riferisce alla “relazione cooperativa tra due o più organismi”) risultante divenne in seguito l’organismo eucariote come lo conosciamo oggi. In altri termini, la fusione di almeno due o tre linee evolutive diede origine a nuove forme di vita significativamente diverse. La teoria dell’endosimbionte fu suggerita in origine da un fisiologo-ecologo pioniere, A. Schimper, nei primi anni ottanta dell’Ottocento e fu sostenuta da G. Mereschovsky nei primi del Novecento, sulla base

lari hanno portato a molte altre rivelazioni sorprendenti, come l’osservazione che i geni degli organelli eucarioti, come i mitocondri e i cloroplasti, originano separatamente e in modo indipendente dalle loro controparti nucleari (Box 23.1). Le origini dell’uomo Un altro campo nel quale si utilizzano le sequenze di DNA è lo studio delle origini dell’uomo moderno e della diversificazione delle attuali popolazioni umane. In contrasto con l’ampia variabilità fenotipica osservata nelle dimensioni, nella struttura corporea, nei tratti somatici e nel colore della pelle, le differenze genetiche tra le popolazioni umane sono sorprendentemente piccole. Per esempio, l’analisi delle sequenze dell’mtDNA mostra che la differenza media tra le sequenze di due popolazioni umane è circa dello 0,33%. Altri primati presentano differenze molto maggiori. Per esempio, le due sottospecie di orangutan possiedono sequenze di mtDNA che differiscono del 5%.

dell’osservazione microscopica delle piante e dei loro plastidi, che Mereschovsky descrisse come “piccoli schiavi verdi”. Analisi molecolari più recenti, specialmente quelle di Lynn Margulis, hanno portato all’accettazione generale di questo modello circa l’origine degli organelli eucarioti. La filogenesi basata sull’rRNA 16S è stata suffragata da numerose altre somiglianze tra batteri, mitocondri e cloroplasti: per esempio, tutti gli organismi (compresi i mitocondri e i cloroplasti) presenti nel ramo batterico dell’albero della vita (vedi Figura 23.6), possiedono cromosomi circolari, arrangiamenti genomici e processi di replicazione simili, dimensioni confrontabili e sensibilità ai farmaci paragonabile, tutte caratteristiche che li distinguono da quelle associate al nucleo delle cellule eucariote. I mitocondri e i cloroplasti condividono queste caratteristiche. Con il passare del tempo, gli endosimbionti delle cellule eucariote sono diventati estremamente specializzati: il nucleo (un probabile endosimbionte delle stesse cellule eucariote!) è diventato il sito deputato all’immagazzinamento dell’informazione ereditabile, i mitocondri il sito primario per la fosforilazione ossidativa e i cloroplasti il sito in cui si svolge la fotosintesi. Molti dei geni necessari per le funzioni degli organelli sono oggi presenti nel nucleo (evento in accordo anche con l’osservazione di come i geni del genoma mitocondriale tendano ad avere tassi di sostituzione più elevati), e la relazione tra gli organelli e le cellule ospiti è diventata obbligata e sempre più elaborata, al punto che nessuno dei compartimenti risulta in grado di vivere in modo indipendente dagli altri.

L’elevato grado di similarità genetica indica che tutti i gruppi umani sono strettamente imparentati a gruppi di altri primati. Un’altra osservazione sorprendente nasce dall’analisi accurata delle differenze genetiche che esistono tra diversi gruppi umani: le differenze maggiori non si trovano tra popolazioni di continenti diversi, ma tra le popolazioni umane residenti in Africa. Infatti, tutte le popolazioni umane originatesi al di fuori dell’Africa rappresentano soltanto un sottogruppo della diversità genetica osservata tra le popolazioni africane. Molti esperti interpretano questo dato a sostegno dell’ipotesi che l’uomo abbia avuto origine in Africa e lì sia andato incontro alle prime divergenze evolutive. Secondo questa teoria – chiamata teoria out of Africa – piccoli gruppi di uomini migrarono dall’Africa e diedero origine a tutte le altre popolazioni umane solo dopo che in Africa si era evoluto un certo numero di popolazioni geneticamente distinte. I dati di sequenza del DNA mitocondriale e del cromosoma Y (il cromosoma sessuale

Evoluzione molecolare

maschile) concordano con questa teoria, suggerendo che tutte le persone attualmente viventi possiedano mitocondri derivati da un’“Eva mitocondriale” e che tutti gli uomini possiedano un cromosoma Y derivato circa 200 000 anni fa da quello di un “cromosoma Y Adamo”. Nonostante la teoria out of Africa non sia universalmente accettata, i dati di sequenza del DNA indicano che l’Africa ha svolto un ruolo chiave nell’origine e nelle migrazioni degli uomini moderni nel mondo.

Attività MyLab

Nella iAttività Were Neanderthals Our Ancestors? (Gli uomini di Neandertal sono i nostri antenati?) del sito dedicato agli studenti vi unirete a un gruppo di genetisti molecolari e di antropologi che hanno sviluppato una tecnica per l’estrazione e l’analisi del DNA antico da fossili di Neandertal.

Le origini del cane L’evoluzione del “migliore amico dell’uomo” è stata recentemente studiata in modo simile mediante uno sforzo congiunto di ricostruzione filogenetica e genomica comparativa. Nei secoli passati, la selezione artificiale (incroci selettivi) ha prodotto centinaia di razze canine con un’ampia varietà di tratti fisici e comportamentali. Il tasso di inincrocio associato alla generazione di queste razze ha originato una serie di problemi tipici di alcune delle razze selezionate, quali la narcolessia, l’artrite e varie forme tumorali che colpiscono anche l’uomo. Il confronto di razze strettamente imparentate che differiscono per la loro suscettibilità alle malattie consente di rintracciare i geni responsabili di molte malattie nel cane e i loro omologhi nell’uomo. Nell’ambito di questi tentativi di individuazione di genimalattia, nel 2004 un gruppo di ricercatori guidato da Elaine Ostrander ha analizzato la variabilità genetica associata ad almeno 100 marcatori microsatelliti in 85 diverse razze canine. Essi scoprirono che le razze canine rappresentano vere e proprie entità distinte a livello genetico (per esempio, un cane San Bernardo è più strettamente legato agli altri San Bernardo di quanto non lo sia a qualunque cane di un’altra razza). Gli alberi filogenetici costruiti dai ricercatori sulla base dei dati molecolari hanno anche dimostrato che tutte le razze sono raggruppate in sole quattro categorie differenti. Il cluster più antico (ovvero il più distante geneticamente) comprendente l’husky siberiano, il chow-chow e lo shar pei, mostra la maggiore similarità con il DNA del lupo e può essere fatto risalire ad antenati che vivevano in Asia e in Africa. Tentativi successivi condotti in Europa sembrano essere stati responsabili della produzione di razze specializzate per la guardia (tra le quali il bulldog, il rottweiler e il pastore tedesco), per la caccia (tra le quali il golden retriever, il segugio e il beagle) e per la pa-

621

storizia (tra le quali il collie, vari pastori e il San Bernardo). Studi simili hanno rivelato anche dati interessanti associati alla storia evolutiva dell’uva per la produzione di vino, dei maiali e delle mucche per uso domestico e di importanti colture di cereali.

L’acquisizione e l’origine di nuove funzioni Una domanda di vecchia data e di profondo interesse per chi studia l’evoluzione molecolare riguarda le modalità con cui hanno origine geni con funzioni nuove. Già nel 1932 il genetista inglese J.B.S. Haldane suggerì che nuovi geni emergono da un processo di mutazione a carico di copie ridondanti di geni già esistenti. Anche se da allora sono stati descritti altri meccanismi come la trasposizione, cioè lo spostamento di una porzione di cromosoma da una localizzazione genomica a un’altra (vedi Capitolo 7), l’idea di Haldane funziona ancora molto bene per descrivere l’origine della maggior parte dei nuovi geni.

Famiglie multigeniche Negli eucarioti si trovano spesso copie di geni disposte in tandem, e tutte le copie possiedono sequenze identiche o molto simili. Queste famiglie multigeniche rappresentano gruppi di geni imparentati che si sono evoluti a partire da un gene ancestrale attraverso la duplicazione genica. La famiglia genica delle globine, che codifica per le proteine utilizzate per la formazione dell’emoglobina, la molecola trasportatrice di ossigeno nel sangue, rappresenta un classico esempio di famiglia multigenica (l’organizzazione e i profili di espressione di questa famiglia multigenica nell’uomo sono stati discussi nel Capitolo 19). Brevemente, la famiglia multigenica delle globine è composta da sette geni simil-α sul cromosoma 16 e da sei geni simil-β sul cromosoma 11. I geni per le globine si trovano anche in altri animali e geni globino-simili sono presenti anche nelle piante, il che suggerisce che questa famiglia genica risalga ad almeno 1,5 miliardi di anni fa. Quasi tutti i geni per le globine funzionali nelle specie animali hanno la stessa struttura generale, costituita da tre esoni separati da due introni. Tuttavia, il numero e l’ordine dei geni globinici variano tra le specie, come riportato nella Figura 23.7 per i geni simil-β. Poiché tutti i geni per le globine possiedono struttura e sequenza simili, sembra che il gene ancestrale della globina (forse molto simile al gene attuale della mioglobina) si sia duplicato e sia andato incontro a divergenza producendo un gene simil-α ancestrale e un gene simil-β ancestrale. Questi due geni sono poi andati incontro a duplicazioni ripetute e indipendenti, dando origine ai diversi geni simil-α e simil-β presenti attualmente nei vertebrati. Duplicazioni geniche

622

Capitolo 23 Figura 23.7 Organizzazione della famiglia dei geni delle globine di tipo simil-␤ in diverse specie di mammiferi.

Pseudo ε

γG γA

ψβ1

δ

β

Uomo Pseudo ψβh1 ψβh2 βh3 y βh0

β1

β2

βA

εV

Topo Pseudo β4

β3

ψβ2

β1

Coniglio Pseudo

Pseudo εI

εII ψβX

εIII

εIV

ψβZ βA

Capra Pseudo = pseudogene

ripetute, come quelle che hanno dato origine alla famiglia genica delle globine, sembrano un evento evolutivo frequente. In effetti, il numero di copie dei geni per le globine è variabile anche all’interno di alcune popolazioni umane. Per esempio, la maggior parte degli individui possiede due geni per l’α-globina sul cromosoma 16; tuttavia alcuni individui hanno un unico gene per l’α-globina, mentre altri possiedono tre o anche quattro copie del gene sul cromosoma 16. Queste osservazioni suggeriscono che le duplicazioni e le delezioni dei geni nelle famiglie multigeniche siano parte di un processo dinamico che continua ancora. Le duplicazioni e le delezioni geniche nei cluster genici spesso sono il risultato di un allineamento errato delle sequenze durante il crossing-over tra i cromosomi omologhi (crossing-over ineguale, vedi Capitolo 16). Le duplicazioni possono anche aver luogo quando i fenomeni riproduttivi in una popolazione introducono un cromosoma recante un segmento trasposto da un secondo cromosoma in un genoma nel quale il secondo cromosoma citato è intatto. Il movimento dei trasposoni (vedi Capitolo 7) può determinare un’ampia dispersione di sequenze copiate.

Duplicazione e conversione genica Dopo la duplicazione genica, una delle copie separate del gene può andare incontro a cambiamenti della sequenza come se fosse libera da vincoli funzionali, almeno finché l’altra copia continua a svolgere la propria funzione. Come già discusso in questo capitolo, la maggior parte dei cambiamenti che avvengono nella copia dovrebbe essere svantaggiosa dal punto di vista evolutivo o addirittura portare alla generazione di uno pseudogene non funzionale. In rari casi, tuttavia, i cambiamenti possono portare a piccole alterazioni della funzione o del profilo di espressione che risultano vantaggiose per l’organismo e si affermano quindi nella popolazione. Si pensa che i geni delle globine dei mammiferi si siano originati proprio in questo modo (vedi Figura 23.7), cioè dalla mutazione di un gene attivo duplicato. Questo approccio “manipolativo” all’evoluzione diventa anco-

ra più evidente nel caso in cui, durante eventi di ricombinazione successivi, avvengano degli allineamenti errati tra le copie pseudogeniche e la copia funzionale che portano alla correzione delle mutazioni inattivanti per opera della conversione genica. La conversione genica è il processo meiotico di ricombinazione genetica in cui la sequenza di DNA di un allele su uno dei due omologhi viene copiata e sostituisce la sequenza di DNA dell’allele sull’altro omologo. A differenza della ricombinazione genetica standard, che comporta uno scambio reciproco di informazione genetica, la conversione genica è un processo non reciproco. Perciò, dato l’allele A su un omologo, la conversione genica può portare alla sostituzione dell’allele a sull’altro omologo, facendo sì che su entrambi gli omologhi sia presente l’allele A. Gli eventi di conversione genica possono fornire a un organismo diverse possibilità di creare un gene con nuove funzioni a partire dalla duplicazione di un gene già funzionante. Come la duplicazione genica, anche la conversione genica continua a operare tuttora, nonostante di solito risulti più evidente quando vengono “corrette” le sostituzioni utili di una copia di un gene. Per esempio, i due geni vicini sul cromosoma X che consentono alla maggior parte degli individui di distinguere il rosso dal verde sono identici a livello nucleotidico per il 98%, e la maggior parte degli eventi spontanei di cecità al verde è il risultato di conversione genica tra i due geni. Circa l’8% degli individui di sesso maschile è cieco ai colori come conseguenza di questo tipo di evento di conversione genica.

Nota chiave Sembra che gli eventi di duplicazione genica siano stati frequenti nella storia evolutiva di tutti gli organismi. Le copie dei geni forniscono il materiale grezzo per l’evoluzione, nel senso che sono libere di accumulare mutazioni che talvolta possono dare origine a proteine con funzioni nuove e vantaggiose.

Evoluzione molecolare

Il genoma di Arabidopsis Con il concludersi di un numero crescente di progetti di sequenziamento genomico, diventa sempre più chiaro quanto gli organismi utilizzino la duplicazione genica per produrre proteine con nuove funzioni. Per esempio, con un genoma di soli 125 milioni di nucleotidi circa, Arabidopsis thaliana (arabide comune) è stata la prima pianta della quale sia stato interamente sequenziato il genoma (vedi Capitolo 8). Il suo tempo di generazione breve e le piccole dimensioni la rendono uno degli organismi preferiti dai genetisti vegetali, ma essa ha costituito una scelta particolarmente interessante come oggetto di sequenziamento poiché vi erano evidenze che il suo genoma fosse andato incontro a molte meno duplicazioni rispetto ad altre piante più importanti dal punto di vista commerciale. Tuttavia, quando il sequenziamento venne completato alla fine del 2000, si scoprì che più della metà dei 25 900 geni di Arabidopsis era duplicata. Il rimescolamento dei domini (esoni) Occorre notare che l’aumento del numero di copie di una sequenza di DNA può anche avvenire a carico di segmenti genomici più piccoli di geni completi. Sono disponibili numerosi esempi di geni contenenti duplicazioni interne di uno o più domini proteici, come il gene umano dell’albumina sierica, che è composto quasi interamente da tre copie perfette di un dominio di 195 amminoacidi. Tuttavia l’allungamento di un gene mediante la duplicazione interna di domini funzionali non è in grado di portare velocemente a nuove proteine con funzioni significativamente diverse. La maggior parte delle proteine complesse è un

623

assemblaggio di diversi domini proteici che svolgono varie funzioni, come un sito di legame per un substrato o una regione transmembrana. Forse non è una semplice coincidenza che l’inizio e la fine degli esoni corrispondano all’inizio e alla fine dei domini funzionali delle proteine complesse. Nel 1978 Walter Gilbert propose che i geni primordiali possedessero un numero limitato di domini proteici e che la maggior parte, se non tutte, delle famiglie geniche utilizzate oggi dagli esseri viventi derivi dal rimescolamento dei domini, ovvero dalla duplicazione e dal riarrangiamento di quei domini (di solito codificati da singoli esoni) in combinazioni diverse. Il rimescolamento dei domini (o degli esoni) è una teoria controversa che presuppone che gli introni fossero già una caratteristica dei primi organismi terrestri, anche se attualmente sono presenti esclusivamente negli eucarioti e non nei più semplici domini di batteri e Archaea. Tuttavia, sono noti numerosi esempi suggestivi di geni complessi formati da porzioni e frammenti di altri geni e sembra chiaro che perlomeno alcuni geni con nuove funzioni abbiano avuto origine in questo modo.

Nota chiave Le duplicazioni interne ai geni non sono rare e molti esoni corrispondono a domini funzionali discreti delle proteine. Alcuni geni con funzioni nuove sembrano essersi formati per un processo di rimescolamento dei domini (ovvero degli esoni) mediante il quale regioni intra- e intergeniche vengono ricombinate in nuove forme.

Sommario l La teoria matematica sviluppata dai genetisti di popolazioni viene applicata a lunghi periodi di tempo nello studio dell’evoluzione molecolare. Essa fornisce informazioni su quali siano le regioni funzionalmente importanti dei geni, sulle relazioni evolutive tra gruppi diversi di organismi e sui meccanismi mediante i quali hanno origine geni con funzioni nuove. l Le mutazioni sono eventi rari e la selezione naturale tende a eliminare dal pool genico quelle che modificano le sequenze degli amminoacidi. l I tassi evolutivi sono molto variabili nei e tra i geni. Le porzioni del genoma che sembrano evolversi più velocemente sono quelle con il minor effetto sulla fitness e molti geni accumulano sostituzioni con un tasso costante per lunghi periodi di tempo evolutivo. Tuttavia, non è ragionevole assumere che tutte le linee evolutive di un albero genico (un albero raffigurante le relazioni di un singolo gene intra- e interspecie) accumulino sostituzioni con la stessa velocità.

l Gli allineamenti di sequenze possono essere utilizzati anche come punto di partenza per la ricostruzione filogenetica di gruppi di organismi molto diversi. Si può utilizzare un piccolo numero di approcci fondamentalmente diversi (i metodi basati sulle matrici di distanza, quelli basati sulla parsimonia e quelli di massima verosimiglianza/approcci bayesiani) per generare alberi filogenetici che hanno fornito nuove conoscenze sui rami più interni dell’albero della vita. l Negli organismi eucarioti i geni si presentano frequentemente in copie multiple con sequenze identiche o molto simili. Un insieme di geni di questo tipo è chiamato famiglia multigenica. Le duplicazioni geniche, in tutto o in parte, sono il materiale grezzo principale dal quale hanno origine proteine con funzioni nuove. l I domini funzionali di molte proteine corrispondono a regioni codificate da singoli esoni. Molti geni sembrano essere derivati dall’unione e dall’abbinamento di domini funzionali di questo tipo di proteine, già dotate di una loro funzione, attraverso il rimescolamento degli esoni.

624

Capitolo 23

Approccio analitico alla soluzione di problemi di genetica D23.1 Considerate il seguente allineamento multiplo di cinque sequenze ipoteticamente omologhe. Costruite una matrice di distanza che descriva le relazioni tra tutte le possibili coppie di sequenze. Utilizzate il metodo UPGMA per costruire un albero che descriva graficamente le relazioni tra queste sequenze.

A: B: C: D: E:

10 GCCAACGTCC GCCAACGTCC GGCAACGTCC GCTAACGTCC GCTGGTGTCC

20 ATACCACGTT ATACCACGTT ATACCACGTT ATATCACGCT ATATCACGTT

A: B: C: D: E:

40 GGTTCTCGTC GGTTCTCGTC GGTTCTCGTC GGTCCTCGTC GGTACTCGTC

50 CGATCACCGA CGATCACCGA AGGTCACCGA AGATCCCCAA CGATCACCGA

30 GTTTAGCACC GTCAAACACC GTTATACACC GTCATGTACC ATCATGTACC

A 3 6 11 11

B – 5 10 10

C – – 11 13

AB 5,5 10,5 10,5

C – 11 13

D – – 9

La distanza minore nella nuova matrice è quella tra (AB) e C, pertanto si crea un nuovo taxon composto (AB)C. A partire dal nuovo taxon si crea un’altra matrice: Taxa (AB)C D 10,75 E 11,75

D – 9

In quest’ultima matrice, la distanza minore si riscontra tra D ed E (dDE = 9), che sono pertanto raggruppati come (DE). Un modo per rappresentare simbolicamente il raggruppamento definitivo dei taxa è ((AB)C)(DE). In alternativa si può utilizzare un albero come il seguente:

R23.1 Una matrice di distanza si costruisce stabilendo il numero di differenze osservate in tutti i possibili confronti tra coppie di sequenze. Per esempio, il numero di differenze tra le sequenze A e B (dAB) è 3. La matrice completa delle distanze è: Taxa B C D E

Taxa C D E

D – – – 9

La distanza minore tra tutte le sequenze nell’allineamento multiplo corrisponde proprio a dAB, pertanto i taxa A e B sono raggruppati insieme. A questo punto si costruisce una nuova matrice di distanza nella quale il gruppo composto (AB) prende il posto di A e B. Le distanze tra il nuovo gruppo e i taxa rimanenti vengono determinate prendendo la distanza media tra i suoi due membri (A e B) e tutti gli altri taxa rimanenti [cioè, d(AB)C = 1/2(dAC + dBC), quindi d(AB)C = 1/2 (6 + 5) = 5,5], con la matrice che segue come risultato:

A

B C D

E

D23.2 Considerando le stesse cinque sequenze della Domanda 23.1, quali posizioni dell’allineamento corrispondono a siti informativi per le analisi basate su criteri di parsimonia? R23.2 Le posizioni che rappresentano siti informativi per le analisi basate su criteri di parsimonia sono: 3, 14, 23, 25, 26, 27 e 41. Si tratta delle sole posizioni che presentano almeno due nucleotidi diversi, ciascuno dei quali è presente almeno due volte.

Glossario

A aberrazione cromosomica (o alterazioni strutturali dei cromosomi) Vedi mutazione cromosomica. accoppiamento (coupling) In individui eterozigoti per due loci genici, la disposizione per cui i due alleli selvatici di entrambi i geni sono su un cromosoma omologo e i due alleli mutanti recessivi sono sull’altro. Anche detto configurazione in cis. acido desossiribonucleico Vedi DNA. acido nucleico Polinucleotide ad alto peso molecolare. I principali acidi nucleici nella cellula sono il DNA e l’RNA. acido ribonucleico (RNA) Polimero di ribonucleotidi solitamente a singolo filamento. I principali tipi di RNA delle cellule sono l’RNA ribosomale (rRNA), l’RNA di trasporto (tRNA), l’RNA messaggero (mRNA), i piccoli RNA nucleari (snRNA) e i micro RNA (miRNA), ciascuno dei quali svolge un ruolo essenziale nella sintesi proteica (traduzione). In alcuni virus l’RNA rappresenta il materiale genetico. adenina (A) Base purinica presente nel DNA e nell’RNA; nel DNA a doppia elica, l’adenina si appaia con la timina, una pirimidina, tramite legami idrogeno. Nell’RNA a doppia elica, l’adenina si appaia con l’uracile, una pirimidina, tramite legami idrogeno. agente intercalante Un mutageno chimico che può inserirsi tra due nucleotidi adiacenti nell’elica di DNA. agente modificatore delle basi Un mutageno chimico che modifica la struttura chimica di una o più basi normalmente presenti nel DNA. Agenti modificatori sono l’ossido nitroso, l’idrossilammina e il metilmetan sulfonato. albero delle specie Un albero filogenetico che rappresenta la storia evolutiva di un gruppo di specie, generalmente ottenuto dall’analisi di molti geni. Un albero delle specie è migliore di un albero basato su un singolo gene per analizzare la storia evolutiva di un gruppo di specie. albero filogenetico La rappresentazione grafica dei rapporti evolutivi tra un gruppo di specie o di geni. Consiste di braccia (linee) che connettono nodi, che rappresentano organismi ancestrali o estinti. Vedi anche massima parsimonia.

albero genico Un albero filogenetico basato sulle divergenze osservate in un singolo gene. Gli alberi genici non sono sempre una buona rappresentazione delle relazioni tra specie, perché i polimorfismi in un gene possono prodursi prima degli eventi di speciazione. Vedi anche albero delle specie. albero rooted Un albero filogenetico dove uno dei nodi rappresenta l’antenato comune a tutti gli altri nodi dell’albero. albero stimato Albero filogenetico generato grazie ai dati molecolari ottenuti da organismi reali. allele Una di due o più forme alternative di un singolo locus genico. Tutti gli alleli di un gene determinano lo stesso carattere ereditario (per esempio, il colore del seme), ma ciascuno ha una sequenza nucleotidica unica, che può determinare fenotipi diversi (per esempio, seme giallo o seme verde). Vedi anche polimorfismo del DNA. allele additivo (o funzionale) Allele che contribuisce al fenotipo di un carattere quantitativo. allele dominante letale Allele che manifesta un fenotipo letale quando è presente sia allo stato omozigote sia allo stato eterozigote. allele letale Allele che provoca la morte di un organismo. allele letale recessivo Un allele che allo stato di omozigosi causa letalità. allele mutante (o mutato) Ogni forma alternativa rispetto all’allele selvatico di un gene. Gli alleli mutanti possono essere dominanti o recessivi rispetto agli alleli selvatici. allele selvatico Quell’allele designato come standard (“normale”) per un ceppo o organismo. alleli multipli Forme alternative di un singolo gene. Sebbene in una popolazione possano essere presenti alleli multipli di un gene particolare, un singolo individuo diploide può presentare un massimo di soli due alleli per locus. alleli non funzionali Alleli che non hanno alcun effetto sul fenotipo di un carattere quantitativo. allelomorfo Vedi allele. allineamento ottimale Nella comparazione di sequenze nucleotidiche o amminoacidiche di uno o più organismi, l’approssimazione al vero allineamento dopo

626

Glossario

che nelle sequenze sono state inserite delle interruzioni per massimizzare i loro livelli di similarità. Vedi anche indel. allopoliploidia Condizione nella quale una cellula o un organismo hanno due o più assetti di cromosomi che si originano di solito da specie diverse, anche se spesso correlate. alternanza di generazioni Ciclo vitale caratteristico delle piante nel quale cellule aploidi (gametofiti) si alternano a cellule diploidi (sporofiti). amminoacidi Piccole molecole che contengono un gruppo carbossilico e uno amminico, uniti tra loro a formare i polipeptidi e le proteine. amminoacil-tRNA Molecola di tRNA covalentemente legata a un amminoacido; detto anche tRNA carico. Questo complesso porta l’amminoacido sul ribosoma in modo che possa essere usato per la sintesi del polipeptide. amminoacil-tRNA sintetasi Enzima che catalizza la reazione di legame di uno specifico amminoacido a una molecola di tRNA. amniocentesi Procedura in cui un campione di liquido è prelevato dal sacco amniotico di un feto e le cellule presenti nel liquido vengono coltivate e analizzate per anomalie cromosomiche. AMP ciclico (cAMP) Adenosina 3′, 5′-monofosfato; una molecola intracellulare con attività regolativa coinvolta nel controllo dell’espressione genica e in altri processi nei procarioti e negli eucarioti. anafase Stadio della mitosi durante il quale i cromatidi fratelli si separano e migrano ai poli opposti della cellula. anafase I Lo stadio della I divisione meiotica nel quale i cromosomi di ogni tetrade si separano e migrano ai poli opposti della cellula. anafase II Lo stadio della II divisione meiotica durante il quale i cromatidi fratelli vengono attirati ai poli opposti del fuso. analisi dei villi coriali Procedura per cui un campione di tessuto dei villi coriali di un feto è raccolto ed esaminato per anomalie cromosomiche. analisi del pedigree Studio di un albero genetico familiare che richiede l’accurata ricostruzione dei dati fenotipici di una famiglia per un certo numero di generazioni. analisi della varianza (ANOVA) Serie di procedure statistiche per determinare se le differenze fra medie di una variabile in due campioni sono significative e per suddividere la varianza in due componenti. analisi della vitalità di una popolazione Analisi delle probabilità di sopravvivenza dei diversi genotipi di una popolazione. analisi per trasferimento northern Tecnica per identificare specifiche molecole di RNA separate per elet-

troforesi, trasferite su filtro di nitrocellulosa e ibridizzate con sonde complementari; anche detta tecnica di analisi northern. Vedi anche tecnica di Southern blot. analogo di base Sostanza chimica con una struttura molecolare estremamente simile alle basi normalmente presenti nel DNA. Alcuni mutageni chimici, come il 5bromouracile (5BU), sono analoghi delle basi. aneuploide Si riferisce a un organismo o a una cellula che presentano un numero di cromosomi differente rispetto a un multiplo esatto del corredo cromosomico aploide. aneuploidia Condizione nella quale il numero dei cromosomi differisce dal multiplo esatto di un normale numero aploide in una cellula o in un organismo. Di solito deriva dalla perdita o dal guadagno di singoli cromosomi, ma può anche originarsi dalla duplicazione o delezione di parti di un cromosoma o di cromosomi. anticipazione genetica Fenomeno per cui una malattia genetica mostra un peggioramento del quadro clinico e un esordio più precoce da una generazione all’altra. anticodone Sequenza di tre nucleotidi che si appaia con un codone mediante appaiamento di basi complementari. anticorpo Molecola proteica che riconosce e si lega a una sostanza estranea introdotta nell’organismo. antigene Qualsiasi molecola che stimoli la produzione di anticorpi specifici o che si leghi specificamente a un anticorpo. antiparallelo Che mostra polarità opposta; nel caso della doppia elica di DNA significa che la polarità chimica di un’elica è opposta a quella dell’altra. aploide (N) Cellula o individuo con una sola copia di ciascun cromosoma nucleare. aplosufficiente Un gene che può manifestare un normale fenotipo selvatico anche se presente in singola copia (condizione di eterozigosi). Un gene aplosufficiente mostra dominanza completa negli incroci genetici. aplotipo Set di alleli polimorfici specifici in particolari loci contenenti SNP situati vicini in una regione cromosomica. apoptosi Processo cellulare controllato che porta alla morte cellulare innescato da un danno intracellulare (per esempio, lesioni al DNA) o da segnali extracellulari delle cellule vicine. Anche chiamato morte cellulare programmata. aporepressore Proteina repressore inattiva che viene attivata dal legame di una molecola effettore. approccio whole-genome shotgun per il sequenziamento del genoma Approccio di sequenziamento in cui l’intero genoma viene tagliato in frammenti parzialmente sovrapposti, ogni frammento viene clonato e sequenziato e la sequenza genomica viene assemblata da un computer a partire dalle sequenze sovrapposte.

Glossario

Archaea Procarioti che costituiscono uno dei tre domini evolutivi principali degli organismi. array di proteine Una collezione di diverse proteine, immobilizzate su un substrato solido, che serve da sonda per identificare proteine marcate che si leghino a quelle fissate sul substrato. Anche chiamato microarray proteici e chip di proteine. ARS (sequenze a replicazione autonoma) Specifiche sequenze nei cromosomi di lievito che, quando incluse come parte in una molecola di DNA circolare extracromosomico, le conferiscono la capacità di replicarsi autonomamente; un tipo di replicatore eucariote. assortimento indipendente Vedi principio dell’assortimento indipendente. attenuazione Meccanismo regolativo che controlla l’espressione di certi operoni batterici facendo sì che l’RNA polimerasi termini prematuramente la trascrizione. attivatori Classe principale di proteine regolatrici della trascrizione negli eucarioti. Il legame di queste proteine a sequenze regolatrici di DNA associate a specifici geni stabilisce l’efficienza dell’inizio della trascrizione. Alcuni geni batterici sono controllati da attivatori. Vedi anche repressori. auto-splicing L’escissione degli introni da alcuni prerRNA che avviene in alcuni organismi in maniera indipendente da una proteina. autofecondazione (selfing) Unione di gameti maschili e femminili provenienti dallo stesso individuo. autopoliploidia Condizione nella quale una cellula o un organismo hanno due o più assetti distinti di cromosomi della stessa specie. autosoma Cromosoma diverso da un cromosoma sessuale. auxotrofo Ceppo mutante di un organismo incapace di sintetizzare una molecola richiesta per la crescita; quindi la molecola deve essere fornita nel mezzo di crescita per permettere all’organismo di crescere. Chiamato anche mutante auxotrofo o nutrizionale. B Bacteria Procarioti che costituiscono uno dei tre domini evolutivi principali degli organismi. I membri di questo dominio sono chiamati batteri. banca di cDNA Collezione di cloni di DNA complementare (cDNA) prodotti dall’intera popolazione di mRNA della cellula. banca genomica Collezione di cloni che contiene almeno una copia di ogni sequenza di DNA di un genoma. banca cromosomica Collezione di cloni prodotti da frammenti di DNA derivati da un particolare cromosoma (per esempio, dal cromosoma X umano).

627

base Chiamata anche base azotata. Purina o pirimidina che rappresenta uno dei componenti di un nucleotide. batteriofagi Virus che attaccano i batteri. Anche detti fagi. bioinformatica Applicazione dell’informatica all’analisi di dati biologici e in particolare di sequenze nucleotidiche o proteiche. bivalente (o tetrade) Paio di cromosomi omologhi appaiati durante la profase della prima divisione meiotica, che consistono di quattro cromatidi. Vedi anche sinapsi. bolla di replicazione Una regione di DNA denaturato, legato alle forche di replicazione, dalle quali viene sintetizzato il DNA in direzioni opposte. breve RNA silenziatore Vedi siRNA. C campione Il sottoinsieme utilizzato per ricavare informazioni su una popolazione. Per poter dare informazioni accurate circa la popolazione dalla quale viene estratto, un campione deve essere sufficientemente grande e deve essere un sottoinsieme preso a caso di un gruppo più grande. cancro Patologia caratterizzata da divisione cellulare incontrollata e anomala e dalla diffusione delle cellule maligne (metastasi) in diversi siti dell’organismo. carattere continuo Vedi carattere quantitativo. carattere discontinuo Carattere ereditabile che mostra un piccolo numero di fenotipi distinguibili, che di solito sono determinati da un allele alternativo in un singolo locus genico. Vedi anche carattere quantitativo. carattere dominante associato al cromosoma X Carattere dovuto a un gene mutante dominante portato sul cromosoma X. carattere ereditario Caratteristica controllata geneticamente che viene trasmessa da una generazione all’altra. carattere familiare Carattere condiviso da membri della stessa famiglia, come risultato dei fattori genetici e/o ambientali condivisi. carattere legato al cromosoma Y Una caratteristica controllata da un gene localizzato sul cromosoma Y per il quale non esiste un corrispondente locus sul cromosoma X. Anche detto carattere olandrico. carattere legato al sesso Carattere controllato da un gene localizzato sul cromosoma X. carattere multifattoriale Carattere influenzato da più geni e da fattori ambientali. carattere olandrico Vedi carattere legato al cromosoma Y. carattere quantitativo Carattere che mostra una variazione fenotipica di tipo continuo.

628

Glossario

carattere recessivo associato al cromosoma X Carattere dovuto a un gene mutante recessivo portato sul cromosoma X. caratteri influenzati dal sesso Caratteri controllati da un autosoma, che si manifestano in modo diverso nei due sessi o per la frequenza o per la correlazione tra genotipo e fenotipo. caratteri limitati a un sesso Caratteri controllati geneticamente da un autosoma, che vengono esibiti a livello fenotipico da uno soltanto dei due sessi. carcinogeni Alcune sostanze naturali o artificiali, perlopiù agenti chimici, che aumentano la frequenza con cui la cellula diventa cancerosa. caricamento Aggiunta di un amminoacido a un tRNA che contiene un anticodone per quell’amminoacido. cariotipo Serie completa di tutte le coppie di cromatidi metafasici in una cellula. carrier (portatore) Un individuo che è eterozigote per una mutazione recessiva. Un portatore di solito non manifesta il fenotipo. cDNA Copie di DNA generate da templati di RNA in una reazione catalizzata dall’enzima trascrittasi inversa. cellula spermatica Gamete maschile maturo, prodotto dai testicoli di animali di sesso maschile. Chiamato anche spermatozoo. cellula staminale embrionale (ES) Cellula derivata da un embrione molto precoce che mantiene la capacità di differenziarsi nei tipi cellulari di ogni parte dell’organismo. centimorgan (cM) L’unità di distanza di una mappa genetica. Equivalente a unità di mappa. centromero Regione di un cromosoma contenente sequenze di DNA a cui si legano le fibre del fuso mitotico e meiotico. Al microscopio il centromero appare come una costrizione nel cromosoma. La regione centromerica di ogni cromosoma è responsabile dell’accurata segregazione dei cromosomi replicati nelle cellule figlie durante la mitosi e la meiosi. Vedi anche cinetocore. ceppo di linea pura Un ceppo nel quale gli individui della progenie hanno tutti lo stesso genotipo dei genitori. ceppo parentale Vedi generazione P. ceppo prototrofo Vedi prototrofo. checkpoint Stadio del ciclo cellulare nel quale la progressione di una cellula viene bloccata se vi è un danno nel genoma o nella mitosi. chi-quadrato (test del) Procedura statistica che determina se la differenza fra i risultati osservati e quelli attesi sulla base di una certa ipotesi è significativa; test di bontà dell’adattamento. chiasma Una struttura a croce che si forma durante il crossing-over ed è visibile durante lo stadio di diplonema della meiosi.

chinasi ciclina-dipendenti Un gruppo di proteine chinasi, attivate dal legame con specifiche cicline, che regolano la progressione del ciclo cellulare. chip a DNA Vedi microarray a DNA. cicline Un gruppo di proteine la cui concentrazione aumenta o diminuisce in modo regolare durante il ciclo cellulare. Le cicline agiscono in connessione con chinasi ciclina-dipendenti che regolano la progressione del ciclo. ciclo cellulare Processo ciclico di crescita e riproduzione cellulare in organismi eucarioti unicellulari e multicellulari. Il ciclo include la divisione nucleare, o mitosi, e la divisione cellulare, o citocinesi. ciclo lisogeno Uno dei due cicli di vita alternativi dei fagi temperati, in cui il genoma fagico è integrato nel cromosoma del batterio ospite e non vi è la formazione di progenie virale. ciclo litico Ciclo della vita del fago, in cui il fago prende il sopravvento sul batterio e indirizza la sua crescita e le sue attività riproduttive all’espressione dei propri geni e alla produzione di una progenie fagica. cinetocore Complesso multiproteico che si assembla sul centromero di un cromatidio e costituisce il sito di attacco ai microtubuli del fuso durante la mitosi. 5„ capping (incappucciamento al 5„) L’addizione di un nucleotide guanina metilato (un cappuccio) all’estremità 5′ di una molecola di RNA premessaggero; il cappuccio è conservato nella molecola di mRNA maturo. cis-dominante Si riferisce a un gene o a una sequenza di DNA in grado di controllare geni localizzati sulla stessa molecola di DNA ma non su altre. cis-trans (test di complementazione) Un test per determinare se due mutazioni diverse che conferiscono lo stesso fenotipo sono localizzate nello stesso gene o in geni diversi. citocinesi Divisione del citoplasma dopo la mitosi o la meiosi I e II, durante la quale i due nuovi nuclei si compartimentalizzano in due cellule figlie separate. citosina (C) Base pirimidinica che si trova nell’RNA e nel DNA. Nel DNA a doppia elica la citosina si appaia con la purina guanina. classe parentale Vedi genotipo parentale. cline La variazione sistematica delle frequenze alleliche in una popolazione distribuita su una regione geografica. clonazione (1) La produzione di molte copie identiche di una molecola di DNA per replicazione in un ospite adatto; anche detta clonazione del DNA, dei geni o molecolare. (2) La generazione di cellule o individui geneticamente identici a se stessi o ai loro genitori. clonazione molecolare Vedi clonazione.

Glossario

cloroplasti Organelli a tripla membrana, contenenti clorofilla, presenti nelle piante verdi e in cui avviene la fotosintesi. coattivatore Negli eucarioti, un grosso complesso multiproteico che interagisce con gli attivatori legati agli enhancer, con i fattori di trascrizione legati al promotore e con l’RNA polimerasi II. Queste interazioni aiutano a determinare l’efficienza della trascrizione dei geni regolati. codice genetico Gruppi di tre nucleotidi (codoni) che nell’mRNA portano l’informazione per una specifica sequenza di amminoacidi. codominanza Situazione in cui l’eterozigote mostra il fenotipo di entrambi gli omozigoti. codone Gruppo di tre nucleotidi adiacenti in una molecola di mRNA che specifica un amminoacido nel polipeptide o la terminazione della sintesi del polipeptide. codone di stop Vedi codone di terminazione. codone di terminazione Uno dei tre codoni per cui non vi è una normale molecola di tRNA con un appropriato codone e che indica la fine della traduzione della sintesi proteica. codone nonsenso Vedi codone di terminazione. coefficiente di coincidenza Numero che esprime la quantità di interferenza da chiasma in una mappa genetica; rapporto fra la frequenza dei doppi ricombinanti osservati e la frequenza di quelli attesi. Vedi anche interferenza. coefficiente di correlazione Parametro statistico che misura la forza dell’associazione fra due variabili. Vedi anche regressione. coefficiente di regressione Nell’analisi della regressione, la pendenza della retta di regressione che mostra la relazione tra due variabili. coefficiente di selezione (s) Misura dell’intensità relativa della selezione contro un dato genotipo; equivale a 1 – w (fitness darwiniana). compensazione di dose Meccanismo presente nei mammiferi che compensa per i cromosomi X in eccesso rispetto alla condizione normale. Vedi anche corpo di Barr. complesso di riconoscimento dell’origine (ORC) Complesso multisubunità che agisce come proteina di inizio negli eucarioti. complesso di rimodellamento del nucleosoma Grosso complesso multiproteico che utilizza l’energia rilasciata dall’idrolisi dell’ATP per alterare la posizione e la struttura dei nucleosomi, con conseguente rimodellamento della struttura della cromatina. complesso sinaptinemale Struttura complessa che comprende la regione tra i cromosomi appaiati alla meiosi e facilita l’evento di crossing-over.

629

concatenazione o associazione (linkage) Termine che definisce i geni localizzati sullo stesso cromosoma, che tendono a essere ereditati insieme. coniugazione Processo di trasferimento unidirezionale di informazione genetica mediante contatto diretto cellulare tra una cellula batterica donatrice (maschio) e una ricevente (femmina). consulenza genetica Valutazione del rischio che potenziali genitori possano mettere al mondo un figlio affetto da una malattia genetica e discussione con la coppia delle eventuali opzioni per eliminare o rendere minime le possibilità del rischio. Contig Una serie di sequenze di DNA contigue che si sovrappongono. Contig di sequenze Sequenza contigua di DNA ottenuta come intermedio nei progetti genomici. controllo della degradazione Regolazione della velocità di degradazione (turnover) delle molecole di RNA della cellula. conversione genica Il processo di ricombinazione non reciproca nella quale un allele in un eterozigote è cambiato nell’altro allele, convertendo il genotipo da eterozigote a omozigote. corepressore Grande complesso multiproteico presente negli eucarioti che interagisce con i repressori legati agli enhancer, con i fattori generali della trascrizione che si legano in prossimità del promotore, e con l’RNA polimerasi II. Tali interazioni aiutano a inibire la trascrizione dei geni regolati. corpo di Barr Un cromosoma X altamente condensato e inattivo che si trova nei nuclei delle cellule delle femmine normali, ma non nei nuclei delle cellule dei maschi normali. Vedi anche lyonizzazione. correlazione fenotipica L’associazione tra due o più caratteri quantitativi in certi individui. correlazione genetica Correlazione fenotipica tra cause genetiche, quali la pleiotropia e la concatenazione. correzione dell’RNA Un tipo inusuale di maturazione dell’RNA che prevede il cambiamento per inserzione o delezione di nucleotidi o la conversione di un nucleotide in un altro. correzione di bozze (proofreading) Durante la sintesi del DNA, il processo di riconoscimento degli errori di polimerizzazione e la loro correzione. La correzione di bozze è una proprietà della DNA polimerasi delle cellule procariote. cotrasduzione Simultanea trasduzione di due o più geni batterici; una buona indicazione che i geni sono strettamente associati. covarianza Parametro statistico usato per misurare la tendenza di due variabili a cambiare in maniera correlata; usato per calcolare il coefficiente di correlazione fra due variabili.

630

Glossario

cromatidi fratelli Due copie identiche di un cromatidio ottenute dalla sua replicazione durante l’interfase del ciclo cellulare. I cromatidi fratelli sono tenuti insieme dal centromero, replicato ma ancora non separato. cromatidio Una delle due unità longitudinali distinte e visibili di tutti i cromosomi replicati; diventa visibile fra l’inizio della profase e la metafase della mitosi ed è congiunto al cromatidio fratello a livello del centromero. cromatina Complesso di DNA associato a proteine, che negli eucarioti costituisce i cromosomi e può esistere in vari gradi di compattamento. cromosoma Nelle cellule eucariote, una struttura lineare costituita da una singola molecola di DNA complessata a proteine. Ogni specie eucariote ha un numero specifico di cromosomi nel nucleo delle sue cellule. La maggior parte delle cellule procariote contiene un singolo cromosoma, di solito circolare. cromosoma acrocentrico Cromosoma con il centromero vicino a un’estremità, cosicché ha un braccio lungo, uno stelo e un satellite. cromosoma artificiale di lievito (YAC) Un vettore usato per clonare nel lievito lunghi frammenti di DNA, anche di alcune centinaia di kilobasi. Lo YAC è un vettore lineare con un telomero di lievito a ciascuna estremità, un centromero, una sequenza per la replicazione autonoma nel lievito (ARS), un marcatore selezionabile e un polylinker. cromosoma artificiale nei batteri (BAC) Vettori in E. coli che contengono un lungo frammento di DNA, fino a 200 kb. I BAC contengono l’origine di replicazione del fattore F, siti multipli di clonaggio e un marcatore selezionabile. cromosoma del sesso Negli organismi eucarioti, un cromosoma diverso morfologicamente o come numero nei due sessi. In molti organismi, uno dei sessi possiede un paio di cromosomi visibilmente diversi, uno dei quali è il cromosoma X e l’altro il cromosoma Y. Di solito il sesso XX è femminile e il sesso XY è maschile. cromosoma dicentrico Una coppia di cromosomi nella quale i due cromatidi hanno due centromeri. Come i due centromeri iniziano la migrazione verso i poli opposti, si forma un ponte dicentrico, che alla fine si spezza. cromosoma metacentrico Cromosoma in cui il centromero è situato approssimativamente a metà e i bracci sono circa di uguale lunghezza. cromosoma politenico Un tipo speciale di cromosoma che rappresenta un fascio di parecchi cromatidi derivati da ripetuti cicli di replicazione dei singoli cromatidi senza divisione nucleare. Questo tipo di cromosoma è caratteristico di vari tessuti dei ditteri. cromosoma ricombinante Un cromosoma che si origina nella meiosi che porta una composizione allelica diversa da quella di entrambi i genitori.

cromosoma submetacentrico Cromosoma in cui il centromero si trova più vicino a una delle estremità che all’altra. cromosoma telocentrico Un cromosoma che ha il centromero localizzato all’incirca a un’estremità, in modo che appare un solo braccio. cromosoma X Cromosoma del sesso presente in due copie nel sesso omogametico (le femmine nei mammiferi) e in una copia nel sesso eterogametico (i maschi nei mammiferi). cromosoma Y Cromosoma del sesso che, quando presente, si trova in una copia nel sesso eterogametico, insieme a un cromosoma X, e non è presente nel sesso omogametico. Non tutti gli organismi che possiedono cromosomi sessuali possiedono un cromosoma Y. cromosomi figli Cromatidi fratelli singoli, dopo la loro separazione all’inizio dell’anafase mitotica o dell’anafase II meiotica. cromosomi non omologhi Cromosomi che contengono geni diversi e che non si appaiano alla meiosi. cromosomi omologhi I membri di un paio di cromosomi, identici nella disposizione dei geni presenti e nella loro struttura visibile. crossing-over Il processo di scambio reciproco tra cromosomi che si verifica frequentemente durante la meiosi e che origina cromosomi ricombinanti. crossing-over ineguale Il processo di scambio tra cromosomi non correttamente allineati, che può avvenire durante la meiosi. D deamminazione La rimozione di un gruppo amminico da un nucleotide del DNA. degenerazione del codice genetico Uno stesso amminoacido è codificato da più di un codone. delezione (deficienza) Mutazione cromosomica che porta alla perdita di una porzione del materiale genetico e dell’informazione genetica in essa contenuta. depurinazione Perdita della base purinica (adenina o guanina) dal nucleotide nel DNA. deriva genetica Variazione casuale nel tempo delle frequenze alleliche in una popolazione; osservata frequentemente in piccole popolazioni isolate. desossiribonucleasi (DNasi) Enzima che catalizza la degradazione del DNA a nucleotidi. desossiribonucleotide Elemento che forma il DNA; consiste in un desossiribosio (uno zucchero), una base e un fosfato. desossiribosio Zucchero pentoso (cinque carboni) che si trova nel DNA.

Glossario

determinazione Processo dello sviluppo precoce che stabilisce il destino di una cellula, cioè quale tipo di cellula differenziata diventerà. determinazione del sesso basata sul cromosoma Y Un sistema genotipico di determinazione del sesso nel quale il cromosoma Y determina il sesso dell’individuo. Individui con un cromosoma Y sono geneticamente maschi e individui senza cromosoma Y sono geneticamente femmine. determinazione del sesso basata sul rapporto cromosomi X/autosomi Un sistema di determinazione del sesso nel quale il rapporto tra il numero di cromosomi X e il numero di assetti di autosomi è il primo determinante del sesso dell’individuo. determinazione genetica del sesso Sistema di determinazione del sesso, trovato nei microrganismi eucarioti, basato su diversi alleli presenti in un piccolo numero di geni a loci diversi. Vedi anche determinazione genotipica del sesso. determinazione genotipica del sesso Un sistema nel quale i cromosomi del sesso giocano un ruolo decisivo nel determinare l’ereditarietà del sesso. Vedi anche determinazione genetica del sesso. deviazione standard Radice quadrata della varianza. Misura il grado con il quale ciascun valore in un insieme di dati differisce dal valore medio nella valutazione dei caratteri quantitativi. diacinesi Lo stadio finale nella profase I della meiosi durante il quale i cromosomi replicati (bivalenti) sono condensati, la membrana nucleare si rompe e si comincia a formare il fuso. didesossinucleotide (ddNTP) Un nucleotide modificato che ha un 3′-H sul desossiribosio invece di un 3′OH. Un ddNTP può essere incorporato nella catena di DNA, ma la sintesi non può proseguire perché non si può formare il legame fosfodiesterico con un successivo nucleotide. Vedi anche sequenziamento con didesossinucleotidi. differenziale di selezione (s) Nella selezione naturale o artificiale, la differenza tra il fenotipo medio dei genitori selezionati e il fenotipo medio nella popolazione non selezionata. differenziamento Una serie di cambiamenti specifici nell’espressione genica che danno origine a tipi cellulari con caratteristiche strutturali e funzioni specifiche. dimensione effettiva di una popolazione L’effettivo numero di adulti che forniscono gameti alla generazione successiva. dimero di timina Una comune lesione del DNA, causata dai raggi ultravioletti, nella quale due timine adiacenti sulla stessa elica sono legate da un legame anormale che distorce la doppia elica.

631

dioica Un termine che si riferisce a specie vegetali che hanno gli organi sessuali maschili portati da un individuo e quelli femminili portati da un altro. Vedi anche monoica. diploide (2N) Una cellula o un individuo che ha due copie di ciascun cromosoma. diplonema Lo stadio della profase I della meiosi, nel quale si disassembla il complesso sinaptinemale e i cromosomi omologhi cominciano a separarsi. dischi imaginali Cellule indifferenziate nel blastoderma di Drosophila, che si svilupperanno in tessuti e organi dell’adulto. disequilibrio gametico Deviazioni dall’atteso per loci che assortiscono indipendentemente a causa di eventi di ibridazione, deriva genetica e migrazione. disomia uniparentale Presenza in un genoma di una coppia di cromosomi di stessa origine parentale (materna o paterna). distribuzione di frequenza In genetica, una rappresentazione grafica del numero di individui all’interno di una popolazione che cade all’interno dello stesso gruppo di valori fenotipici per un carattere quantitativo. Le classi fenotipiche vengono assegnate sull’asse delle x e il numero di individui in ciascuna classe sull’asse delle y. distribuzione normale In statistica, distribuzione di probabilità graficamente rappresentata come una curva a campana. divisione cellulare Processo per cui una cellula si divide per produrre due cellule. DNA Polimero di desossiribonucleotidi a forma di doppia elica che costituisce il materiale genetico di tutti gli organismi viventi. DNA a sequenza unica Una classe di sequenze di DNA ciascuna delle quali è presente in una o poche copie nell’assetto cromosomico aploide. Anche detto DNA a singola copia. DNA altamente ripetuto Vedi sequenza altamente ripetuta. DNA complementare Vedi cDNA. DNA elicasi Enzima che catalizza la despiralizzazione della doppia elica del DNA nella forca replicativa durante la replicazione del DNA. DNA eteroduplex Una regione di DNA a doppia elica con informazioni di sequenza diverse nelle due eliche. DNA ligasi (polinucleotide ligasi) Enzima che catalizza la formazione di legami fosfodiesterici tra l’estremità 5′ di una catena di DNA e l’estremità 3′ di un’altra durante la replicazione del DNA e la sua riparazione. DNA marcatore di peso molecolare Insieme di molecole di DNA di dimensioni note utilizzato in esperimenti di elettroforesi su gel di agarosio. Chiamato anche marcatore di dimensioni.

632

Glossario

DNA moderatamente ripetuto Una classe di sequenze di DNA, ciascuna delle quali è presente in circa 105 copie nell’assetto cromosomico aploide. DNA polimerasi Enzima che catalizza la sintesi del DNA. DNA polimerasi I (DNA Pol I) Un enzima di E. coli che catalizza la sintesi del DNA, originariamente chiamato enzima di Kornberg. DNA primasi Enzima che, nella replicazione del DNA, catalizza la sintesi di un breve primer di acido nucleico. DNA ribosomale (rDNA) Le regioni di DNA che contengono, in procarioti ed eucarioti, i geni per gli rRNA. DNA ricombinante Qualunque molecola di DNA generata in provetta e costituita da due o più molecole distinte di DNA, spesso derivanti da organismi diversi. DNA ricombinante (tecnologia del) Una serie di procedure sperimentali per inserire un frammento di DNA di un organismo in un altro e per clonare le nuove molecole di DNA ricombinante. DNA ripetuto in tandem Sequenze ripetute nel genoma raggruppate insieme per cui ogni sequenza si ripete molte volte di seguito. dominante Allele o fenotipo espresso sia allo stato omozigote sia allo stato eterozigote. dominanza completa La condizione in cui un allele è fenotipicamente espresso, indipendentemente dal fatto che sia presente in una o in due copie, così che il fenotipo dell’eterozigote è sostanzialmente indistinguibile da quello dell’omozigote. dominanza incompleta La condizione nella quale nessuno dei due alleli è completamente dominante sull’altro, così che l’eterozigote ha un fenotipo intermedio tra i due omozigoti. Detto anche dominanza parziale. domini ad ansa (looped domain) Anse (loop) di DNA superavvolto che servono per compattare i cromosomi. domini evolutivi Le tre principali linee evolutive degli organismi – Bacteria, Archaea ed Eukarya – che si suppone si siano evolute da una singola cellula ancestrale. duplicazione Mutazione cromosomica in cui un segmento di cromosoma è presente in più di una copia. E EF Vedi fattore di allungamento. effetto collo di bottiglia Una forma di deriva genetica che avviene quando una popolazione è drasticamente ridotta in dimensione. Nella riduzione qualche allele può venire perduto dal pool genico per effetto del caso.

effetto del fondatore Una forma di deriva genetica che avviene quando una popolazione si forma per migrazione di un piccolo numero di individui di una popolazione grande. effetto glucosio Vedi repressione da catabolita. effetto materno (1) Il fenotipo determinato dall’espressione di geni materni nell’oocita prima della fertilizzazione. (2) L’influenza dell’ambiente materno (per esempio, la grandezza dell’utero, la quantità e la qualità del latte) sul fenotipo della progenie, espressa come VEm; uno degli effetti ambientali familiari che influenzano la variabilità dei caratteri quantitativi. effetto posizione Un cambiamento dell’effetto fenotipico di uno o più geni dovuto al cambiamento della loro posizione nel genoma. effettore Una piccola molecola coinvolta nel controllo dell’espressione di molti geni regolati o nell’attività di una proteina. elemento di risposta agli ormoni steroidei (HRE) Sequenza di DNA a cui si lega il complesso costituito da uno specifico ormone steroideo e dal suo recettore, determinando l’attivazione dei geni regolati da quell’ormone. elemento prossimale del promotore Elementi regolatori di un gene nei genomi eucarioti, localizzati a 50200 bp dal punto di inizio della trascrizione (a monte della TATA box) che determinano l’efficienza della trascrizione. elemento silenziatore (silencer) Negli eucarioti, un elemento di regolazione trascrizionale che reprime la trascrizione dell’RNA invece di stimolarla, come fanno altri elementi enhancer. elemento trasponibile Un segmento di DNA che può muoversi da una posizione a un’altra nel genoma, anche detto elemento genetico mobile. Gli elementi trasponibili sono stati trovati sia nei procarioti sia negli eucarioti. elettroforesi su gel di agarosio Procedura sperimentale in cui si utilizza un campo elettrico per far muovere, attraverso una matrice di gel di agarosio, molecole di DNA o di RNA, caricate negativamente, dal polo negativo al polo positivo. elica continua (leading) Nella replicazione del DNA, il filamento sintetizzato in modo continuo a partire da un unico RNA primer nella stessa direzione in cui si muove la forca replicativa. Vedi anche elica discontinua. elica discontinua (lagging) Nella replicazione del DNA, il filamento sintetizzato in modo discontinuo, a partire da molteplici RNA primer, e che si muove in direzione opposta al movimento della forca replicativa Vedi anche elica continua e frammenti di Okazaki. elica stampo L’elica di DNA sulla quale è sintetizzato un DNA complementare durante la replicazione o un RNA durante la trascrizione.

Glossario

emizigote Organismo che possiede solo una copia (allele) di un gene in una cellula diploide. Di solito si riferisce ai geni sul cromosoma X nei maschi a genotipo XY. endonucleasi di restrizione Vedi enzima di restrizione. enhancer (elemento enhancer) Un gruppo di elementi regolatori nei genomi eucarioti che possono agire a distanza di migliaia di coppie di basi a monte o a valle di un gene. La maggior parte degli enhancer lega un attivatore e stimola la trascrizione. enzima di restrizione Enzima in grado di tagliare il DNA a doppia elica all’interno o in prossimità di una specifica sequenza nucleotidica (sito di restrizione), spesso presente in copie multiple nel genoma. Tali enzimi sono utilizzati per l’analisi del DNA e per la costruzione di molecole di DNA ricombinante. Detti anche endonucleasi di restrizione. enzimi a RNA Molecole di RNA che possiedono una funzione catalitica. epigenetico Un cambiamento ereditario nel genoma che non deriva da un cambio nella sequenza nucleotidica. episoma Nei batteri, un plasmide che può integrarsi nel cromosoma della cellula ospite. epistasi Interazione tra due o più geni che controllano un singolo carattere fenotipico. Per esempio, l’espressione di un gene che maschera o sopprime l’espressione di un secondo gene a un locus diverso. epitopo Piccola regione specifica di una proteina (o di un’altra molecola riconosciuta da un anticorpo) che viene legata in modo specifico dall’anticorpo stesso. ereditabilità Proporzione di variabilità fenotipica in una popolazione attribuibile a fattori genetici. ereditabilità in senso lato La proporzione di varianza fenotipica tra popolazioni dovuta a differenze genetiche tra gli individui. ereditabilità in senso stretto La proporzione della varianza fenotipica che deriva dalla varianza genetica additiva. ereditarietà crisscross Tipo di trasmissione dei geni in cui una caratteristica viene passata dal maschio alle figlie femmine e ai nipoti maschi. ereditarietà extranucleare Ereditarietà dei caratteri determinati da geni localizzati sul DNA mitocondriale e dei cloroplasti. Tali geni extranucleari mostrano modelli di ereditarietà nettamente diversi da quelli dei geni localizzati sui cromosomi nucleari. Chiamata anche ereditarietà non mendeliana. ereditarietà materna Un tipo di ereditarietà uniparentale nella quale il fenotipo materno è l’unico espresso. ereditarietà non mendeliana Vedi ereditarietà extranucleare. ereditarietà uniparentale Un fenomeno, di solito presente nei mitocondri e nei cloroplasti, nel quale la progenie eredita le caratteristiche di un solo genitore.

633

ermafrodita Negli animali, le specie nelle quali ciascun individuo ha sia i testicoli sia le ovaie. Nelle piante, specie che hanno gli stami e i pistilli nello stesso fiore. errore di campionamento Deviazione casuale dei valori rispetto a quelli attesi, dovuta alle piccole dimensioni del campione. errore standard della frequenza genica Una misura statistica del grado di variazione tra le frequenze geniche delle popolazioni. errori congeniti nel metabolismo Un disturbo biochimico causato dalla mutazione in un gene che codifica per un enzima di una particolare catena metabolica. esone Un segmento di un gene che codifica per una proteina e del suo mRNA precursore (pre-mRNA) che specifica una sequenza di amminoacidi e che è mantenuto nell’mRNA funzionante. Vedi anche introne. espressione genica Il processo mediante il quale un gene produce il proprio prodotto genico e questo prodotto svolge le proprie funzioni. espressività Il grado di espressione fenotipica di un particolare genotipo. Un gene con espressività variabile può causare un certo numero di fenotipi diversi. eterocromatina Cromatina che rimane condensata durante il ciclo cellulare e di solito non è trascritta. Vedi anche eucromatina. eterocromatina costitutiva Cromatina condensata che è sempre geneticamente inattiva ed è trovata in posizioni identiche nelle coppie di cromosomi omologhi. eterocromatina facoltativa Cromatina che può condensare e quindi diventare trascrizionalmente inattiva in certi tipi cellulari, a diversi stadi dello sviluppo o in un singolo membro di una coppia di cromosomi omologhi. eterodimero Dimero costituito da due polipeptidi diversi. eteroplasmica Cellula di individui affetti da patologie causate da difetti del DNA mitocondriale contenente una miscela di mitocondri normali e mutati. Chiamata anche citohet. eterosi Fenomeno nel quale i genotipi eterozigoti, per una o più caratteristiche, sono superiori ai corrispondenti genotipi omozigoti in termini di crescita, sopravvivenza, espressione fenotipica e fertilità. Anche detta vantaggio dell’eterozigote o sovradominanza. eterozigosità Una misura della variabilità genetica; rispetto a un particolare locus, la proporzione di individui all’interno di una popolazione che sono eterozigoti per quel locus. eterozigosità attesa (He) Il numero degli eterozigoti attesi in una popolazione in equilibrio di Hardy-Weinberg. eterozigosità osservata (Ho) Il numero di individui di una popolazione eterozigoti per un dato locus.

634

Glossario

eterozigote Termine che descrive un organismo diploide che ha due alleli diversi per uno o più geni. Di conseguenza l’organismo produce gameti di diverso genotipo. eucariote Ogni organismo le cui cellule hanno un nucleo dotato di membrana al cui interno è localizzato il materiale genetico, e organelli dotati di membrana (per esempio, mitocondri). Gli eucarioti possono essere unicellulari o multicellulari e costituiscono uno dei tre principali domini evolutivi degli organismi. Vedi anche Eukarya e procariote. eucromatina Cromatina che si condensa durante la mitosi ma si despiralizza durante l’interfase, quando può essere trascritta. Vedi anche eterocromatina. euploide La condizione nella quale un organismo o una cellula ha una serie completa di cromosomi o un multiplo esatto di questa serie. Eukarya Uno dei tre domini evolutivi principali. Gli organismi appartenenti a questo dominio presentano il materiale genetico all’interno di un nucleo circondato da membrana, oltre a un certo numero di organelli dotati di membrana come i mitocondri. Vedi anche eucariote. evoluzione Cambiamento genetico che avviene nel tempo all’interno di un gruppo di organismi. evoluzione molecolare Lo studio di come i genomi e le macromolecole si evolvono a livello molecolare e di come i geni e gli organismi sono correlati evolutivamente. F F-duzione Il trasferimento di pochi geni dell’ospite portati su un plasmide F′, mediante coniugazione con una cellula F′ o F–. Se i geni sono diversi tra i due tipi cellulari, il ceppo ricevente diventa un diploide parziale per i geni portati su F′. fago Forma abbreviata di batteriofago. fago temperato Un fago che può scegliere tra il ciclo litico e quello lisogeno. Vedi anche fago virulento. fago trasducente Un fago che può mediare il trasferimento di materiale genetico tra batteri per trasduzione. fago trasducente specializzato Batteriofago temperato che può trasdurre solo una sezione specifica del cromosoma batterico da un batterio all’altro. fago virulento Fago come T4, che segue sempre il ciclo litico una volta infettato un batterio. Vedi anche fago temperato. famiglia multigenica Molte forme alternative di un singolo gene. Benché la popolazione possa contenere molti alleli alternativi di un particolare gene, un singolo individuo può avere al massimo due alleli per un singolo locus.

farmacogenomica Lo studio di come il genoma unico di una persona possa alterare la risposta del corpo alle medicine. fase di lettura Una sequenza lineare di codoni (gruppi di tre nucleotidi) nell’mRNA che specificano per amminoacidi specifici a partire da un particolare codone d’inizio. fattore di allungamento (EF) Proteine accessorie necessarie per la fase di allungamento della traduzione nei procarioti e negli eucarioti. fattore di determinazione testicolare Il prodotto genico nei mammiferi placentati che determina la scelta verso la differenziazione sessuale in direzione maschile; in assenza di questo fattore, il tessuto della gonade si sviluppa in ovario. fattore di riciclaggio del ribosoma (RRF) Proteina di forma simile a quella di una molecola di tRNA che, dopo il termine della traduzione, partecipa con l’EG-F a una serie di passaggi che portano al rilascio del tRNA non caricato e alla dissociazione dall’mRNA dalle due subunità ribosomali. fattore di rilascio (RF) Una delle proteine che riconoscono i codoni di stop nell’mRNA e danno inizio a una serie di eventi che determinano la fine della traduzione. fattore F In E. coli un episoma che conferisce alla cellula la capacità di agire da donatore in una coniugazione. L’escissione di un fattore F dal cromosoma batterico può generare un fattore F′, che porta una piccola regione di geni batterici. Vedi anche F-duzione. fattore mendeliano Vedi gene. fattori di inizio (IF) Tutte le diverse proteine coinvolte nell’inizio della traduzione. fattori generali di trascrizione (GTF) Proteine richieste per l’inizio della trascrizione da parte della RNA polimerasi eucariote. fattori particolati Il termine usato da Mendel per indicare le strutture che portano l’informazione ereditaria e vengono trasmesse dai genitori ai figli attraverso i gameti. Questi fattori vengono ora indicati col nome di geni. fecondazione incrociata Vedi incrocio. fenotipo Manifestazione fisica di un carattere genetico, che dipende dal genotipo specifico e dalla sua interazione con l’ambiente. fibra cromatinica da 10 nm La forma meno compatta di cromatina. Ha un diametro di circa 10 nm e una morfologia tipo “filo di perle”. È costituita da nucleosomi formati da un nucleo di otto proteine istoniche intorno a cui è avvolto il DNA. Il DNA linker collega tra loro i nucleosomi. Vedi anche fibra cromatinica da 30 nm. fibra cromatinica da 30 nm Forma di cromatina che presenta un livello di condensazione successivo a

Glossario

quello della fibra cromatinica da 10 nm generato dal legame dell’istone H1 al DNA linker e al DNA legato agli istoni del nucleosoma. Ha un diametro di circa 30 nm. Vedi anche fibra cromatinica da 10 nm. fingerprinting del DNA Vedi tipizzazione del DNA. fitness darwiniana (W) Capacità riproduttiva relativa di un dato genotipo. flusso genico Movimento di geni dovuto alla migrazione di organismi da una popolazione a un’altra e alla successiva riproduzione, che determina l’introduzione dei geni della prima popolazione nell’insieme dei geni della popolazione ricevente. forca replicativa Una struttura a Y che si forma quando una molecola di DNA a doppia elica si svolge ed espone le due eliche stampo per la replicazione del DNA. formilmetionina (fMet) Uno specifico amminoacido modificato per aggiunta di un gruppo formilico al gruppo amminico della metionina. È il primo amminoacido incorporato nella catena polipeptidica nei procarioti e negli organelli delle cellule eucariote. fotoriattivazione Riparazione dei dimeri di timina nel DNA in seguito a esposizione alla luce in un intervallo di lunghezze d’onda compreso tra 320 e 370 nm. Detto anche riparazione alla luce. frammenti di Okazaki Nella replicazione discontinua del DNA, i frammenti di DNA a singolo filamento, relativamente corti, che sono sintetizzati durante la replicazione e che sono successivamente uniti in modo covalente a formare un filamento continuo, l’elica lagging. frequenza allelica Frequenza di un particolare allele in un locus nell’ambito di un pool genico. La somma delle frequenze alleliche in un dato locus è 1. frequenza di mutazione Numero di eventi mutazionali di un certo tipo in una popolazione di cellule o individui. frequenze genotipiche Percentuali di individui in una popolazione che hanno un dato genotipo. La somma di tutte le frequenze genotipiche è uguale a 1. funzioni di mappa Formule matematiche usate per correggere i valori osservati di frequenza di ricombinazione, tenendo conto dell’incidenza dei crossing-over multipli. G gamete Cellula riproduttiva matura specializzata nella fusione cellulare. Ogni gamete è aploide e la fusione di due gameti porta alla formazione di uno zigote diploide. gametofito Generazione sessuale aploide nel ciclo di crescita delle piante, che produce i gameti. gametogenesi Formazione dei gameti maschili e femminili con la meiosi.

635

GC box Elemento del promotore prossimale situato a monte del promotore dei geni eucarioti a circa 90 bp dal sito di inizio della trascrizione. La sequenza consensus della GC box è 5′-GGGCGG-3′. gene Unità fisica e funzionale che determina i caratteri genetici che passano dai genitori ai figli; anche detto fattore mendeliano. In termini molecolari, un gene è una sequenza di nucleotidi nel DNA che specifica un polipeptide o un RNA. Alterazioni della sequenza danno origine a cambiamenti nella specie o nell’individuo. gene costitutivo Un gene la cui espressione non è regolata. Il prodotto dei geni costitutivi è essenziale per il normale funzionamento della cellula ed è sempre espresso dalle cellule qualunque sia la situazione ambientale. gene essenziale Un gene che, se mutato, può essere letale per l’organismo. gene legato al cromosoma X Riferito a geni localizzati sul cromosoma X. gene materno Un gene nucleare, espresso dalla madre durante l’oogenesi, il cui prodotto influisce direttamente sullo sviluppo embrionale. gene modificatore Gene che interagisce con un altro gene non allelico causando una variazione nell’espressione fenotipica degli alleli di quel gene. gene regolato Gene la cui attività è regolata per rispondere alle necessità della cellula o dell’organismo. gene repressore Gene regolatore il cui prodotto è una proteina che controlla l’attività trascrizionale di un particolare operone. gene soppressore Un gene che, quando mutato, sopprime le mutazioni in altri geni. GeneChip® array Vedi microarray a DNA. generazione F1 Prima generazione filiale ottenuta incrociando due ceppi parentali di animali o piante. generazione F2 Seconda generazione filiale ottenuta da incrocio di due individui F1. generazione P Generazione parentale, cioè i genitori di una F1. genetica Scienza dell’ereditarietà, che concerne la struttura e la funzione dei geni e il modo in cui i geni vengono trasmessi da una generazione alla successiva. genetica della trasmissione Studio di come i geni vengono trasmessi da un individuo a un altro. Anche chiamata genetica classica. genetica di popolazioni Lo studio delle conseguenze dell’ereditarietà mendeliana a livello di una popolazione, che include la descrizione della composizione genetica e di come questa vari nel tempo. genetica inversa Approccio sperimentale con cui i ricercatori tentano di individuare il fenotipo, se ne esiste uno, che si associa a un gene clonato.

636

Glossario

genetica molecolare Branca della genetica che studia come l’informazione genetica sia contenuta nel DNA e come i processi biochimici cellulari traducano l’informazione genetica nel fenotipo. genetica quantitativa Studio dell’ereditarietà di caratteri complessi determinati da molti geni. geni concatenati o associati (linked) Geni localizzati sullo stesso cromosoma, che tendono a essere ereditati insieme. Una collezione di questi geni costituisce un gruppo di associazione. geni di segmentazione Un gruppo di geni in Drosophila che determinano il numero e l’organizzazione dei segmenti nell’embrione e nell’adulto. geni mutatori Geni la cui mutazione danneggia o compromette i meccanismi di riparazione del DNA, porta ad accumulo di mutazioni nel genoma e predispone allo sviluppo di tumori. geni omeotici Gruppo di geni in Drosophila che specificano per parti del corpo (appendici) che si svilupperanno in ciascun segmento, determinando l’identità del segmento stesso. geni oncosoppressori (soppressori dei tumori) Geni delle cellule normali che codificano prodotti che impediscono una proliferazione cellulare incontrollata. Vedi anche proto-oncogene. genoma Quantità totale di materiale genetico di una cellula; negli eucarioti usualmente indica l’assetto aploide dei cromosomi di una specie. genomica Lo sviluppo e l’applicazione di nuovi metodi per la mappatura, il sequenziamento e l’analisi computazionale per lo studio dell’intero genoma di organismi. genomica comparativa Il confronto di interi genomi di specie diverse allo scopo di comprendere le funzioni e l’evoluzione dei geni. Questi confronti possono identificare regioni del genoma che sono evolutivamente conservate e probabilmente includono geni con funzioni correlate. genomica funzionale L’analisi complessiva della funzione dei geni e delle sequenze non geniche presenti in interi genomi, inclusi l’espressione dei geni e il loro controllo. genotipo Costituzione genetica completa (composizione allelica) di un organismo. Il termine si riferisce di solito agli alleli presenti in uno o pochi geni specifici. genotipo parentale La costituzione genetica (composizione allelica) di individui della generazione parentale. La progenie nelle generazioni successive può avere combinazioni di alleli di uno o dell’altro genitore o nuove combinazioni (non parentali) come risultato di ricombinazione. Goldberg-Hogness box Vedi TATA box.

gruppo fosfato Un componente chimico acido che, insieme allo zucchero pentoso e alla base azotata, costituisce una delle tre parti del nucleotide. GTF Vedi fattori generali di trascrizione. guanina (G) Base purinica presente nel DNA e nell’RNA. Nel DNA a doppia elica la guanina si appaia con la pirimidina citosina. H Hfr (High frequency of recombination) Cellula maschile di E. coli, che porta il fattore F integrato nel cromosoma batterico. Quando una cellula Hfr coniuga con una cellula femminile (F–), i geni batterici vengono trasferiti alla cellula ricevente con alta frequenza. hitchhiking genetico Nel corso del processo in cui un allele vantaggioso o dannoso, quindi soggetto alla selezione naturale, può dirigersi verso la fissazione o venire perso molto rapidamente nella popolazione, le varianti che sono neutre, o quasi, dal punto di vista selettivo e sono localizzate sul cromosoma vicino alla nuova mutazione possono essere “trascinate” insieme alla mutazione verso la fissazione o la perdita. I ibridazione Appaiamento eseguito sperimentalmente tra le basi complementari di una sonda di DNA o RNA a singolo filamento e una molecola target di DNA o RNA a singolo filamento. In base all’esperimento una delle due molecole, sonda o bersaglio, viene marcata. ibridazione con oligonucleotide allele-specifico (ASO) Un procedimento che, con la PCR, distingue un allele da un altro che differisce per una coppia di basi. IF Vedi fattori di inizio. immunoglobuline (Ig) Proteine specializzate (anticorpi) secrete dalle cellule B. Questi anticorpi circolano nel sangue e nella linfa e sono responsabili delle risposte immunitarie umorali. immunoprecipitazione Tecnica sperimentale in cui un anticorpo si lega a una specifica molecola bersaglio, quindi si raccolgono dalla soluzione (tramite precipitazione) le molecole di un anticorpo e tutte le molecole a esso legate. imprinting genomico Il fenomeno per cui l’espressione di certi geni è determinata dal fatto che il gene sia ereditato da parte paterna o materna. incrocio Fusione dei gameti maschili di un individuo con i gameti femminili di un altro. incrocio a tre punti Incrocio tra un individuo eterozigote per tre geni e un individuo omozigote recessivo

Glossario

per gli stessi geni. Di solito è utilizzato per mappare i geni e determinarne l’ordine sul cromosoma e la distanza reciproca. incrocio casuale Incrocio tra individui dello stesso o di diverso genotipo che avviene in proporzione alle frequenze dei genotipi presenti in una popolazione. incrocio di diibridi Incrocio tra due diibridi dello stesso genotipo che sono eterozigoti per due coppie di alleli in due loci (per esempio, Ss Yy × Ss Yy). incrocio di monoibridi Incrocio tra due individui eterozigoti per lo stesso paio di alleli (per esempio, Aa × Aa). In senso lato, il termine si riferisce anche a incroci tra genitori appartenenti a linee pure che differiscono relativamente agli alleli di un locus (per esempio, AA × aa). incrocio di triibridi Incrocio tra individui dello stesso tipo eterozigoti per tre coppie di alleli a tre loci differenti (per esempio, Ss Yy Cc × Ss Yy Cc). incrocio per assortimento negativo Incrocio preferenziale tra individui a diverso fenotipo che avviene più frequentemente dell’atteso rispetto all’incrocio casuale. incrocio per assortimento positivo Un incrocio che avviene più frequentemente di quanto atteso tra individui che sono fenotipicamente simili, rispetto a un incrocio casuale. incrocio reciproco Una coppia di incroci nei quali i genotipi del maschio e della femmina per un dato carattere sono scambiati. Nella pianta di pisello, per esempio, un incrocio reciproco per semi lisci e rugosi è femmina a semi lisci × maschio a semi rugosi e femmina a semi rugosi × maschio a semi lisci. indel Interruzioni nell’allineamento tra due sequenze, nelle quali non è possibile stabilire se è avvenuta un’inserzione in una sequenza oppure una delezione nell’altra sequenza. induttore Un prodotto chimico o ambientale che stimola la trascrizione di geni specifici. induzione (1) Stimolazione della sintesi di un prodotto genico in risposta all’azione di un induttore, che è un agente chimico o ambientale. (2) Nello sviluppo, la capacità di una cellula o di un gruppo di cellule di influenzare il destino di altre cellule. induzione coordinata Trascrizione e traduzione simultanea di due o più geni provocata dalla presenza di un induttore. ingegneria genetica L’alterazione della costituzione genetica di cellule o individui per modificazione, inserzione o delezione mirata di uno o più geni. In alcuni casi vengono create nuove combinazioni di geni, unendo frammenti di DNA di organismi diversi. inincrocio (inbreeding) Accoppiamento preferenziale tra parenti stretti.

637

insieme genico L’insieme dell’informazione genetica codificata da tutti i geni di una popolazione mendeliana in un certo momento. interferenza Fenomeno nel quale la presenza di un evento di crossing-over interferisce con la formazione di un altro evento di ricombinazione nelle vicinanze. Matematicamente è definito come 1 – il coefficiente di coincidenza. Detto anche interferenza da chiasma. interferenza a RNA (RNAi) Il silenziamento dell’espressione di uno specifico gene a opera di un RNA a doppia elica le cui sequenze si appaiano a una porzione dell’mRNA maturo codificato da un gene. Detto anche silenziamento genico. introne Un segmento di un gene che codifica per una proteina e del suo mRNA precursore (pre-mRNA) che non codifica per una sequenza amminoacidica. Gli introni devono essere eliminati dal pre-mRNA attraverso lo splicing. Vedi anche esone. inversione Mutazione cromosomica che si verifica quando un segmento di un cromosoma viene escisso e reinserito dopo una rotazione di 180° rispetto all’orientamento originale. inversione paracentrica Mutazione cromosomica nella quale un segmento di un braccio cromosomico che non contiene il centromero si inverte. inversione pericentrica Mutazione cromosomica nella quale un segmento che include il centromero e parte di entrambi i bracci è invertito. ipotesi del mondo a RNA Teoria secondo la quale la vita basata sull’RNA ha preceduto la vita attuale basata sul DNA, e l’RNA attuava tutte le reazioni catalitiche necessarie alla vita nelle cellule primitive di quel tempo. ipotesi del segnale L’ipotesi che le proteine secrete siano sintetizzate sui ribosomi e indirizzate al reticolo endoplasmatico da un segnale ammino-terminale della catena polipeptidica stessa. ipotesi del vacillamento Un meccanismo che spiega come un anticodone può appaiarsi a più codoni diversi. ipotesi di Lyon Vedi lyonizzazione. ipotesi poligenica (o multigenica) dell’ereditarietà dei caratteri quantitativi (geni multipli) Ipotesi che i caratteri quantitativi siano controllati da molti geni. ipotesi un gene-un enzima Ipotesi secondo la quale ogni gene controlla la sintesi di un enzima. ipotesi un gene-un polipeptide L’ipotesi che ogni gene controlli la sintesi di una catena polipeptidica. ipotesi zero Ipotesi che stabilisce che non c’è differenza tra i dati osservati e quelli attesi. isola CpG Regione di DNA che contiene molte copie del dinucleotide CpG. Molti geni degli eucarioti hanno isole CpG nel o vicino al promotore. La metilazione delle citosine in queste isole reprime la trascrizione.

638

Glossario

isolamento postzigotico Riduzione degli incroci tra specie strettamente correlate attraverso vari meccanismi che agiscono dopo la fecondazione, dando origine a ibridi poco vitali o sterili o a ibridi con fitness ridotta. Vedi anche isolamento prezigotico. isolamento prezigotico Riduzione degli incroci tra specie strettamente imparentate attraverso vari meccanismi che impediscono il corteggiamento, l’incrocio e la fecondazione. Vedi anche isolamento postzigotico. isolatore (insulator) Regione di DNA regolatrice, localizzata tra un promotore e un elemento enhancer associato, che blocca la capacità dell’attivatore di legare l’enhancer e stimolare la trascrizione. istone Proteina basica complessata con il DNA nella cromatina che svolge un ruolo primario nel determinare la struttura dei cromosomi nucleari negli eucarioti. L legame fosfodiesterico Un legame covalente nell’RNA e nel DNA tra uno zucchero di un nucleotide e il gruppo fosfato di un nucleotide adiacente. I legami fosfodiesterici formano la struttura zucchero-fosfato dell’elica di DNA e RNA. legame peptidico Legame covalente in una catena polipeptidica, che unisce il gruppo α-carbossilico di un amminoacido e il gruppo α-amminico dell’amminoacido adiacente. legge di Hardy-Weinberg (equilibrio di Hardy-Weinberg, legge dell’equilibrio) Estensione delle leggi dell’ereditaritetà di Mendel; descrive le relazioni tra frequenze geniche nelle popolazioni naturali e frequenze degli individui dei diversi genotipi nelle stesse popolazioni. leptonema Lo stadio della profase I della meiosi durante il quale i cromosomi hanno iniziato la spiralizzazione e diventano visibili. LINE (Long Interspersed Repeated Sequences, lunghe sequenze ripetute intersperse) Una classe di sequenze di DNA ripetute che sono sparse nel genoma e lunghe alcune migliaia di coppie di basi. Le LINE possono spostarsi nel genoma per retrotrasposizione. linkage disequilibrium Deviazioni da eventi attesi di assortimento indipendente ed equilibrio di HardyWeinberg causate da associazione fisica o variazioni demografiche. linker con sito di restrizione Oligodesossiribonucleotide a doppia elica di circa 8-12 bp, contenente il sito di taglio per uno specifico enzima di restrizione e che viene utilizzato per clonare i cDNA. lisato fagico Progenie fagica rilasciata dalla lisi di batteri infettati da fagi.

lisogenia Inserzione del cromosoma di un fago temperato in un cromosoma batterico. Il cromosoma del fago viene replicato insieme al cromosoma batterico. In questa condizione il genoma del fago è represso e viene definito allo stato di profago. lisogeno Termine che descrive un batterio che contiene un fago temperato allo stato di profago. In seguito a induzione, la riproduzione del fago inizia, la progenie fagica viene prodotta e la cellula batterica viene lisata. loci dei caratteri quantitativi (QTL) Loci indipendenti che contribuiscono a un carattere quantitativo. locus (plur. loci) Posizione di un gene su una mappa genetica; il sito specifico su un cromosoma nel quale un gene è localizzato. Più in generale, un locus è un qualsiasi sito sul cromosoma che mostra variabilità che può essere analizzata geneticamente e molecolarmente. locus genico Vedi locus. locus SNP Sito in cui è presente una variazione tra individui di un’unica coppia di basi, che può essere utilizzato come marcatore del DNA. lyonizzazione Meccanismo di compensazione di dose, scoperto da Mary Lyon, nel quale uno dei cromosomi X della cellula femminile nei mammiferi diventa altamente condensato e geneticamente inattivo. M mappa degli aplotipi (hapmap) Descrizione completa di tutti gli aplotipi noti nelle popolazioni umane analizzate, nonché della loro localizzazione cromosomica. mappa del destino Un diagramma dei primi stadi dello sviluppo dell’embrione che mostra il destino dei tipi cellulari e dei tessuti che si svilupperanno a poco a poco da esso. mappa di concatenazione o di associazione Vedi mappa genetica. mappa di restrizione Determinazione della posizione dei siti di restrizione su una molecola di DNA, ottenuta studiando la lunghezza dei frammenti di restrizione risultanti dalla digestione. mappa fine Mappatura ad alta risoluzione di siti allelici all’interno dello stesso gene. mappa fisica Una rappresentazione delle distanze fisiche, misurate in coppie di basi, tra geni o marcatori del DNA sul DNA genomico. Una mappa fisica si genera in base all’analisi delle sequenze del DNA e non sull’analisi della ricombinazione, che porta a costruire una mappa genetica. mappa genetica Rappresentazione della distanza che separa i geni, basata sui dati di ricombinazione genetica tra loci non allelici. Vedi anche mappa fisica.

Glossario

marcatore fisico Differenze di struttura dei cromosomi visibili (al microscopio), rilevabili citologicamente che consentono di distinguere i cromosomi stessi e, perciò, i risultati di eventi di crossing-over. marcatore genetico Qualunque gene o regione di DNA la cui sequenza varia tra gli individui ed è utile per le analisi genetiche, per esempio, per l’individuazione di eventi di ricombinazione. marcatori a DNA Variazioni di sequenze tra individui in una specifica regione di DNA che vengono identificate da analisi molecolari e utilizzate per analisi genetiche. Vedi anche marcatori genici. marcatori genici Alleli che producono differenze fenotipiche identificabili, utili per l’analisi genetica. Vedi anche marcatori a DNA. massima parsimonia Proprietà degli alberi filogenetici che richiede il numero minimo di mutazioni e che pertanto è più probabile che rappresenti le vere relazioni evolutive tra specie o tra i loro geni. maturazione dell’mRNA Il processo col quale un introne tra due esoni (sequenze codificanti) viene rimosso in un RNA messaggero precursore (pre-mRNA) e i due esoni legati (spliced) insieme. MCS Vedi sito di clonaggio multiplo. media Media di un insieme di numeri, calcolata sommando tutti i valori e dividendo il totale per il numero dei valori. meiosi Due successive divisioni di un nucleo diploide, che seguono una replicazione del DNA e portano alla formazione di gameti aploidi o meiospore, il cui materiale genetico è la metà di quello della cellula originale. meiosi I Prima divisione meiotica, che riduce a metà il numero dei cromosomi portando la cellula da diploide ad aploide. meiosi II Seconda divisione meiotica, che separa i cromatidi e forma le quattro cellule aploidi. metabolomica Studio di tutte le piccole molecole chimiche che costituiscono intermedi o prodotti dei pathway metabolici. metafase Lo stadio della mitosi o della meiosi durante il quale i cromosomi si dispongono allineati sul piano equatoriale del fuso. metafase I Lo stadio della meiosi I durante il quale ciascuna coppia di cromosomi omologhi (bivalente) si allinea sulla piastra equatoriale. metafase II Il secondo stadio della meiosi II durante il quale i cromosomi (ogni coppia di cromatidi fratelli) si allineano sulla piastra equatoriale in ciascuna delle due cellule sorelle formatesi dalla meiosi I. metagenomica Branca della genomica comparativa comprendente l’analisi dei genomi di intere comunità microbiche isolate dall’ambiente. Chiamata anche genomica ambientale.

639

metastasi La diffusione di cellule tumorali maligne attraverso il corpo con sviluppo di tumore in nuove sedi. metilazione globale del DNA (metiloma) L’insieme completo delle modificazioni legate alla metilazione del DNA nella cellula. metodo del lod score Il metodo del lod score (logarithm of odds, logaritmo delle probabilità) è un’analisi statistica, generalmente eseguita mediante programmi al computer, basata sui dati ottenuti dagli alberi genealogici, e viene usato per saggiare l’associazione tra due loci dell’uomo. metodo di indagine ipotetico-deduttivo Metodo di ricerca che compie osservazioni, formula delle ipotesi per spiegare le osservazioni fatte, fa delle previsioni basate sull’ipotesi e alla fine verifica le previsioni fatte. L’ultimo passaggio produce delle nuove osservazioni, così il ciclo si ripete e può portare alla precisazione di alcune ipotesi e anche a stabilire una legge o un principio. microarray a DNA Una griglia ordinata di molecole di DNA di sequenza nota – sonde – fissate in posizioni note su un substrato solido, un chip di silicio, vetro o, più raramente, una membrana di nylon. Molecole di DNA marcate – i bersagli – vengono aggiunte alle sonde fisse per identificare le molecole bersaglio e per quantificarle. I DNA microarray permettono di analizzare in contemporanea migliaia di molecole di DNA bersaglio. microbioma Comunità di microrganismi di un particolare ambiente. microRNA (miRNA) Molecola di RNA regolatrice non codificante, a singolo filamento, di 21-23 nucleotidi, derivata da un trascritto di RNA. Il miRNA regola l’espressione di un mRNA bersaglio legando il 3′ UTR e causando o l’inibizione della traduzione dell’mRNA o la sua degradazione, a seconda dell’estensione dell’appaiamento delle basi complementari tra le due molecole. microsatellite Vedi STR (Short Tandem Repeats). minisatellite Vedi VNTR (Variable Number of Tandem Repeats). mitocondri Organelli presenti nel citoplasma di tutte le cellule aerobiche animali e vegetali, nei quali viene prodotta la maggior parte dell’ATP. mitosi Il processo di divisione nucleare nelle cellule aploidi o diploidi, che produce nuclei figli che contengono assetti cromosomici geneticamenti identici tra loro e al nucleo della cellula parentale da cui si sono originati. modello classico Modello proposto inizialmente per spiegare la varianza genetica che presupponeva che nella maggior parte delle popolazioni naturali fosse presente l’allele selvatico e solo una piccola quantità di alleli mutati.

640

Glossario

modello conservativo della replicazione Schema di replicazione del DNA in cui le due eliche parentali di DNA restano insieme e servono come stampo per la sintesi di una nuova doppia elica figlia. I risultati dell’esperimento di Meselson-Stahl non hanno supportato questo modello. modello dispersivo della replicazione Modello di replicazione del DNA nel quale la doppia elica parentale è tagliata in frammenti a doppia elica, ciascuno dei quali viene utilizzato come stampo per la sintesi di nuovi segmenti di DNA a doppia elica. In qualche maniera, i frammenti si riassemblano in due eliche di DNA complete, nelle quali i frammenti derivati dall’elica parentale e quelli di nuova sintesi sono mescolati. I risultati di Meselson-Stahl non hanno supportato questo modello. modello semiconservativo della replicazione Modello di replicazione del DNA in cui ogni molecola figlia è formata da una delle eliche parentali. I risultati degli esperimenti di Meselson-Stahl erano in accordo con questo modello. modifiche epigenetiche Modifiche chimiche degli istoni e del DNA che controllano l’espressione genica senza alterare la sequenza del DNA. monoica Riferito a piante in cui i singoli individui possiedono organi sessuali sia maschili sia femminili e quindi producono gameti maschili e femminili. Le piante monoiche sono capaci di autofecondazione. Vedi anche dioica. monoploidia Condizione nella quale una cellula o un organismo normalmente diploide manca di un assetto di cromosomi completo. monosomia Condizione aneuploide nella quale un cromosoma di una coppia di omologhi manca rispetto alla normale cellula o organismo diploide. La cellula è 2N – 1. morfogenesi Il complesso di processi di sviluppo che genera la forma, la grandezza e l’organizzazione di cellule, tessuti e organi. morfogeno Una sostanza che determina il destino delle cellule nei primi stadi dello sviluppo in correlazione alla sua concentrazione. morte cellulare programmata Vedi apoptosi. mRNA antisenso Un mRNA trascritto da un gene clonato complementare all’mRNA prodotto dal gene normale. mRNA poli(A)+ Molecola di mRNA degli eucarioti dotata di una coda di poli(A). mRNA policistronico Molecola di mRNA, trascritta da un operone batterico o fagico, che viene tradotta in tutti i polipeptidi codificati dai geni strutturali dell’operone. mRNA precursore (pre-mRNA) Vedi pre-mRNA.

mutagenesi La creazione di mutazioni. mutagenesi sito-specifica Introduzione di una mutazione in uno specifico sito di un particolare gene mediante una o più tecniche molecolari. mutageno Qualsiasi agente fisico o chimico che aumenti significativamente la frequenza di eventi di mutazione oltre il tasso di mutazione spontanea. mutante nutrizionale Vedi auxotrofo. mutante puntiforme Un organismo il cui fenotipo mutato deriva dall’alterazione di una singola coppia di nucleotidi. mutanti temperatura-sensibili Un ceppo che esibisce un fenotipo selvatico in un range di temperature, ma al di fuori di questo ha un fenotipo mutato. mutazione Ogni cambiamento rilevabile ed ereditabile del materiale genetico, non causato da ricombinazione genetica. Le mutazioni possono avvenire all’interno o tra geni e sono la fonte di tutta la variabilità genetica. mutazione auxotrofa Mutazione che modifica la capacità di un organismo di sintetizzare una particolare molecola essenziale per la crescita. Detta anche mutazione nutrizionale. mutazione condizionale Una mutazione che determina un fenotipo in certe condizioni ma non in altre. Le mutazioni temperatura-sensibili sono un comune esempio di mutazioni condizionali. mutazione cromosomica Cambiamento nella struttura o nel numero dei cromosomi. mutazione di andata Mutazione dall’allele selvatico a quello mutato. mutazione di ritorno Vedi mutazione per reversione. mutazione di tipo repressore Una mutazione in un secondo sito che recupera completamente o in parte la funzione perduta a causa di una mutazione primaria in un altro sito. mutazione dinamica o da espansione di triplette Tipo di mutazione genica caratterizzata da ripetizioni di brevi sequenze, generalmente trinucleotidi, che tendono a espandersi nei passaggi di generazione. Il numero di ripetizioni è correlato con la gravità della malattia. mutazione frameshift L’aggiunta o la perdita di una coppia di basi in un gene, che altera la normale fase di lettura dell’mRNA, che viene letto a gruppi di tre basi. mutazione genica Cambiamento ereditabile del materiale genetico, di solito da una forma allelica a un’altra, o in una sequenza che regola il gene. mutazione indotta Mutazione che risulta da un trattamento con agenti mutageni. mutazione inversa Una mutazione puntiforme in un allele mutante che lo riporta allo stato selvatico. Anche detta reversione. mutazione missenso (di senso sbagliato) Mutazione puntiforme in un gene che cambia un codone nel corri-

Glossario

spondente mRNA che specifica quindi per un amminoacido diverso da quello del codone selvatico. mutazione neutra Una mutazione puntiforme in un gene che cambia un codone in un altro, senza che vi sia un cambiamento nella funzione della proteina tradotta. mutazione nonsenso Una mutazione puntiforme in un gene che cambia un amminoacido in un codone di terminazione. mutazione nulla Mutazione che porta alla sintesi di una proteina priva di funzione. mutazione per acquisto di funzione Una mutazione che conferisce una nuova proprietà a una proteina, determinando un nuovo fenotipo. mutazione per perdita di funzione Una mutazione che porta all’assenza o a una ridotta attività biologica di una particolare proteina. mutazione per reversione Una mutazione puntiforme che cambia un allele mutato in quello selvatico. Anche detta reversione. mutazione per sostituzione di una coppia di basi Cambiamento in un gene per cui una coppia di basi viene sostituita con un’altra, per esempio una coppia A-T viene sostituita da una coppia G-C. mutazione per transizione Caso specifico di mutazione per sostituzione di coppia di basi, dovuto al cambiamento a livello di un sito del DNA da una coppia di basi purina-pirimidina all’altra coppia purina-pirimidina (per esempio da A-T a G-C). mutazione per transversione Tipo specifico di mutazione per sostituzione di coppia di basi, dato dal cambiamento a un sito del DNA da una coppia di basi purina-pirimidina a una coppia pirimidina-purina (per esempio da A-T a T-A o da G-C a T-A). mutazione puntiforme Mutazione ereditabile causata dalla sostituzione di una singola coppia di basi con un’altra. mutazione silente Una mutazione puntiforme in un gene che cambia un codone dell’mRNA in un altro che codifica ancora per lo stesso amminoacido; di conseguenza non vi è cambiamento nella sequenza polipeptidica e nella funzione codificata dalla proteina. mutazione somatica In un organismo multicellulare, un cambiamento del materiale genetico in una cellula somatica (del corpo). Può alterare il fenotipo dell’individuo nel quale avviene la mutazione, ma non può essere trasmessa alle generazioni future. mutazione spontanea Qualsiasi mutazione che avvenga senza l’uso di un agente mutageno fisico o chimico. mutazione visibile Mutazione che ha effetto sulla morfologia, o aspetto fisico, di un organismo. mutazioni nella linea germinale Negli organismi a riproduzione sessuata, un cambiamento nel materiale genetico della linea germinale (quella che dà origine ai

641

gameti), che è trasmesso dai gameti alla generazione seguente, dando origine a individui con genotipo mutato sia nelle cellule somatiche sia in quelle germinali. Vedi anche mutazione somatica. mutazioni non sinonime Mutazioni riferite a nucleotidi in un gene che causano il cambiamento della sequenza amminoacidica rispetto alla proteina selvatica. mutazioni omeotiche Mutazioni che cambiano l’identità di particolari segmenti, trasformandoli in copie di segmenti diversi. mutazioni sinonime Mutazioni in posizioni nucleotidiche che non cambiano la sequenza amminoacidica della proteina risultante. N non-disgiunzione Mancata separazione dei cromosomi omologhi o dei cromatidi fratelli all’anafase. Vedi anche non-disgiunzione primaria. non-disgiunzione del cromosoma X Mancata separazione dei due cromosomi X durante la meiosi che porta alla formazione di gameti con due cromosomi X o a gameti senza cromosomi X, anziché con un cromosoma X come al solito. non-disgiunzione primaria Evento raro nelle cellule con un corredo cromosomico normale in cui i cromatidi fratelli (nella mitosi e nella meiosi II) o i cromosomi omologhi (nella meiosi I) non si separano e non migrano ai poli opposti. Vedi anche non-disgiunzione e nondisgiunzione secondaria. non-disgiunzione secondaria Segregazione anomala dei cromosomi X durante la meiosi nella progenie di femmine con genotipo XXY prodotto da una non-disgiunzione primaria. Vedi anche non-disgiunzione e non-disgiunzione primaria. northern blot Vedi analisi per trasferimento northern. nucleasi Enzima che catalizza la degradazione di un acido nucleico mediante rottura dei legami fosfodiesterici. nucleo Struttura discreta all’interno delle cellule eucariote circondata da una doppia membrana (la membrana nucleare) e contenente la maggior parte del DNA della cellula. nucleo (core) del promotore Negli eucarioti, gli elementi regolatori vicini al punto di inizio della trascrizione che sono richiesti perché la sintesi dell’RNA inizi al nucleotide corretto. nucleo (core) enzimatico La porzione della RNA polimerasi di E. coli che costituisce l’enzima attivo; è legato dal fattore sigma, che dirige l’enzima alla regione promotore. nucleoide La regione della cellula batterica nella quale è compattato il cromosoma.

642

Glossario

nucleoside Una purina o pirimidina legata covalentemente con uno zucchero. nucleoside fosfato Un nucleoside con attaccato un gruppo fosfato. Anche detto nucleotide. nucleosoma L’unità strutturale di base della cromatina degli eucarioti, che consiste in un nucleo di quattro molecole istoniche (H2A, H2B, H3 e H4, l’ottamero di istoni), una singola molecola dell’istone H1 che le connette e circa 180 bp di DNA. nucleotide Molecola monomerica di RNA o DNA, costituita da tre parti distinte: un pentoso (ribosio nell’RNA, desossiribosio nel DNA), una base azotata (purina o pirimidina) e un gruppo fosfato. nullisomia Condizione aneuploide nella quale una coppia di cromosomi omologhi manca rispetto alla normale condizione diploide della cellula o dell’organismo. Una cellula nullisomica è 2N – 2. O oligonucleotide Corta molecola di DNA. omeobox Sequenza di consenso di 180 bp che si trova nelle sequenze codificanti per proteine di geni che regolano lo sviluppo. omeodominio La specifica porzione di 60 amminoacidi delle proteine che corrisponde alla sequenza dell’omeobox. Sembra che tutte le proteine che contengono un omeodominio siano localizzate nel nucleo. omodimero Dimero contenente due copie dello stesso polipeptide. omologo (1) Ogni singolo membro di un paio di cromosomi omologhi. (2) Riferito a geni che hanno avuto origine da un antenato comune nel corso dell’evoluzione; riferito anche a proteine codificate da geni omologhi. omozigosi L’essere omozigote. Vedi anche omozigote. omozigote Termine che definisce un organismo diploide che porta alleli identici di uno o più geni e che produce di conseguenza gameti identici per quei geni. omozigote dominante Organismo diploide che porta lo stesso allele dominante in un determinato locus genico in entrambi i membri di un paio di cromosomi omologhi. omozigote recessivo Organismo diploide che porta lo stesso allele recessivo in un determinato locus genico in entrambi i membri di un paio di cromosomi omologhi. oncogene Un gene il cui prodotto promuove la proliferazione cellulare. Gli oncogeni sono forme alterate di proto-oncogeni. oncogenesi L’insorgenza di un tumore (cancro) in un organismo. oocita secondario La cellula più grande delle due cellule sorelle prodotte dalla citocinesi durante la meiosi

I di un oocita primario nell’ovario degli animali femminili. oociti primari Cellule diploidi che si originano da una divisione mitotica delle cellule germinali primordiali (oogoni) e che vanno incontro a meiosi nell’ovario degli animali femminili. oogenesi Sviluppo della cellula germinale femminile degli animali (cellula uovo). Open Reading Frame (ORF) In un tratto di DNA, una potenziale sequenza codificante una proteina, identificata da un codone d’inizio in fase con un codone di terminazione della catena. operatore La regione di DNA adiacente al promotore di un operone batterico che lega la proteina repressore responsabile del controllo della trascrizione dell’operone stesso. operone Nei batteri, un insieme di geni adiacenti che condividono l’operatore e il promotore e che vengono trascritti in un’unica molecola di RNA messaggero. Tutti i geni di un operone sono regolati in modo coordinato, cioè sono tutti trascritti o non trascritti. operone inducibile Un operone la cui trascrizione viene attivata in presenza di una particolare sostanza (induttore). L’operone del lattosio (lac) è un esempio di operone inducibile. Vedi anche operone reprimibile. operone reprimibile Un operone la cui attività genica viene repressa dall’aggiunta di una sostanza chimica, spesso la sostanza finale di una catena biochimica. Un esempio è l’operone triptofano (trp). Vedi anche operone inducibile. ORF Vedi Open Reading Frame. origine Sito specifico sul cromosoma, a livello del quale la doppia elica viene denaturata in singoli filamenti e la replicazione è iniziata. origine di replicazione Una specifica sequenza di DNA nella quale la doppia elica si srotola e ha inizio la replicazione del DNA. orologio molecolare (ipotesi dell’) Un’ipotesi controversa secondo la quale ogni mutazione genica si accumula con un tasso sostanzialmente costante in tutte le linee evolutive, a patto che il gene mantenga la sua funzione originaria. P pachinema Stadio della profase I della meiosi durante il quale le coppie di cromosomi omologhi si scambiano regioni cromosomiche. parentale Vedi genotipo parentale. particella per il riconoscimento del segnale (SRP) Un complesso ribonucleotidico che si lega alla sequenza del segnale di un polipeptide in crescita, bloccando l’ulteriore traduzione dell’mRNA nel citosol.

Glossario

PCR Vedi reazione a catena della polimerasi. PCR real-time Metodica di PCR per la misura dell’incremento della quantità di DNA durante la sua amplificazione (da qui il nome “real-time” assegnato alla tecnica). Chiamata anche PCR real-time quantitativa. pendenza della retta di regressione Vedi coefficiente di regressione. penetranza Frequenza con cui un gene dominante o un omozigote recessivo si manifesta nel fenotipo di un individuo. peptidasi del segnale Un enzima nella cisterna del reticolo endoplasmico che catalizza la rimozione della sequenza segnale dalle catene polipeptidiche in crescita. peptidil-transferasi Attività catalitica di un componente del ribosoma che forma un legame peptidico tra gli amminoacidi durante la traduzione. piastra metafasica Il piano della cellula sul quale si dispongono i cromosomi alla metafase. pili F (pili sessuali) Componenti filiformi della superficie cellulare prodotti da cellule che contengono il fattore F; permettono l’unione fisica tra cellule F+ e F– o tra cellule Hfr e F–. pirimidina Uno dei due tipi di basi azotate cicliche presenti nel DNA e nell’RNA. Le pirimidine sono la citosina (nel DNA e nell’RNA), la timina (nel DNA) e l’uracile (nell’RNA). pirosequenziamento Tecnica di sequenziamento del DNA che utilizza come templato una molecola di DNA a singolo filamento attaccata a una biglia microscopica in cui il rilascio di pirofosfato durante la crescita della catena di DNA viene rilevato enzimaticamente. Il pirosequenziamento non comporta la terminazione della catena. pistillo Organo riproduttivo femminile del fiore di una pianta; la sua struttura è generalmente costituita dallo stigma, dallo stilo e dall’ovario. placca Un’area circolare chiara in uno strato di batteri su un terreno di crescita solido; è il risultato della lisi delle cellule per effetto della continua crescita di fagi litici. plasmide Un elemento genetico extranucleare formato da un DNA a doppia elica che si replica autonomamente rispetto al cromosoma dell’ospite. I plasmidi sono presenti naturalmente in molti batteri e possono essere modificati per essere utilizzati come vettori per la clonazione. pleiotropico Si riferisce a geni o mutazioni che danno effetti multipli a livello del fenotipo (pleiotropia). poli(A) (coda di) Una sequenza di 50-250 adenine aggiunte come modificazione post-trascrizionale alla estremità 3′ della maggior parte degli mRNA eucarioti. poli(A) polimerasi (PAP) L’enzima che catalizza la produzione della coda di poli(A) in 3′.

643

poli(A) (sito di) Nei precursori degli mRNA (premRNA) eucarioti, la sequenza che dirige il taglio dell’estremità 3′ e la successiva aggiunta di nucleotidi adenina a formare la coda di poli(A), durante la maturazione dell’RNA. poliadenilazione alternativa Processo che genera differenti mRNA funzionali da un unico gene tramite il taglio e la poliadenilazione del trascritto primario in diversi siti di poliadenilazione. poligeni Due o più geni i cui effetti additivi determinano un particolare carattere quantitativo. polimorfismo bilanciato Condizione per cui una o più varianti alleliche anche sfavorevoli sono mantenute stabili all’interno di una popolazione, in un determinato ambiente selettivo, a una frequenza elevata (maggiore di 0,01). Può essere dovuta al vantaggio dell’eterozigote. polimorfismo del DNA Variazione nella sequenza nucleotidica o nel numero di ripetizioni in tandem a un particolare locus del genoma. Di solito, questi polimorfismi sono riferiti a marcatori a DNA, variazioni che sono localizzate fuori dai geni e che sono identificate mediante analisi molecolare. polimorfismo della lunghezza dei frammenti di restrizione (RFLP) Variazione nella lunghezza di frammenti generati dal trattamento del DNA con un particolare enzima di restrizione. Gli RFLP derivano da mutazioni puntiformi che creano o distruggono un sito di restrizione. polinucleotide Una molecola polimerica composta da nucleotidi uniti da legami fosfodiesterici. Il DNA e l’RNA sono polinucleotidi. polipeptide Una sequenza lineare polimerica di amminoacidi uniti da legami peptidici. Vedi anche proteina. poliploide Una cellula o un organismo che ha più di due serie di cromosomi. poliribosomi (polisomi) Il complesso che si forma tra una molecola di mRNA e tutti i ribosomi che lo stanno traducendo simultaneamente. polylinker Vedi sito di clonaggio multiplo. ponte dicentrico Vedi cromosoma dicentrico. pool genico Tutti gli alleli esistenti in una popolazione effettiva a un determinato momento. popolazione Uno specifico gruppo di individui della stessa specie. popolazione mendeliana Gruppo di individui che si incrociano e che condividono un insieme comune di geni (“pool genico”); costituisce la base di studio in genetica di popolazioni. pre-mRNA (mRNA precursore) Il trascritto iniziale (primario) di un gene che codifica per una proteina che sarà modificato e maturato a produrre una molecola di mRNA matura e funzionante.

644

Glossario

pre-rRNA (rRNA precursore) Il trascritto iniziale di geni prodotti dal DNA ribosomale che è processato in tre diverse molecole di rRNA nei procarioti e negli eucarioti. pre-tRNA (tRNA precursore) Il trascritto primario di un gene per il tRNA, che viene estesamente modificato e maturato a produrre una molecola di tRNA matura e funzionante. Pribnow box Una parte della sequenza del promotore nei procarioti, posizionata circa 10 bp a monte del punto di inizio della trascrizione. Anche detta box –10. prima generazione filiale Vedi anche generazione F1. prima legge di Mendel Vedi principio della segregazione. primasi Vedi DNA primasi. primer Vedi RNA primer. primosoma Un complesso costituito da primasi, elicasi e forse da altri polipeptidi di E. coli che insieme catalizzano l’inizio della sintesi di DNA. principio dell’assortimento indipendente La seconda legge mendeliana secondo la quale fattori (geni) che controllano diversi caratteri si distribuiscono indipendentemente l’uno rispetto all’altro alla meiosi. In altre parole, i geni posti su cromosomi diversi segregano in modo indipendente nei gameti. principio della segregazione La prima legge mendeliana secondo la quale i due membri di una coppia genica (alleli) segregano (si separano) l’uno dall’altro durante la formazione dei gameti. Di conseguenza, metà dei gameti porta un allele, l’altra metà porta l’altro. principio trasformante Nell’esperimento di Frederick Griffith sulla trasformazione, l’agente sconosciuto responsabile del cambiamento nel genotipo. È ormai noto che il DNA costituisce il principio trasformante. probabilità Il rapporto tra il numero di volte in cui un dato evento avviene e il totale di tutte le prove. probando In genetica umana la persona affetta con la quale incomincia lo studio di un carattere in una famiglia. Vedi anche proposita e proposito. procariote Qualunque organismo il cui materiale genetico non sia localizzato all’interno di un nucleo circondato da una membrana. I procarioti si dividono in due gruppi distinti dal punto di vista evolutivo, Bacteria e Archaea. Vedi anche eucariote. procedura bootstrap Metodo per la determinazione dei livelli di confidenza delle ramificazioni di un albero filogenetico scelto con il metodo di massima parsimonia. profago Il genoma di un fago temperato integrato nel cromosoma batterico nel ciclo lisogenico. Un profago è replicato insieme al cromosoma cellulare. profase Il primo stadio della mitosi e della meiosi durante il quale i cromosomi duplicati condensano e diventano visibili al microscopio.

profase I Prima fase della meiosi, suddivisa in diversi sottostadi, durante i quali i cromosomi replicati condensano, gli omologhi si appaiano (sinapsi) e avviene l’evento di crossing-over. profase II La prima fase della meiosi II durante la quale i cromosomi condensano. profilo del DNA Vedi tipizzazione del DNA. Progetto Genoma Umano Progetto per ottenere la sequenza dei 3 miliardi (3 × 109) di coppie di basi dell’intero genoma umano e di mappare tutti i geni umani, il cui numero stimato è 50 000-100 000. prometafase Fase della mitosi in cui il fuso mitotico che si è formato tra le coppie di centrioli in fase di separazione entra nell’area precedentemente occupata dal nucleo, un cinetocore si lega a ogni centromero e i microtubuli del cinetocore che si originano da uno dei due poli si attaccano a ciascun cinetocore. prometafase I Fase della meiosi I in cui i nucleoli scompaiono, la membrana nucleare si dissolve, il fuso meiotico che si è formato tra le coppie di centrioli in fase di separazione entra nell’area precedentemente occupata dal nucleo, un cinetocore si lega a ogni centromero e i microtubuli del cinetocore che originano da uno dei due poli si attaccano a ciascun cinetocore. prometafase II Fase della meiosi II in cui le membrane nucleari (se si sono formate nella telofase I) si dissolvono, il fuso si organizza lungo tutta la cellula e i microtubuli del cinetocore da poli opposti si attaccano ai cinetocori di ogni cromosoma. promotore Una specifica sequenza con funzioni regolative nel DNA alla quale si lega l’RNA polimerasi per iniziare la trascrizione. Vedi anche nucleo (core) del promotore. proposizione di loci polimorfici Rapporto calcolato determinando il numero di loci con più di un allele e dividendolo per il numero totale di loci analizzati. proposita In genetica umana una donna affetta dalla quale ha inizio lo studio di un carattere nella famiglia. Vedi anche probando. proposito In genetica umana un uomo affetto dal quale ha inizio lo studio di un carattere nella famiglia. Vedi anche probando. proteina Una macromolecola composta da uno o più polipeptidi. L’attività della proteina dipende dalla sua struttura tridimensionale e composizione. proteina CAP (proteina attivatrice del catabolismo) Una proteina regolatrice che lega l’AMP ciclico (cAMP) a basse concentrazioni di glucosio, formando un complesso che stimola la trascrizione dell’operone lac e di alcuni altri operoni batterici. proteina che lega il DNA a singola elica (SSB protein) Una proteina che lega l’elica del DNA svolta in una bolla replicativa e previene il suo riavvolgimento.

Glossario

proteina iniziatrice Una proteina che lega il replicatore, stimola lo svolgimento locale del DNA e contribuisce a reclutare altre proteine necessarie per l’inizio della replicazione. proteina non istonica Una proteina acida o neutra presente nella cromatina. proteine ribosomali Un gruppo di proteine che insieme all’rRNA formano i ribosomi nei procarioti e negli eucarioti. proteoma L’insieme di tutte le proteine di una cellula. proteomica La catalogazione e l’analisi delle proteine in una cellula per stabilire quando una proteina venga espressa, i suoi livelli di produzione e con quali altre proteine possa interagire. proto-oncogene Un gene che, nelle cellule normali, svolge la funzione di controllo del normale processo di proliferazione cellulare e che, quando mutato o cambiato in qualche modo, diventa un oncogene. prototrofo Ceppo che è di genotipo selvatico per tutti i geni necessari per i processi nutrizionali e che quindi cresce in terreno minimo di coltura. Vedi anche auxotrofo. pseudodominanza L’espressione fenotipica di un allele recessivo dovuta all’assenza dell’allele dominante. pseudogene Un gene non funzionante che ha omologia di sequenza con uno o più geni funzionanti in altre parti del genoma. Punnett (quadrato di) Una matrice che descrive tutti i genotipi possibili della progenie in un incrocio genetico. purina Uno dei due tipi di basi azotate presenti nel DNA e nell’RNA. Le purine sono adenina e guanina. Q QTL Vedi loci dei caratteri quantitativi. R rafforzamento Modello secondo cui, nelle popolazioni in cui sono presenti varianti genetiche per il riconoscimento del compagno, aumenta la frequenza degli alleli che permettono agli adulti di individuarsi in modo efficace. rDNA (unità ripetute) La serie di geni per gli rRNA (18S, 5,8S e 28S) disposti uno di seguito all’altro e ripetuti molte volte sui cromosomi. reazione a catena della polimerasi (PCR) Metodo usato per replicare ripetutamente e in modo selettivo delle sequenze di DNA da una miscela di DNA, senza avere la necessità di clonare la sequenza in un organismo ospite.

645

recessività completa La situazione in cui un allele è fenotipicamente espresso solo quando è omozigote. recessivo Un allele o un fenotipo espresso solo allo stato di omozigosi. recettore SRP Il recettore della particella di riconoscimento del segnale (SRP) è una proteina integrale della membrana del reticolo endoplasmatico (RE) a cui si lega il complesso formato dal polipeptide nascente, dalla particella di riconoscimento del segnale (SRP) e dal ribosoma. Questa interazione facilita il legame del ribosoma alla superficie esterna del RE e l’inserimento del polipeptide nel lume del RE. regola del prodotto La regola secondo la quale la probabilità che due eventi indipendenti avvengano simultaneamente è data dal prodotto delle singole probabilità. regola della somma La regola secondo la quale la probabilità che avvenga uno di due eventi mutualmente escludentisi è data dalla somma delle probabilità di ciascuno dei due. regola di Haldane In riferimento alle basi genetiche della speciazione, quando, tra la progenie degli incroci tra due specie, uno dei due sessi è sterile, oppure assente o raro. Spesso gli ibridi maschili sono sterili, mentre gli ibridi femminili sono fertili. regolazione genica combinata Negli eucarioti, il controllo trascrizionale raggiunto combinando relativamente poche proteine regolatrici (negative e positive) che si legano a particolari sequenze di DNA. regressione Un’analisi statistica che permette di stabilire quanto i cambiamenti in una variabile sono correlati a quelli di un’altra. reincrocio a tre punti Incrocio tra un individuo eterozigote per tre loci e un individuo omozigote recessivo per gli stessi loci. Di solito è usato per determinare l’ordine e la distanza dei geni sul cromosoma. reincrocio di prova (testcross) Un incrocio tra un individuo a genotipo ignoto, di solito a fenotipo dominante, e un individuo omozigote recessivo allo scopo di determinare il genotipo ignoto. relazioni filogenetiche La ricostruzione della storia evolutiva di un gruppo di geni o di organismi (taxa). replica plating La procedura per trasferire l’ordine delle colonie da una piastra originaria (master plate) a una nuova piastra. In questa procedura un panno di velluto posto su un cilindro è adagiato delicatamente sulla superficie della piastra originale, in modo da prelevare un po’ di cellule da ogni colonia, che serviranno per inoculare la nuova piastra. replicatore L’intera serie di sequenze di DNA, inclusa l’origine di replicazione, necessaria per l’inizio della replicazione del DNA. replicazione a cerchio rotante Processo che si verifica quando un DNA circolare a doppio filamento si replica.

646

Glossario

replicazione bidirezionale La sintesi del DNA che avviene in entrambe le direzioni a partire dal punto di origine della replicazione. replicazione semidiscontinua Riguardante la replicazione del DNA, quando un’elica viene sintetizzata in modo continuo e l’altra in modo discontinuo. replicone Negli eucarioti un tratto di DNA cromosomico che va dall’origine di replicazione alle estremità terminali della replicazione, da ciascun lato dell’origine di replicazione stessa. Anche chiamato unità di replicazione. replisoma Il complesso formato dalla stretta associazione delle proteine fondamentali necessarie per la replicazione del DNA. repressione da catabolita L’inattivazione di un operone batterico inducibile quando è presente il glucosio, anche se l’induttore dell’operone è presente. Anche detta effetto glucosio. repressori Classe principale di proteine regolatrici della trascrizione nei procarioti. I repressori batterici di solito si legano all’operatore e impediscono la trascrizione bloccando il legame dell’RNA polimerasi. Negli eucarioti, i repressori agiscono in vari modi per controllare la trascrizione di alcuni geni. Vedi anche attivatori. repulsione Un individuo eterozigote per due loci genetici, nel quale un cromosoma omologo porta l’allele selvatico di un gene e l’altro cromosoma omologo porta l’allele mutato; detto anche configurazione in trans. Vedi anche accoppiamento. retrotrasposizione Il movimento di certi elementi genetici mobili nel genoma (retrotrasposoni) mediato da un intermedio a RNA. retrotrasposone Un tipo di elemento genetico mobile, che si trova negli eucarioti, che codifica per la trascrittasi inversa e si muove nel genoma attraverso un intermedio a RNA. retrovirus Virus a RNA a singola elica che si replicano attraverso un intermedio a DNA a doppia elica prodotto dalla trascrittasi inversa, un enzima codificato dal genoma virale. Il DNA si integra nel cromosoma dell’ospite, dove può essere trascritto. retrovirus trasducenti Retrovirus che hanno prelevato un oncogene dal genoma cellulare. retta di regressione Una retta calcolata matematicamente che rappresenta la linea che meglio interpola i punti sperimentali ottenuti per due variabili espresse l’una rispetto all’altra. La pendenza della retta di regressione indica il cambiamento di una variabile (y) associato all’unità di aumento dell’altra variabile (x). reversione Vedi mutazione per reversione. reversione parziale Una mutazione puntiforme in un allele mutato che ristabilisce completamente o parzial-

mente la funzione della proteina codificata, ma non la sequenza amminoacidica selvatica. reversione vera Una mutazione puntiforme in un allele mutato che riporta all’allele selvatico; di conseguenza, la sequenza amminoacidica e la funzione della proteina codificata vengono restaurate. RFLP (Restriction Fragment Length Polymorphism) Ovvero polimorfismo di lunghezza dei frammenti di DNA prodotti da taglio con enzimi di restrizione. I diversi profili di restrizione risultano da mutazioni puntiformi che creano o distruggono un sito di restrizione. ribonucleasi (RNasi) Un enzima che catalizza la degradazione dell’RNA in r-ribonucleotidi. ribonucleotide Qualunque nucleotide che forma l’RNA, che consiste in uno zucchero (ribosio), una base e un gruppo fosfato. ribosio Lo zucchero pentoso (5 atomi di carbonio) presente nell’RNA. ribosoma Una particella cellulare complessa, formata da proteine ribosomali e RNA ribosomale, che è il sito di polimerizzazione degli amminoacidi durante la sintesi proteica. ribozima Molecola di RNA con attività enzimatica catalitica. ricerca applicata Ricerca effettuata allo scopo di produrre o sviluppare prodotti o processi che possano essere commercializzati o perlomeno possano portare beneficio all’umanità. ricerca di base Ricerca il cui fine è l’acquisizione di nuove conoscenze. ricombinante Un cromosoma, una cellula o un individuo che presenta una combinazione non parentale di marcatori genetici, in seguito a ricombinazione genetica. ricombinazione genetica Processo mediante il quale genitori con caratteristiche genetiche diverse danno origine a progenie, in cui i geni che nei genitori differiscono vengono associati in nuove combinazioni. Per esempio, da genitori A B e a b vengono prodotti ricombinanti A b e a B. ricombinazione non omologa Ricombinazione tra sequenze di DNA non identiche o molto simili. Vedi anche ricombinazione omologa. ricombinazione omologa Ricombinazione tra sequenze di DNA identiche o molto simili; è più comune durante la meiosi. rimescolamento degli esoni Vedi rimescolamento dei domini. rimescolamento dei domini Meccanismo proposto per l’evoluzione dei geni che codificano per nuove funzioni per duplicazione e riarrangiamento di esoni che codificano per domini di proteine in diverse combinazioni. Anche detto rimescolamento degli esoni.

Glossario

rimodellamento della cromatina Alterazione della struttura del cromosoma nella vicinanze del nucleo del promotore in modo da stimolare o reprimere l’inizio della trascrizione. Il rimodellamento è dovuto a enzimi catalizzanti l’acetilazione e la deacetilazione degli istoni e il rimodellamento dei complessi dei nucleosomi. riparazione a opera della luce Vedi fotoriattivazione. riparazione al buio Vedi riparazione per escissione. riparazione di un appaiamento errato diretta dalla metilazione Un processo catalizzato da un enzima per riparare appaiamenti errati dopo che la replicazione del DNA è stata completata; diversamente dalla correzione delle bozze (proofreading) che avviene durante la replicazione. riparazione per escissione (riparazione al buio) Meccanismo enzimatico che comporta la rimozione dei dimeri di timina e la sintesi di un nuovo pezzo di DNA, complementare all’elica non danneggiata. riparazione per escissione di nucleotidi (NER) Vedi riparazione per escissione. riproduzione sessuata Riproduzione che richiede la fusione dei gameti aploidi formatisi direttamente o indirettamente mediante la meiosi. risposta alla selezione Quantità di cui varia un fenotipo in una generazione quando viene applicata la selezione a un gruppo di individui. RNA Vedi acido ribonucleico. RNA editing Vedi correzione dell’RNA. RNA messaggero (mRNA) Molecola di RNA che contiene l’informazione in codice per la sequenza amminoacidica di una proteina. RNA nucleare eterogeneo (hnRNA, heterogeneous nuclear RNA) Molecole di RNA di diversa lunghezza presenti in grande quantità nel nucleo, che includono i precursori degli mRNA maturi. RNA polimerasi Un enzima che catalizza la sintesi di molecole di RNA da uno stampo di DNA, nel processo chiamato trascrizione. RNA polimerasi DNA-dipendente Nome completo dell’RNA polimerasi, l’enzima responsabile della trascrizione, il processo di sintesi dell’RNA a partire da uno stampo di DNA. Vedi RNA polimerasi. RNA polimerasi I Si trova nel nucleolo degli eucarioti e catalizza la trascrizione dei geni per gli rRNA 18S, 5,8S e 28S. RNA polimerasi II Enzima eucariote che catalizza la trascrizione dei geni che codificano per gli mRNA e per alcuni snRNA. RNA polimerasi III Enzima eucariote che catalizza la trascrizione dei geni per i tRNA, per gli rRNA 5S e per alcuni snRNA. RNA primer La corta catena polinucleotidica a RNA prodotta dalla DNA primasi durante la replicazione del

647

DNA, alla quale vengono aggiunti nuovi nucleotidi, estendendo la nuova elica di DNA. RNA ribosomale (rRNA) Le molecole di RNA di dimensione discreta che, insieme con le proteine ribosomali, compongono i ribosomi di procarioti ed eucarioti. RNA transfer (tRNA) Una delle molecole di RNA che portano gli amminoacidi al ribosoma, dove vengono trasferiti al polipeptide tradotto. RRF Vedi fattore di riciclaggio del ribosoma. RT-PCR (PCR dopo retrotrascrizione) Metodo in due passaggi per identificare e quantificare un particolare RNA in una miscela di RNA, convertendo prima gli RNA in cDNA e poi effettuando la reazione a catena della polimerasi (PCR) con primer specifici per l’RNA di interesse. S sbilanciamento nell’uso dei codoni Un uso sproporzionato di uno o pochi codoni sinonimi in una famiglia di codoni per un particolare gene o genoma. segregazione genica Vedi principio della segregazione. selezione Azione a favore di particolari combinazioni di geni in un dato ambiente. selezione artificiale Processo che causa deliberatamente il cambiamento fenotipico dei caratteri in una popolazione determinando quali individui sopravviveranno e si riprodurranno. selezione clonale Un processo dove cellule con un tipo specifico di anticorpo sulla superficie sono stimolate a proliferare e a secernere l’anticorpo. selezione naturale Riproduzione differenziale di individui in una popolazione determinata da differenze nei loro genotipi. selvatico Termine che descrive un allele o fenotipo designato come standard (normale) per un organismo e che di solito, ma non sempre, è il prevalente nella popolazione; anche usato per designare un ceppo o un individuo. sequenza 3„ non tradotta (3„ UTR) La parte non tradotta dell’mRNA dal codone di stop del gene all’estremità 3′ della molecola dell’mRNA. sequenza 5„ non tradotta (5„ UTR) Negli eucarioti, la parte iniziale non tradotta della molecola di mRNA dall’estremità 5′ al primo codone. Contiene le informazioni per la traduzione del gene a valle. sequenza altamente ripetuta Sequenza di DNA ripetuta da 105 a 107 volte nel genoma. sequenza associata al telomero Sequenza complessa di DNA, ripetuta, che si estende all’interno dalla semplice sequenza telomerica a ogni estremità del cromosoma.

648

Glossario

sequenza CEN Sequenza di DNA centromerica nei cromosomi. Le sequenze CEN differiscono tra le diverse specie e tra i cromosomi della stessa specie. sequenza codificante Parte di una molecola di mRNA che specifica la sequenza amminoacidica di un polipeptide durante la traduzione. sequenza consenso Una serie di nucleotidi presenti con maggiore frequenza in una particolare posizione nel DNA. sequenza di branch-point (del punto di ramificazione) La sequenza consenso interna agli introni dei premRNA che contengono un nucleotide adenina (A) al quale si lega l’estremità 5′ libera dell’introne per portare al taglio dell’mRNA. sequenza di coda (trailer) Sequenza della molecola di mRNA che comincia al termine della sequenza codificante per amminoacidi e che termina con l’estremità 3′ dell’mRNA. Vedi sequenza 3′ non tradotta. sequenza di inserzione (elemento IS) Il più semplice elemento genetico trasponibile trovato nei procarioti. Questo elemento è un tratto mobile di DNA che contiene i geni necessari all’inserzione del tratto stesso in un cromosoma e alla mobilizzazione dell’elemento in siti diversi. sequenza di Shine-Dalgarno Sequenza degli mRNA procarioti situata a monte del codone d’inizio e complementare a un RNA della subunità ribosomale minore, che consente al ribosoma di posizionarsi sul codone d’inizio per il corretto avvio della traduzione. Chiamata anche sito di legame del ribosoma (RBS). sequenza guida (leader) Vedi sequenza 5′ non tradotta (5′ UTR). sequenza moderatamente ripetuta Sequenza di DNA ripetuta nel genoma da poche volte fino a 105 volte. sequenza segnale La sequenza idrofobica di 15-30 amminoacidi all’estremità amminica di una catena polipeptidica in crescita che dirige il complesso polipeptide-mRNA-ribosoma al reticolo endoplasmatico dove viene completata la traduzione. La sequenza segnale è rimossa e degradata nelle cisterne del reticolo endoplasmatico. sequenze ripetute intersperse di DNA Sequenze ripetute distribuite in modo irregolare nel genoma. sequenze telomeriche semplici Sequenze semplici di DNA, ripetute in tandem e poste alle estremità delle molecole di DNA cromosomico o molto prossime a esse. Le stesse sequenze specie-specifiche sono presenti alle estremità dei cromosomi in un organismo. sequenziamento con didesossinucleotidi Metodo per sequenziare velocemente il DNA, nel quale il DNA viene usato come stampo per la sintesi in vitro di una catena di DNA in presenza di didesossinucleotidi (ddNTP). Quando un ddNTP è incorporato nella molecola, la sin-

tesi del DNA non può proseguire e si genera una catena tronca, con il 5′ ddNTP che corrisponde al normale nucleotide presente in quel punto della sequenza. sesso eterogametico In una specie, il sesso che ha cromosomi sessuali di tipo diverso (per esempio, XY); quindi produce gameti diversi dal punto di vista del cromosoma sessuale. sesso omogametico In una specie, il sesso che ha un solo tipo di cromosoma sessuale (per esempio, X) e quindi produce solo un tipo di gameti, rispetto a quel cromosoma. Nei mammiferi, la femmina è il sesso omogametico. silenziamento dell’RNA Vedi interferenza a RNA (RNAi). silenziamento genico Inattivazione di un gene dovuta alla sua localizzazione nel genoma, a metilazione del DNA o interferenza a RNA (RNAi). Questo tipo di controllo genico spesso reprime la trascrizione di una serie di geni in una data regione di DNA. sinapsi L’intimo appaiamento dei cromosomi omologhi replicati che porta alla formazione della struttura tipo “a cerniera” (complesso sinaptinemale) tra i cromosomi omologhi nella profase I della meiosi. sindrome di Down (trisomia 21) Una condizione clinica nell’uomo caratterizzata da numerose anomalie. Di solito è causata dalla presenza di una copia soprannumeraria del cromosoma 21. sindrome di Klinefelter Sindrome clinica umana che deriva da una disomia del cromosoma X in un maschio, risultante in un cariotipo maschile 47,XXY. Molti maschi affetti hanno ritardo mentale, testicoli sottosviluppati e statura superiore alla media. sindrome di Turner Sindrome clinica umana derivante dalla monosomia per il cromosoma X nella femmina, risultante in una femmina 45,X. Queste femmine non sviluppano le caratteristiche sessuali secondarie, tendono a essere di bassa statura, ad avere pterigio del collo e mammelle poco sviluppate, a essere di solito non fertili e a presentare deficit mentali. SINE (Short Interspersed Elements, corte sequenze intersperse ripetute) Una classe di sequenze disperse altamente ripetute, che consiste di sequenze di 100400 bp di lunghezza. Le SINE si possono spostare nel genoma per retrotrasposizione. sintesi di DNA translesioni Un sistema di riparazione del DNA che permette la replicazione oltre una lesione che normalmente interromperebbe la sintesi. In E. coli questo processo è detto risposta SOS. sintesi di RNA Vedi trascrizione. sintesi proteica Vedi traduzione. siRNA (short interfering RNA) Un breve RNA a doppia elica che silenzia l’espressione genica per interferenza a RNA (RNAi).

Glossario

sistema del doppio ibrido in lievito Procedura sperimentale per trovare geni che codificano per proteine che interagiscono con una proteina nota. sistema di bilanciamento tra autosomi e cromosomi X Sistema genotipico di determinazione del sesso. Il fattore principale nella determinazione del sesso è il rapporto tra il numero dei cromosomi X e quello degli autosomi. siti fragili Loci cromosomici, evidenziabili citogeneticamente in determinate condizioni di coltura cellulare, che presentano un’aumentata frequenza di rotture cromosomiche. siti ipersensibili Regioni del DNA intorno a geni trascrizionalmente attivi, altamente sensibili alla digestione con DNasi I. Chiamati anche regioni ipersensibili. sito di clonaggio multiplo (MCS) Regione di un vettore di clonaggio contenente molti siti di restrizione diversi. Chiamata anche polylinker. sito di legame al ribosoma (RBS) Sequenza nucleotidica di una molecola di mRNA su cui il ribosoma si orienta nella fase di lettura corretta per l’inizio della traduzione. Chiamata più comunemente sequenza di Shine-Dalgarno. sito di poli(A) Sequenza degli mRNA precursori eucarioti (pre-mRNA) che dirige il taglio dell’estremità 3′ e la successiva aggiunta di nucleotidi adenina per la formazione della coda di poli(A) durante il processamento dell’RNA. sito di restrizione Sequenza di DNA riconosciuta da un enzima di restrizione. Molti enzimi di restrizione tagliano entrambi i filamenti di DNA all’interno del sito di restrizione. SNP (Single Nucleotide Polymorphisms, polimorfismi di un singolo nucleotide) Una differenza in una coppia di basi in un particolare sito (locus SNP) codificante o meno. Gli SNP che alterano un sito di restrizione causano polimorfismo per i frammenti di restrizione (RFLP). SNP “etichetta” (tag) Uno (o più) loci SNP utilizzati per analizzare e per rappresentare un intero aplotipo. snRNA (piccolo RNA nucleare) Classe di molecole di RNA degli eucarioti, associate a certe proteine a formare le piccole particelle nucleari ribonucleoproteiche (snRNP). snRNP (piccole particelle nucleari ribonucleoproteiche) Grossi complessi formati da piccoli RNA nucleari (snRNA) e proteine all’interno dei quali avviene il processamento del pre-mRNA. sonicazione Utilizzo di onde sonore a frequenza molto elevata (ben oltre la nostra capacità di udire) per distruggere cellule o molecole. soppressore di tumore Vedi proto-oncogene.

649

soppressore intergenico Mutazione il cui effetto è la soppressione delle conseguenze fenotipiche di un’altra mutazione, in un gene diverso da quello in cui è localizzata la mutazione soppressore. soppressore intragenico Mutazione che sopprime le conseguenze fenotipiche di un’altra mutazione, entro lo stesso gene in cui la mutazione soppressore è localizzata. sostituzione Una mutazione che è passata attraverso il filtro della selezione almeno a qualche livello. Southern blot Vedi tecnica di Southern blot. sovradominanza Vedi eterosi. spermatogenesi Sviluppo della cellula germinale maschile negli animali (cellule spermatiche). spliceosomi Larghi complessi presenti nel nucleo delle cellule eucariote, deputati al processamento degli mRNA. Sono formati dall’associazione di diversi snRNP legati al pre-mRNA. splicing alternativo Processo eucariote che genera differenti mRNA funzionali da un singolo mRNA precursore (pre-mRNA) attraverso l’incorporazione di esoni diversi nell’mRNA maturo. splicing dell’mRNA Processo attraverso cui l’introne (sequenza intermedia) situato tra due esoni (sequenze codificanti) in un mRNA precursore viene escisso e gli esoni uniti l’uno con l’altro. sporofito Generazione diploide asessuata nel ciclo vitale delle piante che produce spore aploidi per meiosi. stame Organo riproduttivo maschile delle piante a fiori, che di solito è formato da uno stelo, detto filamento, che porta l’antera per la produzione del polline. STR (Short Tandem Repeats) Un tipo di polimorfismo del DNA che implica la variazione del numero di piccole sequenze identiche (2-6 bp di lunghezza) che sono ripetute in tandem in un particolare locus nel genoma. Anche dette microsatelliti e sequenze ripetute semplici. struttura genetica di una popolazione Gli andamenti di variabilità genetica che si trovano tra gli individui all’interno di gruppi di individui. superavvolto Termine riferito al DNA, quando la doppia elica è stata avvolta nello spazio attorno al proprio asse. sviluppo Processo di crescita, differenziazione e morfogenesi che, partendo da uno zigote, dà origine a un individuo adulto. Comprende una serie di eventi che sono tipicamente irreversibili. T tasso di mutazione Probabilità di un certo tipo di mutazione in funzione del tempo.

650

Glossario

TATA box Una parte del promotore essenziale dei genomi eucarioti; è localizzato circa 30 bp a monte del sito di inizio della trascrizione. Chiamata anche elemento TATA, o Goldberg-Hogness box. tautomeri Forme chimiche alternative delle basi del DNA (o dell’RNA). tecnica di Southern blot Una tecnica per identificare specifici frammenti di DNA, dopo averli separati per elettroforesi su gel, trasferiti su un filtro di nitrocellulosa e ibridati con una sonda complementare; detto anche Southern blotting. Vedi anche analisi per trasferimento northern. telofase Stadio della mitosi e della meiosi durante il quale viene completata la migrazione dei cromosomi figli ai due poli. telofase I Lo stadio della meiosi I durante il quale i cromosomi (ciascuno come coppia di cromatidi fratelli) completano la migrazione ai poli e si forma una nuova membrana nucleare attorno a ogni serie di cromosomi replicati. telofase II L’ultimo stadio della meiosi II, durante il quale attorno a ogni insieme di cromosomi si forma la membrana nucleare e avviene la citocinesi. telomerasi Un enzima che aggiunge piccole sequenze di DNA ripetuto in tandem (sequenze telomeriche ripetute) alle estremità dei cromosomi eucarioti. Contiene un RNA complementare alle sequenze telomeriche e ha attività di trascrittasi inversa. telomero Insieme di sequenze specifiche alle estremità dei cromosomi lineari che stabilizza il cromosoma ed è necessario per la replicazione. teoria cromosomica dell’ereditarietà La teoria secondo cui i cromosomi portano i geni e la trasmissione dei cromosomi da una generazione all’altra è responsabile della trasmissione ereditaria dei caratteri. teoria di Hardy-Weinberg L’estensione delle leggi di Mendel che descrivono in una popolazione naturale le relazioni tra le frequenze geniche e le frequenze degli individui di vari genotipi. teoria neutrale Ipotesi secondo la quale molti dei cambiamenti evolutivi nelle molecole proteiche sono dovuti alle forze opposte degli eventi di mutazione e di deriva genetica casuale. terminatore Una sequenza di DNA alla fine del gene (regione distale) che segnala la fine della trascrizione. terreno completo Per un microrganismo, un terreno completo comprende tutte le sostanze necessarie per la sintesi delle macromolecole richieste per la crescita e la riproduzione, incluse quelle normalmente prodotte dall’organismo selvatico. terreno minimo Per un microrganismo, il terreno di crescita che contiene la serie più semplice di ingredienti (per esempio, zucchero, alcuni sali e tracce di

elementi) che il microrganismo stesso può usare per la sintesi di tutte le molecole necessarie per la propria crescita e riproduzione. test di Ames Saggio che misura la capacità degli agenti chimici di indurre mutazioni in alcuni batteri. Può individuare potenziali cancerogeni. test di complementazione Vedi cis-trans. test genetico Analisi condotte per determinare se un individuo, che ha i sintomi oppure è ad alto rischio di sviluppare una malattia genetica perché la sua famiglia ha una storia di malattia ereditaria, ha effettivamente una particolare mutazione genica. test molecolare del DNA Un test che focalizza la natura molecolare delle mutazioni associate a una malattia. tetrasomia Un tipo di aneuploidia nella quale una cellula o un organismo normalmente diploide possiede quattro copie di un particolare cromosoma invece delle due copie normali. Una cellula tetrasomica è 2N + 2. timina (T) Base pirimidinica che si trova nel DNA ma non nell’RNA. Nel DNA a doppia elica la timina si appaia con l’adenina, una purina. tipi sessuali (mating types) Negli eucarioti inferiori, due forme morfologicamente indistinguibili che portano diversi alleli e che potranno incrociarsi; equivalente ai sessi diversi negli eucarioti superiori. Vedi anche determinazione genica del sesso. tipizzazione del DNA Analisi molecolare del polimorfismo del DNA per identificare individui con caratteristiche uniche. Anche detto fingerprinting del DNA. topo knock-out Un topo nel quale un allele non funzionante di un particolare gene è stato sostituito all’allele normale, impedendo quindi la normale funzione del gene nell’individuo. topoisomerasi Un enzima che catalizza il superavvolgimento del DNA. totipotente Una cellula che ha la potenzialità di sviluppare qualsiasi tipo di cellule dell’organismo. traduzione Conversione a livello cellulare della informazione portata dalla sequenza di basi dell’mRNA nella sequenza amminoacidica di un polipeptide. Detta anche sintesi proteica. trans-dominante Il fenomeno per cui un gene o una sequenza di DNA controlla geni che si trovano su un diverso filamento di DNA. transconiugante Una cellula batterica che incorpora nel suo genoma il DNA del donatore durante una coniugazione. transgene Un gene introdotto per manipolazione nel genoma di un organismo in modo da alterarne il genotipo. transgenico Termine applicato a una cellula o a un organismo il cui genotipo è stato alterato dall’intro-

Glossario

duzione di un gene nel genoma con mezzi artificiali (per esempio, cellula transgenica o organismo transgenico). transizione Vedi mutazione per transizione. transversione Vedi mutazione per transversione. trascrittasi inversa Un enzima (una DNA polimerasi RNA-dipendente) che produce una copia di DNA complementare a un’elica di mRNA. trascrittoma L’insieme dei trascritti di mRNA in una cellula. trascrittomica Lo studio dell’espressione genica a livello dell’intero genoma. trascrizione Il processo per ottenere un RNA a singola elica complementare a un’elica (l’elica stampo) del DNA, trasferendo in questo modo l’informazione dal DNA all’RNA. Anche detta sintesi dell’RNA. trasduttanti Nei batteri, le cellule riceventi che ereditano il DNA donatore nel processo di trasduzione. trasduzione Processo mediante il quale i batteriofagi mediano il trasferimento di informazione genetica batterica da un batterio (donatore) all’altro (ricevente). trasduzione del segnale Processo attraverso il quale un segnale esterno, come un fattore di crescita, determina una specifica risposta cellulare. trasduzione generalizzata Tipo di trasduzione nella quale qualsiasi gene può essere trasferito tra batteri. trasduzione specializzata Un tipo di trasduzione nel quale vengono trasferiti solo geni specifici. trasformante Ricombinante genetico generato dal processo di trasformazione. trasformazione (1) Processo nel quale l’informazione genetica viene trasferita tra batteri mediante frammenti extracellulari di DNA. (2) Negli eucarioti, la conversione di una cellula normale con proprietà di crescita controllate a cellula cancerogena che può crescere a formare tumori. traslocazione (1) Mutazione cromosomica dovuta a un cambiamento di posizione di un segmento (o più segmenti) cromosomico e quindi delle sequenze geniche in esso contenute. (2) Nella sintesi proteica, la traslocazione è il movimento del ribosoma, un codone per volta, lungo l’mRNA verso l’estremità 3′. traslocazione robertsoniana Un tipo di traslocazione non reciproca, nella quale i bracci lunghi di due cromosomi acrocentrici omologhi o non omologhi si fondono nella regione centromerica formando cromosomi metacentrici. trasposasi Un enzima codificato da molti tipi di elementi genetici mobili che catalizza il movimento di trasposizione di questi elementi nel genoma. trasposizione Lo spostamento di materiale genetico da una posizione nel genoma a un’altra. Vedi anche retrotrasposizione.

651

trasposone Un elemento genetico mobile che contiene un gene per la trasposasi, che catalizza la trasposizione, e geni per altre funzioni, quali la resistenza ad antibiotici. trisomia Un tipo di aneuploidia, nella quale una normale cellula o organismo diploide possiede tre copie di un particolare cromosoma invece delle due copie normali. Una cellula trisomica è 2N + 1. trisomia 13 La presenza di un cromosoma 13 soprannumerario, che nell’uomo causa la sindrome di Patau. trisomia 18 La presenza di un cromosoma 18 soprannumerario, che nell’uomo causa la sindrome di Edwards. trisomia 21 La presenza di un cromosoma 21 soprannumerario, che nell’uomo causa la sindrome di Down. tRNA carico Vedi amminoacil-tRNA. tumore Una massa di cellule trasformate, che si moltiplicano in modo non controllato e differiscono dalle cellule normali anche per altre caratteristiche; anche detto neoplasma. I tumori benigni non invadono i tessuti circostanti, mentre i tumori maligni invadono i tessuti e spesso si diffondono ad altre parti del corpo. U unità di mappa (um) Unità di misura della distanza tra due geni su una mappa genetica. Una frequenza di ricombinazione dell’1% tra due geni è uguale a 1 unità di mappa. Vedi anche centimorgan. unità di trascrizione dell’rRNA Vedi DNA ribosomale. uovo Un gamete femminile maturo (cellula uovo). La cellula più grande delle due che si originano dall’oocita secondario alla seconda divisione meiotica nell’ovario femminile. UPGMA (Unweighted-Pair Group Method by Arithmetic Averages) Un approccio di tipo statistico, usato per costruire alberi filogenetici che raggruppano taxa sulla base della somiglianza tra di loro. Anche detto cluster analysis. uracile (U) Base pirimidinica che si trova nell’RNA ma non nel DNA. V valore C La quantità di DNA rinvenuta nell’assetto aploide dei cromosomi. vantaggio dell’eterozigote Vedi eterosi. varianza Misura statistica di come i valori sono distribuiti attorno alla media. varianza ambientale (VE) Componente della varianza fenotipica di un carattere che è dovuta a una qualsiasi sorgente di variazione non genetica tra gli individui di una popolazione. VE include la variazione che deriva

652

Glossario

dagli effetti ambientali, che influenzano il fenotipo in modo permanente, da effetti ambientali speciali che influenzano il fenotipo temporaneamente, e da effetti ambientali familiari che sono condivisi dai membri della famiglia. varianza di interazione (VI) Varianza genetica tra individui dovuta all’epistasi. varianza fenotipica (VF) Una misura della variabilità di un carattere quantitativo in una popolazione; matematicamente è identica alla varianza. varianza genetica (VG) Componente della varianza fenotipica di un carattere dovuta a differenze genetiche tra gli individui in una popolazione. VG include la variabilità che dipende dall’effetto di alleli dominanti, dall’effetto di alleli additivi e dalle interazioni epistatiche tra i geni. vettore di clonazione Molecola di DNA a doppia elica capace di replicarsi autonomamente in una cellula ospite e a cui un frammento di DNA può essere legato per formare una molecola di DNA ricombinante adatta alla clonazione. vettore di espressione Un vettore per il clonaggio che porta un promotore e altre sequenze richieste per l’espressione di un gene clonato nella cellula ospite. vettore fagico Un fago che porta pezzi di DNA batterico da un ceppo batterico a un altro nel processo di trasduzione. vettore navetta (shuttle) Vettore di clonazione che può replicarsi in due o più organismi ospiti.

virus tumorali Virus che inducono le cellule a differenziarsi e a dividersi dando origine a un tumore. VNTR (Variable Number of Tandem Repeats) Un tipo di polimorfismo del DNA che coinvolge la variazione del numero di sequenza identiche (lunghe da 7 a poche decine di basi) che sono ripetute in tandem in un dato locus nel genoma. Detto anche minisatellite. W Whole-genome shotgun Vedi approccio whole-genome shotgun per il sequenziamento del genoma. X X-linked Riferito a geni localizzati sul cromosoma X. Z zigonema Lo stadio della meiosi alla profase I durante il quale i cromosomi omologhi cominciano ad appaiarsi in modo altamente specifico per tutta la loro lunghezza. zigote La cellula prodotta dalla fusione dei gameti maschile (sperma) e femminile (uovo). zucchero pentoso Zucchero a cinque atomi di carbonio che, insieme con le basi azotate e i gruppi fosfato, è uno dei tre componenti dei nucleotidi.

Letture consigliate

Capitolo 1: Introduzione alla genetica Genetics Review. http://www.ncbi.nlm.nih.gov/Class/ MLACourse/Original8Hour/Genetics/ Sturtevant, A.H. 1965. A history of genetics. New York: Harper & Row. Capitolo 2: DNA: il materiale genetico DNA Structure. http://www.johnkyrk.com/DNAanatomy.html Arya, G., and Schlick, T. 2006. Role of histone tails in chromatin folding revealed by a mesoscopic oligonucleosome model. Proc. Natl. Acad. Sci. USA 103: 16236-16241. Avery, O.T., MacLeod, C.M., and McCarty, M. 1944. Studies on the chemical nature of the substance inducing transformation of pneumococcal types. Induction of transformation by a deoxyribonucleic acid fraction isolated from pneumococcus type III. J. Exp. Med. 79:137-158. Blackburn, E.H. 1994. Telomeres: No end in sight. Cell 77:621-623. Britten, R.J., and Kohne, D.E. 1968. Repeated sequences in DNA. Science 161:529-540. Chargaff, E. 1951. Structure and function of nucleic acids as cell constituents. Fed. Proc. 10:654-659. Clarke, L. 1990. Centromeres of budding and fission yeasts. Trends Genet. 6:150-154. D’Ambrosio, E., Waitzikin, S.D., Whitney, F.R., Salemme, A., and Furano, A.V. 1985. Structure of the highly repeated, long interspersed DNA family (LINE or L1Rn) of the rat. Mol. Cell. Biol. 6:411-424. Dickerson, R.E. 1983. The DNA helix and how it is read. Sci. Am. 249 (Dec):94-111. Franklin, R.E., and Gosling, R. 1953. Molecular configuration of sodium thymonucleate. Nature 171:740-741. Geis, I. 1983. Visualizing the anatomy of A, B, and ZDNAs. J. Biomol. Struct. Dyn. 1:581-591. Gierer, A., and Schramm, G. 1956. Infectivity of ribonucleic acid from tobacco mosaic virus. Nature 177:702703. Greider, C.W. 1999. Telomeres do D-loop-T-loop. Cell 97:419-422. Griffith, F. 1928. The significance of pneumococcal types. J. Hyg. (Lond.) 27:113-159. Griffith, J.D., Corneau, L., Rosenfield, S., Stansel, R.M., Bianchi, A., Moss, H., and de Lange, T. 1999. Mammalian telomeres end in a large duplex loop. Cell 97:503514.

Grosschedl, R., Giese, K., and Pagel, J. 1994. HMG domain proteins: Architectural elements in the assembly of nucleoprotein structures. Trends Genet. 10:94-100. Grunstein, M. 1998. Yeast heterochromatin: Regulation of its assembly and inheritance by histones. Cell 93:325328. Hershey, A.D., and Chase, M. 1952. Independent functions of viral protein and nucleic acid in growth of bacteriophage. J. Gen. Physiol. 36:39-56. Jaworski, A., Hsieh, W.T., Blaho, J.A., Larson, J.E., and Wells, R.D. 1987. Left-handed DNA in vivo. Science 238:773-777. Korenberg, J.R., and Rykowski, M.C. 1988. Human genome organization: Alu, LINES, and the molecular structure of metaphase chromosome bands. Cell 53:391-400. Kornberg, R.D., and Klug, A. 1981. The nucleosome. Sci. Am. 244 (Feb):52-64. Kornberg, R.D., and Lorch, Y. 1999. Twenty-five years of the nucleosome, fundamental particle of the eukaryote chromosome. Cell 98:285-294. Krishna, P., Kennedy, B.P., van de Sande, J.H., and McGhee, J.D. 1988. Yolk proteins from nematodes, chickens, and frogs bind strongly and preferentially to lefthanded ZDNA. J. Biol. Chem. 263:19066-19070. Mason, J.M., and Biessmann, A. 1995. The unusual telomeres of Drosophila. Trends Genet. 11:58-62. Moyzis, R.K. 1991. The human telomere. Sci. Am. 265 (Aug):48-55. Olins, A.L., Carlson, R.D., and Olins, D.E. 1975. Visualization of chromatin substructure: Nu-bodies. J. Cell Biol. 64:528-537. Pauling, L., and Corey, R.B. 1956. Specific hydrogen-bond formation between pyrimidines and purines in deoxyribonucleic acids. Arch. Biochem. Biophys. 65:164-181. Pluta, A.F., Mackay, A.M., Ainsztein, A.M., Goldberg, I.G., and Earnshaw, W.C. 1995. The centromere: Hub of chromosomal activities. Science 270:1591-1594. Pruss, D., Bartholomew, B., Persinger, J., Hayes, J., Arents, G., Moudrianakis, E.N., and Wolfe, A. P. 1996. An asymmetric model for the nucleosome: A binding site for linker histones inside the DNA gyres. Science 274:614-617. Singer, M.F. 1982. SINEs and LINEs: Highly repeated short and long interspersed sequences in mammalian genomes. Cell 28:133-134. Sinsheimer, R.L. 1959. A single-stranded deoxyribonucleic acid from bacteriophage J. Mol. Biol. 1:43-53.

654

Letture consigliate

Wang, A.H.J., Quigley, G.J., Kolpak, F J., Crawford, J.L., van Boom, J.H., van der Marel, G., and Rich, A. 1979. Molecular structure of a left-handed double helical DNA fragment at atomic resolution. Nature 282:680-686. Wang, J.C. 1982. DNA topoisomerases. Sci. Am. 247 (Jul):94-109. Watson, J.D. 1968. The double helix. New York: Atheneum. Watson, J.D., and Crick, F.H.C. 1953. Genetical implications of the structure of deoxyribonucleic acid. Nature 171:964-969. 1953. Molecular structure of nucleic acids. A structure for deoxyribose nucleic acid. Nature 171:737-738. Wilkins, M.H.F., Stokes, A.R., and Wilson, H.R. 1953. Molecular structure of deoxypentose nucleic acids. Nature 171:738-740. Capitolo 3: La replicazione del DNA DNA Replication. http://users.rcn.com/jkimball.ma.ultranet/BiologyPages/D/DNAReplication.html Andrews, B., and Measday, V. 1998. The cyclin family of budding yeast: Abundant use of a good idea. Trends Genet. 14:66-72. Armanios, M., and Greider, C.W. 2005. Telomerase and cancer stem cells. Cold Spring Harbor Symp. Quant. Biol. 70:205-208. Blasco, M.A. 2005. Telomeres and human disease: Ageing, cancer, and beyond. Nature Rev. Genet. 6:611-622. Chan, S.R.W.L., and Blackburn, E.H. 2004. Telomeres and telomerase. Phil. Trans. R. Soc. Lond. B. 359:109-121. Cimbora, D.M., and Groudine, M. 2001. The control of mammalian DNA replication: A brief history of space and timing. Cell 104:643-646. Cook, P.R. 1999. The organization of replication and transcription. Science 284:1790-1795. DeLucia, P., and Cairns, J. 1969. Isolation of an E. coli strain with a mutation affecting DNA polymerase. Nature 224:1164-1166. Diller, J.D., and Raghuraman, M.K. 1994. Eukaryotic replication origins: Control in space and time. Trends Biochem. 19:320-325. Flores, I., Cayuela, M.L., and Blasco, M.A. 2005. Effects of telomerase and telomere length on epidermal stem cell behavior. Science 209:1253-1256. Gilbert, W., and Dressler, D. 1968. DNA replication: The rolling circle model. Cold Spring Harbor Symp. Quant. Biol. 33:473-484. Grabowski, B., and Kelman, Z. 2003. Archaeal DNA replication: Eukaryal proteins in a bacterial context. Annu. Rev. Microbiol. 57:487-516. Greider, C.W., and Blackburn, E.. 1996. Telomeres, telomerase and cancer. Sci. Am. 274 (Feb):92-97. Huberman, J.A., and Riggs, A.D. 1968. On the mechanism of DNA replication in mammalian chromosomes. J. Mol. Biol. 32:327-341.

Kornberg, A. 1960. Biologic synthesis of deoxyribonucleic acid. Science 131:1503-1508. FX174. Lendvay, T.S., Morris, D.K., Sah, J., Balasubramanian, B., and Lundblad, V. 1996. Senescence mutants of Saccharomyces cerevisiae with a defect in telomere replication identify three additional EST genes. Genetics 144:1399-1412. Meselson, M., and Stahl, F.W. 1958. The replication of DNA in Escherichia coli. Proc. Natl. Acad. Sci. USA 44:671-682. Nieduszynski, C.A., Knox, Y., and Donaldson, A.D. 2006. Genome-wide identification of replication origins in yeast by comparative genomics. Genes Dev. 20:1874-1879. Ogawa, T., Baker, T.A., van der Ende, A., and Kornberg, A. 1985. Initiation of enzymatic replication at the origin of the Escherichia coli chromosome: Contributions of RNA polymerase and primase. Proc. Natl. Acad. Sci. USA 82:3562-3566. Ogawa, T., and Okazaki, T. 1980. Discontinuous DNA replication. Annu. Rev. Biochem. 49:424-457. Okazaki, R.T., Okazaki, K., Sakobe, K., Sugimoto, K., and Sugino, A. 1968. Mechanism of DNA chain growth. I. Possible discontinuity and unusual secondary structure of newly synthesized chains. Proc. Natl. Acad. Sci. USA 59:598-605. Rossi, M.L., and Bambara, R.A. 2006. Reconstituted Okazaki fragment processing indicates two pathways of primer removal. J. Biol. Chem. 281:26051-26061. Runge, K.W., and Zakian, V.A. 1996. TEL2, an essential gene required for telomere length regulation and telomere position effect in Saccharomyces cerevisiae. Mol. Cell. Biol. 16:3094-3105. Shippen-Lentz, D., and Blackburn, E.H. 1990. Functional evidence for an RNA template in telomerase. Science 247:546-552. Stillman, B. 1994. Smart machines at the DNA replication fork. Cell 78:725-728. Taylor, J.H. 1970. The structure and duplication of chromosomes. In Genetic organization, E. Caspari and A. Ravin, eds., vol. 1 (pp. 163-221). New York: Academic Press. Van der Ende, A., Baker, T.A., Ogawa, T., and Kornberg, A. 1985. Initiation of enzymatic replication at the origin of the Escherichia coli chromosome: Primase as the sole priming enzyme. Proc. Natl. Acad. Sci. USA 82:3954-3958. Wright, W.E., Piatyszek, M.A., Rainey, W.E., Byrd, W., and Shay, J.W. 1996. Telomerase activity in human germline and embryonic tissues and cells. Dev. Genet. 18:173-179. Zyskind, J.W., and Smith, D.W. 1986. The bacterial origin of replication, oriC. Cell 46:489-490. Capitolo 4: La funzione del gene Beadle, G.W., and Tatum, E.L. 1942. Genetic control of biochemical reactions in Neurospora. Proc. Natl. Acad. Sci. USA 27:499-506.

Letture consigliate

Bush, A., Chodhari, R., Collins, N., Copeland, F., Hall, P., Harcourt, J., Hariri, M., Hogg, C., Lucas, J., Mitchison, H.M., O’Callaghan, C., and Phillips, G. 2007. Primary ciliary dyskinesia: Current state of the art. Arch. Dis. Child. 92:1136-1140. [Primary ciliary dyskinesia is a pseudonym for Kartagener syndrome.] Collins, F. 1992. Cystic fibrosis: Molecular biology and therapeutic implications. Science 256:774-779. Garrod, A.E. 1909. Inborn errors of metabolism. New York: Oxford University Press. Geremek, M., and Witt, M. 2004. Primary ciliary dyskinesia: Genes, candidate genes and chromosomal regions. J. Appl. Genet. 45:347-361. [Primary ciliary dyskinesia is a pseudonym for Kartagener syndrome.] Gilbert, F., Kucherlapati, R., Creagan, R.P., Murnane, M.J., Darlington, G.J., and Ruddle, F.H. 1975. Tay-Sachs and Sandhoff’s diseases: The assignment of genes for hexosaminidase A and B to individual human chromosomes. Proc. Natl. Acad. Sci. USA 72:263-267. Gusella, J.F., Wexler, N.S., Conneally, P.M., Naylor, S.L., Anderson, M.A., Tanzi, R.E., Watkins, P.C., Ottina, K., Wallace, M.R., Sakaguchi, A.Y., Young, A.B., Shoulson, I., Bonilla, E., and Martin, J.B. 1993. A polymorphic DNA marker genetically linked to Huntington’s disease. Nature 306:234-238. Guttler, F., and Woo, S.L.C. 1986. Molecular genetics of PKU. J. Inherit. Metab. Dis. 9 (Suppl. 1):58-68. Ha, M.N., Graham, F.L., D’Souza, C.K., Muller, W.J., Igdoura, S.A., and Schellhorn, H.E. 2004. Functional rescue of vitamin C synthesis deficiency in human cells using adenoviral-based expression of murine l-gulonogamma-lactone oxidase. Genomics 83:482-492. Inai, Y., Ohta, Y., and Nishikimi, M. 2003. The whole structure of the human nonfunctional L-gulono-gammalactone oxidase gene – the gene responsible for scurvy – and the evolution of repetitive sequences thereon. J. Nutr. Sci. Vitaminol. (Tokyo) 49:315-319. Ingram, V.M. 1963. The hemoglobins in genetics and evolution. New York: Columbia University Press. Kaput, J., and Rodriguez, R.L. 2004. Nutritional genomics: The next frontier in the postgenomic era. Physiol. Genomics 16:166-177. McIntosh, I., and Cutting, G.R. 1992. Cystic fibrosis transmembrane conductance regulator and the etiology and pathogenesis of cystic fibrosis. FASEB J. 6:2775-2782. Motulsky, A.G. 1973. Frequency of sickling disorders in U.S. blacks. N. Engl. J. Med. 288:31-33. Neel, J.V. 1949. The inheritance of sickle-cell anemia. Science 110:64-66. Pauling, L., Itano, H.A., Singer, S.J., and Wells, J.C. 1949. Sicklecell anemia, a molecular disease. Science 110:543548. Riordan, J.R., Rommens, J.M., Kerem, B., Alon, N., Rozmahel, R., Grzelczak, Z., Zielenski, J., Lok, S., Plavsic, N., Chou, J.L., Drumm, M.L., Ianuzzi, M.C., Collins,

655

F.S., and Tsui, L.C. 1989. Identification of the cystic fibrosis gene: Cloning and characterization of complementary DNA. Science 245:1066-1073. Rommens, J.M., Ianuzzi, M.C., Kerem, B., Drumm, M.L., Melmer, G., Dean, M., Rozmahel, R., Cole, J.L., Kennedy, D., Hidaka, N., Zsiga, M., Buchwald, M., Riordan, J.R., Tsui, L.C., and Collins, F.S. 1989. Identification of the cystic fibrosis gene: Chromosome walking and jumping. Science 245:1059-1065. Scriver, C.R., and Clow, C.L. 1980. Phenylketonuria and other phenylalanine hydroxylation mutants in man. Annu. Rev. Genet. 14:179-202. Scriver, C.R., and Waters, P.J. 1999. Monogenic traits are not simple: Lessons from phenylketonuria. Trends Genet. 15:267-272. Srb, A.M., and Horowitz, N.H. 1944. The ornithine cycle in Neurospora and its genetic control. J. Biol. Chem. 154:129-139. Capitolo 5: Espressione genica: la trascrizione Eukaryotic Transcription. http://www.mun.ca/biochem/ courses/3107/Topics/euk_transcription.html Gene Expression: Transcription. http://users.rcn.com/ jkimball.ma.ultranet/BiologyPages/T/Transcription.html Baker, T.A., and Bell, S.P. 1998. Polymerases and the replisome: Machines within machines. Cell 92:295-305. Barabino, S.M.L., and Keller, W. 1999. Last but not least: Regulated poly(A) tail formation. Cell 99:9-11. Bogenhagen, D.F., Sakonju, S., and Brown, D.D. 1980. A control region in the center of the 5S RNA gene directs specific initiation of transcription II: The 3′ border of the region. Cell 19:27-35. Breathnach, R., and Chambon, P. 1981. Organization and expression of eucaryotic split genes coding for proteins. Annu. Rev. Biochem. 50:349-383. Breathnach, R., Mandel, J.L., and Chambon, P. 1977. Ovalbumin gene is split in chicken DNA. Nature 270:314318. Brody, E., and Abelson, J. 1985. The “spliceosome”: Yeast premessenger RNA associates with a 40S complex in a splicing-dependent reaction. Science 228:963-967. Buratowski, S. 1994. The basics of basal transcription by RNA polymerase II. Cell 77:1-3. Busby, S., and Ebright, R.H. 1994. Promoter structure, promoter recognition, and transcription activation in prokaryotes. Cell 79:743-746. Cate, J.H., Yusupov, M.M., Yusupova, G.Z., Earnest, T.N., and Noller, H.F. 1999. X-ray crystal structures of 70S ribosome functional complexes. Science 285:2095-2104. Cech, T.R. 1983. RNA splicing: Three themes with variations. Cell 34:713-716. 1985. Self-splicing RNA: Implications for evolution. Int. Rev. Cytol. 93:3-22. 1986. The generality of self-splicing RNA: Relationship to nuclear mRNA splicing. Cell 44:207-210.

656

Letture consigliate

Choi, Y.D., Grabowski, P.J., Sharp, P.A., and Dreyfuss, G. 1986. Heterogeneous nuclear ribonucleoproteins: Role in RNA splicing. Science 231:1534-1539. Cook, P. R. 1999. The organization of replication and transcription. Science 284:1790-1795. Cramer, P., Bushnell, D.A., Fu, J., Gnatt, A.L., Maier-Davis, B., Thompson, N.E., Burgess, R.R., Edwards, A.M., David, P.R., and Kornberg, R. D. 2000. Architecture of RNA polymerase II and implications for the transcription mechanism. Science 288:640-649. Crick, F.H.C. 1979. Split genes and RNA splicing. Science 204:264-271. Grabowski, P.J., Seiler, S.R., and Sharp, P.A. 1985. A multicomponent complex is involved in the splicing of messenger RNA precursors. Cell 42:355-367. Green, M.R. 1986. Pre-mRNA splicing. Annu. Rev. Genet. 20:671-708. 1991. Biochemical mechanisms of constitutive and regulated pre-mRNA splicing. Annu. Rev. Cell Biol. 7:559-599. Guarente, L. 1988. UASs and enhancers: Common mechanism of transcriptional activation in yeast and mammals. Cell 52:303-305. Guthrie, C. 1992. Messenger RNA splicing in yeast: Clues to why the spliceosome is a ribonucleoprotein. Science 253:157-163. Guthrie, C., and Patterson, B. 1988. Spliceosomal snRNAs. Annu. Rev. Genet. 22:387-419. Horowitz, D.S., and Krainer, A.R. 1994. Mechanisms for selecting 5′ splice sites in mammalian pre-mRNA splicing. Trends Genet. 10:100-105. Jeffreys, A.J., and Flavell, R.A. 1977. The rabbit beta-globin gene contains a large insert in the coding sequence. Cell 12:1097-1108. Kim, T.H., Barrera, L.O., Zheng, M., Qu, C., Singer, M.A., Richmond, T.A., Wu, Y., Green, R.D., and Ren, B. 2005. A high-resolution map of active promoters in the human genome. Nature 436:876-880. Kim, M., Vasiljeva, L., Rando, O.J., Zhelkovsky, A., Moore, C., and Buratowski, S. 2006. Distinct pathways for snoRNA and mRNA termination. Mol. Cell 24:723-734. Korzheva, N., Mustaev, A., Kozlov, M., Malhotra, A., Nikiforov, V., Goldfarb, A., and Darst, S.A. 2000. A structural model of transcription elongation. Science 289:619625. Marmur, J., Greenspan, C.M., Palecek, E., Kahan, F.M., Levine, J., and Mandel, M. 1963. Specificity of the complementary RNA formed by Bacillus subtilis infected with bacteriophage SP8. Cold Spring Harbor Symp. Quant. Biol. 28:191-199. Narlikar, G.J., Fan, H.Y., and Kingston, R.E. 2002. Cooperation between complexes that regulate chromatin structure and transcription. Cell 108:475-487. Nilsen, T.W. 1994. RNA-RNA interactions in the spliceosome: Unraveling the ties that bind. Cell 78:1-4.

Nomura, M. 1973. Assembly of bacterial ribosomes. Science 179:864-873. O’Hare, K. 1995. mRNA 3′ ends in focus. Trends Genet. 11:253-257. Orphanides, G., and Reinberg, D. 2000. A unified theory of gene expression. Cell 108:439-451. Padgett, R.A., Grabowski, P.J., Konarska, M.M., and Sharp, P.A. 1985. Splicing messenger RNA precursors: Branch sites and lariat RNAs. Trends Biochem. Sci. (April):154-157. Proudfoot, N., Furger, A., and Dye, A. J. 2002. Integrating mRNA processing with transcription. Cell 108:501-512. Reed, R. 2003. Coupling transcription, splicing and mRNA export. Curr. Opin. Cell Biol. 15:326-331. Sharp, P.A. 1985. On the origin of RNA splicing and introns. Cell 42:397-400. 1994. Split genes and RNA splicing. Nobel lecture. Cell 77:805-815. Simpson, L., and Thiemann, O.H. 1995. Sense from nonsense: RNA editing in mitochondria of kinetoplastid protozoa and slime molds. Cell 81:837-840. Sollner-Webb, B. 1988. Surprises in polymerase III transcription. Cell 52:153-154. Thompson, C.C., and McKnight, S. L. 1992. Anatomy of an enhancer. Trends Genet. 8:232-236. Tilghman, S.M., Curis, P.J., Tiemeier, D.C., Leder, P., and Weissman, C. 1978. The intervening sequence of a mouseglobin gene is transcribed within the 15S β-globin mRNA precursor. Proc. Natl. Acad. Sci. USA 75:1309-1313. Tilghman, S.M., Tiemeier, D.C., Seidman, J.G., Peterlin, B.M., Sullivan, M., Maizel, J.V., and Leder, P. 1978. Intervening sequence of DNA identified in the structural portion of a mouse beta-globin gene. Proc. Natl. Acad. Sci. USA 78:725-729. Weinstock, R., Sweet, R., Weiss, M., Cedar, H., and Axel, R. 1978. Intragenic DNA spacers interrupt the ovalbumin gene. Proc. Natl. Acad. Sci. USA 75:1299-1303. White, R.J., and Jackson, S.P. 1992. The TATA-binding protein: A central role in transcription by RNA polymerases I, II, and III. Trends Genet. 8:284-288. Woychik, N.A., and Hampsey, M. 2002. The RNA polymerase II machinery: Structure illuminates function. Cell 108:453-463. Zaug, A.J., and Cech, T.R. 1986. The intervening sequence RNA of Tetrahymena is an enzyme. Science 231:470475. Capitolo 6: Espressione genica: la traduzione Translation. http://users.rcn.com/jkimball.ma.ultranet/ BiologyPages/T/Translation.html Ban, N., Nissen, P., Hansen, J., Moore, P.B., and Steitz, T.A. 2000. The complete atomic structure of the large ribosomal subunit at 2.4Å resolution. Science 289:905-920. Blobel, G., and Dobberstein, B. 1975. Transfer of proteins across membranes. I. Presence of proteolytically proces-

Letture consigliate

sed and unprocessed nascent immunoglobulin light chains on membrane-bound ribosomes of murine myeloma. J. Cell Biol. 67:835-851. Brenner, S., Jacob, F., and Meselson, M. 1961. An unstable intermediate carrying information from genes to ribosomes for protein synthesis. Nature 190:576-581. Carter, A.P., Clemons, W.M., Brodersen, D.E., MorganWarren, R.J., Wimberly, B.T., and Ramakrishnan, V. 2000. Functional insights from the structure of the 30S ribosomal sub-unit and its interactions with antibiotics. Nature 407:340-348. Crick, F.H.C. 1966. Codon-anticodon pairing: The wobble hypothesis. J. Mol. Biol. 19:548-555. Crick, F.H.C., Barnett, L., Brenner, S., and Watts-Tobin, R.J. 1961. General nature of the genetic code for proteins. Nature 192:1227-1232. Garen, A. 1968. Sense and nonsense in the genetic code. Science 160:149-159. Khorana, H.G. 1966-67. Polynucleotide synthesis and the genetic code. Harvey Lect. 62:79-105. Kimchi-Sarfaty, C., Oh, J.M., Kim, I.W., Sauna, Z.E., Calcagno, A.M., Ambudkar, S.V., and Gottesman, M.M. 2007. A “silent” polymorphism in the MDR1 gene changes substrate specificity. Science 315:525-528. Komar, A.A. 2007. SNPs, silent but not invisible. Science 315:466-467. Kozak, M. 1983. Comparison of initiation of protein synthesis in procaryotes, eucaryotes, and organelles. Microbiol. Rev. 47:1-45. 1989. Context effects and inefficient initiation at nonAUG codons in eukaryotic cell-free translation systems. Mol. Cell. Biol. 9:5073-5080. McCarthy, J.E.G., and Brimacombe, R. 1994. Prokaryotic translation: The interactive pathway leading to initiation. Trends Genet. 10:402-407. Meyer, D.I. 1982. The signal hypothesis: A working model. Trends Biochem. Sci. 7:320-321. Morgan, A.R., Wells, R.D., and Khorana, HG. 1966. Studie on polynucleotides. LIX. Further codon assignments from amino acid incorporation directed by ribopolynucleotides containing repeating trinucleotide sequences. Proc. Natl. Acad. Sci. USA 56:1899-1906. Nierhaus, K.H. 1990. The allosteric three-site model for the ribosomal elongation cycle: Features and future. Biochemistry 29:4997-5008. Nirenberg, M., and Leder, P. 1964. RNA code words and protein synthesis. Science 145:1399-1407. Nirenberg, M., and Matthaei, J.H. 1961. The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polyribonucleotides. Proc. Natl. Acad. Sci. USA 47:1588-1602. Nissen, P., Hansen, J., Ban, N., Moore, P.B., and Steitz, T.A. 2000. The structural basis of ribosome activity in peptide bond formation. Science 289:920-930. Noller, H.F., Hoffarth, V., and Zimniak, L. 1992. Unusual

657

resistance of peptidyl transferase to protein extraction procedures. Science 256:1416-1419. Ramakrishnan, V. 2002. Ribosome structure and the mechanism of translation. Cell 108:557-572. Ryan, K.R., and Jensen, R.E. 1995. Protein translocation across mitochondrial membranes: What a long, strange trip it is. Cell 83:517-519. Schnell, D.J. 1995. Shedding light on the chloroplast protein import machinery. Cell 83:521-524. Shine, J., and Dalgarno, L. 1974. The 3′-terminal sequence of Escherichia coli 16S ribosomal RNA: Complementarity to nonsense triplet and ribosome binding sites. Proc. Natl. Acad. Sci. USA 71:1342-1346. Watson, J.D. 1963. The involvement of RNA in the synthesis of proteins. Science 140:17-26. Zheng, N., and Gierasch, L. M. 1996. Signal sequences: The same yet different. Cell 86:849-852. Capitolo 7: Mutazione, riparazione del DNA, ed elementi trasponibili Profiles in Science; The Barbara McClintock Papers. http://profiles.nlm.nih.gov/LL/ Transposable genetic elements. http://www.ndsu.nodak. edu/instruct/mcclean/plsc431/transelem/trans1.htm Ames, B.N., Durston, W.E., Yamasaki, E., and Lee, F. 1973. Carcinogens are mutagens: A simple test system combining liver homogenates for activation and bacteria for detection. Proc. Natl. Acad. Sci. USA 70:2281-2285. Boeke, J.D., Garfinkel, D.J., Styles, C.A., and Fink, G.R. 1985. Ty elements transpose through an RNA intermediate. Cell 40:491-500. Boyce, R.P., and Howard-Flanders, P. 1964. Release of ultraviolet light-induced thymine dimers from DNA in E. coli K12. Proc. Natl. Acad. Sci. USA 51:293-300. Cleaver, J.E. 1994. It was a very good year for DNA repair. Cell 76:1-4. Cohen, S.N., and Shapiro, J.A. 1980. Transposable genetic elements. Sci. Am. 242 (Feb):40-49. Devoret, R. 1979. Bacterial tests for potential carcinogens. Sci. Am. 241 (Aug):40-49. Federoff, N.V. 1989. About maize transposable elements and development. Cell 56:181-191. Fishel, R., Lescoe, M.K., Rao, M.R.S., Copeland, N.G., Jenkins, N.A., Garber, J., Kane, M., and Kolodner, R. 1993. The human mutator gene homolog MSH2 and its association with hereditary nonpolyposis colon cancer. Cell 75:1027-1038. Kingsman, A.J., and Kingsman, S.M. 1988. Ty: A retroelement moving forward. Cell 53:333-335. Lederberg, J., and Lederberg, E.M. 1952. Replica plating and indirect selection of bacterial mutants. J. Bacteriol. 63:399-406. Luria, S.E., and Delbrück, M. 1943. Mutations of bacteria from virus sensitivity to virus resistance. Genetics 28: 491-511.

658

Letture consigliate

Makarova, K.S., Aravind, L., Wolf, Y.I., Tatusov, R.L., Minton, K.W., Koonin, E.V., and Daly, M.J. 2001. Genome of the extremely radiation-resistant bacterium Deinococcus radiodurans viewed from the perspective of comparative genomics. Microbiol. Mol. Biol. Rev. 65:4479. Makarova, K.S., Omelchenko, M.V., Gaidamakova, E.K., Matrosova, V.Y., Vasilenko, A., Zhai, M., Lapidus, A., Copeland, A., Kim, E., Land, M., Mavrommatis, K., Pitluck, S., Richardson, P.M., Detter, C., Brettin, T., Saunders, E., Lai, B., Ravel, B., Kemner, K.M., Wolf, Y.I., Sorokin, A., Gerasimova, A.V., Gelfand, M.S., Fredrickson, J.K., Koonin, E.V., and Daly, M.J. 2007. Deinococcus geothermalis: The pool of extreme radiation resistance genes shrinks. PLoS ONE 2:e955. McClintock, B. 1939. The behavior in successive nuclear divisions of a chromosome broken at meiosis. Proc. Natl. Acad. Sci. USA 25:405-416. 1950. The origin and behavior of mutable loci in maize. Proc. Natl. Acad. Sci. USA 36:344-355. 1951. Chromosome organization and genic expression. Cold Spring Harbor Symp. Quant. Biol. 16:13-47. 1953. Induction of instability at selected loci in maize. Genetics 38:579-599. 1956. Controlling elements and the gene. Cold Spring Harbor Symp. Quant. Biol. 21:197-216. 1961. Some parallels between gene control systems in maize and in bacteria. Am. Naturalist 95:265-277. 1965. The control of gene action in maize. Brookhaven Symp. Biol. 18:162 ff. 1984. The significance of responses of the genome to challenge. Nobel lecture. Science 226:792-801. Morgan, A.R. 1993. Base mismatches and mutagenesis: How important is tautomerism? Trends Biochem. Sci. 18:160-163. Pashin, Y.V., and Bakhitova, L.M. 1979. Mutagenic and carcinogenic properties of polycyclic aromatic hydrocarbons. Env. Health Perspectives 30:185-189. Setlow, R.B., and Carrier, W.L. 1964. The disappearance of thymine dimers from DNA: An error-correcting mechanism. Proc. Natl. Acad. Sci. USA 51:226-231. Tessman, I., Liu, S.K., and Kennedy, A. 1992. Mechanism of SOS mutagenesis of UV-irradiated DNA: Mostly error-free processing of deaminated cytosine. Proc. Natl. Acad. Sci. USA 89:1159-1163. Capitolo 8: La genomica: la mappatura e il sequenziamento dei genomi Cloning and Molecular Analysis of Genes. http://www. ndsu.nodak.edu/instruct/mcclean/plsc431/cloning/ Genome Research and Genetics News: Nature Genome Gateway. http://www.nature.com/genomics/ Recombinant DNA and Gene Cloning. http://users.rcn. com/jkimball.ma.ultranet/BiologyPages/R/RecombinantDNA.html

Adams, M.D., et al. 2000. The genome sequence of Drosophila melanogaster. Science 287:2185-2215. Arabidopsis Genome Initiative. 2000. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408:796-815. Arber, W. 1965. Host-controlled modification of bacteriophage. Annu. Rev. Microbiol. 19:365-378. Arber, W., and Dussoix, D. 1962. Host specificity of DNA produced by Escherichia coli I. Host controlled modification of bacteriophage lambda. J. Mol. Biol. 5:18-36. Blattner, F.R., et al. 1997. The complete genome sequence of Escherichia coli K-12. Science 277:1453-1463. Boyer, H.W. 1971. DNA restriction and modification mechanisms in bacteria. Annu. Rev. Microbiol. 25:153-176. Bult, C.J., et al. 1996. Complete genome sequence of the methanogenic archaeon, Methanococcus jannaschii. Science 273:1058-1073. The C. elegans Sequencing Consortium. 1998. Genome sequence of the nematode C. elegans: A platform for investigating biology. Science 282:2012-2018. Danna, K., and Nathans, D. 1971. Specific cleavage of simian virus 40 DNA by restriction endonuclease of Haemophilus influenzae. Proc. Natl. Acad. Sci. USA 68:2913-2917. Dujon, B. 1996. The yeast genome project: What did we learn? Trends Genet. 12:263-270. Dunham, I., et al. 1999. The DNA chromosome of human chromosome 22. Nature 402:489-495. Fleischmann, R.D., et al. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science 269:496-512. Foote, S., Vollrath, D., Hilton, A., and Page, D. C. 1992. The human Y chromosome: Overlapping DNA clones spanning the euchromatic region. Science 258:60-66. Fraser, C.M., et al. 1995. The minimal gene complement of Mycoplasma genitalium. Science 270:397-403. Fraser, C.M., et al. 1998. Complete genome sequence of Treponema pallidum, the syphilis spirochete. Science 281:375-388. Goffeau, A., et al. 1996. Life with 6000 genes. Science 274:546-567. International Genome Sequencing Consortium. 2004. Finishing the euchromatic sequence of the human genome. Nature 431:931-945. Klenk, H.P., et al. 1997. The complete genome sequence of the hyperthermophilic, sulphate-reducing archaeon Archaeoglobus fulgidus. Nature 390:364-370. Kornberg, T.B., and Krasnow, M.A. 2000. The Drosophila genome sequence: Implications for biology and medicine. Science 287:2218-2220. Luria, S.E. 1953. Host-induced modification of viruses. Cold Spring Harbor Symp. Quant. Biol. 18:237-244. Mouse Genome Sequencing Consortium. 2002. Initial sequencing and comparative analysis of the mouse genome. Nature 420:520-562.

Letture consigliate

Nature 15 February 2001. An issue with a special section on “The Human Genome,” an analysis of the draft sequence of the human genome. Rat Genome Sequencing Project Consortium. 2004. Genome sequence of the Brown Norway rat yields insights into mammalian evolution. Nature 428:493-521 Rubin, G.M., and Lewis, E.B. 2000. A brief history of Drosophila’s contributions to genome research. Science 287:2216-2218. Sambrook, J., Fritsch, E.F., and Maniatis, T. 1989. Molecular cloning: A laboratory manual, 2nd ed. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory. Sanger, F., and Coulson, A.R. 1975. A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. J. Mol. Biol. 94:441-448. Science 16 February 2001. An issue focused on “The Human Genome,” an analysis of the draft sequence of the human genome. Tang, C.M., Hood, D.W., and Moxon, E.R. 1997. Haemophilus influence: The impact of whole genome sequencing on microbiology. Trends Genet. 13:399-404. Watson, J.D., Gilman, M., Witkowski, J., and Zoller, M. 1992. Recombinant DNA, 2nd ed. New York: Scientific American Books, Freeman. Wayne, R.K., and Ostrander, E. O. 2007. Lessons learned for the dog genome. Trends Genet. 11:557-567. Capitolo 9: Genomica funzionale e comparativa Genome Research and Genetics News: Nature Genome Gateway.http://www.nature.com/genomics/ Mouse knockout project.http://www.nih.gov/science/ models/mouse/knockout/ Polymerase Chain Reaction (PCR): Cloning DNA in the Test Tube. http://users.rcn.com/jkimball.ma.ultranet/ BiologyPages/P/PCR.html Allzadeh, A.A., et al. 2000. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403:503-511. Bevan, M., and Murphy, G. 1999. The small, the large and the wild. The value of comparison in plant genomics. Trends Genet. 15:211-214. Breitbart, M., Hewson, I., Felts, B., Mahaffy, J.M., Nulton, J., Salamon, P., and Rohwer, F. 2003. Metagenomic analyses of an uncultured viral community from human feces. J. Bacteriol. 185:6220-6223. Cho, R.J., Campbell, M.J., Winzeler, E.A., Steinmetz, L., Conway, A., Wodicka, L., Wolfsberg, T.G., Gabriellan, A.E., Landsman, D., Lockhart, D.J., and Davis, R.W. 1998. A genome-wide transcriptional analysis of mitotic cell cycle. Mol. Cell 2:65-73. Chu, S., DeRisi, J., Eisen, M., Mulholland, J., Botstein, D., Brown, P.O., and Herskowitz, I. 1998. The transcriptional program of sporulation in budding yeast. Science 282:699-705. DeRisi, J.L., Iyer, V.R., and Brown, P.O. 1997. Exploring

659

the metabolic and genetic control of gene expression on a genomic scale. Science 278:680-686. Dib, C., Fauré, S., Fizames, C., Samson, D., Drouot, N., Vignal, A., Millasseau, P., Marc, S., Hazan, J., Seboun, E., Lathrop, M., Gyapay, G., Morissette, J., and Weissenbach, J. 1996. A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature 380:152-154. Gill, S.R., Pop, M., Deboy, R.T., Eckburg, P.B., Turnbaugh, P.J., Samuel, B.S., Gordon, J.I., Relman, D.A., Fraser-Liggett, C.M., and Nelson, K. E. 2006. Metagenomic analysis of the human distal gut microbiome. Science 312:1355-1359. Goetze, S., Mateos-Langerak, J., Gierman, H. J., De Leeuw, W., Giromus, O., Indemans, M. H. G., Koster, J., Ondrej, V., Versteeg, R., and van Driel, R. 2007. The threedimensional structure of human interphase chromosomes is related to the transcriptome map. Mol. Cell. Biol. 27:44754487. Green, R.E., Krause, J., Ptak, S.E., Briggs, A.W., Ronan, M.T., Simons, J.F., Du, L., Egholm, M., Rothberg, J.M., Paunovic, M., and Pääbo, S. 2006. Analysis of one million base pairs of Naeanderthal DNA. Nature 444:330-336. Krings, M., Stone, A., Schmitz, R.W., Krainitzki, H., Stoneking, M., and Pääbo, S. 1997. Neanderthal DNA sequences and the origin of modern humans. Cell 90:19-30. Mullis, K.B. 1990. The unusual origin of the polymerase chain reaction. Sci. Am. 262 (Apr):56-65. Mullis, K.B., and Faloona, F.A. 1987. Specific synthesis of DNA in vitro via a polymerase-catalyzed chain reaction. Methods Enzymol. 155:335-350. O’Brien, S.J., Wienberg, J., and Lyons, L.A. 1997. Comparative genomics: Lessons from cats. Trends Genet. 13:393-399. Pääbo, S. 1993. Ancient DNA. Sci. Am. 269 (Nov):86-92. Palacios, G., Druce, J., Du, L., Tran, T., Birch, C., Briese, T., Conlan, S., Quan, P.L., Hui, J., Marshall, J., Simons, J.F., Egholm, M., Paddock, C.D., Shieh, W.J., Goldsmith, C.S., Zaki, S.R., Catton, M., and Lipkin, W. I. 2008. A new arenavirus in a cluster of fatal transplant-associated diseases. N. Engl. J. Med. 358:991-998. Pollard, K.S., Salamai, S.R., Lambert, N., Lambot, M.A., Coppens, S., Pedersen, J.S., Katzman, S., King, B., Onodera, C., Siepel, A., Kern, A.D., Dehay, C., Igel, H., Ares, M., Vanderhaegen, P., and Haussler, D. 2006. An RNA gene expressed during cortical development evolved rapidly in humans. Science 443:167-172. Sambrook, J., Fritsch, E.F., and Maniatis, T. 1989. Molecular cloning: A laboratory manual, 2nd ed. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory. Schlabach, M.R., Luo, J., Solimini, N.L., Hu, G., Xu, O., Li, M.Z., Zhao, Z., Smogorzewska, A., Sowa, M.E., Ang, X.L., Westbrook, T.F., Liang, A.C., Chang, K., Hackett, J.A., Harper, J.W., Hannon, G.J., and Elledge S.J. 2008. Cancer proliferation gene discovery through functional genomics. Science 319:620-624.

660

Letture consigliate

Silva, J.M., Marran, K., Parker, J.S., Silva, J., Golding, M., Schlabach, M.R., Elledge, S.J., Hannon, G.J., and Chang K. 2008. Profiling essential genes in human mammary cells by multiplex RNAi screening. Science 319:617-620. Various authors. 1999. The chipping forecast. Nat. Genet. 21(suppl.):1-60. Versteeg, R., van Schaik, B.D.C., van Batenburg, M.F., Roos, M., Monajemi, R., Caron, H., Bussemaker, H.J., and van Kampen, A.H.C. 2003. The human transcriptome make revelas extremes in gene density, intron length, GC content, and repeat pattern for domains of highly and weakly expressed genes. Genome Res. 13:1998-2004. Voight, B.F., Kudaravalli, S., Wen, X., and Pritchard, J.K. 2006. A map of recent positive selection in the human genome. PLoS Biology 4(3):e72. Wang, D., Coscoy, L., Zylberberg, M., Avila, P.C., Boushey, H.A., Ganem, D., and DeRisi, J.L. 2002. Microarray-based detection and genotyping of viral pathogens. Proc. Natl. Acad. Sci. USA 99:15687-15692. Watson, J.D., Gilman, M., Witkowski, J., and Zoller, M. 1992. Recombinant DNA, 2nd ed. New York: Scientific American Books, Freeman. White, R., and Lalouel, J.M. 1988. Chromosome mapping with DNA markers. Sci. Am. 258 (February):40-48. White, T.J., Arnheim, N., and Erlich, H.A. 1989. The polymerase chain reaction. Trends Genet. 5:185-188. Young, R.A. 2000. Biomedical discovery with DNA arrays. Cell 102:9-15. Chapter 10: La tecnologia del DNA ricombinante DNA Typing and Identification. http://faculty.ncwc. edu/toconnor/425/425lect15.htm Gene Therapy. http://www.ornl.gov/sci/techresources/ Human_Genome/medicine/genetherapy.shtml What is Genetic Testing? http://www.lbl.gov/Education/ELSI/Frames/genetic-testing.html Anderson, W.F. 1992. Human gene therapy. Science 256: 808-813. Antonarakis, S.E. 1989. Diagnosis of genetic disorders at the DNA level. N. Engl. J. Med. 320:153-163. Cavazzana-Calvo, M., Havein-Bey, S., de Saint Basile, G., Gross, F., Yvon, E., Nusbaum, P., Selz, F., Hu, C., Certain, S., Casanova, J.L., Bousso, P., Le Deist, F., and Fischer, A. 2000. Gene therapy of human severe combined immunodeficiency (SCID)-X1 disease. Science 288:669672. Chien, C.T., Bartel, P.L., Sternglanz, R., and Fields, S. 1991. The two-hybrid system: A method to identify and clone genes for proteins that interact with a protein of interest. Proc. Natl. Acad. Sci. USA 88:9578-9582. Collins, F. 1992. Cystic fibrosis: Molecular biology and therapeutic implications. Science 256:774-779. Culver, K.V., and Blaese, R.M. 1994. Gene therapy for cancer. Trends Genet. 10:174-178. Eisenstein, B.I. 1990. The polymerase chain reaction: A

new method of using molecular genetics for medical diagnosis. N. Engl. J. Med. 322:178-183. Feinberg, A.P., and Vogelstein, B. 1983. A technique for radiolabeling DNA restriction endonuclease fragments to high specific activity. Anal. Biochem. 132: 6-13. 1984. Addendum: A technique for radiolabeling DNA restriction endonuclease fragments to high specific activity. Anal. Biochem. 137:266-267. Fields, S., and Sternglanz, R. 1994. The two-hybrid system: An assay for protein-protein interactions. Trends Genet. 10:286-292. Geisbrecht, B.V., Collins, C.S., Reuber, B.E., and Gould, S.J. 1998. Disruption of a PEX1-PEX6 interaction is the most common cause of the neurological disorders Zellweger syndrome, neonatal adrenoleukodystrophy, and infantile Refsum disease. Proc. Natl. Acad. Sci. USA 95:8630-8635. Harris, J.D., and Lemoine, N.R. 1996. Strategies for targeted gene therapy. Trends Genet. 12:400-405. Huntington’s Disease Collaborative Research Group. 1993. A novel gene containing a trinucleotide repeat that is expanded and unstable on Huntington’s disease chromosomes. Cell 72:971-983. Kay, M.A., and Woo, S.L.C. 1994. Gene therapy for metabolic disorders. Trends Genet. 10:253-257. Knowlton, R.G., Cohen-Haguenauer, O., Van Cong, N., Frézal, J., Brown, V.A., Barker, D., Braman, J.C., Schumm, J.W., Tsui, L.C., Buchwald, M., and DonisKeller, H. 1985. A polymorphic DNA marker linked to cystic fibrosis is located on chromosome 7. Nature 318:380-385. Mulligan, R.C. 1993. The basic science of gene therapy. Science 260:926-932. Mullis, K.B. 1990. The unusual origin of the polymerase chain reaction. Sci. Am. 262 (Apr):56-65. Mullis, K.B., and Faloona, F.A. 1987. Specific synthesis of DNA in vitro via a polymerase-catalyzed chain reaction. Methods Enzymol. 155:335-350. Murray, J.M., Davies, K.E., Harper, P.S., Meredith, L., Mueller, C.R., and Williamson, R. 1982. Linkage relationship of a cloned DNA sequence on the short arm of the X chromosome to Duchenne muscular dystrophy. Nature 300:69-71. Rozsa, F.W., Shimizu, S., Lichter, P.R., Johnson, A.T., Othman, M.I., Scott, K., Downs, C.A., Nguyen, T.D., Polansky, J., and Richards, J.E. 1998. GLC1A mutations point to regions of potential functional importance on the TIGR/MYOC protein. Mol. Vis. 4:20. Sambrook, J., Fritsch, E.F., and Maniatis, T. 1989. Molecular cloning: A laboratory manual, 2nd ed. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory. Southern, E.M. 1975. Detection of specific sequences among DNA fragments separated by gel electrophoresis. J. Mol. Biol. 98:503-517. Stafford, H.A. 2000. Crown gall disease and Agrobac-

Letture consigliate

terium tumefaciens: A study of the history, present knowledge, missing information, and impact on molecular genetics. Botanical Rev. 66:99-118. Watson, J.D., Gilman, M., Witkowski, J., and Zoller, M. 1992. Recombinant DNA, 2nd ed. New York: Scientific American Books, Freeman. White, T.J., Arnheim, N., and Erlich, H.A. 1989. The polymerase chain reaction. Trends Genet. 5:185-188. Wolfenbarger, L.L., and Phifer, P. R. 2000. The ecological risks and benefits of genetically engineered plants. Science 290:2088-2093. Capitolo 11: La genetica mendeliana Basic Principles of Genetics. http://anthro.palomar.edu/ mendel/ Bateson, W. 1909. Mendel’s principles of heredity. Cambridge, UK: Cambridge University Press. Bhattacharyya, M.K., Smith, A.M., Ellis, T.H.N., Hedley, C., and Martin, C. 1990. The wrinkled-seed character of pea described by Mendel is caused by a transposon-like insertion in a gene encoding starch-branching enzyme. Cell 60:115-122. Mendel, G. 1866. Experiments in plant hybridization (translation). In Classic papers in genetics, J. A. Peters, ed., 1959. Englewood Cliffs, NJ: Prentice Hall. Peters, J.A., ed. 1959. Classic papers in genetics. Englewood Cliffs, NJ: Prentice Hall. Sandler, I., and Sandler, L. 1985. A conceptual ambiguity that contributed to the neglect of Mendel’s paper. Hist. Phil. Life Sci. 7:3-70. Tschermak-Seysenegg, E. von. 1951. The rediscovery of Mendel’s work. J. Hered. 42:163-171. Capitolo 12: Le basi cromosomiche dell’ereditarietà Cell Cycle and Mitosis Tutorial. http://www.biology. arizona. edu/cell_bio/tutorials/cell_cycle/cells3.html Meiosis Tutorial.http://www.biology.arizona.edu/cell_ bio/ tutorials/meiosis/main.html Barr, M.L. 1960. Sexual dimorphism in interphase nuclei. Am. J. Hum. Genet. 12:118-127. Bridges, C.B. 1916. Nondisjunction as a proof of the chromosome theory of heredity. Genetics 1:1-52, 107-163. 1925. Sex in relation to chromosomes and genes. Am. Nat. 59:127-137. Egel, R. 1995. The synaptonemal complex and the distribution of meiotic recombination events. Trends Genet. 11:206-208. Lyon, M.F. 1962. Sex chromatin and gene action in the mammalian X-chromosome. Am. J. Hum. Genet. 14:135-148. McClung, C.E. 1902. The accessory chromosome: Sex determinant? Biol. Bull. 3:43-84. McKusick, V.A. 1965. The royal hemophilia. Sci. Am. 213 (Aug):88-95. Morgan, L.V. 1922. Non criss-cross inheritance in Drosophila melanogaster. Biol. Bull. 42:267-274.

661

Morgan, T.H. 1910. Sex-limited inheritance in Drosophila. Science 32:120-122. 1911. An attempt to analyze the constitution of the chromosomes on the basis of sex-limited inheritance in Drosophila. J. Exp. Zool. 11:365-414. Shonn, M.A., McCarroll, R., and Murray, A.W. 2000. Requirement of the spindle checkpoint for proper chromosome segregation in budding yeast meiosis. Science 289:300-303. Stern, C., Centerwall, W.P., and Sarkar, Q.S. 1964. New data on the problem of Y-linkage of hairy pinnae. Am. J. Hum. Genet. 16:455-471. Sutton, W.S. 1903. The chromosomes in heredity. Biol. Bull. 4:231-251. Wilson, E.B. 1905. The chromosomes in relation to the determinationof sex in insects. Science 22:500-502. Capitolo 13: Estensioni e deviazioni dai principi della genetica mendeliana Gene Interactions. http://www.ndsu.nodak.edu/instruct/ mcclean/plsc431/mendel/mendel6.htm Birky, C.W. 1978. Transmission genetics of mitochondria and chloroplasts. Annu. Rev. Genet. 12:471-512. Brown, M.D., Voljavec, A.S., Lott, M.T., MacDonald, I., and Wallace, D.C. 1992. Leber’s hereditary optic neuropathy: A model for mitochondrial neurodegenerative diseases. FASEB J. 6:2791-2799. Bultman, S.J., Michaud, E.J., and Woychik, R.P. 1992. Molecular characterization of the mouse agouti locus. Cell 71:1195-1204. Chiu, W.L., and Sears, B.B. 1993. Plastome-genome interactions affect plastid transmission in Oenothera. Genetics 133:989-997. Ephrussi, B. 1953. Nucleo-cytoplasmic relations in microorganisms. New York: Oxford University Press. Freeman, G., and Lundelius, J.W. 1982. The developmental genetics of dextrality and sinistrality in the gastropod Limnaea peregra. Wilhelm Roux Arch. Dev. Biol. 191:69-83. Ginsburg, V. 1972. Enzymatic basis for blood groups. Methods Enzymol. 36:131-149. Grivell, L. 1983. Mitochondrial DNA. Sci. Am. 225 (Mar):78-89. Gyllensten, U., Wharton, D., Josefsson, A., and Wilson, A. C. 1991. Paternal inheritance of mitochondrial DNA in mice. Nature 352:255-257. Landauer, W. 1948. Hereditary abnormalities and their chemically induced phenocopies. Growth Symp. 12: 171200. Lander, E.S., and Lodish, H. 1990. Mitochondrial diseases: Gene mapping and gene therapy. Cell 61:925-926. Landsteiner, K., and Levine, P. 1927. Further observations on individual differences of human blood. Proc. Soc. Exp. Biol. Med. 24:941-942. Siracusa, L.D. 1994. The agouti gene: Turned on to yellow. Trends Genet. 10:423-428.

662

Letture consigliate

Umesono, K., and Ozeki, H. 1987. Chloroplast gene organization in plants. Trends Genet. 3:281-287. Van Winkle-Swift, K.P., and Birky, C.W. 1978. The nonreciprocality of organelle gene recombination in Chlamydomonas reinhardi and Saccharomyces cerevisiae. Mol. Gen. Genet. 166:193-209. Capitolo 14: Mappe genetiche negli eucarioti Gene Linkage and Genetic Maps. http://users.rcn.com/ jkimball.ma.ultranet/BiologyPages/L/Linkage.html Bateson, W., Saunders, E.R., and Punnett, R.G. 1905. Experimental studies in the physiology of heredity. Rep. Evol. Committee R. Soc. II:1-55, 80-99. Blixt, S. 1975. Why didn’t Mendel find linkage? Nature 256:206. Creighton, H.S., and McClintock, B. 1931. A correlation of cytological and genetical crossing-over in Zea mays. Proc. Natl. Acad. Sci. USA 17:492-497. Dib, C., Fauré, S., Fizames, C., Samson, D., Drouot, N., Vignal, A., Millasseu, P., Marc, S., Hazan, J., Seboun, E., Lathrop, M., Gyapay, G., Morissette, J., and Weissenbach, J. 1996. A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature 380:152-154. Gusella, J.F. 1986. DNA polymorphism and human disease. Annu. Rev. Biochem. 55:831-854. McKusick, V.A. 1971. The mapping of human chromosomes. Sci. Am. 224 (Apr):104-113. Morgan, T.H. 1910. The method of inheritance of two sexlimited characters in the same animal. Proc. Soc. Exp. Biol. Med. 8:17. 1910. Sex-limited inheritance in Drosophila. Science 32:120-122. 1911. An attempt to analyze the constitution of the chromosomes on the basis of sex-limited inheritance in Drosophila. J. Exp. Zool. 11:365-414. 1911. Random segregation versus coupling in Mendelian inheritance. Science 34:384. Morgan, T.H., Sturtevant, A.H., Müller, H.J., and Bridges, C.B. 1915. The mechanism of Mendelian heredity. New York: Henry Holt. Sturtevant, A.H. 1913. The linear arrangement of six sexlinked factors in Drosophila as shown by their mode of association. J. Exp. Zool. 14:43-59. Sutton, W.S. 1903. The chromosomes in heredity. Biol. Bull. 4:231-251. Szostak, J., Orr-Weaver, T., Rothstein, R., and Stahl, F. 1983. The double-strand break repair model for recombination. Cell 33:25-35. Weissenbach, J., Gyapay, G., Dib, C., Vignal, A., Morissett, J., Millasseau, P., Vaysseix, G., and Lathrop, M. 1992. A second-generation linkage map of the human genome. Nature 359:794-801. Yu, A., Zhao, C., Fan, Y., Jang, W., Mungall, A.J., Deloukas, P., Olsen, A., Doggett, N.A., Ghebranicus, N.,

Broman, K.W., and Weber, J.L. 2001. Comparison of human genetic and sequence-based physical maps. Nature 409:951-953. Capitolo 15: La genetica dei batteri e dei batteriofagi Bacterial Conjugation (A History of its Discovery). http://www.mun.ca/biochem/courses/3107/Lectures/ Topics/conjugation.html Mapping within a Gene: The rII Locus. http://users.rcn. com/jkimball.ma.ultranet/BiologyPages/B/Benzer. html Archer, L.J. 1973. Bacterial transformation. New York: Academic Press. Benzer, S. 1959. On the topology of the genetic fine structure. Proc. Natl. Acad. Sci. USA 45:1607-1620. 1961. On the topography of the genetic fine structure. Proc. Natl. Acad. Sci. USA 47:403-415. 1962. The fine structure of the gene. Sci. Am. 206 (Jan):70-84. Curtiss, R. 1969. Bacterial conjugation. Annu. Rev. Microbiol. 23:69-136. Ellis, E.L., and Delbruck, M. 1939. The growth of bacteriophage. J. Gen. Physiol. 22:365-384. Fincham, J. 1966. Genetic complementation. New York: W.A. Benjamin. Hayes, W. 1968. The genetics of bacteria and their viruses, 2nd ed. New York: Wiley. Hershey, A.D., and Rotman, R. 1949. Genetic recombination between host-range and plaque-type mutants of bacteriophage in single bacterial cells. Genetics 34:44-71. Hotchkiss, R.D., and Gabor, M. 1970. Bacterial transformation with special reference to recombination processes. Annu. Rev. Genet. 4:193-224. Jacob, F., and Wollman, E.L. 1951. Sexuality and the genetics of bacteria. New York: Academic Press. Lederberg, J., and Tatum, E.L. 1946. Gene recombination in Escherichia coli. Nature 158:558. Ravin, A.W. 1961. The genetics of transformation. Adv. Genet. 10:61-163. Susman, M. 1970. General bacterial genetics. Annu. Rev. Genet. 4:135-176. Vielmetter, W., Bonhoeffer, F., and Schutte, A. 1968. Genetic evidence for transfer of a single DNA strand during bacterial conjugation. J. Mol. Biol. 37:81-86. Wollman, E.L., Jacob, F., and Hayes, W. 1962. Conjugation and genetic recombination in E. coli K-12. Cold Spring Harbor Symp. Quant. Biol. 21:141-162. Zinder, N., and Lederberg, J. L. 1952. Genetic exchange in Salmonella. J. Bacteriol. 64:679-699. Capitolo 16: Variazioni della struttura e del numero dei cromosomi Barr, M.L., and Bertram, E.G. 1949. A morphological distinction between neurones of the male and female, and the behavior of the nucleolar satellite during accelerated nucleoprotein synthesis. Nature 163: 676-677.

Letture consigliate

Borst, P., and Greaves, D.R. 1987. Programmed gene rearrangements altering gene expression. Science 235:658667. Caskey, C.T., Pizzuti, A., Fu, Y.H., Fenwick, R.G., and Nelson, D.L. 1992. Triplet repeat mutations in human disease. Science 256:784-789. Dalla-Favera, R., Martinotti, S., Gallo, R., Erickson, J., and Croce, C. 1983. Translocation and rearrangements of the c-myc oncogene locus in human undifferentiated B-cell lymphomas. Science 219:963-997. DeKlein, A., van Kessel, A.G., Grosveld, G., Bartram, C.R., Hagemeijer, A., Bootsma, D., Spurr, N.K., Heisterkamp, N., Groffen, J., and Stephenson, J.R. 1982. A cellular oncogene is translocated to the Philadelphia chromosome in chronic myelocytic leukemia. Nature 300:765-767. Huntington’s Disease Collaborative Research Group. 1993. A novel gene containing a trinucleotide repeat that is expanded and unstable in Huntington’s disease chromosome. Cell 72:971-983. Kremer, E., Pritchard, M., Lynch, M., Yu, S., Holman, K., Baker, E., Warren, S. T., Schlessinger, D., Sutherland, G. R., and Richards, R.I. 1991. Mapping of DNA instability at the fragile X to a trinucleotide repeat sequence p(CGG)n. Science 252:1711-1714. Lyon, M.F. 1961. Gene action in the X-chromosomes of the mouse (Mus musculus L). Nature 190:372-373. Penrose, L.S., and Smith, G.F. 1966. Down’s anomaly. Boston: Little, Brown. Richards, R.I., and Sutherland, G.R. 1992. Dynamic mutations: A new class of mutations causing human disease. Cell 70:709-712. 1992. Fragile X syndrome: The molecular picture comes into focus. Trends Genet. 8:249-255. Rowley, J.D. 1973. A new consistent chromosomal abnormality in chronic myelogenous leukemia identified by quinacrine fluorescence and Giemsa staining. Nature 243:290-293. Shaw, M.W. 1962. Familial mongolism. Cytogenetics 1: 141-179. Tarleton, J.C., and Saul, R.A. 1993. Molecular genetic advances in fragile X syndrome. J. Pediatr. 122:169-185. Verkerk, A.J.M.H., Piertti, M., Sutcliff, J.S., Fu, Y.H., Kuhl, D.P.A., Pizzuti, A., Reiner, O., Richards, S., Victoria, M.F., Zhang, F., Eussen, B.E., van Ommen, G.J.B., Blonden, L.A.J., Riggins, G.J., Chastain, J.L., Kunst, C.B., Galjaard, H., Caskey, C.T., Nelson, D.L., Oostra, B.A., and Warrent, S.T. 1991. Identification of a gene (FMR-1) containing a CGG repeat coincident with a breakpoint cluster region exhibiting length variation in fragile X syndrome. Cell 65:905-914. Capitolo 17:

Regolazione dell’espressione genica nei batteri e nei batteriofagi The Operon. http://users.rcn.com/jkimball.ma.ultranet/ BiologyPages/L/LacOperon.html

663

Bell, C.E., Frescura, P., Hochschild, A., and Lewis, M. 2000. Crystal structure of the repressor C-terminal domain provides a model for cooperative operator binding. Cell 101:801-811. Bertrand, K., Korn, L., Lee, F., Platt, T., Squires, C.L., Squires, C., and Yanofsky, C. 1975. New features of the structure and regulation of the tryptophan operon of Escherichia coli. Science 189:22-26. Bertrand, K., and Yanofsky, C. 1976. Regulation of transcription termination in the leader region of the tryptophan operon of Escherichia coli involves tryptophan as its metabolic product. J. Mol. Biol. 103:339-349. Dickson, R.C., Abelson, J., Barnes, W.M., and Reznikoff, W.S. 1975. Genetic regulation: The lac control region. Science 187:27-35. Fisher, R.F., Das, A., Kolter, R., Winkler, M.E., and Yanofsky, C. 1985. Analysis of the requirements for transcription pausing in the tryptophan operon. J. Mol. Biol. 182:397-409. Gilbert, W., Maizels, N., and Maxam, A. 1974. Sequences of controlling regions of the lactose operon. Cold Spring Harbor Symp. Quant. Biol. 38:845-855. Gilbert, W., and Muller-Hill, B. 1966. Isolation of the lac repressor. Proc. Natl. Acad. Sci. USA 56:1891-1898. Jacob, F. 1965. Genetic mapping of the elements of the lactose region of Escherichia coli. Biochem. Biophys. Res. Commun. 18:693-701. Jacob, F., and Monod, J. 1961. Genetic regulatory mechanisms in the synthesis of proteins. J. Mol. Biol. 3:318-356. Lee, F., and Yanofsky, C. 1977. Transcription termination at the trp operon attenuators of Escherichia coli and Salmonella typhimurium: RNA secondary structure and regulation of termination. Proc. Natl. Acad. Sci. USA 74:4365-4369. Lewis, M., Chang, G., Horton, N.C., Kercher, M.A., Pace, H.C., Schumacher, M.A., Brennan, R.G., and Lu, P. 1996. Crystal structure of the lactose operon repressor and its complexes with DNA and inducer. Science 271:1247-1254. Maizels, N. 1974. E. coli lactose operon ribosome binding site. Nature (New Biol.) 249:647-649. Pabo, C.O., Sauer, R.T., Sturtevant, J.M., and Ptashne, M. 1979. The repressor contains two domains. Proc. Natl. Acad. Sci. USA 76:1608-4612. Ptashne, M. 1967. Isolation of the phage repressor. Proc. Natl. Acad. Sci. USA 57:306-313. 1984. Repressors. Trends Biochem. Sci. 9:142-145. 1992. A genetic switch, 2nd ed. Oxford: Cell Press and Blackwell Scientific Publications. Ptashne, M., and Gilbert, W. 1970. Genetic repressors. Sci. Am. 222 (Jun):36-44. Schlief, R. 2000. Regulation of the L-arabinose operon of Escherichia coli. Trends Genet. 16:559-566. Schlief, R. 2003. AraC protein: A love-hate relationship. BioEssays 25:274-282.

664

Letture consigliate

Winkler, M.E., and Yanofsky, C. 1981. Pausing of RNA polymerase during in vitro transcription of the tryptophan operon leader region. Biochemistry 20:3738-3744. Yanofsky, C. 1981. Attenuation in the control of expression of bacterial operons. Nature 289:751-758. 1987. Operon-specific control by transcription attenuation. Trends Genet. 3:356-360. Capitolo 18: La regolazione dell’espressione genica negli eucarioti Antisense RNA (includes RNA interference). http://users. rcn.com/jkimball.ma.ultranet/BiologyPages/ A/AntisenseRNA.html Control of Gene Expression (includes prokaryotes). http://themedicalbiochemistrypage.org/gene-regulation. html Gene Regulation in Eukaryotes. http://users.rcn.com/ jkimball. ma.ultranet/Biology Pages/P/Promoter.html RNAi-Interference RNA. http://fig.cox.miami. edu/ ~cmallery/150/gene/siRNA.htm RNA interference (animation). http://www.nature. com/focus/rnai/animations/index.html Lifecyle of an miRNA (video). http://www.nature. com/ng/supplements/micrornas/video.html Ambros, V., and Chen, X. 2007. The regulation of genes and genomes by small RNAs. Development 134: 1635-1641. Ashburner, M. 1990. Puffs, genes, and hormones revisited. Cell 61:1-3. Bartel, D.P. 2004. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell 116:281-297. Beermann, W., and Clever, U. 1964. Chromosome puffs. Sci. Am. 210 (Apr):50-58. Blumenthal, T., and Gleason, K.S. 2003. Caenorhabditis elegans operons: Form and function. Nature Rev. Genet. 4:110-118. Carpousis, A.J., Vanzo, N.F., and Raynal, L.C. 1999. mRNA degradation. A tale of poly(A) and multiprotein machines. Trends Genet. 15:24-28. Chen, C.Y.A., and Shyu, A.-B. 1995. AU-rich elements: Characterization and importance of mRNA degradation. Trends Biochem. Sci. 20:465-470. Claverle, J.M. 2005. Fewer genes, more noncoding RNA. Science 309:1529-1530. Erkmann, J.A., and Kutay, U. 2004. Nuclear export of mRNA: From the site of transcription to the cytoplasm. Exp. Cell Res. 296:12-20. Garneau, N.L., Wilusz, J., and Wilusz, C.J. 2007. The highways and byways of mRNA decay. Nature Rev. Mol. Cell Biol. 8:113-126. Gasser, S.M. 2001. Positions of potential: Nuclear organization and gene expression. Cell 104:639-642. Gellert, M. 1992. V(D)J recombination gets a break. Trends Genet. 8:408-412. Green, M.R. 1989. Pre-mRNA processing and mRNA nuclear export. Curr. Opin. Cell Biol. 1:519-525.

Grewal, S.I.S., and Jia, S. 2008. Heterochromatin revisited. Nature Rev. Genet. 8:35-46. Grunstein, M. 1992. Histones as regulators of genes. Sci. Am. 267 (Oct):68-74B. Hochstrasser, M. 1996. Protein degradation or regulation: Ub the judge. Cell 84:813-815. Horn, P.J., and Peterson, C.L. 2002. Chromatin higher order folding: Wrapping up transcription. Science 297: 1824-1828. Johnston, M., Flick, J.S, and Pexton, T. 1994. Multiple mechanisms provide rapid and stringent repression of GAL gene expression in Saccharomyces cerevisiae. Mol. Cell. Biol. 14:3834-3841. Jones, P.A. 1999. The DNA methylation paradox. Trends Genet. 15:34-37. Karlsson, S., and Nienhuis, A.W. 1985. Development regulation of human globin genes. Annu. Rev. Biochem. 54:1071-1078. Kawasaki, H., Taira, K., and Morris, K.V. 2005. siRNA induced transcriptional gene silencing in mammalian cells. Cell Cycle 4:442-448. Keyes, L.N., Cline, T.W., and Schedl, P. 1992. The primary sex determination signal of Drosophila acts at the level of transcription. Cell 68:933-943. Kim, K., Lee, Y.S., and Carthew, R.W. 2007. Conversion of pre-RISC to holo-RISC by Ago2 during assembly of RNAi complexes. RNA 13:22-29. Kornberg, R.D. 1999. Eukaryotic transcriptional control. Trends Genet. 15:M46-M49. Lehner, B., and Sanderson, C.M. 2007. A protein degradation framework for human mRNA degradation. Genome Res. 14:1315-1323. Mallory, A.C., and Vaucheret, H. 2006. Functions of microRNAs and related small RNAs in plants. Nature Genet. 38:S31-S37. Mattick, J.S. 2005. The functional genomics of noncoding RNA. Science 309:1527-1528. 2007. A new paradigm for developmental biology. J. Exp. Biol. 210:1526-1547. Mattick, J.S., and Makunin, I.V. 2006. Non-coding RNA. Hum. Mol. Gen. 15:R17-R29. Moore, M.J. 2005. From birth to death: The complex lives of eukaryotic mRNAs. Science 309:1514-1518. Nilsen, T.W. 2007. Mechanisms of microRNA-mediated gene regulation in animal cells. Trends Genet. 23:243-249. Oettinger, M.A., Schatz, D.G., Gorka, C., and Baltimore, D. 1990. RAG-1 and RAG-2, adjacent genes that synergistically activate V(D)J recombination. Science 248:15171522. O’Malley, B.W., and Schrader, W.T. 1976. The receptors of steroid hormones. Sci. Am. 234 (Feb):32-43. Pankratz, M.J., and Jäckle, H. 1990. Making stripes in the Drosophila embryo. Trends Genet. 6:287-292. Parker, R., and Sheth, U. 2007. P bodies and the control of mRNA translation and degradation. Mol. Cell 25:635-646.

Letture consigliate

Parthun, M.R., and Jaehning, J.A. 1992. A transcriptionally active form of GAL4 is phosphorylated and associated with GAL80. Mol. Cell. Biol. 12:4981-4987. Postlethwait, J.H., and Schneiderman, H.A. 1973. Developmental genetics of Drosophila imaginal discs. Annu. Rev. Genet. 7:381-433. Prasanth, K.V., and Spector, D.L. 2007. Eukaryotic regulatory RNAs: An answer to the ‘genome complexity’ conundrum. Genes Dev. 21:11-42. Ptashne, M. 1989. How gene activators work. Sci. Am. 243 (Jan):41-47. Rhodes, D., and Klug, A. 1993. Zinc fingers. Sci. Am. 259 (Feb):56-65. Rivera-Pomar, R., and Jäckle, H. 1996. From gradients to stripes in Drosophila embryogenesis: Filling in the gaps. Trends Genet. 12:478-483. Rogers, J.O., Early, H., Carter, C., Calame, K., Bond, M., Hood, L., and Wall, R. 1980. Two mRNAs with different 3′ ends encode membrane-bound and secreted forms of immunoglobin chain. Cell 20:303-312. Rogers, S., Wells, R., and Rechsteiner, M. 1986. Amino acid sequences common to rapidly degraded proteins: The PEST hypothesis. Science 234:364-368. Ross, J. 1996. Control of messenger RNA stability in higher eukaryotes. Trends Genet. 12:171-175. Scott, M.P., Tamkun, J.W., and Hartzell, III, G.W. 1989. The structure and function of the homeodomain. Biochim. Biophys. Acta 989:25-48. Segal, E., Fondufe-Mittendorf, Y., Chen, L., Thåström, A., Field, Y., Moore, I.K., Wang, P.Z., and Widom, J. 2006. A genomic code for nucleosome positioning. Nature 442:772-778. Siomi, H., and Siomi, M.C. 2007. Expanding RNA physiology: MicroRNAs in a unicellular organism. Genes Dev. 21:1153-1156. Struhl, K. 1999. Fundamentally different logic of gene regulation in eukaryotes and prokaryotes. Cell 98:104. Varshavksy, A. 1996. The N-end rule: Functions, mysteries, uses. Proc. Natl. Acad. Sci. USA 93:1214212149. Vaucheret, H. 2007. Post-transcriptional small RNA pathways in plants: Mechanisms and regulations. Genes Dev. 20:759-771. Verdel, A., Jia, S., Gerber, S., Sugiyama, T., Gygi, S., Grewal, S.I.S., and Moazed, D. 2004. RNAi-mediated targeting of heterochromatin by the RITS complex. Science 303:672-676. Verdine, G.L. 1994. The flip side of DNA methylation. Cell 76:197-200. Wilmut, I., Schnieke, A.E., McWhir, J., Kind, A.J., and Campbell, K.H.S. 1997. Viable offspring derived from fetal and adult mammalian cells. Nature 385:810-813. Wolffe, A.P. 1994. Transcription: In tune with the histones. Cell 77:13-16. Wolffe, A.P., and Pruss, D. 1996. Targeting chromatin dis-

665

ruption: Transcription regulators that acetylate histones. Cell 84:817-819. Zamore, P.D., and Haley, B. 2005. Ribo-gnome: The big world of small RNAs. Science 309:1519-1524. Capitolo 19: Analisi genetica dello sviluppo Zygote: A Developmental Biology Website (by Scott Gilbert, Swarthmore College). http://zygote.swarthmore.edu/ Albrecht, E.B., and Salz, H.K. 1993. The Drosophila sex determination gene snf is utilized for the establishment of the femalespecific splicing pattern of Sex-lethal. Genetics 134:801-807. Alvarez-Garcia, I., and Miska, E.A. 2005. MicroRNA functions in animal development and human disease. Development 132:4653-4662. Beachy, P.A. 1990. A molecular view of the Ultrabithorax homeotic gene of Drosophila. Trends Genet. 6:46-51. Boggs, R.T., Gregor, P., Idriss, S., Belote, J.M., and McKeown, M. 1987. Regulation of sexual differentiation in Drosophila melanogaster via alternative splicing of RNA from the transformer. Cell 50:739-747. Capel, B. 1995. New bedfellows in the mammalian sexdetermination affair. Trends Genet. 11:161-163. De Robertis, E.M., and Gurdon, J.B. 1977. Gene activation in somatic nuclei after injection into amphibian oocytes. Proc. Natl. Acad. Sci. USA 74:2470-2474. Efstratiadis, A., Posakony, J.W., Maniatis, T., Lawn, R.M., O’Connell, C., Spritz, R.A., DeRiel, J.K., Forget, B.G., Weissman, S.M., Slighton, J.L., Blechtl, A.E., Smithies, O., Baralle, F.E., Shoulders, C.C., and Proudfoot, N.J. 1980. The structure and evolution of the human β-globin gene family. Cell 21:653-668. Eicher, E.M., and Washburn, L.L. 1986. Genetic control of primary sex determination in mice. Annu. Rev. Genet. 20:327-360. Gurdon, J.B. 1968. Transplanted nuclei and cell differentiation. Sci. Am. 219 (Dec):24-35. Gurdon, J.B., Laskey, R.A., and Reeves, R. 1975. The developmental capacity of nuclei transplanted from keratinized skin cells of adult frogs. J. Embryol. Exp. Morph. 34:93-112. Haqq, C.M., King, C.Y., Ukiyama, E., Falsafi, S., Haqq, T.N., Donahoe, P.K., and Weiss, M.A. 1994. Molecular basis of mammalian sexual determination: Activation of Müllerian inhibiting substance gene expression by SRY. Science 266:1494-1500. Hodgkin, J. 1987. Sex determination and dosage compensation in Caenorhabditis elegans. Annu. Rev. Genet. 21:133-154. 1989. Drosophila sex determination: A cascade of regulated splicing. Cell 56:905-906. 1993. Molecular cloning and duplication of the nematode sex-determining gene tra-1. Genetics 133:543-560. Jiménez, R., Sánchez, A., Burgos, M., and Díaz de la Guar-

666

Letture consigliate

dia, R. 1996. Puzzling out the genetics of mammalian sex determination. Trends Genet. 12:164-166. Kay, G.F., Barton, S.C., Surani, M.A., and Rastan, S. 1994. Imprinting and X chromosome counting mechanisms determine Xist expression in early mouse development. Cell 77:639-650. Kloosterman, W.P., and Plastork, R.H.A. 2006. The diverse functions of microRNAs in animal development and disease. Dev. Cell 11:441-450. Koopman, P., Gubbay, J., Vivian, N., Goodfellow, P., and Lovell-Badge, R. 1991. Male development of chromosomally female mice transgenic for Sry. Nature 351:117121. Lee, J.T., Strauss, W.M., Dausman, J.A., and Jaenisch, R. 1996. A 450 kb transgene displays properties of the mammalian X-inactivation center. Cell 86:83-94. Marahrens, Y., Loring, J., and Jaenisch, R. 1998. Role of the Xist gene in X chromosome choosing. Cell 92:657664. Meller, V.H. 2000. Dosage compensation: Making 1X equal 2X. Trends Cell Biol. 10:54-59. Meyer, B.J. 2000. Sex in the worm. Counting and compensating X-chromosome dose. Trends Genet. 16:247253. Migeon, B.R. 1994. X-chromosome inactivation: Molecular mechanisms and genetic consequences. Trends Genet. 10:230-235. Page, D.C. 1985. Sex-reversal: Deletion mapping of the maledetermining function of the human Y chromosome. Cold Spring Harbor Symp. Quant. Biol. 51: 229-235. Page, D.C., de la Chapelle, A., and Weissenbach, J. 1985. Chromosome Y-specific DNA in related human XX males. Nature 315:224-226. Page, D.C., Mosher, R., Simpson, E.M., Fisher, E.M.C., Mardon, G., Pollack, J., McGillivray, B., de la Chapelle, A., and Brown, L.G. 1987. The sex-determining region of the human Y chromosome encodes a finger protein. Cell 51:1091-1104. Palmer, M.S., Sinclair, A.H., Berta, P., Ellis, N.A., Goodfellow, P.N., Abbas, N.E., and Fellous, M. 1990. Genetic evidence that ZFY is not the testis-determining factor. Nature 342:937-939. Penny, G.D., Kay, G.F., Sheardown, S.A., Rastan, S., and Brockdorff, N. 1996. Requirement for Xist in X chromosome inactivation. Nature 379:131-137. Peters, L., and Meister, G. 2007. Argonaute proteins: Mediators of RNA silencing. Mol. Cell 26:611-623. Rivera-Pomar, R., and Jäckle, H. 1996. From gradients to stripes in Drosophila embryogenesis: Filling in the gaps. Trends Genet. 12:478-483. Willard, H.F. 1996. X chromosome inactivation, XIST, and pursuit of the X-inactivation center. Cell 86:5-7. Zhao, Y., and Srivastava, D. 2007. A developmental view of microRNA function. Trends Biochem. Sci. 32:189197.

Capitolo 20: La genetica del cancro Oncogenes. http://users.rcn.com/jkimball.ma.ultranet/ BiologyPages/O/Oncogenes.html Tumor suppressor genes. http://users.rcn.com/jkimball. ma.ultranet/BiologyPages/T/TumorSuppressorGenes. html Baltimore, D. 1985. Retroviruses and retrotransposons: The role of reverse transcription in shaping the eukaryotic genome. Cell 40:481-482. Bishop, J.M. 1983. Cancer genes come of age. Cell 32:1018-1020. 1983. Cellular oncogenes and retroviruses. Annu. Rev. Biochem. 52:301-354. 1987. The molecular genetics of cancer. Science 235: 305-311. Brown, M.A., and Solomon, E. 1997. Studies on inherited cancers: Outcomes and challenges of 25 years. Trends Genet. 13:202-206. Cavenee, W.K., and White, R.L. 1995. The genetic basis of cancer. Sci. Am. (Mar):72-79. Fishel, R., Lescoe, M.K., Rao, M.R.S., Copeland, N.G., Jenkins, N.A., Garber, J., Kane, M., and Kolodner, R. 1994. The human mutator gene homolog MSH2 and its association with hereditary nonpolyposis colon cancer. Cell 75:1027-1038. Jiricny, J. 1994. Colon cancer and DNA repair: Have mismatches met their match? Trends Genet. 10:164168. Kingston, R.E., Baldwin, A.S., and Sharp, P.A. 1985. Transcription control by oncogenes. Cell 41:3-5. Levine, A.J. 1997. p53, the cellular gatekeeper for growth and division. Cell 88:323-331. Negrini, M., Ferracin, M., Sabbioni, S., and Croce, C.M. 2007. MicroRNAs in human cancer: from research to therapy. J. Cell Sci. 120:1833-1840. Rabbitts, T.H. 1994. Chromosomal translocations in human cancer. Nature 372:143-149. Rebbeck, T.R., Couch, F.J., Kant, J., Calzone, K., DeShano, M., Peng, Y., Chen, K., Garber, J.E., and Weber, B.L. 1996. Genetic heterogeneity in hereditary breast cancer: Role of BRCA1 and BRCA2. Am. J. Hum. Genet. 59:547553. Vousden, K.H. 2000. p53: Death star. Cell 103:691-694. Weinberg, R.A. 1995. The retinoblastoma protein and cell cycle protein. Cell 81:323-330. 1997. The cat and mouse games that genes, viruses, and cells play. Cell 88:573-575. Welcsh, P.L., Owens, K.N., and King, M.C. 2000. Insights into the functions of BRCA1 and BRCA2. Trends Genet. 16:69-74. Wooster, R., and Stratton, M.R. 1995. Breast cancer susceptibility: A complex disease unravels. Trends Genet. 11:3-5. Zakian, V.A. 1997. Life and cancer without telomerase. Cell 91:1-3.

Letture consigliate

Zhang, B., Pan, X., Cobb, G.P., and Anderson, T.A. 2007. microRNAs as oncogenes and tumor suppressors. Dev. Biol. 302:1-12. Capitolo 21: Genetica di popolazioni Avise, J.C. 1986. Mitochondrial DNA and the evolutionary genetics of higher animals. Phil. Trans. Roy. Soc. Lond., Ser. B 321:325-342. Buri, P. 1956. Gene frequency in small populations of mutant Drosophila. Evolution 10:367-402. Clarke, C.A., and Sheppard, P.M. 1966. A local survey of the distribution of industrial melanic forms in the moth Biston betularia and estimates of the selective values of these in an industrial environment. Proc. R. Soc. Lond. [Biol.] 165:424-439. Coop, G., and Przeworski, M. 2007. An evolutionary view of human recombination. Nature Rev. Genet. 8:23-24. Crow, J.F. 1986. Basic concepts in population, quantitative, and evolutionary genetics. New York: Freeman. Darwin, C. 1860. On the origin of species by means of natural selection, or the preservation of favoured races in the struggle for life. New York: Appleton. Dobzhansky, T. 1951. Genetics and the origin of species, 3rd ed. New York: Columbia University Press. Fisher, R.A. 1930. The genetical theory of natural selection. Oxford: Clarendon Press. Ford, E.B. 1971. Ecological genetics, 3rd ed. London: Chapman & Hall. Gillespie, J.H. 1991. The causes of molecular evolution. Oxford: Oxford University Press. Glass, B., Sacks, M.S., Jahn, EF., and Hess, C. 1952. Genetic drift in a religious isolate: An analysis of the causes of variation in blood group and other gene frequencies in a small population. Am. Nat. 86:145-159. Hardy, G.H. 1908. Mendelian proportions in a mixed population. Science 28:49-50. Hartl, D.L., and Clark, A. G. 1995. Principles of population genetics, 3rd ed. Sunderland, MA: Sinauer. Hedrick, P.H. 2000. Genetics of populations. Boston: Science Books International. Hillis, D.M., and Moritz, C. 1990. Molecular systematics. Sunderland, MA: Sinauer. Hillis, D.M., Moritz, C., Porter, C.A., and Baker, R.J. 1991. Evidence for biased gene conversion in concerted evolution of ribosomal DNA. Science 251: 308-309. Kettlewell, H.B.D. 1961. The phenomenon of industrial melanism in the Lepidoptera. Annu. Rev. Entomol. 6:245-262. Kreitman, M. 1983. Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster. Nature 304:412-417. Lehman, N., Eisenhawer, A., Hansen, K., Mech, L.D., Peterson, R.O., Gogan, P.J., and Wayne, R.K. 1991. Introgression of coyote mitochondrial DNA into sympatric North American gray wolf populations. Evolution 45:104-119.

667

Lewontin, R.C. 1974. The genetic basis of evolutionary change. New York: Columbia University Press. 1985. Population genetics. Annu. Rev. Genet. 19: 81-102. Lewontin, R.C., Moore, J.A., Provine, W.B., and Wallace, B. 1981. Dobzhansky’s genetics of natural populations IXLIII. New York: Columbia University Press. Li, W.H. 1997. Molecular evolution. Sunderland, MA: Sinauer. Li, W.H., Luo, C.C., and Wu, C.I. 1985. Evolution of DNA sequences. In Molecular evolutionary genetics, R.J. MacIntyre, ed. (pp. 1-94). New York: Plenum. Maniatis, T., Fritsch, E.F., Lauer, L., and Lawn, R.M. 1980. The molecular genetics of human hemoglobin. Annu. Rev. Genet. 14:145-178. Maynard Smith, J. 1989. Evolutionary genetics. Oxford: Oxford University Press. Nei, M. 1987. Molecular evolutionary genetics. New York: Columbia University Press. Nei, M., and Koehn, R.K. 1983. Evolution of genes and proteins. Sunderland, MA: Sinauer. Powell, J.R. 1997. Progress and prospects in evolutionary biology: The Drosophila model. New York: Oxford University Press. Selander, R.K., and Kaufman, D.W. 1975. Self-fertilization and genetic population structure in a colonizing land snail. Proc. Natl. Acad. Sci. USA 70:1186-1190. Soulé, M.E., ed. 1986. Conservation biology: The science of scarcity and diversity. Sunderland, MA: Sinauer. Stringer, C.B. 1990. The emergence of modern humans. Sci. Am. 263 (Dec):98-104. Weir, B.S. 1996. Genetic data analysis II. Sunderland, MA: Sinauer. Woese, C.R. 1981. Archaebacteria. Sci. Am. 244 (Jun): 98122. Capitolo 22: Genetica quantitativa Bradshaw, H.D., Otto, K.G., Frewen, B.E., McKay, J.K., and Schemske, D.W. 1998. Quantitative trait loci affecting differences in floral morphology between two species of monkeyflower (Mimulus). Genetics 149:367-382. Dobzhansky, T., and Pavlovsky, O. 1969. Artificial and natural selection for two behavioral traits in Drosophila pseudoobscura. Proc. Natl. Acad. Sci. USA 62:75-80. Doebley, J., Stec, A., and Hubbard, L. 1997. The evolution of apical dominance in maize. Nature 386:485-488. East, E.M. 1910. A Mendelian interpretation of variation that is apparently continuous. Am. Nat. 44:65-82. 1916. Studies on size inheritance in Nicotiana. Genetics 1:164-176. Emerson, R.A., and East, E.M. 1913. The inheritance of quantitative characters in maize. Bull. Nebr. Agric. Exper. Sta. Bull. 2. Frary, A. Nesbitt, T.C., Frary, A., Grandillo, S., van der Knaap, E., Cong, B., Liu, J., Meller, J., Elber, R., Alpert, K.B., and Tanksley, S.D. 2000. fw2.2: A quantitative trait

668

Letture consigliate

locus key to the evolution of tomato fruit size. Science 289:85-88. Kim, U-k., Jorgenson, E., Coon, H., Leppert, M., Risch, N., and Drayna, D. 2003. Positional cloning of the human quantitative trait locus underlying taste sensitivity to phenylthiocarbamide. Science 299:1221-1225. Lynch, M., and Walsh, B. 1998. Genetics and analysis of quantitative traits. Sunderland, MA: Sinauer. Nilsson-Ehle, H. 1909. Kreuzungsuntersuchungen an Hafer und Weizen. Lunds Univ. Aarskr. N. F. Atd., Ser. 2, 5(2): 1-122. Robin, C., Lyman, R.F., Long, A.D., Langley, C.H., and Mackay, T.F.C. 2002. hairy: A quantitative trait locus for Drosophila sensory bristle number. Genetics 162:155164. Weedon, M.N., Lettre, G., Freathy, R.M., Lindgren, C.M., Voight, B. F., et al. 2007. A common variant of HMGA2 is associated with adult and childhood height in the general population. Nature Gen. 39:1245-1250. Capitolo 23: Evoluzione molecolare Andersson, S.G.E., Zomorodipour, A., Andersson, J.O., Sicheritz-Ponten, T., Alsmark, U.C., Podowski, R.M., Naslund, A.K., Eriksson, A.S., Winkler, H.H., and Kurland, C.G. 1998. The genome sequence of Rickettsia prowazekii and the origin of mitochondria. Nature 396:133-140. Cann, R.L., Stoneking, M., and Wilson, A.C. 1987. Mitochondrial DNA and human evolution. Nature 325:3136. Dobzhanksy, T. 1973. Nothing in biology makes sense except in the light of evolution. Amer. Biol. Teacher 35:125-129. Fitch, W.M., and Ayala, F.J. 1984. Molecular clocks are not as bad as you think. In Molecular Evolution of Physiological Processes, D.M. Fambrough, ed. (pp. 3-12). New York: Rockefeller University Press. Gillespie, J.H. 1997. Junk ain’t what junk does: Neutral alleles in a selected context. Gene 205:291-299. Gould, S.J., and Lewontin, R.C., 1979. The spandrels of San Marco and the Panglossian paradigm: A critique of the adaptationist programme. Proc. Royal Soc. Lond., Series B, 205:581-598.

Haldane, J.B.S. 1932. The causes of evolution. London: Longmans and Green. Heizer, E.M., Raiford, D.W., Raymer, M.L., Doom, T.E., Miller, R.V., and Krane, D.E.. 2006. Amino acid cost and codon usage biases in six prokaryotic genomes: A whole genome analysis. Mol. Biol. Evol. 23:1670-1680. Jacob, F. 1977. Evolution and tinkering. Science 196: 11611166. Jukes, T.H., and Cantor, C.R. 1969. Evolution of protein molecules. In Mammalian protein metabolism, H.N. Munro, ed. (pp. 21-123). New York: Academic Press. Klein, J., and Figueroa, F. 1986. Evolution of the major histocompatability complex. CRC Crit. Rev. Immunol. 6:295-386. Margulis, L. 1981. Symbiosis in cell evolution: Life and its environment in the early earth. San Francisco: W.H. Freeman. Miklos, G.L.G. 1993. Emergence of organizational complexities during metazoan evolution: Perspectives from molecular biology, palaeontology and neo-Darwinism. Memoirs of the Assoc. of Australasian Palaeontologists 15:7-41. Pace, N. 1997. A molecular view of microbial diversity in the biosphere. Science 276:735. Papadopoulos, D., Schneider, D., Meier-Eiss, J., Arber, W., Lenski, R.E., and Blot, M. 1999. Genomic evolution during a 10 000-generation experiment with bacteria. Proc. Natl. Acad. Sci. USA 96:3807-3812. Parker, H.G., Kim, L.V., Sutter, N.B., Carlson, S., Lorentzen, T.D., Malek, T.B., Johnson, G.S., DeFrance, H.B., Ostrander, E. A., and Kruglyak, L. 2004. Genetic structure of the purebred domestic dog. Science 304:1160-1164. Perutz, M.F. 1983. Species adaptation in a protein molecule. Mol. Biol. Evol. 1:1-28. Sarich, V.M., and Wilson, A.C. 1967. Immunological time scale for hominid evolution. Science 158:1200-1203. Saxonov, S., and Gilbert, W. 2003. The universe of exons revisited. Genetica 118:267-278. Vrba, E.S., and Gould, S.J. 1986. The hierarchical expansion of sorting and selection: Sorting and selection cannot be equated. Paleobiology 12:217-228. Zuckerkandl, E., and Pauling, L. 1965. Molecules as documents of evolutionary history. J. Theor. Biol. 8:357-366.

Crediti

Crediti delle illustrazioni e dei testi Figura 1.3: Da Robert H. Tamarin, Principles of Genetics, 5/e. © 1996 McGraw-Hill. Con il permesso di McGraw-Hill Companies, Inc. Figura 1.5: Peregrine Publishing. Figura 1.6: Peregrine Publishing. Figura 2.17: Per gentile concessione di Benjamin Lewin, Genes IV. © 1990, per gentile concessione di Excerpta Medica, Inc. Figura 2.18a, b, c: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 7.21. © 2004 Benjamin Cummings. Per gentile concessione di Pearson Education, Inc. Figura 2.21a: Da Hartwell, Genetics: From Genes to Genomes, fig. 12.4, p. 421. © 2003 McGraw-Hill Companies, Inc. Figura 2.21b: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 7.32b. © 2004 Benjamin Cummings. Per gentile concessione di Pearson Education, Inc. Figura 2.22: Da Mark F. Sanders e John L. Bowman, Genetica: un approccio integrato, ed. italiana a cura di R. Cozzi e C. Tanzarella, fig. 12.3, p. 429. © 2013 Pearson Italia. Figura 2.24: Per gentile concessione di Cell, Vol. 97, Greider, pp. 419-422. © 1999 per gentile concessione di Excerpta Medica, Inc. Figura 3.4: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 8.26. © 2004 Benjamin Cummings. Con il permesso di Pearson Education, Inc. Figura 3.16: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 7.41. © 2004 Benjamin Cummings. Con il permesso di Pearson Education, Inc. Figura 5.7: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 12.13. © 2004 Benjamin Cummings. Con il permesso di Pearson Education, Inc. Figura 5.11a, b: Per gentile concessione di Cell, Vol. 87, N. Proudfoot. “Ending the Message Is Not So Sim-

ple,” pp. 779-781. © 1996 con il permesso di Excerpta Medica, Inc. Figura 5.14: Da Maizels and Winer, “RNA Editing,” Nature, Vol. 334, 1988, p. 469. © 1988 Macmillan Magazines Limited. Riproduzione autorizzata. Figura 6.4: Illustrazione, Irving Geis. Diritti della Howard Hughes Medical Institute. Non utilizzare senza permesso. Figura 6.17: Peregrine Publishing. Figura 7.18: Da Brooker, Genetics: Analysis and Principles, p. 474. © 1998. Riproduzione autorizzata da Pearson Education, Inc. Figura 7.28: “Ty-transposable element of yeast” adattamento da Watson con il permesso di Gerald B. Fink. Riproduzione da Pearson Education, Inc. Box 7.1: Estratto da Nina Federoff, Biographical Memoirs, Vol. 68, 1996. © 1996 National Academies Press. Riproduzione autorizzata. Figura 8.17: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 7.2. © 2004 Benjamin Cummings. Con il permesso di Pearson Education, Inc. Figura 8.18: Con il permesso di Fleischmann et al., Science, 28 luglio 1995, Vol. 269, p. 507. © 1995 American Association for the Advancement of Science. Figura 9.4: © Stanford University. Riproduzione autorizzata. Figura 9.7a: Con il permesso di Chu et al., Science, Vol. 282, n. 699, fig. 1. © 1998 American Association for the Advancement of Science. Con il permesso di AAAS. Figura 9.7c: © Patrick Brown. Riproduzione autorizzata. Figura 10.11: Da Johnston et al., Molecular Cell Biology, Vol. 14, pp. 3834-3841, 1994. © 1994 American Society for Microbiology. Riproduzione autorizzata. Figura 10.20a: Roza et al., Molecular Vision, Vol. 4, n. 20, 1998, fig. 3a. Riproduzione autorizzata. Figura 10.23: Da J.D. Watson, M. Gillman, J. Witkowski e M. Zoller, Recombinant DNA. © 1983, 1992. Con il permesso di W.H. Freeman and Company.

670

Crediti

Figura 10.24: Da Robert Weaver e Philip Hedrick, Genetics. © 1989. Per gentile concessione di McGrawHill Companies, Inc. Tabella 11.5: Da Fisher e Yates, Statistical Tables for Biological, Agricultural, and Medical Research, 6/e, tab. IV. © 1994 Pearson Education Ltd. Riproduzione autorizzata. Figura 12.10: Da William T. Keeton e James Gould con la collaborazione di Carol Grant Gould, Biological Science, 4/e. © 1986, 1980, 1979, 1978, 1972, 1967 edito da W.W. Norton & Company, Inc. Uso consentito da W.W. Norton & Company, Inc. Figura 13.2: Da Mark F. Sanders e John L. Bowman, Genetica: un approccio integrato, ed. italiana a cura di R. Cozzi e C. Tanzarella, fig. 4.5, p. 122. © 2013 Pearson Italia. Figura 14.1: Da Ursula W. Goodenough, Genetics, 2/e, © 1978 Brooks/Cole, parte della Cengage Learning, Inc. Riproduzione autorizzata. Figura 14.11: Da Srb. Owen, Edgar, General Genetics, © 1965 edito da W.H. Freeman and Company. Riproduzione autorizzata. Figura 14.12: Adattata da: J.H. Renwick, “Linkage in Human Genetics”, The Eugenics Review. © 1956. Figura 16.12: Per gentile concessione di Cancer and Cytogenetics, Vol. 11, O. Prakash e J.J. Yunis, “High Resolution chromosomes of the +(922)Leukemias”, pp. 361-368. © 1984 con il permesso di Elsevier Science, Inc. Figura 16.14b: Da Gerald Stine, The New Human Genetics. © 1989. Uso per gentile concessione di McGraw-Hill Companies, Inc. Figura 17.9: Da Charles Yanofsky, “Attenuation in the Control of Expression of Bacterial Operons”, Nature, Vol. 289, 1981. © 1981 edito da Macmillan Magazines Limited. Riproduzione autorizzata. Figura 18.1: Da Peter J. Russell, Genetics, 5/e, fig. 17.1, p. 538. © 1998. Riproduzione autorizzata da Pearson Education, Inc. Figura 18.2a: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 12.16. © 2004 Benjamin Cummings. Riproduzione autorizzata da Pearson Education, Inc. Figura 18.2b: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e, fig. 17.1. © 2004 Benjamin Cummings. Riproduzione autorizzata da Pearson Education, Inc. Figura 18.9b: Da Wolpert et al., Principles of Development, 3/e. © 2007 Oxford University Press. Riproduzione autorizzata. Figura 18.10: Da Mark F. Sanders e John L. Bowman, Genetica: un approccio integrato, ed. italiana a cura di

R. Cozzi e C. Tanzarella, fig. 15.13, p. 541. © 2013 Pearson Italia. Figura 18.11: Da Mark F. Sanders e John L. Bowman, Genetica: un approccio integrato, ed. italiana a cura di R. Cozzi e C. Tanzarella, fig. 15.15, p. 544. © 2013 Pearson Italia. Figura 18.12: Da Mark F. Sanders e John L. Bowman, Genetica: un approccio integrato, ed. italiana a cura di R. Cozzi e C. Tanzarella, fig. 15.18, p. 546. © 2013 Pearson Italia. Figura tratta da J.D. Watson, T.A. Baker, S.P. Bell, A. Gann, M. Levine, R. Losick, CSHLP, Inglis, Molecular Biology of the Gene, VI, ©2008. Stampa e riproduzione elettronica per concessione di Pearson Education, Inc. Adattato da fig. 4.35, Copyright © 2007 da Molecular Biology of the Cell, 4e by Bruce Alberts et al. Riproduzione per concessione di Garland Science/Taylor & Francis Books, Inc. come libro di testo attraverso il Copyright Clearance Center. Figura adattata tratta da T. Jenuwein e C. D. Allis, “Translating the histone code”, Science, 10 agosto 2001, 293(5532):1077-1078. Ristampa autorizzata dalla AAAS. http://www.sciencemag.org/content/293/5532/1074.abstract?sid=eaef9715-35ec-4d8bb8d2-5183099ed927. Figura 18.13: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e. © 2004 Benjamin Cummings. Riproduzione col permesso di Pearson Education, Inc. Figura 18.15: Da Mark F. Sanders e John L. Bowman, Genetica: un approccio integrato, ed. italiana a cura di R. Cozzi e C. Tanzarella, fig. 15.22, p. 552. © 2013 Pearson Italia. Figura 18.16: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e. © 2004 Benjamin Cummings. Riproduzione autorizzata. Figura 18.17: Da Mark F. Sanders e John L. Bowman, Genetica: un approccio integrato, ed. italiana a cura di R. Cozzi e C. Tanzarella, fig. 15.21, p. 551. © 2013 Pearson Italia. Figura 20.2: Adattata da Campbell et al., Biology: Concepts and Connections, 2/e, fig. 8.10, p. 136. © 1997 Benjamin Cummings. Per gentile concessione di Pearson Education, Inc. Figura 20.6: Per gentile concessione di James Watson et al., Molecular Biology of the Gene, 5/e. © 2004 Benjamin Cummings. Riproduzione autorizzata da Pearson Education, Inc. Tabella 20.3: Riproduzione autorizzata da J. Marx, Science, Vol. 261, 1993, pp. 1385-1387. © 1993 American Association for the Advancement of Science. Figura 21.2: Da E.B. Ford, Ecological Genetics. © 1975. Per gentile concessione di The Natural History Museum Picture Library.

Crediti

Figura 21.3: Da P. Buri in Evolution 10 (1956), p. 367. Riproduzione autorizzata da The Society for the Study of Evolution. Figura 21.6: Da R.K. Koehn et al., in Evolution 30 (1976), p. 6. Riproduzione autorizzata da The Society for the Study of Evolution. Figura 21.9: Da P. Buri in Evolution 10 (1956), p. 367. Riproduzione autorizzata da The Society for the Study of Evolution. Figura 21.10: Da Philip Hedrick, Genetics of Populations, 1983. © 1983 Jones and Bartlett Publishers, Sudbury, MA. www.jbpub.com. Riproduzione autorizzata. Figura 21.11: Cortesia di Andrew Clark. Figura 21.12: Cortesia di Andrew Clark. Figura 21.18: Da A.C. Allison, “Abnormal Hemoglobin and Erythovute Enzyme-Deficiency Traits” in Genetic Variation in Human Population, edito da G.A. Harrison, ed. Tabella 21.3: Dati da R.K. Selander, “Behavior and Genetic Variation in Natural Populations (Mus musculus)”, in American Zoologist, Vol. 10, 1970, pp. 53-66. Tabella 21.6: Da Monroe W. Strickberger, Genetics, 3/e. © 1985. Adattata da Pearson Education, Inc. Figura 23.2: Da R.E. Dickerson, Journal of Molecular Evolution, Vol. 1, 1971, pp. 26-45. © 1971 SpringerVerlag. Riproduzione autorizzata. Figura 23.4: Da Hartl e Clark, Principles of Population Genetics, 3/e, p. 373. © Sinauer Associations. Riproduzione autorizzata dall’editore. Figura 23.6: Da N. Pace, “A Molecular View of Microbial Diversity in the Biosphere,” Science, Vol. 276, p. 735, 1007. © 1997. Riproduzione autorizzata da AAAS. Tabella 23.1: Da W. Li, C. Luo e C. Wu, “Evolution of DNA Sequences” in Molecular Evolutionary Genetics, Vol. 2, 1985, pp. 150-174, edito da R.J. MacIntyre, ed. Riproduzione autorizzata da Kluwer Academic/Plenum Publishers.

Crediti delle Fotografie Capitolo 1 1.1: © IstockPhoto, Inc. 1.2: © Eli Lilly and Company. Riproduzione autorizzata. 1.4a: Photo Researchers, Inc. 1.4b: IstockPhoto, Inc. 1.4c: Dr. ChinSang 1.4d: Photo Researchers, Inc. 1.4e: Alamy Images 1.4f: Shutterstock 1.4g: Prof. Katherine A. Borkovich, PhD 1.4h: IstockPhoto, Inc. 1.4i: Pearson Science 1.4j: Visuals Unlimited 1.4k: Istockphoto,

671

Inc.1.4l: istockphoto.com 1.4m: Da Kimmel et al. “Stages of Embryonic Development of the Zebrafish.” Developmental Dynamics 203:253-310 (1995) Capitolo 2 2.1a: Peter Arnold, Inc. 2.1b-c: Da Aimee E. Belanger, Melissa J. Clague, John I. Glass e Donald J. LeBlanc, “Pyruvate Oxidase Is a Determinant of Avery’s Rough Morphology”, in Journal of Bacteriology , 186:8164-8171. © 2004, American Society for Microbiology 2.4: Cortesia del Dr. Harold W. Fisher, University of Rhode Island 2.10: National Cancer Institute 2.14: Photo Researchers, Inc. 2.16a: Dr. Jack Griffith/University of North Carolina/School of Medicine 2.16b: Dr. Jack Griffith/University of North Carolina/School of Medicine 2.19a: Barbara Hamkalo 2.20: Professor Ulrich K. Laemmli Capitolo 3 3.13: National Institutes of Health Capitolo 4 4.5: National Geographic Image Collection 4.7: Photo Researchers, Inc. Capitolo 5 5.6: Roger D. Kornberg Capitolo 6 6.12: Professor Harry Noller, University of California, Santa Cruz Capitolo 7 7.25: Virginia Walbot, Stanford University Capitolo 8 8.8b: Dr. Fritz Thuemmler/Vertis Biotechnologie AG 8.14b: Alfred Pasieka/SPL/Photo Researchers, Inc. 8.19: J. Forsdyke/Gene Cox/Photo Researchers, Inc. 8.20: Dr. Chin-Sang Capitolo 9 9.8: J.M. Zicherman, D. Weissman, C. Griggin, et al., “Best cases from the AFIP: primary diffuse large Bcell lymphoma of the epididymis and testis”, RadioGraphics 2005, fig. 2c, 25:243-248, Radiological Society of North America 9.9: Michael Wigler-ROMA lab/Cold Spring Harbor Laboratory Capitolo 10 10.22: Alec Jeffreys Capitolo 11 11.2: National Library of Medicine 11.15: Photo Researchers, Inc. 11.18a, sinistra e destra: Retna Ltd. 11.19a: © Itani/Alamy Capitolo 12 12.3a: Cortesia di Applied Imaging a Genetix Company 12.3b: Cortesia di Applied Imaging a Genetix

672

Crediti

Company 12.6a: © Michael Abbey/Photo Researchers, Inc. 12.6b: Photo Researchers, Inc. 12.6c: © Michael Abbey/Photo Researchers, Inc. 12.6d: Photo Researchers, Inc. 12.6e: © Michael Abbey/Photo Researchers, Inc. 12.6f: Photo Researchers, Inc. 12.7a: Armed Forces Institute of Pathology 12.7b: Visuals Unlimited 12.22a: Digamber S. Borgaonkar, Ph.D. 12.23a: © Dr. Glenn D. Braunstein, M.D., Chairman, Dept. of Medicine, Cedars-Sinai Medical Center, Los Angeles, CA 12.24a: Visuals Unlimited 12.24b: Photo Researchers, Inc. 12.25: Peter J. Russell 12.26a: Cortesia della Library of Congress 12.27a: National Library of Medicine Capitolo 13 13.9, alto e basso: Dr. James H. Tonsgard 13.11: istockphoto.com 13.17: Hans Reinhard/OKA PIA/Photo Researchers, Inc. 13.18: Photo Researchers, Inc. Capitolo 15 15.1: Cortesia di Gunther S. Stent, University of California Berkeley 15.4a: © Dennis Kunkel/Phototake 15.4b: © Omikron/Photo Researchers, Inc. 15.11: Bruce Iverson, Photomicrography 15.16: Cortesia di Gunther S. Stent, University of California Berkeley 15.17: Cortesia del Dr. D.P. Snustad, Department of Genetics and Cell Biology, College of Biological Sciences, University of Minnesota Capitolo 16 16.4a: Dr. Laird Jackson, Thomas Jefferson University Hospital, Division of Medical Genetics. 16.4b: C. Weinkove e R. McDonald, S Afr Med J 43 (1969): 318 da Syndromes of the Head and Neck, di Robert Gorlin, M. Michael Cohen e L. Stefan Levin, 3/e, Oxford University Press 16.13: Per gentile concessione di Warren & Nelson (JAMA, 2/16/94, 271; 536-542); © 1994, American Medical Association. 16.14a: Cortesia di Christine J. Harrison, da American Journal of Medical Genetics, Vol. 20, pp. 280-285, 1983. Riproduzione autorizzata da Wiley-Liss, Inc., una divisione della

John Wiley & Sons, Inc. 16.17a: National Library of Medicine 16.17b: Getty Images-Stockbyte 16.20a-b: Dr. Laird Jackson, Thomas Jefferson University Hospital, Division of Medical Genetics. 16.21a-b: Dr. Laird Jackson, Thomas Jefferson University Hospital, Division of Medical Genetics. Capitolo 18 18.3: Riken BioResource Center Capitolo 19 19.1: Bill Stark, da Marcey, D. and Stark, W.S., “The morphology, physiology and neural projections of supernumerary compound eyes in Drosophila melanogaster”. Developmental Biology, 1985, I07, I80-I97 19.2: Edward Kipreos 19.3, sinistra e destra: Yanofsky Martin 19.4, sinistra e destra: Gary C. Schoenwolf, da Kimmel et al., “Stages of Embryonic Development of the Zebrafish”. Developmental Dynamics 203:253-310 (1995) 19.6a: Texas A & M University College of Veterinary Medicine 19.6b: Texas A & M University College of Veterinary Medicine 19.9: Photo Researchers 19.23: F. Rudolf Turner, Indiana University 19.24, alto e basso: Nipam H. Patel 19.26b-c: Edward B. Lewis, California Institute of Technology 19.27a-b: David Suzuki Foundation, da David Suzuki et al., Introduction to Genetic Analysis, p. 485 Capitolo 20 20.1: GUSTOIMAGES/Photo Researchers, Inc. 20.7: Custom Medical Stock Photo, Inc. Capitolo 21 21.1a, c: Corbis/Bettmann 21.1b: Cortesia di James F. Crow 21.5: The Field Museum, Neg #CSA 118, Chicago 21.14: istockphoto.com 21.15a: Photo Researchers, Inc. 21.15b: The Granger Collection 21.16a-b: Breck P. Kent Capitolo 22 22.14a-d: Douglas W. Schemske

Indice analitico

A A-DNA, 21 aberrazioni cromosomiche (o mutazioni cromosomiche), 405 ABP (Androgen-Binding Protein), 409 accoppiamento di trascrizione e traduzione, 81 acondroplasia, 292, 330 adattabilità, vedi fitness, darwiniana adattatore, 183, 218 adenina (A), 17 Agrobacterium tumefaciens (o Rhizobium radiobacter), 23, 260 albero-i dei geni, 613 delle specie, 614 filogenetici, 613 affidabilità, 618 albero della vita, 619 criterio di parsimonia, 616 massima parsimonia, 616 massima verosimiglianza, 617 matrici di distanza, 616 approccio con metodo UPGMA (Unweighted Pair Group Method with Arithmetic Averages), 616 metodo bootstrap, 618 genealogico-i (o pedigree), 284 analisi, 69, 284, 318, 369 numero, 613 radicato, 613 outgroup, 613 stimati, 614 albinismo, 63, 285 da mancanza di tirosinasi, 549 oculocutaneo, 63, 343 di tipo I (OCA1), 63 di tipo II (OCA2), 63 di tipo III (OCA3), 63 alcaptonuria, 55 allele-i, 271 disposizione in accoppiamento (o in cis), 360 in repulsione (o in trans), 360 funzionali (o additivi), 577 letale, 330 dominante, 330

recessivo, 330 multipli, 324 non funzionali, 577 nullo, 206 selvatico, 277 wild-type, 277 allelomorfo, 282 allopoliploidia, 425 amminoacidi, 91 legame peptidico, 92 amminoacil-tRNA, 101 sintetasi, 101 amminoacilazione (o caricamento), 101 amniocentesi, 69, 250 AMP, 18, 101 ciclico, vedi cAMP amplificazione genica, 518 analisi della regressione, 583, 584 della varianza, vedi ANOVA di ibridazione di oligonucleotidi allelespecifici (ASO, Allele-Specific Oligonucleotide), 248 di vitalità delle popolazioni, 571 fetale, 69 genetica quantitativa, 585 anemia di Fanconi (AF), 137t falciforme (SCA, Sickle-Cell Anemia), 65, 250, 251 aneuploidia, 310, 418 origine, 418 tipi, 418 aniridia, 417 ANOVA (ANalysis Of VAriance, analisi della varianza), 584 anticipazione genetica, 132 anticodone, 100 anticorpo-i, 415, 486 riarrangiamento di segmenti genici, 487 antigene, 325, 486 antociani, 142 aploidia, 418 aplotipo-i, 178, 216 blocco, 216 apolipoproteine, 610 apoptosi, 480, 508 Arabidopsis thaliana, 7, 190, 191, 481

genoma, 186, 623 Archaea (archeobatteri), 204, 221, 405 genomi, dimensioni e densità geniche, 186 radioresistenza, 125 array di cattura (capture array), 215 di proteine (o microarray proteici o chip di proteine), 214 ASO, vedi oligonucleotide allelespecifico assetti cromosomici, 316t anormali, 418, 422, 423 aploidi, 294, 297 aster, 296 atassia telangectasia (AT), 137t ATP, 101, 173 idrolisi, 42, 78, 101 ATPasi, 347, 350 attenuazione, 440 modello molecolare, 440 attivatori, 80 eterodimeri, 451 omodimeri, 451 attività genica differenziale durante lo sviluppo, esempi, 484, 485 autofecondazione (selfing), 268 autopoliploidia, 424 autoradiografia, 233 autoradiogramma, 233 autosomi, 167, 292, 300, 304, 315 auxotrofi (o mutanti auxotrofi), 57, 129, 130, 378, 552t B B-DNA, 21 BAC (Bacterial Artificial Chromosomes, cromosomi artificiali batterici), 162, 231 BamHI, 156, 157t, 226, 227, 247, 547 banca-he cromosomiche (o librerie cromosomiche), 167 di cDNA, 180 annotazione dei geni, 184 costruzione, 182, 183 genomica (o libreria genomica, o genoteca), 154, 163-167

674

Indice analitico

calico, gatto, 315, 483 calvizie, 333, 334 cAMP (AMP ciclico), 436 campione, di popolazione, 579 cancerogeno-i-e, 528 ad azione diretta, 528 chimici, 528 definitivi, 528 radiazioni, 529 cancro-i, 218, 508 del colon ereditario non poliposico (HNPCC), 136, 137t, 524 retto ereditario (FAP), 524, 526 familiari (ereditari), 511 geni, 511 metastasi, 508, 527 natura multifasica, 526 oncogenesi, 508 sporadici (non ereditari), 511 umano, 525, 526 cane-i colore del pelo, 343 ereditabilità dei caratteri, 594t genoma, 192 origini, 621 CAP (Catabolite Activator Protein), 436 Cap Binding Protein (CBP), 106 capping al 5 , 83 carattere-i (o tratto-i), 267 continui, 576 trasmissione ereditaria, 576 discontinui, 575, 578, 579 dominante-i, 275, 292 legato al cromosoma X, 318 influenzati dal sesso, 333 legato all’Y (olandrico), 319 multifattoriali, 557 recessivo-i, 64, 273, 292 legato all’X, 317 carcinogeno, 129 cariosside di grano, ipotesi poligenica per il colore, 577 cariotipo, 292 analisi, 405, 407 carota, rigenerazione da una singola cellula matura, 482 cascata di segnali, proteine G, 516 catena-e biochimica, caratterizzazione genetica, 58 C leggere (L), 486 lambda, 486 CAAT box, 80 kappa, 486 Caenorhabditis elegans (C. elegans), 6, oligo (dT), 182 26t, 154 pesanti (H), 486 analisi genetica dello sviluppo, 481, alfa, 486 525 delta, 486 determinazione del sesso, 316 epsilon, 486 regolazione genica, 470 gamma, 486 sequenziamento del genoma, 190, 201 bandeggio G, 293, 408, 420, 423 base azotata, 16 batteri analisi genetica, 377-379 coniugazione, 379 F-duzione (o sexduzione), 382, 383 interrotta, 383 transconiuganti, 379, 383 lisogeni, 389 traduzione, 104, 106, 108, 109 trascrizione nei, 74-78 trasduttanti, 388 trasduzione generalizzata, 389 specializzata, 389 trasformanti, 385 trasformazione co-, 387, 388 ingegnerizzata, 385 naturale, 385 batteriofago-i (o fago-i), 14, 230, 388 lambda (λ), 26t, 45 ciclo vitale, 388 eventi precoci nella trascrizione, 444 regolazione dell’espressione genica, 445 lisato LFT (Low-Frequency Transducing lysate, lisato a bassa frequenza di trasduzione), 393 lisato (High-Frequency Transducing lysate, lisato ad alta frequenza di trasduzione), 393 P1, 389 replicazione del DNA, 45 ricombinazione, frequenza di, 395 T-pari, 23 T1, 116 T2, 14, 23, 388 T4, 23, 26t, 95, 388 mutanti, 395 temperati, 389 trasducenti, 390 vettori di clonaggio, 159 bicluster, 428 bioinformatica, 200, 428 biologia della conservazione, 571 biotecnologia, 259-263 blastoderma sinciziale, 458, 496 brachidattilia, 283, 332, 536

mu, 486 Cdk (chinasi dipendenti dalle cicline), 509 cDNA (DNA complementari), 180, 226, 227, 230, 515 libreria, vedi banca, di cDNA marcati, 211, 212 sintesi, 180, 181, 228 cellula-e B, 415, 486 divisione cellulare, regolazione della, 504 eteroplasmiche, 350 staminali embrionali (ES), 207, 208 struttura, 6 T, 258, 486 transgenica, 258 tumorali, 213, 218, 508 vegetali, trasformazione, 260 centimorgan (cM), vedi unità, di mappa centrifugazione all’equilibrio in gradiente di densità, 36 centromero, 25, 292 cinetocori, 30, 296 sequenze CEN, 30, 226 ceppo-i auxotrofi, 389 Hfr (High frequency of recombination), 380 prototrofi, 378 chaperonine, 53, 94, 455 checkpoint, 509 chiasmi (meiosi), 299 chimera, 208 chinasi dipendenti dalle cicline, vedi Cdk chip di proteine (o array di proteine, o microarray proteici), 214 genici (a DNA), 213, 214, 218, vedi anche microarray, di DNA ChIP on chip (Cromatin ImmunoPrecipitation on chip, immunoprecipitazione della cromatina su microarray), 464 cicline, 509 ciclo cellulare, 294 cancro, 508 controllo molecolare, 508 fasi G1, S, G2 e M, 25 lisogenico, 445, 447 lisogeno, 388 litico, 388, 390, 446 del batteriofago T2, 15 cinetocore, 296 cis-dominanza, 431 cistrone, 400, 427 citocinesi, 297 citofluorimetria, 167 citoplasma polare, 496 citosina (C), 17

Indice analitico cline, 543 clonaggio, 154 del DNA, 155 di un gene specifico, 231 forzato (o direzionale), 228 clonazione, 482 animale, 482 Dolly, 482, 483 di mammiferi, 483, 484 problemi, 483 clone-i, 155, 163, 226 genomici, 236 specifici, identificazione, 232 cloroplasti, 8, 22, 347 coattivatori, 451 codice genetico caratteristiche, 97 cloroplasti, 99 decifrazione, 96 degenerazione (o ridondanza), 98 mitocondri, 99 natura, 94 triplette, 95 codominanza, 329, 330 codone-i, 95 anticodone, 100 di stop (nonsenso o di terminazione), 98 preferenza nell’uso dei, 548, 608 senso, 98 sinonimo, 111b coltura, titolo, 378 compensazione di dose (lyonizzazione), 314, 420 in Drosophila, 495 per i geni X-linked, 491 complementazione, 236, 338 test (o test cis-trans), 337, 338, 398 complesso del promotore aperto, 76 chiuso, 76 di inizio 30S, 106 70S, 106 di pre-inizio (PIC), 80 di riconoscimento dell’origine (ORC), 48 di rimodellamento dei nucleosomi, 461 di silenziamento indotto da pre-microRNA (pre-miRISC, pre-microRNA-Induced Silencing Complex), 471 da pre-siRNA (o pre-siRISC, pre-siRNA-Induced Silencing Complex), 473 maggiore di istocompatibilità, vedi MHC sinaptinemale, 299 concatamero, 47

consulenza genetica, 68, 333 Contig (sequenze contigue), 174 conversione genica, 520b, 603, 622 corea di Huntington, 132, 331, 552t corpo di Barr, 30, 314 P (P body), 472, 473 correlazione coefficiente di, 581 fenotipica, 594 genetica, 595 corte ripetizioni in tandem, vedi STR covarianza, 581 cpDNA (DNA dei cloroplasti), 347, 348 cromatidi fratelli, 25, 48, 294 cromatina, 25, vedi anche eterocromatina; eucromatina compattamento, 26 fibra da 10 nm, 26 struttura, 26, 27 cromocentro, 406 cromosoma-i acrocentrici, 292 artificiali, 159 batterici, vedi BAC di lievito, vedi YAC assetto X0, 310 Y0, 310 assortimento indipendente, 302 bande, 293 dicentrico, 411 DNA, 22 domini ad ansa, 25, 28 Drosophila, 305 eucarioti, 317 impalcatura (scaffold), 28 metacentrico, 292 non omologhi, 292 omologhi, 292 politenici, 406, 85 puff, 485 riarrangiamenti, 416, 458 sessuali, 292, 304 struttura, 22 submetacentrici, 292 telocentrici, 292 variazioni della struttura, 406-417 nel numero, 418-425 W, 316, 490b X, 292, 305 non-disgiunzione, 311 Y, 292, 305 Z, 316, 490b crossing-over, 205, 299, 300, 357, 360, 362 cold spot, 178, 3608 hot spot, 368 ineguale, 299, 413b, 622

675

CTCF (CCCTC-binding Factor, fattore di legame alla sequenza CCCTC), 466 D Danio rerio (pesce zebra, zebrafish), 6, 26t, 481 ddNTP (didesossinucleotidi), 169 ddATP, ddTTP, ddCTP, ddGTP, 169-171 deamminazione, 123, 217b decapping, 474 Deinococcus radiodurans, 125b delezione, 203, 407, 499, 604 conseguenze, 407, 408 mappatura per, 397 depurinazione, 122 deriva genetica, 537 casuale, 553 desossinucleotidi, vedi dNTP desossiribosio, struttura, 16 destrocardia, 63, 64 determinazione, del destino cellulare, 480 deviazione standard, 580 diabete di tipo 1, 232b Dicer, 471, 504 didesossinucleotidi, vedi ddNTP differenziale di selezione (s), 593 differenziamento, 480 digestione del DNA, 155, 164 dimeri di timina, 124 diploide, 25, 274b, 291 diplonema, 299 dischi imaginali, 497 disequilibrio gametico, 570 disgenesi degli ibridi, 244 disomia uniparentale, 418 distribuzione di frequenza, 579 normale, 579 distrofia muscolare di Duchenne, 250, 318, 333 DNA (acido desossiribonucleico), 11 a sequenza unica, 31, 32 altamente ripetuto, 31 amplificazione, 204, 205 caratteristiche, 11 circolare, 23, 260, 380 clonato, analisi molecolari, 237 complementari, vedi cDNA composizione e struttura, 16 in basi, 18 regole di Chargaff, 18 conservazione sequenze, 26 cromosomi, 22 dei cloroplasti, vedi cpDNA denaturazione, 42 diffrazione dei raggi X, 19 figura, 19

676

Indice analitico

dNTP (Deoxyribo-Nucleoside TriPhosfate), 38 domini ad ansa, 28 elica doppia elica, 18 guida (leading strand), 43 in ritardo (lagging strand), 43 elicasi, 40 endonucleasi, 47 eteroduplex, 387 fingerprinting, vedi tipizzazione del DNA, girasi, 43 impieghi dei polimorfismi nell’analisi genetica, 246 in medicina legale, 255 legame fosfodiesterico, 18 libreria, 232 ligasi, 44, 135, 139, 155, 158, 184 linker, 27 marcatura non radioattiva, 234 radioattiva, 235, 236 mitocondriale, vedi mtDNA modello di Watson e Crick, 19 moderatamente ripetuto, 31 nomenclatura, 18 plasmidico, 159 polimerasi, 40, 121 attività di correzione di bozze, 133, 134 I (DNA Pol I), 38, 204 III, 60 polimerizzazione, 38 replicazione, 50 ruolo, 38, 39 termostabile, 205 uso nel sequenziamento, 169 polimorfismo del, 349b primasi, 42 primer, 38, 235 replicazione, 35, 45, 47 a cerchio rotante, 45 modello conservativo, 35 modello dispersivo, 35 modello molecolare, in E. coli, 40-45 modello semiconservativo, 35 negli eucarioti, 47-53 semidiscontinua, 42 ribosomale, vedi rDNA ricombinante, 154, 155 creazione, 157, 158 tecnologia del, 225, vedi anche ingegneria genetica ripetuto, disperso (o ripetuto intersperso), 32 in tandem, 32, vedi anche STR, VNTR sequenza-e di inserzione, vedi elemento-i, IS

LINE (Long Interspersed Elements, lunghe sequenze ripetute intersperse), 32 ripetuta, 31, 32 SINE (Short Interspersed Elements, corte sequenze ripetute intersperse), 32 famiglia Alu, 32 unica (a singola copia), 31 stampo, 204 superavvolgimento, 23 telomerico, 30, 51 test molecolari, 249 basati sull’analisi dei RFLP, 251 trasformante (T-DNA), 260 DNasi (desossiribonucleasi), 14, 260, 437 dNTP (desossinucleotidi), 169, 204 dATP, dTTP, dCTP, dGTP, 169, 170 dominanza completa, 328 incompleta, 328, 329 dominio di legame per l’ormone (HBD), 455 Drosha, 471 Drosophila melanogaster, 6, 210, 244, 480, 481 analisi dello sviluppo mediante microarray, 503 associazione genetica, 356, 357 colore del corpo, 338 dell’occhio, 307, 327, 554 compensazione di dose, 495 determinazione del sesso, 492 elementi trasponibili P, 307, 308 forma dell’occhio, 358 geni associati al cromosoma X, 356 mappa genetica, 5f parasegmenti, 458, 497 QTL associati al comportamento aggressivo, 600b segmenti, 458, 497 sviluppo dell’embrione, 458, 480, 481 regolazione genetica, 496-503 Drosophila pseudoobscura, 594 dsRNA (RNA a doppio filamento), 208, 470 duplicazione-i, 409 genica, 622 in tandem invertita, 409 terminale, 409 E effetto-i ambientali familiari, 588 generali, 588 speciali, 588

collo di bottiglia, 555, 556 del fondatore, 555 della deriva genetica, 553 della selezione sulle frequenze alleliche, 562, 563 di posizione, 416 glucosio (o repressione da cataboliti), 436 materni, 589 pleiotropici, 562, 581 effettori (o molecole effettrici), 427 elemento-i di risposta all’ormone (HRE, Hormone Response Elements), 455 IS (o elemento IS, o sequenza di inserzione), 138 L, 140 R, 140 ricco in adenilato/uridilato (ARE), 470 silenziatore (silencer), 457 trasponibile-i, 115, vedi anche trasposoni caratteristiche generali, 138 degli eucarioti, 141 dei batteri, 138 di Drosophila, 147 elemento P, 147, 148 nei vegetali, 141, 142 nel lievito, 147 Ty, 147 nel mais, 142, 145 famiglia Ac-Ds, 145, 146 elettroforesi su gel di agarosio, 165 elettroporazione, 160, 261, 385 emizigote, 307 emofilia, 317, 331 emoglobina, 65, 66, 92, 94f, 409 fetale, 484 frequenze alleliche e genotipiche, 535b tipi, 484, 485 endonucleasi di restrizione, 155 endoreduplicazione, 406 enhancer, 80, 450 enzima-i controllo genetico della struttura, 55 deficienze nell’uomo, 60 di restrizione, 155 digestione, 164 nomenclatura, 155, 156 parziale, 155 epilessia mioclonica a “fibre rosse stracciate”, 350 episomi, 159 epistasi, 341, 346t a carico di geni duplicati, 344 azione genica complementare, 341 dominante, 341, 343 duplicata, 345 recessiva, 341, 342 duplicata, 345

Indice analitico epitopo, 234 ereditabilità, 586 calcolo dell’, 591, 592 caratteristiche, 586-589 in senso lato, 589 stretto, 589 stima mediante regressione genitoriprogenie, 591 ereditarietà ambiente ed, 335 crisscross, 307 extranucleare (o non mendeliana), 347 esempi, 348, 349 leggi, 348 legata al cromosoma X, dominante, 318 recessiva, 317 legata al cromosoma Y, 319 materna, 348 eccezioni, 351 teoria cromosomica, 204 uniparentale, 348 ermafrodita, 316 errore di campionamento, 533 Escherichia coli (E. coli), 3, 95, 414 analisi genetica, 377, 378 cromosoma, 25 mappa del, 383 fattore F, 162, 380 mutanti di DNA polimerasi, 41b operone trp, 439 replicazione del DNA, 36, 40, 42 geni, 41t prodotti genici, 41t replicone, 48 test di fluttuazione, 116 trascrizione, 75 vettore plasmidico, 159 esoni, 82 ligazione, 86f rimescolamento dei domini, 623 espansioni di triplette ripetute, 131, 417 esperimento-i con i batteriofagi di Hershey e Chase, 14 di Benzer, 395 di Lederberg e Tatum, 379 di Meselson e Stahl, 35, 36 di Morgan con Drosophila, 356 di trasformazione di Avery, 13 di Griffith, 12 espressione genica, 73, 91 differenziale durante lo sviluppo, 480, 482 dogma centrale, 73 effetti ambientali età di insorgenza, 333 sesso, 333

sostanze chimiche, 335 temperatura, 335 negli eucarioti regolazione, 449-475 a livello post-trascrizionale, 473 controllo del processamento dell’RNA, 468 controllo della degradazione delle proteine, 475, 476 controllo della traduzione, 469 controllo del trasporto dell’mRNA, 450 livelli di controllo, 450 silenziamento, 471 espressività, 332 eterocromatina, 30 costitutiva, 30 facoltativa, 30 eterosi (o vantaggio dell’eterozigote), 350, 566 eterozigosi, perdita di (LOH), 519, 520b eterozigosità, 545 eterozigoti, 271 eubatteri (Eubacteria), 185 genomi, 185, eucarioti, 186 genomi, 186-188 traduzione, 106, 108, 109 trascrizione negli, 81 eucromatina, 29, 416 euploide, 418 evoluzione, 532 molecolare, 603 variabilità nei tassi, 605 F fago-i, vedi batteriofago-i famiglie multigeniche, 413b, 621 farmacogenomica, 212 fattore-i di allungamento (EF), 106 di crescita, 510, 516 del sistema nervoso, 491 IGF2 (Insulin-like Growth Factor 2), 212 di determinazione testicolare (TDF), 490 di inibizione della crescita, 510 di inizio (IF), 104 eucarioti (eIF), 106 di riciclaggio del ribosoma (RRF), 109 di rilascio (RF), 109 F, 162, 380 F′, 382 generali di trascrizione (GTF), 80, 451 fecondazione incrociata (o incrocio), 269, vedi anche incrocio-i fenilchetonuria (o PKU), 61, 252, 335 fenomeno epigenetico, 315, 465, 491

677

fenotipo, 267 mutante, 95, 287, 330, 395, 466 revertante, 96 selvatico, 95, 177, 330, 361f, 400 fibroblasti, 258, 508, 516, 526 fetali, 482 fibrosi cistica (CF), 61t, 253, 337, 346, 369 regolatore del trasporto transmembrana della (CFTR), 68, 177b filamento guida, 471 passeggero, 471 filogenesi molecolare, 612 morfologica, 613 fitness, 606-608 darwiniana (o adattabilità), 562 flusso genico, 559, 570 barriere al, 572 effetti, 556 formilmetionina (fMet), 106 fosforilazioni, 509 frequenza-e di crossing-over, 360 coefficiente di coincidenza, 366 interferenza, 366 di ricombinazione, 360, 368 formula, 361 per geni e marcatori di DNA associati, 370b G gametofito, 298, 305f femminile, 269, 304 maschile, 269 gametogenesi, 297 GC box, 79 GDP (guanosina difosfato), 517 gemelli, 592 dizigoti, 284f identici, 254, 285b, 302 gene-i, 267 a effetto materno, 458, 498 ada, 134 ADA, 258 agouti, 208, 331, 342 ampR, 159, 226 analisi dell’espressione di singoli, 243 Antennapedia, 500 aplosufficiente, 329 araA, 443 araB, 443 araC, 443 araD, 443 ARG1, 236 associazione, vedi linkage autosomico, 333 barnasi, 351

678

Indice analitico

barnstar, 351 bicoid (bcd), 458, 498 bithorax, 500 black, 338 BRCA1, 250, 253 BRCA2, 250, 253 brown (bw), 339 CALC, 468 camR, 162 caudal (cad), 499 conversione, 603 costitutivi (o housekeeping), 80, 427 CYP2D6, 213 deadpan (dpn), 492 definizione mediante test di complementazione (cis-trans), 398 densità, 185 di batteriofago, analisi della struttura fine, 395 di segmentazione, 458, 499, 500 doublesex (dsx), 494 ebony (e), 338 env, 512 essenziali, 330 EST1, 52 eterocronico, 503 even-skipped (eve), 458, 459 FGFR3, 286 FMR-1, 417 FOXP2, 217b FUN (Function UNknown, a funzione sconosciuta), 202 fushi tarazu, 459 gag, 512 GAL, 243 GAL1, 453 GAL7, 453 GAL10, 453 gap, 458, 459, 499 giant, 459 GLC1A, 252 H19, 466 hairy (h), 599 HAR-1, 215 HEXA, 331 housekeeping (o geni costitutivi), 80, 427 Hox, 502 hunchback (hb), 458, 459, 499 Igf2, 466 IL2RA, 372b induzione, 427 interazione-i che coinvolge geni modificatori, 346 che determinano nuovi fenotipi, 339 con rapporti mendeliani modificati, 339 kanR, 205 Krüppel, 459

lacA, 430 lacY, 430 lacZ, 160, 430 legati (o associati) al cromosoma X, 307 compensazione di dose per i, 314 let-7, 504, 525 lexA, 136 lin-4, 503 lin-14, 503 locus, 5, 273 lozenge (lz), 395 mappatura, 367, 407 nei batteri mediante coniugazione, 379 mediante trasduzione, 388 per trasformazione, 385 nei batteriofagi, 393 MC1R, 344b mde2, 303b MDR1, 111b MHC, 372b, 610 modelli di espressione, 428b modificatori, 346 attivatori, 346 riduttori, 346 mutatori, 134, 136, 524 mutazioni con lo stesso fenotipo, 337 mutD, 134 nanos (nos), 499 neoR, 206 omeotici, 500-503 orfani, 202 ortologhi, 125b pair-rule, 459, 499 per gli RNA ribosomali, 103 per i tRNA, 101 per la polarità segmentale, 499 per la sclerosi multipla, 372b phr, 134 pol, 512 Raly, 331 ras, 516 RB, 518 recA, 136 regolati, 427 reporter, 245 Rf, 351 ricombinazione somatica del per la catena leggera, 487 per la catena pesante, 488 rIIA, 398 rIIB, 398 rosy+, 148 scarlet (st), 339 segment polarity, 459 segregazione durante la meiosi, 303b, 309, 311 la mitosi, 297 selettori, 500 sgo1+, 303b

simboli dei, 309b sintenici, 355 sisterless, 492 soppressore-i, 120, 346 dei tumori, vedi oncosoppressori SRY (Sex-determining Region of the Y), 490 Sxl (Sex-lethal), 492 TEP1, 212 ter, 47 tetM, 386b tetR, 159 tk, 206 TLC1, 52 TP53, 522 transformer (tra), 494 trasferimento orizzontale, 615b trpE, 439 trpR, 440 Ultrabithorax (Ubx), 500 Xist, topo, 491 XIST, uomo, 491 genetica branche, 2, 531 dell’evoluzione, 531 della trasmissione dei caratteri, 531 di popolazioni, 531 modello classico, 545 teoria neutrale, 545 inversa, 200 quantitativa, 531, 576 analisi, 585 argomenti studiati, 576 metodi statistici, 578 terminologia, 274b genoma-i, 153, 200-203 artificiali, 386b copertura, 175 definizione, 22 dimensioni, 185, 186 extranucleari, 347 trasferimento, 386b umano, 368, vedi anche Progetto Genoma Umano genomica, 153 ambientale (o metagenomica), 220 comparativa, 154, 199, 215, 607 funzionale, 154, 199 prospettive future, 192 strutturale, 153 genoteca, vedi banca genomica genotipo-i, 267 parentali (o classi parentali, o parentali), 357, 577 glicosiltransferasi, 326 globina-e, 66, 607 tipi α e β, 66, 244, 251, 409, 484 gRNA (RNA guida), 89 gruppi sanguigni AB0, 369 GTF, vedi fattore-i

Indice analitico GTP (guanosina trifosfato), 74, 104, 517 guanina (G), 17 H Halobacterium salinum, 427, 428b HAT (Histone Acetyl Transferases, istone acetiltransferasi), 462 HDAC (Histone DeACetylases, istone deacetilasi), 447 helix-turn-helix (HTH, elica-giro-elica), 451 Hfr, vedi ceppo-i, Hfr hitchhiking genetico, 548 HIV-1, 512 genoma, 512 hnRNA (RNA nucleari eterogenei), 84 I ibridazione, 179 con oligonucleotide allele-specifico (ASO), 248 inversa, 253 ibridi, 350 immunoglobuline (Ig), 486 immunoprecipitazione (IP), 464b imprinting genomico, 465-468 inbreeding (o inincrocio), 568 incrocio-i (o fecondazione incrociata), 269 casuale (random mating), 537 di diibridi, 277 schema ramificato, 278 di monoibridi, 269 di triibridi, 280 per assortimento negativo, 568 positivo, 568 indel, 246, 604 indovinameri, 237 induzione, 480 coordinata, 429 ingegneria genetica, 225-263 delle piante, 260 applicazioni, 261 inincrocio, vedi inbreeding interferenza dell’RNA (RNA interference, RNAi), 203, 208, 470 interruttore genetico, 444 introni, 82, 83, 606 auto-splicing (self-splicing), 87 inversione-i, 406, 410 del sesso (sex reversal), 490 paracentrica, 410 pericentrica, 410 ipotesi del mondo a RNA, 88 del segnale, 111 del vacillamento, 98

dell’orologio molecolare, 611 di Garrod, 55 nulla, 282, 359 poligenica (o multigenica) per l’ereditarietà quantitativa, 577 un gene-un enzima, 56, 60 un gene-un polipeptide, 60 isolamento ecologico, 572 postzigotico, 572 prezigotico, 572 temporale, 572 isolatore (insulator), 466 isole CpG (CpG island), 463 istone-i, 26, 52, 460 acetilazione/deacetilazione, 462 H1, H2A, H2B, H3 e H4, 26 metilazione/demetilazione, 462 modifiche istoniche, 462, 492 regolazione negativa della trascrizione, 460 variazione della sequenza di amminoacidi in, 610 K KAT (lisina (K) acetiltransferasi), 462 knock-down genico, 208 knock-out genico, 203, 208 mediante interferenza dell’RNA, 208 nel batterio Mycoplasma genitalium, 208 nei topi, 206, 243, 466, 481, 523 nel lievito, 203

679

di specifiche sequenze di DNA mediante l’uso di sonde eterologhe, 236 lievito, vedi anche Saccharomyces cerevisiae tipo sessuale MATα 317, 400, 461 tipo sessuale MAT , 317, 400, 461 regolazione dell’utilizzo di galattosio, 453 sporulazione, 210 ligazione, 155 Limnaea peregra, 336 LINE, vedi DNA, sequenza-e LINE linee inbred, 597 pure, 269 linfoma-i di Burkitt, 415, 511 non-Hodgkin, 213 trascrittoma, 216 linkage (associazione di geni), 355, 359 disequilibrium, 216, 570 linker con sito di restrizione, 183 lisosomi, 20, 64 locus-i, 246 per caratteri quantitativi, vedi QTL poligeni, 578 polimorfico, 545 proporzione, 545 LTR (lunghe sequenze terminali ripetute), 513, 514 lyonizzazione, vedi compensazione di dose M

L mais, 585 legge di Hardy-Weinberg, 532, 536 produzione di semi ibridi, 350 applicazione per sterilità maschile citoplasmatica alleli legati al sesso, 540 (CMS), 350, 351 loci con più di due alleli, 540 malattia di Tay-Sachs, 64, 331 assunzioni, 537 mammiferi derivazione della, 538 classi di anticorpi, 486 previsioni, 538 compensazione di dose, 491 test statistico delle proporzioni, 541 determinazione del sesso, 489 utilizzo per la stima delle frequenze problemi relativi alla clonazione, 483 alleliche, 542 mappa-e leptonema, 299 calcolo delle distanze, 367 coincidenza, coefficiente di, 366 leucemia mieloide cronica (CML), 415, cromosomica, 368 511 degli aplotipi (hapmap), 180 leucine zipper (cerniera di leucine), 451 del destino, 479 libreria-e di E. coli, circolarità, 383 cromosomica, vedi banca cromosomica di restrizione a lungo raggio, 176 di cDNA, vedi banca di cDNA distanze, 367 genomica, vedi banca genomica ereditarietà dei caratteri, 181b identificazione fisica, 6, 176, 255, 368 di geni o di cDNA mediante l’uso funzioni di, 367 di sonde oligonucleotidiche, 237 genetica-he (o di associazione), 5, 359 di geni per complementazione costruzione, 359, 362 di mutazioni, 236

680

Indice analitico

umane, 368, 369 interferenza, 366 unità, vedi unità, di mappa mappatura dei geni, 356, 361 mediante reincroci di prova a due punti, 361 mediante reincrocio di prova a tre punti, 362 nei batteri mediante coniugazione, 379, 383 mediante trasduzione, 388 per trasformazione, 385 nei batteriofagi, 393 della struttura fine del gene, 395 mutanti rII, 395 fisica, 176 intergenica, 395, 597 per delezione, 397 per restrizione, 227 marcatore-i genetici, 355, 369 di DNA (polimorfici), 178, 355, 369 genici, 355 di peso molecolare (DNA ladder), 165 di selezione, 159, 162, 207 fisici (o citologici), 357 meccanismo di adattamento, 116, 560 media, 580 meiosi, 299 I, 298, 299 II, 298, 300 negli animali, 302 nelle piante, 303 melanina eu-, 342 feo-, 342 Mendel, G., 267, 268 merodiploide, 382 metabolomica intestinale, 61 metagenomica, vedi genomica, ambientale Methanobrevibacter smithii, 61, 221 metodo del lod score (logaritmo delle probabilità), 373 genome-wide screen, 372b MHC (complesso maggiore di istocompatibilità), 372b, 610 microarray, 49 a DNA (o chip di DNA), 178, 213, 214, 218 diagnosi di malattie, 253 con oligonucleotidi rappresentativi (Representational Oligonucleotide Microarray Analysis o ROMA), 215 proteici, vedi array, di proteine microbioma, 220

microRNA (miRNA), 471 geni, 524 ruolo nello sviluppo, 503 microsatelliti, vedi STR migrazione, flusso genico, 559 Mimulus cardinalis e lewisii, 597 miRISC (complesso di silenziamento indotto da miRNA), 471, 474 mitocondri, 8, 25, 347 mitosi, 294 anafase, 294, 296 metafase, 294, 296 profase, 294-296 prometafase, 294 segregazione dei cromosomi, 297 telofase, 294, 297 modello a scansione, 106 degli alleli infiniti, 558 di Jukes-Cantor, 604 di Knudson, 518, 519 modifiche epigenetiche, 461, 484, 528b monoploidia, 422, 423 monosomia, 419 morfogenesi, 480 morfogeno, 498 mosaici genetici, 315 mRNA, 73, 180 antisenso, 262 codone, riconoscimento, 101 controllo della degradazione, 473 maturo, produzione, 82 monocistronici, 82 poli(A)+, 83 policistronico-i (o poligenico), 82, 427, 430 precursore, 79 quantificazione, 240 splicing, vedi splicing mtDNA (DNA mitocondriale), 347 analisi, 349b tassi di evoluzione, 610 Mus musculus (topo), 6, 481 mutagenesi, 120 inserzionale, 138, 149, 514 sito-specifica, 128, 242 mutageno-i, 41b, 57, 120, 124 carcinogeni, 129 chimici, 123, 125 agenti che modificano le basi, 126 intercalanti, 128 ambientali, 128 analoghi delle basi, 125 fisici, 123 proflavina, 95, 128 test di Ames, 129 mutante-i auxotrofi, 57, 378 condizionali, 131

di DNA polimerasi di E. coli, 41b di resistenza, 131 di Neurospora, 59, 350 nutrizionali, 378 in Neurospora, 56 [poky] di Neurospora, ereditarietà materna, 348 rII, 95, 395, 397 analisi per ricombinazione, 396 sensibili alla temperatura, 131 mutazione-i, 115, 603 Aristapedia, 501 auxotrofa (o nutrizionale), 130 Bar, 409 bithorax, 500 complementazione, 236 con perdita di funzione, 141, 277 condizionali, 131 costitutive, 430 cromosoma Philadelphia (Ph1), 415 cromosomiche (o aberrazioni cromosomiche), 405 tumori nell’uomo, 415 da radiazioni ionizzanti, 124 UV, 124 delezioni, 96, 117 della linea germinale, 117 di tipo soppressore, 120 dinamiche (o da espansione di triplette), 131 eteroalleliche, 397 frameshift, 95, 119 frequenza di, 117 geniche, 115, 551 genomiche, 115 in avanti, 119, 551 indotte, 123 inserzioni, 96, 117 lacOc, 430, 431 missenso, 117 nel gene lacI, 433 nella regione trpL, 442f neutra, 118 nonsenso, 118 nulla, 141, 277 nutrizionale (o auxotrofa), 130 omeotiche, 500 omoalleliche, 397 per resistenza, 131 per reversione, vedi reversione-i per sostituzione di una coppia di basi, 117 per transizione, 117 per transversione-i, 117, 605 punti caldi (hot spots), 123, 178, 398, 571 puntiforme-i, 117, 398, 517, 604 silente (o sinonimo), 111b, 118 somatica, 116

Indice analitico

681

polimerasi (PAP), 83 operatore (lacO), 430 sito, 83 sequenze di regolazione, 438 poliadenilazione alternativa, 468 modello di Jacob e Monod, 431 polimorfismo-i trp, 439 bilanciato, 567 attenuazione, 440 del DNA, 246, 339b espressione, 440 classi, 246 N organizzazione dei geni per la della lunghezza dei frammenti biosintesi del triptofano, 439 di restrizione (RFLP), 251 Neandertal, uomo di, 217b, 344b, 621 sito attenuatore, 440 di corte ripetizioni in tandem (STR), neoplasie, vedi tumore-i, benigno ORF (Open Reading Frame), 80, 98, 248 neurofibromatosi, 149, 333, 519t, 552t 184, 200, 212, 221 di lunghezza del DNA, 550 neuropatia ottica ereditaria di Leber organismo modello, caratteristiche, 6 di singoli nucleotidi (o SNP, “snip”), (LHON), 350 ormone steroideo, 454-456 177b, 178, 246, 549 Neurospora crassa, 7f, 56, 186t, 348, ornitorinco, genoma, cromosomi sessuali, polipeptidi, 91 552t 490b poliploidia, 423, 424 non-disgiunzione poliposi adenomatosa familiare (FAP, cromosomica, 309 P o ereditaria), 328, 519t, 526 primaria, 309 poliribosoma (o polisoma), 109 secondaria, 311 PAB (Poly(A) Binding Protein), 474 pomodori, 262 norma di reazione, 336, 575 pachinema, 299 ponti disolfuro, 92, 486 Northern blot (o northern blotting), 239 pannocchia di mais, ereditarietà popolazione-i, 579 nucleoside, 17 della lunghezza della, 585 analisi di vitalità delle, 571 nucleosomi, 26, 52, 81 parentali, vedi genotipo-i, parentali dimensione effettiva, 554 complessi di rimodellamento, 461 particella di riconoscimento del segnale divergenza genetica tra, 569 nucleotide-i, 16, 23 (SRP), 111 frequenze alleliche, 533 unità di mutazione e di ricombinazione, Pasha, proteina, 471 a un locus associato al cromosoma 395 PCR (reazione a catena della polimerasi), X, 534 nullisomia, 419 203-208, 218, 221, 232, 242, 351, 370, genotipiche, 533 546 nel caso di alleli multipli, 534 O applicazioni, 240 mendeliana, 532 real-time, 241 naturali, selezione nelle, 561 Okazaki, frammenti di, 44 Reverse Transcription (RT-PCR), 240 struttura genetica delle, 532, 533 oligonucleotide allele-specifico (ASO, vantaggi e limitazioni, 239 effetto dei processi evolutivi sulla, Allele-Specific Oligonucleotide), 248 PDGF (Platelet-Derived Growth Factor), 569 oloenzima, 76 516 variabilità genetica, 570 core,76 penetranza, 332 portatori, identificazione, 69 fattore sigma, 76 peptidil-transferasi, 108 pre-miRISC, 456 omeobox, 501 pharming, 263 pre-mRNA, 79 omeodominio, 501 Phaseolus vulgaris, 579 maturazione, 85 omozigoti, 271, 285 piante pre-rRNA, 103 oncogene-i, 415, 506 dioiche, 316 pre-siRISC, 473 virali (v-onc), 514 monoiche, 317 pre-tRNA, 101 oncosoppressore-i (o geni soppressori transgeniche, 260-263, 351 premutazione, 403 dei tumori), 511, 518 piccoli RNA Pribnow box, 76 del tumore della mammella, 523 interferenti (siRNA, short interfering pri-miRNA (primary miRNA, trascritto RB, 518 RNA), 471, 473 primario del miRNA), 471 TP53, 519t, 522 regolatori, 203, 471 primer operone silenziamento dell’espressione oligo (dT), 182 ara di E. coli, controllo positivo genica a livello post-trascrizionale, oligonucleotidico, 168 e negativo, 443 471 universali, 168 inducibile, 428 pirimidine, 17 primosoma, 42 lac, 427 pirosequenziamento, 172, 221 principio controllo pirogramma, 172f dell’assortimento indipendente, 277 negativo, 432 Pisum sativum, 268 dell’uniformità della F1, 270 positivo, 436 plasmide-i, 23, 159, 381 I o gene per il repressore Lac, 430 della segregazione, 273 ricombinante, 160, 205, 226 mutazioni conferma con reincroci, 275 Ti, 260 nel gene regolatore lacI, 431 trasformante, 13 pleiotropia, 575, 594 nel promotore, 431 probabilità, 275b poli(A) nell’operatore, 430 pro-cancerogeni, 528 coda di, 83 spontanea-e, 120 tasso di, 117 tipo-specifiche, 12 trasposone, 141 visibili, 130

682

Indice analitico

progetto dei 1000 genomi, 549b Progetto Genoma Umano, 154 promotore-i, 75, 79, 443 del gene lacI, 431 elementi prossimali, 79 nucleo, 79 proteasoma, 475 proteina-e, 91 Ago1, 471 aporepressore, 440 Bt, 263 chaperonine (o chaperon molecolari), 94, 455 istoniche, 53 chinasi, 454, 516 controllo della degradazione delle, 474 genetico della struttura, 64 di legame al poli(A) II (PABPII), 106 DSX -M, 492 -F, 492 G, 516 isoforme, 468 istoniche, 26, vedi anche istone-i licensing factor, 50 MOF, 495 MSL, 495 non istoniche, 26 omologhe, 604 p53, 522 funzione di, 522, 523 -proteina, analisi delle interazioni, 244 regolatrici, 76 attivatori, 76 repressori, 76 ribosomali, 102 rimescolamento dei domini (esoni), 623 SSB (Single-Strand Binding), 42 struttura molecolare, 92 SXL, 493-495 TRA, 494 proteolisi, 475 proteoma, 210, 214 proto-oncogene-i, 415, 511 cellulari, 515 chinasi, 516 fattori di crescita, 516 mutati, vedi oncogeni prodotti proteici dei, 515 proteine G, 516 trasformazione in oncogeni, 517 prototrofo, 57, 378 pseudodominanza, 407 pseudogene-i, 410b, 606, 607 PTGS (Post-Trascriptional Gene Silencing, silenziamento genico post-trascrizionale), 470 puff, 485 purine, 17

retinoblastoma, 518 retrotrasposizione, 147 retrotrasposoni, 147 QTL (Quantitative Trait Loci, loci umani, 148 per caratteri quantitativi), 596 sequenze SINE, 148 associati al comportamento aggressivo, famiglia Alu, 148 600b sequenze LINE, 148 quadrato di Punnet, 272 elemento L1, 148 retrovirus, 147, 512 R cancro indotto da, 512 ciclo vitale, 512 radiazioni ionizzanti, 124 non oncogeno, 512 rDNA (DNA ribosomale), 103 non trasducenti, 514 cluster di unità ripetute, 104 oncogeni, 512, 513 real-time PCR, vedi PCR, real-time struttura, 512 recessività completa, 328 trasducenti, 514 regione-i Reverse Transcription PCR, vedi PCR, centro d’inattivazione dell’X (XIC), Reverse Transcription 493 reversione-i (o mutazioni di ritorno, costante, anticorpo, 488 o mutazioni per reversione), 95, 119 fiancheggianti, 606 parziale, 120 intergeniche, 185, 471 vera, 120 leader, 606 RFLP (Restriction Fragment Lenght pseudoautosomiche (PAR), 300 Polymorphisms), 177b, 246, 251, trailer, 606 371, 547 variabile, anticorpo, 488 Rhizobium radiobacter, vedi regola Agrobacterium tumefaciens della colinearità, 502 ribonucleasi, 92, 104, 182 di Haldane, 572 ribosio, struttura, 16 N-terminale, 475 ribosoma-i, 101, 102 regolazione genica combinatoriale, 457 sito regressione, 583 A, 103 coefficiente di, 584 E, 103 pendenza, 584 P, 103 retta di, 584 subunità, 102 reincrocio-i, 276 ribozima-i, 87, 108 di prova (testcross), 276, 355 ricerca a due punti, 361 applicata, 3 a tre punti, 362 di base, 3 relazioni ricombinanti, 357 filogenetiche, 200, 603 ricombinazione metodi di ricostruzione, 614 non omologa, 138, 206 replica plating, 379 omologa, 205 replicazione somatica, 487 a cerchio rotante, 45 riparazione del DNA, 45 conseguente all’attività di correzione errori nella, 121 di bozze della DNA polimerasi, malattie genetiche umane derivanti 133 da mutazioni, 137 degli errori di appaiamento diretta modello semiconservativo, 35 dalla metilazione, 135 negli eucarioti, 47 dei danni semidiscontinua del DNA, 42 al DNA, 133 unità di, vedi repliconi risposta SOS, 136 repliconi (unità di replicazione), 48 sintesi translesionale del DNA, replisoma, 45 136 repressione da alchilazione, 134 da cataboliti, 436 del DNA, malattie genetiche umane da glucosio del gene Gal1 di lievito, derivanti da mutazioni, 137 243 dei dimeri di pirimidina indotti repressore-i, 431, 435 da UV, 134 resolvasi, 140 Q

Indice analitico per escissione di basi, 134 di nucleotidi (NER), 134 ripetizioni di sequenze semplici, vedi SSR in tandem in numero variabile, vedi VNTR riproduzione sessuata, 303 risposta alla selezione, 593 stima della, 593 RNA (acido ribonucleico), 11 a doppio filamento (dsRNA), 208, 470 a singolo filamento (ssRNA), 471, 473 antisenso, 470 caratteristiche, 11 composizione e struttura, 16 controllo del processamento, 468 correzione (editing), 88 corto a forcina (short hairpin RNA, shRNA), 209 gRNA (RNA guida), 89 hnRNA (RNA nucleari eterogenei), 84 mRNA (RNA messaggero), 73 nomenclatura, 18 piccoli RNA regolatori a singolo filamento, 209 polimerasi DNA-dipendente, 74 II, 79, 451 primer, 42 processamento, 81 rRNA (RNA ribosomale), 73 senso, 470 snRNA (small nuclear RNA; piccolo RNA nucleare), 22, 74 telomerasi, 31, 50 tRNA (transfer RNA o RNA di trasporto), 73, 100 RNAi, vedi interferenza dell’RNA RNasi (ribonucleasi), 14 H, 182 ROMA (Representational Oligonucleotide Microarray Analysis), 215 rRNA, 73 16S, 103, 221 28S, 18S, e 5,8S, 79, 103 5S, 79, 104 precursore (pre-rRNA), 103 ribosomi, 102 RSV, 494, 496 RT-PCR, vedi PCR, Reverse Transcription S Saccharomyces cerevisiae, 3, 236, 243 ARS (Autonomously Replicating Sequences, sequenze autonome di

replicazione), 48 origine di replicazione,, 49b tipo sessuale MATα, 317, 400, 461 tipo sessuale MATa, 317, 400, 461 saggio bianco-blu, 160 Salmonella typhimurium, 129, 389 SARS (Sudden Acute Respiratory Syndrome, o sindrome respiratoria acuta grave), 220 SBEI (Starch-Branching Enzyme), 277 SCFA (acidi grassi a catena corta), 61b Schizosaccharomyces pombe, 26t, 303b sclerosi multipla (SM), 372b segregazione adiacente-1, 414 adiacente-2, 415 alternata, 415 selezione artificiale, 593 clonale, 486 coefficiente di, 562 contro un carattere recessivo, 564 direzionale, 564 naturale, 560, 593 nelle popolazioni naturali, 561 risposta alla, 593 selvatico (o wild-type), 306 semina in replica, 130 senescenza replicativa, 52, 526 sequenza-e allineamento delle, 604 indel, 604 consenso, 76, 237, 455, 502 cos, 47 di inserzione (IS), vedi elemento-i, IS di Kozak, 106 di origine della replicazione – ARS (Autonomously Replicating Sequence), 48, 162, 226 di Shine-Dalgarno, 105, 226, 437 geniche, 180 analisi, 180 identificazione mediante l’analisi dei cDNA, 180 genomiche, 180 identificazione dei geni con metodi computazionali, 184 leader, 81, vedi 5 UTR Open Reading Frame (ORF), 98 ori, 159 polipeptidica, dominio, 202 query, 201 ripetute invertite (IR), 139 segnale, 111 similarità, 200 SINE, famiglia Alu, 148, vedi anche DNA, sequenza SINE sostituzioni nucleotidiche, 604 tassi, variabilità all’interno dei geni, 605

683

tra i geni, 608 spaziatrici, 103 subject, 201 trailer, 81 sequenziamento, 167 dei genomi, 153,184, 210, 369 annotazione della variazione, 176 assemblaggio e rifinitura, 176 casuale diretto (whole-genome shotgun), 174, 373 di Arabidopsis thaliana, 190, 191 di archeobatteri, 188, 189 di Caenorhabditis elegans, 190 di Canis familiaris, 192 di Drosophila melanogaster, 190 di Escherichia coli, 188 di Haemophilus influenzae, 188 di Homo sapiens, 190, vedi anche Progetto Genoma Umano di Mus musculus, 191 di Oryza sativa, 190 di Saccharomyces cerevisiae, 189 mediante didesossinucleotidi, 168 reazione, 168 pirosequenziamento, 172 primer per il, 168 sesso, 304, 305 analisi dei caratteri legati al, 317 determinazione genica, 312 genotipica, 313 in Caenorhabditis elegans, 315 in Drosophila melanogaster, 313, 492 in Saccharomyces cerevisiae, 317 nei mammiferi, 313, 489 nelle piante, 316, 317 eredità legata al, 306 eterogametico, 305 omogametico, 305 shRNA, vedi RNA, corto a forcina silencer, vedi elemento-i, silenziatore silenziamento dell’espressione genica, 209, 407 mediante interferenza dell’RNA, 470 genico, 463 metilazione del DNA, 463 telomeri, 467 sindrome del cri-du-chat, 408 dell’X fragile (o sindrome di MartinBell), 132, 417 di Angelman, 418, 467 di Bloom (BS), 137t di Cockayne (CS), 137t di Down, 420, 421 di Edwards, 422 di Kartagener, 63 di Kearns-Sayre, 350 di Klinefelter, 313

684

Indice analitico

di Li-Fraumeni, 519t, 522 di Patau, 422 di Prader-Willi, 408, 467 di Tay-Sachs, 64, 331 di Turner, 313 di Williams-Beuren, 413b di Zellweger, 246 XYY, 313 SINE, vedi DNA, sequenza SINE sintesi dei cDNA, vedi cDNA, sintesi siRISC, 473 siRNA, vedi piccoli RNA, interferenti sistema-i del doppio ibrido di lievito (o saggio della trappola di interazione), 244 di sintesi proteica cell-free, 96 sito-i di clonaggio multiplo (o polylinker), 159 di legame al ribosoma (RBS), 104 di restrizione, 155, 157 BamHI, 156, 226 frequenza, 156 sequenza di riconoscimento, 157t sequenze palindrome, 156 fragili, 417 ipersensibili (o regioni ipersensibili), 460 non sinonimi, 606 sinonimi, 606 Slicer, proteina, 208, 471 SNP, vedi polimorfismo, di singoli nucleotidi snRNA, vedi RNA, snRNA snRNP (piccole particelle nucleari ribonucleoproteiche), 85-87 sonde eterologhe, 236 oligonucleotidiche, 218, 237 sonicazione, 464b soppressori intergenici, 120 intragenici, 120 sordità, 347 SOS proteina, 516 risposta, 136 sostituzioni, 604 Southern blot, analisi di sequenze nel genoma, 237, 465 sovradominanza, 566 spaziatori, 103 speciazione, 571 basi genetiche, 572 spliceosoma, 85 splicing alternativo (o differenziale), 449, 468 del pre-mRNA, 85, 243 auto-splicing (self-splicing), 87 sporofito, 303

sporogenesi, 297 ssRNA, vedi RNA, a singolo filamento STR (Short Tandem Repeats, corte ripetizione in tandem, o microsatelliti, o ripetizioni di sequenze semplici, SSR), 248, 370b, 371 analisi, 248, 483 esempi, 248 superiorità dell’eterozigote, 350, 566 super-repressore, 435 sviluppo, 479 costanza del DNA durante lo, 482 eccezione alla, 486 del corpo di Drosophila, 496 eventi base, 479 nell’uomo, 484 organismi modello per l’analisi genetica, 480 ruolo dei miRNA, 503

del chi-quadrato, 282, 359 di fluttuazione, 116 genetici mediante PCR, 252 nell’uomo, 250 molecolare-i del DNA, 250 Tetrahymena, auto-splicing (self-splicing), 87 tetrasomia, 419 timina, 17 tipizzazione del DNA (o DNA fingerprinting o DNA profiling), 240, 254, 325 applicazioni, 254-257 paternità, 254 tipo-i sessuale-i, 57, 317 MATα e MATa, 317, 400, 461 tirosinasi, 63, 324, 335 traduzione, 91-112 controllo della, 469-473 T trans-dominante, gene, 431 transfezione, 258 T-DNA, vedi DNA, trasformante transgene, 209, 258 tag SNP, 178 transizioni, 127, 605 Taq polimerasi, 204, 240 trascrittasi inversa (RT, Reverse TATA box, 79 Trascriptase), 51, 145, 180, 512 tautomeri, 121 trascritto primario, 82f, 488 TBP (TATA-Binding Protein), 451 del miRNA, vedi pri-miRNA TDF, vedi fattore, di determinazione trascrittoma, 61b, 210, testicolare trascrittomica, 61b, 125b, 210 telomerasi, 31, 50, 525 trascrizione, 74 telomero-i, 30, 31 blocco dell’inizio a opera dei accorciamento dei, 525 repressori, 452 di lievito (TEL), 162 inversa, 51, 211 sequenze, 31 modifica associate, 31 all’estremità 3′, 83 D-loop (displacement loop), 31 all’estremità 5′, 83 processo della, 74 semplici, 31 regolazione specie-specifiche ripetute controllo del processamento in tandem, 50 dell’RNA, 468 t-loop, 31 da parte degli ormoni steroidei teoria negli animali, 454 dell’endosimbionte, 620b dell’inizio da parte delle proteine out of Africa, 620 regolatrici, 451 terapia mediante combinazioni delle cellule somatiche, 258 di attivatori e repressori, 457 genica, 258, 259 positiva e negativa, 453 della linea cellulare germinale, ruolo della cromatina, 460 258 silenziamento genico, 463 terminatore-i, 76 ribonucleosidi trifosfati (NTP), 74 Rho-dipendenti, 78 trasduzione, 388 Rho-indipendenti, 78 co-, 391 terreno di coltura, 378 cotrasduttanti, 391 completo, 57, 378 frequenza di, 391 minimo, 57, 378 del segnale, 491 TERT (telomerasi trascrittasi inversa), 51 generalizzata, 389 test specializzata, 389, 392 basati sull’analisi dei RFLP, 251 trasduttanti, 388 cis-trans (o di complementazione), trasformanti, 385 337, 338, 398

Indice analitico co-, 388 trasformazione, 160 258, 385 dei proto-oncogeni cellulari in oncogeni, 517 ingegnerizzata, 385 naturale, 385 neoplastica, 507 traslocazione, 412 intracromosomica non reciproca, 412 non reciproca intercromosomica, 412 reciproca intercromosomica, 412 robertsoniana, 421 traslocazione (fase della traduzione), 108 trasposasi, 139 trasposizione, 116, conservativa, 141 frequenza, 138 replicativa, 141 trasposoni (Tn), 115, 138, 140, 208, 471, 615b, 622 degli eucarioti, compositi, 140 Tn10, 140 non compositi, 140 Tn3, 140 3′ UTR (sequenza non tradotta al 3′, o sequenza trailer), 81 5′ UTR (5′ UnTranslated Region, regione non tradotta al 5′, o sequenza leader), 81 trisomia, 419 13, 422 18, 422 21, 420 tRNA, 73, 100, 608 anticodone, riconoscimento, 101 geni degli, 101 precursori, 101 tumore-i (o neoplasie), 507 benigno, 507 maligno, 508, vedi anche cancro turnover dell’RNA, 473

U ubiquitina, 463, 475, 524 unità di mappa (um, o centimorgan, cM), 360, 570 di trascrizione dell’rRNA, 103 uomo, origini, 620 uracile, 17 V vaccini eduli, 263 valore C, 25, 185 paradosso del, 25 vantaggio dell’eterozigote, vedi eterosi variabilità genetica delle sequenze di DNA, 548 effetti del crossing-over, 570 genetica e ambientale, relazione, 579, 587, 588 misura a livello del DNA, 546 proteico, 544 nelle popolazioni naturali, 544 nello spazio e nel tempo, 542 varianza, 580 ambientale, 587 analisi della, vedi ANOVA da dominanza, 588 da interazione (o epistatica), 588 delle frequenze alleliche, 557 fenotipica, componenti della, 586 genetica, 587 additiva, 588 scomposizione della, 585, 589 variazioni nelle frequenze alleliche, 557, 563, 569 non sinonime, 548 sinonime, 548 vettore-i, 225 cosmidi, 159 di clonaggio, 159, vedi anche BAC, e YAC

685

da PCR, 229 plasmidici, 159, vedi anche plasmide-i di espressione, 226 caratteristiche, 226 fagici, 159, 388 navetta, 226 non plasmidici, 231 trascrivibili, 230 villi coriali, analisi, 70, 252, 421 Virochip, 219 virus, 14, vedi anche retrovirus del sarcoma di Rous (RSV), 512 helper, 514 tumorali, 511 a DNA, 511, 515 a RNA, 511 umano dell’immodeficienza (HIV-1), 512 VNTR (Variable Number Tandem Repeats, ripetizioni in tandem in numero variabile, o minisatelliti), 246, 249, 255, 256 X xeroderma pigmentoso (XP), 137t Xic, topo, 491 XIC, uomo, 491 Y YAC (Yeast Artificial Chromosomes, cromosomi artificiali di lievito), 162, 226 Z Z-DNA, 22 Zea mays, 142, 357, 585 zigonema, 299 zigote, 292 totipotente, 479 zinc finger (dita di zinco), 451 zucca, colore del frutto, 343

Tappe fondamentali della genetica

1856-1863 Gregorio Mendel Conduce i suoi famosi esperimenti sulle piante di pisello inerenti alla segregazione dei geni 1859 Charles Darwin Pubblica L’origine delle specie, testo base della teoria moderna dell’evoluzione

1913 Alfred Sturtevant Escogita il principio per la costruzione di una mappa genetica di concatenazione 1916 Thomas Hunt Morgan Propone una teoria che correla la mutazione e la selezione

1866 Gregorio Mendel Pubblica un saggio relativo al suo lavoro in cui fonda i principi di base dell’ereditarietà

1924-1932 John B.S. Haldane Pubblica una serie di lavori sulla sua teoria matematica della selezione naturale e artificiale

1869 Fredrich Miescher Isola la nucleina dal nucleo; ora è noto che la nucleina è DNA

1927 Herman J. Müller Dimostra che i raggi X possono indurre mutazioni

1875 Oscar Hertwig Dimostra che il nucleo è necessario per la fecondazione e la divisione cellulare e quindi contiene le informazioni necessarie per questi processi

1928 Frederick Griffith Scopre la trasformazione genetica nei batteri e chiama “principio trasformante” l’agente responsabile della stessa

1882-1885 Eduard Strasburger, Walther Flemming Dimostrano che i nuclei contengono i cromosomi 1900 Hugo de Vries, Carl Correns, Erich von TschermakSeysenegg Producono in modo indipendente risultati che confermano i principi mendeliani dell’ereditarietà 1902 Archibald Garrod Identifica la prima malattia genetica umana, l’alcaptonuria Walter Sutton, Theodor Boveri Propongono la teoria cromosomica dell’ereditarietà 1903 William E. Castle Riconosce per la prima volta la relazione tra frequenze alleliche e genotipiche (vedere 1908, Hardy e Weinberg) 1905 William Bateson Chiama “genetica” la scienza dell’ereditarietà William Bateson, Reginald Crundall Punnett Dimostrano la concatenazione tra geni 1908 Godfrey H. Hardy, Wilhelm Weinberg Formulano la legge di Hardy-Weinberg che correla matematicamente le frequenze genotipiche alle frequenze alleliche in popolazioni con incroci casuali 1909 Wilhelm Johannsen Introduce il termine “gene” Herman Nilsson-Ehle Ottiene la prova sperimentale che l’ereditarietà multigenica è alla base dei caratteri a variabilità continua 1910 Edward M. East Chiarisce il ruolo della riproduzione sessuale nell’evoluzione Thomas Hunt Morgan Scopre il primo gene legato al sesso, white, un gene del colore dell’occhio in Drosophila melanogaster 1911 Thomas Hunt Morgan Propone che la concatenazione genica sia dovuta a geni localizzati sullo stesso cromosoma

1930 Ronald A. Fisher Pubblica col nome di “Teoria genetica della selezione naturale” la sua teoria unificante dell’evoluzione, che sintetizza le teorie dell’ereditarietà mendeliana e della selezione darwiniana Anni trenta Sewall Wright Sviluppa la sua teoria della selezione naturale e getta le basi teoriche della deriva genetica, ovvero il cambiamento delle frequenze geniche dovuto al caso 1931 Harriet Creighton, Barbara McClintock Dimostrano che la ricombinazione nel mais è dovuta a scambi fisici tra cromosomi omologhi Curt Stern Dimostra che la ricombinazione genetica in Drosophila è dovuta a scambi fisici tra cromosomi omologhi 1942 George Beadle, Edward Tatum Propongono l’ipotesi un gene-un enzima 1944 Oswald Avery, Colin MacLeod, Maclyn McCarthy Dimostrano che il principio trasformante di Griffith (si veda 1928) è il DNA 1946 Joshua Lederberg, Edward Tatum Scoprono la coniugazione nei batteri 1950 Barbara McClintock Descrive dei risultati che indicano l’esistenza di geni mobili in mais, ora chiamati elementi trasponibili 1952 Alfred Hershey, Martha Chase Dimostrano che il materiale genetico del batteriofago T2 è DNA 1953 James Watson, Francis Crick Propongono il modello a doppia elica del DNA 1958 Matthew Meselson, Franklin Stahl Dimostrano il modello semi-conservativo della replicazione del DNA Arthur Kornberg Isola la DNA polimerasi I da E. coli

1959 Severo Ochoa Scopre la prima RNA polimerasi 1961 Sidney Brenner, François Jacob, Matthew Meselson Scoprono l’RNA messaggero (mRNA) François Jacob, Jaques Monod Propongono il modello dell’operone per spiegare la regolazione dell’espressione genica nei batteri 1966 Marshall Nirenberg, H. Gobind Khorana Decifrano completamente il codice genetico 1972 Paul Berg Costruisce in vitro la prima molecola di DNA ricombinante 1973 Herb Boyer, Stanley Cohen Utilizzano per la prima volta un plasmide per clonare il DNA 1975 Edward M. Southern Sviluppa un sistema per trasferire su filtri frammenti di DNA separati su gel, mantenendo la posizione relativa dei frammenti. Questo rappresenta ancora oggi uno dei sistemi più efficaci per l’individuazione di geni clonati 1977 Walter Gilbert e Frederick Sanger Mettono a punto dei metodi per il sequenziamento del DNA Phillip Sharp e altri Scoprono gli introni nei geni eucarioti 1982 Thomas Cech, Sidney Altman Scoprono il meccanismo di auto-splicing di un introne di RNA 1986 Kary Mullis e altri Sviluppano la reazione a catena della polimerasi (PCR), una tecnica che consente l’amplificazione di segmenti selezionati di DNA senza previa clonazione 1989 Lap-Chee Tsui, John Riordan e il gruppo di Francis Collins Identificano e clonano il gene umano responsabile della fibrosi cistica 1990 James Watson e molti altri scienziati Lanciano il Progetto Genoma Umano, allo scopo di mappare e sequenziare completamente il genoma di un certo numero di organismi importanti dal punto di vista genetico, tra cui l’uomo 1993 Il Gruppo di ricerca congiunto sulla sindrome di Huntington Scopre la base genetica della sindrome di Huntington, una malattia genetica umana 1994 Mark Skolnick e altri scienziati Clonano il primo gene responsabile del cancro alla mammella (BRCA1) 1996 Molti scienziati di vari gruppi di ricerca Pubblicano la prima sequenza di DNA completa di un organismo eucariote, il lievito Saccharomyces cerevisiae John Craig Venter e molti altri scienziati di diversi gruppi di ricerca degli U.S.A. Pubblicano la sequenza di DNA completa di un membro degli Archaea, Methanococcus jannaschii. La sequenza conferma che gli Archaea costituiscono un terzo ramo degli organismi viventi, distinto dai procarioti e dagli eucarioti Istituti Nazionali di Sanità degli U.S.A. Rendono nota l’approvazione di circa 150 sperimentazioni cliniche di trasferimento di geni nell’uomo nell’ambito di progetti a lungo termine che

mirano a curare le malattie genetiche mediante terapia genica 1997 Il Roslin Institute Clona per la prima volta un mammifero, una pecora di nome Dolly, da un adulto tramite la tecnica del clonaggio transgenico Viene completata la sequenza genomica di Escherichia coli 1998 Celera Genomics Company Questa compagnia viene fondata per sequenziare il genoma umano in 3 anni, usando le risorse del Progetto Genoma Umano Viene ultimata la sequenza genomica di Caenorhabditis elegans 1999 Progetto Genoma Umano Annunciato il completamento del sequenziamento del cromosoma 22 umano Anni novanta In un certo numero di organismi viene scoperto il meccanismo dell’interferenza dell’RNA (RNAi) mediante il quale un frammento di RNA a doppia elica silenzia l’espressione di un gene. L’RNAi è diventato successivamente un importante strumento di ricerca per indagare le funzioni dei geni 2000 Collaboratori internazionali Pubblicano la sequenza genomica del moscerino della frutta, Drosophila melanogaster, il più lungo genoma completato fino ad allora Un consorzio di ricercatori internazionali Pubblica il genoma del cromosoma 21, il più piccolo cromosoma umano 2001 Progetto Genoma Umano Annuncia il completamento della “prima stesura” della sequenza completa del genoma umano 2004 Il sequenziamento nel genoma umano è quasi completato. L’analisi rivela la presenza di soli 20 00025 000 geni codificanti proteine 2005 Viene annunciata la prima stesura della sequenza del genoma dello scimpanzè, che consente una prima analisi delle sequenze dei primati esclusive dell’uomo 2006 Inizio del Progetto Genoma del Cancro per individuare i geni chiave nello sviluppo del cancro 2007 Inizio del Progetto Microbioma Umano al fine di caratterizzare globalmente i microrganismi associati all’uomo e di analizzare il loro ruolo nella salute e nella malattia umane 2008 Inizio del Progetto 1000 Genomi al fine di ottenere la sequenza dei genomi di almeno mille individui da tutto il mondo e di fornire una mappa dettagliata della variabilità genetica umana per aiutare lo studio delle malattie umane 2010 Presentati i risultati della fase pilota del Progetto 1000 Genomi. Descritti posizione, frequenza allelica e struttura degli aplotipi per circa 15 milioni di SNP, 1 milione di piccole inserzioni e delezioni e 20 000 varianti strutturali, la maggior parte precedentemente sconosciuta

Related Documents

Russel Genetica Umana
February 2021 10
Genetica Umana
February 2021 1
Genetica
February 2021 2
Testare Genetica
January 2021 0
Acuicultura Genetica
January 2021 0

More Documents from "Morcho"