In genetica , la duplicazione genetica è la moltiplicazione di materiale genetico su un cromosoma . Esistono diversi meccanismi che risultano dalla duplicazione di una grande porzione cromosomica, o di un gene o di una sequenza di nucleotidi . Questi cambiamenti nel genoma rappresentano un motore importante nell'evoluzione dei genomi. Il raddoppio di un gene crea una copia extra rilasciata dalla pressione di selezione , che può consentire alla copia di muta di nuovo senza conseguenze dannose per l' organismo . È uno dei meccanismi importanti dell'evoluzione molecolare .
Tuttavia, in molti casi, queste alterazioni sono responsabili di malattie genetiche dovute all'eccesso di dati genetici che portano a problemi durante lo sviluppo. Inoltre, l'amplificazione genica può contribuire alla crescita di un tumore . Ad esempio, l' oncogene C-myc è spesso amplificato in molti tumori .
Durante la loro evoluzione diverse specie eucariotiche hanno subito una completa duplicazione del loro genoma. Si parla quindi di paleoploidismo . Ad esempio, nel lievito di birra ( Saccharomyces cerevisiae ) , il suo genoma si è duplicato 100 milioni di anni fa. Il genoma di molte piante è poliploide . Possiamo citare il grano che è esaploide (6 copie del suo genoma). Recentemente, una collaborazione franco-italiana ha permesso di sequenziare il genoma della vite , Vitis vinifera, che ha rivelato che l'antenato delle piante dicotiledoni ha subito diversi eventi di duplicazione del suo genoma a seguito della divergenza di piante monocotiledoni e dicotiledoni ; la pianta ancestrale dicotiledone doveva essere esaploide. L'ipotesi avanzata sarebbe che questa duplicazione del genoma sia all'origine della radiazione delle piante dicotiledoni.
Esistono due meccanismi che consentono la duplicazione completa di un genoma:
La duplicazione dei genomi è rara perché l'alterazione della dose genica in un embrione è spesso letale . D'altra parte, dal 30 all'80% delle piante è poliploide e l'esplosione del numero di specie nelle angiosperme è correlata alla completa duplicazione del genoma di una pianta ancestrale. Ciò è spiegato da una maggiore tolleranza al cambiamento del numero di cromosomi nelle angiosperme rispetto agli animali. Recenti duplicazioni del genoma con meno di 150 anni sono state identificate in molte piante come la salsefrica dove le specie Tragopogon mirus e Tragopogon miscellus apparvero circa 80 anni fa per allotetraploidia. Questi risultati ci consentono di comprendere le conseguenze fenotipiche e genetiche del cambiamento nella ploidia.
Si stanno accumulando molte prove che dimostrano che durante l'evoluzione dei vertebrati si sono verificate diverse duplicazioni complete del genoma. Dopo l' esplosione del Cambriano circa 450 milioni di anni fa, ebbe luogo una prima duplicazione del genoma di un antenato cordato seguita circa 10 milioni di anni dopo, all'inizio del periodo devoniano, da una seconda duplicazione completa del genoma. Alla fine del Devoniano , si è verificata una terza duplicazione del genoma nei pesci con le pinne raggiate .
Assunzione 2RLe prime stime del numero di geni nell'uomo hanno dimostrato che il genoma dei vertebrati è più complesso di quello degli invertebrati. Per spiegare l'aumento delle dimensioni dei genomi dei vertebrati, Susumu Ohno ha proposto nel 1970 che il genoma dei vertebrati è il risultato di una o più duplicazioni complete del genoma. Oggi, questa ipotesi è nota come ipotesi 2R (2 Round) perché afferma che 450 milioni di anni fa una specie di vertebrati ancestrali ha subito due eventi di duplicazione del genoma. Durante gli anni '90, questa ipotesi era estremamente controversa perché le vestigia delle duplicazioni geniche scompaiono con l'evoluzione. Tuttavia, oggi questa ipotesi ha raccolto molte prove genetiche e filogenetiche. Uno dei primi argomenti è stata la mancanza di connessione tra la maggior parte dei geni paraloghi . Infatti, a seguito di una duplicazione segmentale, i geni duplicati sono presenti sullo stesso cromosoma e quindi geneticamente legati. D'altra parte, a seguito di una duplicazione del genoma, i geni duplicati si trovano su diversi cromosomi. Infine, il principale argomento a favore dell'ipotesi 2R è venuto dallo studio dei complessi del gene Hox che seguono la regola 4: 1, cioè c'è un complesso Hox negli invertebrati e quattro complessi Hox nella maggior parte dei vertebrati che sarebbero il risultato di due genomi eventi di duplicazione.
Paralogon HoxUn complesso Hox è una raccolta di geni omeotici raggruppati su un cromosoma che codifica per fattori di trascrizione essenziali per l'istituzione dell'asse antero-posteriore e dell'identità segmentale negli animali. I quattro complessi Hox nell'uomo sono sui cromosomi 2, 7, 12 e 17. Vicino a ciascun complesso c'è un gene paralog appartenente alla famiglia Dlx , Collagen e / o ErbB . Pertanto, il paralogon Hox corrisponde ai complessi Hox associati ai geni paralog situati vicino al complesso Hox. La presenza di diversi geni paraloghi vicino ai complessi Hox è un argomento importante per l'ipotesi 2R. Tuttavia, analisi filogenetiche hanno dimostrato che alcuni geni paraloghi e geni Hox hanno una storia evolutiva diversa che contraddice l'ipotesi 2R. Recentemente, uno studio propone che due traslocazioni reciproche all'interno dei complessi di Hox che si verificano dopo la seconda duplicazione completa del genoma spiegherebbero le differenze nell'evoluzione all'interno del paralogon di Hox.
Assunzione 3RNel 1998, sette complessi Hox sono stati identificati nel pesce zebra Danio rerio . Gli autori di questo studio hanno proposto che dopo le due duplicazioni del genoma che si sono verificate in un vertebrato ancestrale, un terzo evento di duplicazione del genoma si è verificato specificamente nei pesci teleostei che ha provocato otto complessi Hox seguiti dalla perdita di un complesso Hox.
Assunzione 4RNel 2005, un team canadese ha dimostrato che nel salmone atlantico e nella trota arcobaleno, che appartengono alla famiglia dei salmonidi , c'erano quattordici complessi Hox che suggerivano una nuova duplicazione del genoma specifico della famiglia dei salmonidi .
La duplicazione è talvolta descritta come una trisomia parziale. Esistono 2 tipi di duplicazione:
Possiamo anche distinguere le duplicazioni:
Molte sindromi derivano dalla duplicazione di un segmento di un cromosoma, come la sindrome di Beckwith-Wiedemann o la malattia di Charcot-Marie-Tooth di tipo 1 . Sebbene spesso deleterio per un organismo, l'analisi dei genomi di molte specie, e in particolare del genoma umano, ha rivelato la presenza di numerose regioni duplicate.
Il sequenziamento e l'analisi del genoma umano hanno rivelato che grandi blocchi di cromosomi erano simili. 400 segmenti cromosomici durante l'evoluzione dei primati hanno subito numerosi eventi di duplicazione intracromosomica (tra cromosomi identici) e intercromosomica (tra cromosomi diversi), alcuni dei quali, che rappresentano il 5% del genoma, sono specifici del genoma umano. Questi segmenti cromosomici duplicati si trovano preferenzialmente vicino a telomeri e centromeri. Inoltre, queste regioni duplicate sono sensibili ai riarrangiamenti cromosomici e sono il sito di interruzioni nelle traslocazioni, delezioni o inversioni. Tuttavia, sebbene deleteri, i frammenti cromosomici duplicati sono proporzionalmente più attivi dal punto di vista trascrizionale rispetto alle singole regioni dei genomi dei primati. Inoltre, queste ripetute duplicazioni hanno creato nuove famiglie di geni uniche per gli ominoidi.
Cromosoma 15L'8,8% del cromosoma 15 corrisponde a segmenti cromosomici duplicati, il 50% dei quali sono duplicazioni intracromosomiche. Ad esempio, nella regione 15q, è stata identificata una sequenza "core" di 2920 coppie di basi. Viene ripetuto 37 volte sul cromosoma 15, due volte sul cromosoma Y e una volta sul cromosoma 2 e 10. L'analisi delle diverse sequenze di questa porzione del cromosoma "cuore" ha permesso di ricapitolare la storia di questa sequenza. Dal genoma di cani e topi contengono solo una copia di questa sequenza "cuore" sul cromosoma corrispondente al cromosoma umano 2. Pertanto, questa sequenza è stata copiata mediante retrotrasposizione sul cromosoma 10, quindi un frammento più grande di 15 kilobasi è stato copiato sul cromosoma 15. Questo segmento di DNA di 15 Kb è stato quindi duplicato più volte sul cromosoma 15. Le due copie della sequenza "cuore" originale sul il cromosoma Y è il risultato della copia di una sequenza di 40 kb proveniente dal cromosoma 15. Come accennato in precedenza, le regioni duplicate sono porzioni fragili del cromosoma suscettibili di riarrangiamenti cromosomici. Le delezioni cromosomiche nella regione duplicata 15q11-q13 sono la causa delle sindromi di Prader-Willi e Angelman .
Sindrome di Beckwith-WiedemannLa sindrome di Beckwith-Wiedemann è caratterizzata da grandi dimensioni, macroglossia e organomegalia e provoca un gran numero di casi di duplicazione della regione terminale del cromosoma 11 paterno. Questa regione cromosomica contiene due geni essenziali per la regolazione della crescita; i geni IGF2 e H19 . IGF2 è un fattore di crescita che stimola la proliferazione cellulare e H19 codifica per RNA non codificante. L'espressione di questi geni è altamente regolata da un complesso meccanismo di imprinting genitoriale . Sul cromosoma materno il gene “IGF2” viene represso e H19 viene espresso mentre sul cromosoma paterno viene espresso il gene IGF2 e H19 represso. La sindrome deriva da una duplicazione parziale della parte terminale del cromosoma paterno 11. Questa duplicazione fornisce una copia aggiuntiva del gene IGF2 sul cromosoma 11 che porta ad un aumento della produzione del fattore di crescita IGF2.
Un particolare gene può essere duplicato durante l'evoluzione. Esistono quattro meccanismi principali che consentono la duplicazione di un gene o di alcuni geni:
Le duplicazioni di geni sono eventi estremamente comuni. Pertanto, il numero di ripetizioni dello stesso gene può variare tra individui della stessa specie, formando così un polimorfismo del numero di ripetizioni . L'aumento del numero di geni è però controbilanciato da una perdita di geni anche abbastanza forte, principalmente per deriva genetica, ma anche dalla contro-selezione dell'aumento della concentrazione proteica generata dall'aumento del numero di geni codificanti. questa proteina.
Esistono cinque scenari evolutivi che seguono la duplicazione genica:
Durante l'evoluzione dei genomi, i geni possono fondersi o rompersi. Una delle conseguenze della sottofunzionalizzazione di un gene duplicato può essere la fissione di un gene in due geni diversi. Infatti, nel caso in cui il gene originale codifichi una proteina con due distinti domini funzionali indicati con I e II, uno dei geni duplicati accumula mutazioni (degenerazione) nella regione corrispondente al dominio II mentre il secondo gene accumula mutazioni nella regione corrispondente a dominio I. Ciò si traduce in un gene 1 che codifica per una proteina con dominio I e un secondo gene che codifica per una proteina con dominio II. Questo meccanismo di fissione genica è stato dimostrato nella Drosophila durante lo studio del gene Monkey-king.
L'isolamento riproduttivo è un processo essenziale per la speciazione perché consente l'inizio della divergenza e il mantenimento di specie distinte. Se due specie strettamente imparentate si adattano ad ambienti diversi, i loro ibridi si adatteranno meno bene a questi ambienti: si parla di debolezza ibrida . Questo fenomeno può essere spiegato dal modello Dobzhansky-Muller di incompatibilità genica sviluppato da Theodosius Dobzhansky nel 1936 e da Herman Joseph Müller nel 1942. La riscoperta dell'opera di William Bateson ha portato alcuni autori a parlare del modello Bateson-Dobzhansky-Muller. Il modello propone che le interazioni epistatiche negative tra due loci conducano alla debolezza ibrida. Nel 2000, Michael Lynch e Allan G. Force hanno adattato il modello di incompatibilità genica per la duplicazione genica. Hanno proposto che in seguito alla duplicazione del gene, la perdita reciproca del gene è un fattore che porta all'isolamento riproduttivo. Quindi, questo modello spiegherebbe la correlazione tra eventi di completa duplicazione del genoma e la radiazione evolutiva di alcuni phyla. Ad esempio, è stato dimostrato che nell'antenato del lievito di birra, che ha subito la completa duplicazione del genoma, la rapida perdita di geni duplicati ha favorito l'emergere di molte specie di lievito attraverso un meccanismo di incompatibilità genica.
I microRNA sono RNA a filamento singolo di 21-23 nucleotidi lunghi che regolano l'espressione genica post-trascrizionale. Nella pianta Arabidopsis thaliana , c'è una classe di microRNA che mostrano una forte omologia di sequenza con i loro geni bersaglio e che sono apparsi di recente durante l'evoluzione. Questi microRNA sono il risultato di duplicazioni geniche inverse.
La duplicazione in tandem di esoni corrisponde alla duplicazione interna di un esone all'interno dello stesso gene. Questo tipo di duplicazione è un'importante fonte di innovazione perché permette di generare nuovi fs all'interno della stessa proteina. Un'analisi completa dei genomi di Homo sapiens , Drosophila melanogaster e il verme Caenorhabditis elegans ha mostrato 12291 casi di duplicazione dell'esone in tandem. L'analisi delle regioni introniche ha anche rivelato 4660 esoni duplicati non caratterizzati. Tra questi potenziali esoni, il 35,1% si trova nei database EST che confermano il loro potenziale ruolo.
La replicazione di queste coppie di basi è all'origine di molte malattie genetiche come la sindrome dell'X fragile o la corea di Huntington . Nel batterio Streptococcus pneumoniae , la duplicazione di 18 coppie di basi nel gene rplV che codifica per la proteina ribosomiale L22 è responsabile della resistenza al macrolide . Questa duplicazione genera una duplicazione di 6 amminoacidi vicino al sito di interazione del macrolide sulla subunità 23S del ribosoma, bloccando così l'interazione dell'antibiotico con il ribosoma.
L'analisi dei genomi procariotici ha rivelato numerosi geni paraloghi . A seconda della specie batterica, la proporzione di geni paraloghi varia dal 7% del genoma nella Rickettsia conorii al 41% nello Streptomyces coelicolor . Dei 106 genomi batterici sequenziati nel 2004, in media il 25% del genoma batterico è costituito da geni paraloghi. Esiste anche una correlazione molto forte tra la dimensione del genoma batterico e la proporzione di geni duplicati.
Esistono tre meccanismi di duplicazione genica nei procarioti:
In Escherichia coli K12, il 16% dei geni omologhi è xenologo suggerendo che il trasferimento genico orizzontale ha un basso impatto sulla proporzione di geni paraloghi. In media, il 15% dei geni paraloghi sono organizzati in tandem, suggerendo eventi di duplicazione genica in tandem che possono provocare la duplicazione dell'operone .
Nei procarioti non è stata dimostrata alcuna duplicazione ancestrale completa del genoma. Tuttavia, alcuni batteri sono poliploidi durante una fase di sviluppo come la Buchnera aphidicola il cui numero di copie del genoma varia a seconda dello stadio di sviluppo del suo ospite, l' afide del legno verde .
La maggior parte dei genomi eucariotici porta un gran numero di geni duplicati funzionali, la grande maggioranza dei quali sarebbe apparsa da 10 a 100 milioni di anni fa. A seguito di massicci eventi di duplicazione, viene conservato circa il 20-50% dei geni duplicati. Questa conservazione suggerisce l'esistenza di un meccanismo di selezione naturale che compenserebbe la produzione di pseudogeni . Dopo una duplicazione, potrebbe esserci una separazione delle funzioni ancestrali tra le due copie, ad esempio in tessuti diversi (fenomeno noto come sotto-funzionalizzazione ); la comparsa di una nuova funzione per una delle copie (fenomeno noto come neofunzionalizzazione ); ogni copia può subire una perdita o una riduzione nell'espressione delle sue funzioni a causa di mutazioni degenerative.
L'evoluzione del genoma batterico è profondamente influenzata dagli scambi genetici tra diverse specie batteriche. In effetti, l'evoluzione delle vie metaboliche in E. coli deriva principalmente dallo scambio genico orizzontale; tuttavia, anche la duplicazione genica sembra contribuire all'evoluzione batterica. I geni preferenzialmente duplicati sono coinvolti nel metabolismo degli amminoacidi , degli ioni inorganici e della regolazione trascrizionale . In alcune specie, l'espansione genica di una classe di geni è stata proposta come adattamento evolutivo. Ad esempio, la complessità della parete batterica nei micobatteri può essere spiegata da una duplicazione specifica di questo genere batterico di geni coinvolti nel metabolismo e nel trasporto dei lipidi .
I batteri possono adattarsi alla tossicità di un antibiotico grazie a una grande batteria di meccanismi derivanti da mutazioni puntiformi o dal trasferimento genico orizzontale . I principali meccanismi di resistenza sono:
L'adattamento di un batterio a un antibiotico viene effettuato in due fasi:
Le amplificazioni geniche sono instabili e possono essere perse in assenza di pressione di selezione mediante ricombinazione omologa. Pertanto, i geni duplicati possono essere mantenuti in ceppi batterici in cui la proteina Rec A è carente. Tuttavia, ci sono meccanismi di perdita di geni duplicati indipendenti dalla Rec A che non sono ben compresi.
Amplificazione genica su un plasmideAll'inizio degli anni '70, la scoperta di plasmidi R portatori di geni per la resistenza agli antibiotici ha permesso di dimostrare per la prima volta il ruolo della duplicazione genica nel fenomeno della resistenza agli antibiotici. Il plasmide NR1 aumenta di dimensioni nel Proteus mirabilis in presenza di basse concentrazioni di cloramfenicolo , streptomicina e sulfonamide . La regione amplificata del plasmide è chiamata determinante-r (r per resistenza) ed è affiancata da sequenze IS1 ( Insertion Sequence 1 ) ripetute dirette che consentono l'amplificazione della regione grazie ad omologie di sequenza tra le sequenze IS1 con conseguente ricombinazione omologa. Tra sorelle cromatidi . In molti batteri, la resistenza associata all'amplificazione genica su un plasmide è spesso associata alla presenza della sequenza IS. Tuttavia, ci sono alcuni casi in cui regioni omologhe imperfette possono consentire l'amplificazione dei geni di resistenza come l'amplificazione del gene tetL sul plasmide pAMα1 che conferisce resistenza alla tetraciclina in Enterococcus faecalis .
Amplificazione genica sul cromosoma battericoL'amplificazione dei geni cromosomici è simile a quella osservata sui plasmidi batterici. Ad esempio, in Escherichia coli e Yersinia enterocolitica è stata osservata un'amplificazione della β-lattamasi che conferisce resistenza ai β-lattamici mediante meccanismi dipendenti e indipendenti dalla proteina Rec A. Tuttavia, esistono esempi specifici in cui sono duplicate solo poche coppie di basi. In Staphylococcus aureus e Yersinia enterocolitica , la duplicazione del sito di ingresso ribosomiale del gene di resistenza ai macrolidi chiamato ermA (per la resistenza all'eritromicina metilasi A) porta alla stimolazione della traduzione di ermA. Infine, nel batterio Streptococcus pneumoniae , la duplicazione di 18 coppie di basi nel gene rplV che codifica per la proteina ribosomiale L22 è responsabile della resistenza ai macrolidi . Questa duplicazione genera una duplicazione di 6 amminoacidi vicino al sito di interazione del macrolide sulla subunità 23S del ribosoma, bloccando così l'interazione dell'antibiotico con il ribosoma. La maggior parte delle amplificazioni geniche che conferiscono resistenza agli antibiotici sono state indotte nei laboratori di ricerca. Negli studi clinici, l'identificazione dell'amplificazione genica è piuttosto rara, probabilmente a causa dell'instabilità delle amplificazioni geniche. Durante lo screening dei ceppi di Streptococcus agalactiae , due ceppi resistenti alle sulfonamidi e al trimetoprim sono stati isolati con un'amplificazione contenente l' operone folCEPBK coinvolto nella sintesi della vitamina B9 .