L' acido desossiribonucleico , o DNA , è una macromolecola biologica presente in quasi tutte le cellule e in molti virus . Il DNA contiene tutte le informazioni genetiche, chiamate genoma , che consentono lo sviluppo, il funzionamento e la riproduzione degli esseri viventi . È un acido nucleico , come l'acido ribonucleico (RNA). Gli acidi nucleici sono, insieme a peptidi e carboidrati , una delle tre principali famiglie di biopolimeri essenziali per tutte le forme di vita conosciute.
Le molecole di DNA nelle cellule viventi sono costituite da due filamenti antiparalleli avvolti l'uno intorno all'altro per formare una doppia elica . Si dice che il DNA sia a doppia elica o a doppia elica. Ciascuno di questi filamenti è un polimero chiamato polinucleotide . Ogni monomero che lo costituisce è un nucleotide , che è formato da una base nucleica , o base azotata - adenina (A), citosina (C), guanina (G) o timina (T) - legata a un ose - qui, il desossiribosio - esso stesso legato a un gruppo fosfato . I nucleotidi polimerizzati sono uniti tra loro da legami covalenti tra il desossiribosio di un nucleotide e il gruppo fosfato del nucleotide successivo, formando così una catena in cui si alternano osi e fosfati, con basi nucleiche ciascuna legata a un oso. L'ordine in cui i nucleotidi si succedono lungo un filamento di DNA costituisce la sequenza di questo filamento. È questa sequenza che trasporta le informazioni genetiche. Questo è strutturato in geni , che vengono espressi attraverso la trascrizione in RNA . Questi RNA possono essere non codificanti - in particolare RNA di trasferimento e RNA ribosomiale - oppure codificanti: in questo caso sono RNA messaggeri , tradotti in proteine dai ribosomi . La successione delle basi nucleiche sul DNA determina la successione degli amminoacidi che costituiscono le proteine risultanti da questi geni. La corrispondenza tra basi nucleiche e amminoacidi è il codice genetico . Tutti i geni di un organismo costituiscono il suo genoma .
Le basi degli acidi nucleici di un filamento di DNA possono interagire con le basi nucleiche di un altro filamento di DNA attraverso legami idrogeno , che determinano le regole di accoppiamento tra coppie di basi : adenina e timina s 'coppia per mezzo di due legami idrogeno, mentre guanina e coppia di citosina mediante tre legami idrogeno. Normalmente, l'adenina e la citosina non si accoppiano, proprio come la guanina e la timina. Quando le sequenze dei due filamenti sono complementari, queste linee possono accoppiare insieme formando una caratteristica doppia - filamento elicoidale struttura chiamata DNA a doppia elica. Questa doppia elica si adatta bene alla memorizzazione di informazioni genetiche: la catena ose-fosfato è resistente alle reazioni di scissione ; inoltre l'informazione è duplicata sui due filamenti della doppia elica, il che consente di riparare un filamento danneggiato dall'altro filamento rimasto intatto; infine, queste informazioni possono essere copiate attraverso un meccanismo chiamato replicazione del DNA in cui una doppia elica del DNA viene copiata fedelmente in un'altra doppia elica che trasporta le stesse informazioni. Questo è in particolare ciò che accade durante la divisione cellulare : ogni molecola di DNA della cellula madre viene replicata in due molecole di DNA, ciascuna delle due cellule figlie riceve così un set completo di molecole di DNA, ogni gioco è identico all'altro.
Nelle cellule, il DNA è organizzato in strutture chiamate cromosomi . Questi cromosomi lavorano per rendere il DNA più compatto con l'aiuto delle proteine , in particolare degli istoni , che insieme agli acidi nucleici formano una sostanza chiamata cromatina . I cromosomi partecipano anche alla regolazione dell'espressione genica determinando quali parti del DNA devono essere trascritte nell'RNA . Negli eucarioti ( animali , piante , funghi e protisti ) il DNA è contenuto essenzialmente nel nucleo delle cellule, con una frazione di DNA presente anche nei mitocondri oltre che, nelle piante , nei cloroplasti . Nei procarioti ( batteri e archei ), il DNA è contenuto nel citoplasma . Nei virus che contengono DNA, è immagazzinato nel capside . Qualunque sia l'organismo considerato, il DNA si trasmette durante la riproduzione : svolge il ruolo di supporto dell'ereditarietà . La modificazione della sequenza delle basi di un gene può portare ad una mutazione genetica , che può, a seconda dei casi, essere benefica, senza conseguenze o dannosa per l'organismo, addirittura incompatibile con la sua sopravvivenza. A titolo di esempio, la modifica di una singola base di un singolo gene - quella della β-globina , una subunità di proteine di emoglobina A - del l' umana genotipo è responsabile per l'anemia falciforme , una malattia genetica tra le più diffuse nel mondo.
Il DNA è un lungo polimero formato dalla ripetizione di monomeri chiamati nucleotidi . Il primo DNA fu identificato e isolato nel 1869 dal nucleo dei globuli bianchi dallo svizzero Friedrich Miescher . La sua struttura a doppia elica fu dimostrata nel 1953 dal britannico Francis Crick e dall'americano James Watson da dati sperimentali ottenuti dai britannici Rosalind Franklin e Maurice Wilkins . Questa struttura, comune a tutte le specie , è costituita da due catene polinucleotidiche elicoidali avvolte l'una intorno all'altra attorno ad un asse comune, con un passo di circa 3,4 nm per un diametro di circa 2, 0 nm . Un altro studio che misura i parametri geometrici del DNA in soluzione fornisce un diametro compreso tra 2,2 e 2,6 nm con una lunghezza per nucleotide di 0,33 nm . Sebbene ogni nucleotide sia molto piccolo, le molecole di DNA possono contenerne milioni e crescere fino a dimensioni significative. Ad esempio, il cromosoma umano 1 , che è il più grande dei cromosomi umani , contiene circa 220 milioni di paia di basi con una lunghezza lineare di oltre 7 cm .
In cellule viventi , il DNA generalmente non esiste in singolo filamento (singolo filamento forma), ma piuttosto a doppio filamento forma (doppio filamento) con una configurazione a doppia elica. I monomeri che costituiscono ciascun filamento di DNA comprendono un segmento della catena desossiribosio - fosfato e una base nucleica legata al desossiribosio. La molecola risultante dal legame di una base nucleica a un ose è chiamata nucleoside ; l'aggiunta di uno a tre gruppi fosfato alla dose di un nucleoside forma un nucleotide . Un polimero risultante dalla polimerizzazione dei nucleotidi è chiamato polinucleotide . Il DNA e l' RNA sono polinucleotidi.
L' ose che costituisce la spina dorsale della molecola è il 2'-desossiribosio , un derivato del ribosio . Questo pentoso si alterna con gruppi fosfato per formare legami fosfodiestere tra atomi n ° 3 'e residui n ° 5' adiacenti desossiribosio. A causa di questo legame asimmetrico, i filamenti di DNA hanno un senso. In una doppia elica, i due filamenti di DNA sono in direzioni opposte: si dice che siano antiparalleli . La direzione da 5 'a 3' di un filamento di DNA designa convenzionalmente quella dell'estremità che trasporta un gruppo fosfato -PO 3 2− verso la fine recante un gruppo idrossile –OH; è in questo senso che il DNA viene sintetizzato dalle DNA polimerasi . Una delle principali differenze tra DNA e RNA è il fatto che il coraggio dello scheletro della molecola è il ribosio nel caso dell'RNA invece del DNA desossiribosio, che gioca sulla stabilità e la geometria di questa macromolecola .
La doppia elica del DNA è stabilizzata essenzialmente da due forze: i legami idrogeno tra i nucleotidi da un lato e le interazioni di impilamento degli anelli aromatici delle basi nucleiche dall'altro. Nell'ambiente acquoso della cellula , i legami π coniugati di queste basi si allineano perpendicolarmente all'asse della molecola di DNA in modo da minimizzare le loro interazioni con lo strato di solvatazione e, quindi, la loro entalpia libera . I quattro nucleotidi costituenti del DNA sono adenina (A), citosina (C), guanina (G) e timina (T), che formano rispettivamente i seguenti quattro nucleotidi , che compongono il DNA:
Le quattro basi nucleiche del DNA sono di due tipi: da un lato le purine - adenina e guanina - che sono composti biciclici costituiti rispettivamente da due eterocicli con cinque e sei atomi, dall'altro le pirimidine - citosina e timina - che sono monocicliche composti che comprendono un eterociclo con sei atomi. Le coppie di basi della doppia elica del DNA sono costituite da una purina che interagisce con una pirimidina attraverso due o tre legami idrogeno :
A causa di questa complementarità, tutta l'informazione genetica trasportata da uno dei filamenti della doppia elica del DNA viene trasportata in modo identico anche sull'altro filamento. È su questo principio che si basa il meccanismo di replicazione del DNA , ed è su questa complementarità tra basi nucleiche che si basano tutte le funzioni biologiche del DNA nelle cellule viventi.
Il DNA di alcuni virus , come i batteriofagi PBS1 e PBS2 di Bacillus subtilis , il batteriofago φR1-37 di Yersinia e il fago S6 di Staphylococcus , possono sostituire la timina con uracile , una pirimidina solitamente caratteristica dell'RNA ma normalmente assente dal DNA, dove si trova solo come prodotto di degradazione della citosina.
Le basi azotate si accoppiano più spesso formando le coppie di basi chiamate "Watson-Crick" corrispondenti a due o tre legami idrogeno stabiliti tra due basi orientate anti al residuo di desossiribosio . Tuttavia, è possibile stabilire legami idrogeno anche tra una purina syn-oriented e una pirimidina anti-oriented: in questo caso, si tratta di un accoppiamento Hoogsteen . Una coppia di basi Watson-Crick è anche in grado di stabilire legami idrogeno di tipo Hoogsteen con una terza base, che consente la formazione di strutture di DNA a tre filamenti .
Solo uno dei filamenti di un segmento di DNA che costituisce un gene viene trascritto in RNA funzionale, in modo che i due filamenti di un gene non siano equivalenti: si dice che quello che è trascritto in RNA funzionale abbia polarità negativa e trasporta una sequenza antisenso, mentre il filamento complementare - che può anche essere trascritto in RNA, ma non funzionale - si dice che abbia polarità positiva e trasporta una sequenza di DNA sensoriale. Il filamento trascritto nell'RNA funzionale è talvolta chiamato filamento codificante, ma questa designazione è valida solo all'interno di un dato gene perché i due filamenti della stessa doppia elica del DNA possono codificare proteine diverse; si parla quindi di filoni ambisenso. RNA sono trascritte da sequenze di DNA senso - quindi antisenso sequenze di RNA - sia procarioti ed eucarioti , ma il loro ruolo biologico non è pienamente chiarito; una delle ipotesi è che questi RNA antisenso possano intervenire nella regolazione dell'espressione genica attraverso l' accoppiamento tra sequenze di RNA senso e antisenso, che sono, per definizione, complementari.
La distinzione tra filamenti di DNA senso e antisenso è sfumata in alcuni tipi di geni sovrapposti , piuttosto rari nei procarioti e negli eucarioti ma più comuni sui plasmidi e nei virus , in cui entrambi i filamenti dello stesso segmento di DNA codificano ciascuno un diverso RNA funzionale. Nei batteri , questa sovrapposizione può svolgere un ruolo nella regolazione della trascrizione genica mentre, nei virus, i geni sovrapposti aumentano la quantità di informazioni genetiche che possono essere codificate nelle piccole dimensioni del genoma virale.
Il DNA rilasciato può essere lineare, come è tipico degli eucarioti , o circolare, come nei procarioti . Può tuttavia essere attorcigliato in modo talvolta complesso sotto l'effetto dell'introduzione di giri aggiuntivi dell'elica o della rimozione di giri nella doppia elica . La doppia elica di DNA così superavvolta per effetto di supercircuiti positivi o negativi ha un passo rispettivamente accorciato o allungato rispetto al suo stato rilassato: nel primo caso le basi nucleiche sono disposte in modo più compatto; nel secondo caso, al contrario, interagiscono meno strettamente. In vivo , il DNA mostra tipicamente un superavvolgimento leggermente negativo sotto l'effetto di enzimi chiamati DNA topoisomerasi , che sono anche essenziali per allentare gli stress introdotti nel DNA durante i processi che coinvolgono la doppia elica che viene svolta per separarla da essa. I due filamenti , così come sono in particolare il caso durante la replicazione del DNA e durante la sua trascrizione in RNA .
Poiché i legami idrogeno non sono legami covalenti , possono essere rotti abbastanza facilmente. È così possibile separare i due filamenti della doppia elica del DNA come una cerniera sia meccanicamente che per effetto di alta temperatura, nonché a bassa salinità , a pH alto - soluzione basica - ea pH basso - soluzione acida , che tuttavia altera il DNA in particolare mediante depurazione. Questa separazione dei filamenti di DNA a doppio filamento per formare due molecole di DNA a filamento singolo è chiamata fusione o denaturazione del DNA . La temperatura alla quale il 50% del DNA a doppio filamento viene dissociato in due molecole di DNA a filamento singolo è chiamata temperatura di fusione o temperatura di semi-denaturazione del DNA, indicata con T m . Si misura seguendo l' assorbimento ottico a 260 nm della soluzione contenente il DNA: questo assorbimento aumenta durante il disadattamento, che si chiama ipercromicità . Le molecole di DNA a filamento singolo rilasciate non hanno una configurazione particolare, ma alcune strutture tridimensionali sono più stabili di altre.
La stabilità di una doppia elica del DNA dipende essenzialmente dal numero di legami idrogeno da rompere per separare i due filamenti. Pertanto, più lunga è la doppia elica, più è stabile. Tuttavia, poiché le coppie G C sono unite da tre legami idrogeno invece di due per le coppie A T , la stabilità delle molecole di DNA a doppio filamento della stessa lunghezza aumenta con il numero di coppie G C che contengono, misurato dalla loro velocità. di GC . Questo effetto è rafforzato dal fatto che le interazioni di stacking tra basi nucleiche dello stesso filamento di DNA sono più forti tra guanina e residui di citosina, così che la sequenza di DNA influenza anche la sua stabilità. La temperatura di fusione del DNA dipende quindi dalla lunghezza delle molecole, dal loro livello di GC, dalla loro sequenza, dalla loro concentrazione nel solvente e dalla forza ionica in esso. In biologia molecolare , si osserva che i segmenti di DNA a doppia elica la cui funzione implica che i due filamenti della doppia elica possano separarsi facilmente hanno un alto tasso di coppie A T : questo è il caso della sequenza TATAAT tipica del Pribnow scatola di alcuni promotori .
I due filamenti di DNA formano una doppia elica la cui spina dorsale forma due solchi. Queste scanalature sono adiacenti alle coppie di basi ed è probabile che forniscano un sito di legame per varie molecole. Poiché i filamenti di DNA non sono posizionati simmetricamente rispetto all'asse della doppia elica, definiscono due solchi di dimensione disuguale: il solco maggiore è largo 2,2 nm mentre il solco minore è 1,2 nm . I bordi delle basi nucleiche sono più accessibili nel solco maggiore che nel solco minore. Pertanto, le proteine , come i fattori di trascrizione , che si legano a sequenze specifiche nel DNA a doppia elica di solito lo fanno a livello del solco maggiore.
Ci sono molti possibili conformatori della doppia elica del DNA. Le forme classiche sono chiamate DNA A , DNA B e DNA Z , di cui solo le ultime due sono state osservate direttamente in vivo . La conformazione adottata dal DNA a doppia elica dipende dal suo grado di idratazione , dalla sua sequenza , dalla sua velocità di superavvolgimento , dalle modificazioni chimiche delle basi che lo compongono, dalla natura e dalla concentrazione degli ioni metallici in soluzione , anche dalla presenza di poliammine .
Ambientazione | DNA A | DNA B | Z DNA |
---|---|---|---|
Direzione dell'elica | giusto | giusto | sinistra |
Schema ripetuto | 1 bp | 1 bp | 2 bp |
Rotazione per coppia di basi | 32,7 ° | 34,3 ° | 60 ° / 2 |
Coppia di basi per giro di elica | 11 | 10.5 | 12 |
Passo dell'elica per giro | 2.82 nm | 3,32 nm | 4,56 nm |
Allungamento assi tramite coppia di basi | 0,24 nm | 0,32 nm | 0,38 nm |
Diametro | 2,3 nm | 2,0 nm | 1,8 nm |
Inclinazione delle coppie di basi sull'asse dell'elica | + 19 ° | −1,2 ° | −9 ° |
Torsione media ( torsione dell'elica ) | + 18 ° | + 16 ° | 0 ° |
Orientamento dei sostituenti delle basi sui residui osidici |
anti | anti |
Pirimidina : anti, Purina : syn |
Piegatura / torsione endociclica del furanosio ( increspatura dello zucchero ) |
C3'- endo | C2'- endo |
Citosina : C2'- endo , Guanine : C2'- exo |
L' espressione genica del DNA dipende da come il DNA è confezionato nei cromosomi in una struttura chiamata cromatina . Alcune basi possono essere modificate durante la formazione della cromatina, i residui di citosina delle regioni che sono poco o non espressi geneticamente sono generalmente fortemente metilati , e questo principalmente nei siti CpG . Anche gli istoni attorno ai quali il DNA è avvolto nelle cromatine possono essere modificati in modo covalente . La stessa cromatina può essere alterata dai complessi di rimodellamento della cromatina. Inoltre, la metilazione del DNA e la modifica covalente degli istoni sono coordinate per influenzare l' espressione genica e della cromatina .
Così, la metilazione di residui di citosina produce 5-metilcitosina , che svolge un ruolo importante nella inattivazione del cromosoma X . Il tasso di metilazione varia tra gli organismi, il nematode Caenorhabditis elegans ne è completamente privo, mentre i vertebrati hanno circa l'1% del loro DNA contenente 5-metilcitosina .
Le pirimidine hanno una struttura molecolare molto simile. Pertanto, la citosina e la 5-metilcitosina possono essere deaminate per produrre rispettivamente uracile (che non è una base che fa parte del codice del DNA) e timina . La reazione di deaminazione potrebbe quindi promuovere mutazioni genetiche .
Esistono anche altre basi modificate nel DNA, derivanti ad esempio dalla metilazione dei residui di adenina nei batteri ma anche nei nematodi ( Caenorhabditis elegans ), nelle alghe verdi ( Chlamydomonas ) e nei moscerini della frutta . La 5-idrossimetilcitosina è un derivato della citosina particolarmente abbondante nel cervello dei mammiferi . Organismi come i flagellati Diplonema ed Euglena e il genere Kinetoplastida , inoltre, contengono una pirimidina glicosilata derivata dall'uracile e chiamata base J ; questa base modificata funge da segnale di terminazione della trascrizione per la RNA polimerasi II . Sono state identificate numerose proteine che si legano specificamente alla base J.
Il DNA può essere danneggiato da un gran numero di mutageni che ne alterano la sequenza . Questi mutageni comprendono gli ossidanti , gli alchilanti , l' energia delle radiazioni elettromagnetiche come ultravioletti e raggi X e gamma , nonché particelle subatomiche di radiazioni ionizzanti come risultanti dalla radioattività anche dai raggi cosmici . Il tipo di danno prodotto dipende dal tipo di mutageno. Pertanto, i raggi ultravioletti sono in grado di danneggiare il DNA producendo dimeri di pirimidina stabilendo legami tra basi adiacenti dello stesso filamento di DNA. Gli ossidanti come i radicali liberi o il perossido di idrogeno producono diversi tipi di danni, come cambiamenti di base, compresa la guanosina , e rotture nella struttura a doppio filamento . Una tipica cellula umana contiene circa 150.000 basi danneggiate da un ossidante. Tra queste lesioni dovute agli ossidanti, le più pericolose sono le rotture a doppio filamento perché sono le più difficili da riparare e sono suscettibili di produrre mutazioni puntiformi , inserzioni e delezioni all'interno della sequenza del DNA, nonché traslocazioni cromosomiche . È probabile che queste mutazioni causino il cancro . Le alterazioni naturali del DNA, ad esempio risultanti da processi cellulari che producono derivati reattivi dell'ossigeno , sono abbastanza comuni. Sebbene i meccanismi di riparazione del DNA risolvano la maggior parte di queste lesioni, alcune di esse non vengono riparate e si accumulano nel tempo nei tessuti postmitotici dei mammiferi . L'accumulo di tali lesioni non riparate sembra essere un'importante causa alla base dell'invecchiamento .
Molti mutageni si inseriscono nello spazio tra due coppie di basi adiacenti in un modo chiamato intercalazione . La maggior parte delle intercalazioni sono costituite da composti aromatici e molecole planari, come il bromuro di etidio , acridine , daunorubicina o doxorubicina . Le basi devono allontanarsi per consentire l'inserimento della mescola di intercalazione, che per svolgimento parziale provoca la deformazione della doppia elica. Ciò blocca sia la trascrizione che la replicazione del DNA , con conseguente citotossicità e mutazioni . Di conseguenza, i composti intercalanti possono essere cancerogeni e, nel caso della talidomide , teratogeni . Altri composti come la resina epossidica benzo [ a ] pirene diolo e l' aflatossina formano addotti con il DNA che causano errori di replicazione. Tuttavia, a causa della loro capacità di bloccare la trascrizione e la replicazione del DNA, altre tossine simili vengono utilizzate anche nella chemioterapia contro le cellule in rapida proliferazione.
Il DNA si trova principalmente nei cromosomi , che sono generalmente lineari negli eucarioti e circolari nei procarioti . In quest'ultimo si può trovare anche all'esterno dei cromosomi, all'interno dei plasmidi . Tutto il DNA di una cellula costituisce il suo genoma . Il genoma umano rappresenta circa tre miliardi di paia di basi distribuite in 46 cromosomi. Le informazioni contenute nel genoma sono trasportate da segmenti di DNA che formano i geni . L' informazione genetica viene trasmessa attraverso specifiche basi di regole di abbinamento chiamate accoppiamento Watson-Crick: le uniche due coppie di basi normalmente consentite sono l' adenina con timina e la guanina con citosina . Queste regole di accoppiamento sono alla base dei diversi processi in atto nelle funzioni biologiche del DNA:
Quando una cellula viene divisa , deve replicare il DNA che trasporta il suo genoma in modo che entrambe le cellule figlie ereditino le stesse informazioni genetiche della cellula madre. La doppia elica del DNA fornisce un semplice meccanismo di replicazione: i due filamenti vengono svolti per essere separati e ciascuno dei due filamenti funge da stampo per ricreare un filamento con la sequenza complementare mediante accoppiamento tra basi nucleiche , che consente di ricostituire due filamenti identici eliche di DNA a doppio filamento . Questo processo è catalizzato da un insieme di enzimi tra cui le DNA polimerasi sono quelle che completano i filamenti di DNA svolti per ricostruire i due filamenti complementari. Poiché queste DNA polimerasi possono polimerizzare il DNA solo nella direzione da 5 'a 3' , intervengono diversi meccanismi per copiare i filamenti antiparalleli della doppia elica:
Il DNA nel genoma è organizzato e compattato in un processo chiamato condensazione del DNA in modo che possa adattarsi allo spazio ristretto di una cellula . Negli eucarioti il DNA è localizzato principalmente nel nucleo , con una piccola frazione anche nei mitocondri e, nelle piante , nei cloroplasti . Nei procarioti , il DNA si trova all'interno di una struttura irregolare del citoplasma chiamata nucleoide . L'informazione genetica del genoma è organizzata all'interno dei geni e l'intero insieme di queste informazioni è chiamato genotipo . Un gene è una frazione del DNA che influenza una particolare caratteristica dell'organismo e fa quindi parte dell'eredità . Contiene un frame di lettura aperto che può essere trascritto in RNA , nonché sequenze per la regolazione dell'espressione genica come promotori ed esaltatori che controllano la trascrizione.
Nella maggior parte delle specie , solo una piccola frazione del genoma codifica per le proteine . Pertanto, circa l'1,5% del genoma umano è costituito da esoni che codificano per proteine, mentre più del 50% del DNA umano è costituito da sequenze ripetute non codificanti; il resto del DNA codifica diversi tipi di RNA come gli RNA di trasferimento e gli RNA ribosomiali . La presenza di una tale quantità di DNA non codificante nel genoma degli eucarioti così come la grande variabilità nella dimensione del genoma di diversi organismi - dimensione che non ha relazione con la complessità degli organismi corrispondenti - è una questione nota poiché l'inizio della biologia molecolare e spesso chiamato il paradosso del valore C , questo " valore C " che designa, negli organismi diploidi , la dimensione del genoma e un multiplo di questa dimensione nei poliploidi . Tuttavia, alcune sequenze di DNA che codificano per proteine potrebbero non codificare molecole di RNA coinvolte nella regolazione funzionale dell'espressione genica .
Alcune sequenze di DNA non codificanti svolgono un ruolo strutturale nei cromosomi . I telomeri e i centromeri contengono tipicamente pochi geni, ma contribuiscono in modo significativo alle funzioni biologiche e alla stabilità meccanica dei cromosomi. Una frazione significativa di DNA non codificante è costituita da pseudogeni , che sono copie di geni resi inattivi a seguito di mutazioni . Queste sequenze sono solitamente solo fossili molecolari, ma a volte possono servire come materia prima genetica per la creazione di nuovi geni attraverso processi di duplicazione genetica e divergenza evolutiva.
L' espressione genica serve a convertire il genotipo del fenotipo di un organismo , vale a dire un insieme di caratteristiche di questa organizzazione. Questo processo è influenzato da vari stimoli esterni e si compone delle seguenti tre fasi principali:
Si noti che lo stesso DNA può in due fasi di sviluppo di un organismo essere espresso (a causa di diversi repressori e derepressivi) in modi molto diversi, l'esempio più noto è quello del bruco e della farfalla, morfologicamente molto distanti.
Il gene dell'informazione codificato dalla sequenza di nucleotidi del gene DNA può essere copiato in un acido nucleico diverso da DNA e RNA noti . Questo RNA è strutturalmente molto simile a una molecola di DNA a filamento singolo , ma differisce nella natura del ose dei suoi nucleotidi - l'RNA contiene ribosio dove il DNA contiene desossiribosio - così come uno dei suoi nucleotidi. Basi di acidi nucleici - la timina nel DNA è sostituito da uracile .
La trascrizione di DNA in RNA è un processo complesso la cui spiegazione era un importante progresso nella biologia molecolare durante la seconda metà del XX ° secolo. È strettamente regolato, in particolare da proteine chiamate fattori di trascrizione che, in risposta ad esempio agli ormoni , consentono la trascrizione di geni bersaglio: è il caso ad esempio degli ormoni sessuali come estrogeni , progesterone e testosterone .
L' RNA risultante dalla trascrizione del DNA può essere non codificante o codificante. Nel primo caso ha una sua funzione fisiologica nella cellula ; nel secondo caso si tratta di un RNA messaggero , che viene utilizzato per trasportare l'informazione genetica contenuta nel DNA ai ribosomi , che organizzano la decodifica di queste informazioni utilizzando l' RNA di trasferimento . Questi RNA di trasferimento sono legati a un amminoacido tra i 22 aminoacidi proteinogenici e ciascuno ha un gruppo di tre basi nucleiche consecutive chiamate anticodon . Le tre basi di questi anticodoni possono accoppiarsi con tre basi consecutive dell'RNA messaggero, questa tripletta di basi formando un codone complementare all'anticodone dell'RNA di trasferimento. La complementarità del codone dell'RNA messaggero e dell'anticodone dell'RNA di trasferimento si basa sulle regole di accoppiamento di tipo Watson-Crick che regolano la struttura secondaria dei DNA a doppia elica .
La corrispondenza tra i 64 possibili codoni e i 22 amminoacidi proteinogenici è chiamata codice genetico . Questo codice è materializzato dai diversi RNA di trasferimento che formano fisicamente il legame tra un dato amminoacido e diversi anticodoni in base ai diversi RNA di trasferimento che possono legarsi allo stesso amminoacido. Pertanto, una data sequenza di basi nucleiche all'interno di un gene sul DNA può essere convertita in una precisa sequenza di amminoacidi che formano una proteina nel citoplasma della cellula.
Ci sono più codoni che amminoacidi da codificare. Si dice quindi che il codice genetico sia degenerato. Oltre agli amminoacidi proteinogenici, codifica anche la fine della traduzione utilizzando tre particolari codoni chiamati codoni di STOP : TAA, TGA e TAG sul DNA.
Tutte le funzioni biologiche del DNA dipendono dalle interazioni con le proteine . Questi possono variare da interazioni aspecifiche a interazioni con proteine che si legano specificamente a una specifica sequenza di DNA. Degli enzimi possono anche legarsi al DNA e, tra questi, le polimerasi che forniscono la replicazione del DNA e la sua trascrizione in RNA giocano un ruolo particolarmente importante.
Le proteine strutturali che si legano al DNA forniscono esempi ben compresi di interazioni aspecifiche tra proteine e DNA. Questo viene mantenuto all'interno dei cromosomi formando complessi con proteine strutturali che condensano il DNA in una struttura compatta chiamata cromatina . Negli eucarioti , questa struttura coinvolge piccole proteine di base chiamate istoni , mentre coinvolge molte proteine di diverso tipo nei procarioti . Gli istoni formano un complesso a forma di disco con DNA chiamato nucleosoma contenente due giri completi di una molecola di DNA a doppia elica avvolta attorno alla proteina. Queste interazioni aspecifiche si stabiliscono tra i residui basici degli istoni e la spina dorsale acida costituita da un ose - fosfato alternato portante le basi nucleiche della doppia elica del DNA. In questo modo si formano legami ionici indipendenti dalla sequenza di basi del DNA. Questi residui di amminoacidi basici subiscono cambiamenti chimici come metilazioni , fosforilazioni e acetilazioni . Queste modificazioni chimiche modificano l'intensità delle interazioni tra DNA e istoni, rendendo il DNA più o meno accessibile ai fattori di trascrizione e modulando così l'attività di trascrizione . Altre proteine che si legano al DNA in modo aspecifico includono proteine nucleari del gruppo ad alta mobilità elettroforetica , noto come HMG , che si legano al DNA piegato o attorcigliato. Queste proteine sono importanti per flettere le reti di nucleosomi e disporle nelle strutture più grandi che compongono i cromosomi.
Delle proteine con interazioni aspecifiche con il DNA, quelle che si legano specificamente al DNA a filamento singolo costituiscono un gruppo speciale. Negli esseri umani , la proteina A è il rappresentante meglio compreso. Si verifica quando i due filamenti di una doppia elica vengono separati, in particolare durante la replicazione , la ricombinazione e la riparazione del DNA . Queste proteine sembrano stabilizzare il DNA a filamento singolo e impedirgli di formare cappi a stelo - strutture a forcina - o degradarsi da nucleasi .
Proteine specifiche per una sequenza di DNAAl contrario , altre proteine si legano solo a sequenze di DNA specifiche. Tra queste proteine, le più studiate sono i vari fattori di trascrizione , che sono proteine che regolano la trascrizione . Ciascun fattore di trascrizione si lega solo a un particolare insieme di sequenze di DNA e attiva o inibisce i geni di cui una di queste specifiche sequenze è vicina al promotore . I fattori di trascrizione ottengono questo risultato in due modi. Possono prima legarsi alla RNA polimerasi responsabile della trascrizione, direttamente o tramite altre proteine mediatori; questo posiziona la polimerasi a livello del promotore e le consente di iniziare la trascrizione. Possono anche legarsi agli enzimi che modificano gli istoni a livello del promotore, il che ha l'effetto di modificare l'accessibilità del DNA alla polimerasi.
Poiché questi bersagli del DNA possono essere distribuiti in tutto il genoma di un organismo, un cambiamento nell'attività di un tipo di fattore di trascrizione può influenzare migliaia di geni. Pertanto, queste proteine sono spesso l'obiettivo dei processi di trasduzione del segnale che controllano le risposte ai cambiamenti ambientali, lo sviluppo o la differenziazione delle cellule . La specificità dell'interazione di questi fattori di trascrizione con il DNA deriva dal fatto che queste proteine stabiliscono numerosi contatti con i bordi delle basi nucleiche , il che consente loro di "leggere" la sequenza del DNA. La maggior parte di queste interazioni ha luogo nel solco principale della doppia elica del DNA, dove le basi sono più accessibili.
Le nucleasi sono enzimi che scindono i filamenti di DNA catalizzando l' idrolisi dei legami fosfodiestere . Le nucleotidi che scindono i nucleotidi situati all'estremità dei filamenti di DNA sono chiamate esonucleasi , mentre quelle che scindono i nucleotidi situati all'interno dei filamenti di DNA sono chiamate endonucleasi . Le nucleasi più comunemente usate in biologia molecolare sono gli enzimi di restrizione , che scindono il DNA in sequenze specifiche. Così l'enzima EcoRV riconosce la sequenza di sei basi 5′-GATATC-3 ′ e la scinde nel mezzo. In vivo , questi enzimi proteggono i batteri dall'infezione da fagi digerendo il DNA di questi virus quando entra nella cellula batterica. Nell'ingegneria molecolare, vengono utilizzati nelle tecniche di clonazione molecolare e per determinare l' impronta genetica .
Ligasi del DNAAl contrario, gli enzimi chiamati DNA ligasi possono riattaccare i filamenti di DNA rotti o tagliati. Questi enzimi sono particolarmente importanti durante la replicazione del DNA perché sono quelli che suturano i frammenti di Okazaki prodotti sul filo in ritardo, chiamato anche filo indiretto, a livello della forcella di replicazione. Sono anche coinvolti nella riparazione del DNA e nei meccanismi di ricombinazione genetica .
Le topoisomerasi sono enzimi aventi sia un'attività nucleasi che un'attività ligasi . La DNA girasi è un esempio di tali enzimi. Queste proteine alterano la velocità del superavvolgimento del DNA recidendo una doppia elica per consentire ai due segmenti formati di ruotare l'uno rispetto all'altro rilasciando le supercoil prima di essere suturati di nuovo insieme. Altri tipi di topoisomerasi sono in grado di tagliare una doppia elica per consentire il passaggio di un altro segmento di doppia elica attraverso la fenditura così formata prima della chiusura di quest'ultima. Le topoisomerasi sono essenziali per molti processi che coinvolgono il DNA, come la trascrizione e la replicazione del DNA .
HelicasesLe elicotteri sono tipi di motori molecolari . Usano l'energia chimica del nucleoside trifosfato , essenzialmente ATP , per rompere i legami idrogeno tra le coppie di basi e svolgere la doppia elica del DNA per liberare entrambi i filamenti . Questi enzimi sono essenziali per la maggior parte dei processi che richiedono agli enzimi di accedere alle basi del DNA.
DNA polimerasiLe DNA polimerasi sono enzimi che sintetizzano catene polinucleotidi da nucleosidi trifosfati . La sequenza delle catene che sintetizzano è determinata da quella di una catena polinucleotidica preesistente chiamata matrice . Questi enzimi funzionano aggiungendo continuamente nucleotidi alla ossidrile del 'estremità della catena polipeptidica crescente 3. Per questo motivo, tutte le polimerasi lavorano nella direzione da 5 'a 3' . Nucleoside trifosfato avente una base complementare a quella del modello si accoppia ad esso nel sito attivo di questi enzimi, che consente alle polimerasi di produrre filamenti di DNA la cui sequenza è esattamente complementare a quella del filamento stampo. Le polimerasi sono classificate in base al tipo di filamenti che utilizzano.
Durante la replicazione , le DNA polimerasi DNA-dipendenti creano copie di filamenti di DNA. Al fine di preservare l'informazione genetica, è essenziale che la sequenza di basi di ciascuna copia sia esattamente complementare alla sequenza di basi sul filamento modello. Per fare questo, molte DNA polimerasi hanno la capacità di correggere i loro possibili errori di replicazione - funzione di correzione di bozze . Sono quindi in grado di identificare il difetto nella formazione di una coppia di basi tra il filamento stampo e il filamento in crescita alla base che hanno appena inserito e di scindere questo nucleotide utilizzando un'attività di esonucleasi 3 '→ 5' al fine di eliminare questa replicazione errore. Nella maggior parte degli organismi, le DNA polimerasi lavorano in grandi complessi chiamati repisomi che contengono diverse subunità complementari come le pinze - pinzette per DNA - e le elicasi .
Le DNA polimerasi RNA-dipendenti sono una classe di polimerasi specializzate in grado di copiare una sequenza di RNA nel DNA. Includono la trascrittasi inversa , un enzima virale coinvolto nell'infezione delle cellule ospiti da parte dei retrovirus , e la telomerasi , un enzima essenziale per la replicazione dei telomeri . La telomerasi è una polimerasi insolita in quanto contiene il proprio modello di RNA all'interno della sua struttura.
RNA polimerasiLa trascrizione viene eseguita da una RNA polimerasi DNA-dipendente che copia una sequenza di DNA in RNA . Per iniziare la trascrizione di un gene , la RNA polimerasi lega prima una sequenza di DNA chiamata promotore e separa i filamenti di DNA. Quindi copia la sequenza di DNA che costituisce il gene in una sequenza di RNA complementare fino a raggiungere una regione del DNA chiamata terminatore , dove si ferma e si stacca dal DNA. In quanto DNA dipendente dalla DNA polimerasi, l' RNA polimerasi II - enzima che trascrive la maggior parte dei geni del genoma umano - opera all'interno di un grande complesso proteico comprendente diverse subunità complementari e regolatrici.
Ogni divisione cellulare è preceduta dalla replicazione del DNA che porta alla replicazione cromosomica . Questo processo normalmente preserva le informazioni genetiche della cellula , ciascuna delle due cellule figlie eredita una composizione genetica completa identica a quella della cellula madre. Tuttavia, a volte questo processo non avviene normalmente e le informazioni genetiche nella cellula vengono alterate. Parliamo in questo caso di mutazione genetica . Questa alterazione del genotipo può essere irrilevante o, al contrario, alterare anche il fenotipo derivante dall'espressione dei geni alterati.
Una doppia elica del DNA di solito non interagisce con altri segmenti di DNA e nelle cellule umane i diversi cromosomi occupano ciascuno una propria regione all'interno del nucleo chiamata territorio cromosomico . Questa separazione fisica dei diversi cromosomi è essenziale per il funzionamento del DNA come deposito stabile e duraturo di informazioni genetiche poiché una delle rare volte in cui i cromosomi interagiscono si verifica durante l' incrocio responsabile della ricombinazione genetica , cioè quando due doppie eliche del DNA sono rotto, scambiare le loro sezioni e saldare insieme.
La ricombinazione consente ai cromosomi di scambiare materiale genetico e produrre nuove combinazioni di geni , il che aumenta l'efficienza della selezione naturale e può essere determinante nella rapida evoluzione di nuove proteine . La ricombinazione genetica può avvenire anche durante la riparazione del DNA , soprattutto in caso di rottura simultanea di entrambi i filamenti della doppia elica del DNA.
La forma più comune di ricombinazione cromosomica è la ricombinazione omologa , in cui i due cromosomi interagenti condividono sequenze molto simili. Le ricombinazioni non omologhe possono danneggiare gravemente le cellule in quanto possono portare a traslocazioni e anomalie genetiche. La reazione di ricombinazione è catalizzata da enzimi chiamati ricombinasi , come la proteina Rad51. Il primo passo in questo processo è una rottura in entrambi i filamenti della doppia elica causata da endonucleasi o danni al DNA. Una serie di passaggi catalizzati dalla ricombinasi porta a unire le due eliche mediante almeno una giunzione di Holliday in cui un segmento a filamento singolo di ciascuna doppia elica è saldato al filo complementare dell'altra doppia elica. La giunzione di Holliday è una giunzione cruciforme che, quando i fili hanno sequenze simmetriche, può muoversi lungo la coppia cromosomica, scambiando un filo con l'altro. La reazione di ricombinazione viene interrotta tagliando la giunzione e suturando il DNA rilasciato.
L'informazione genetica codificata dal DNA non è necessariamente fissata nel tempo ed è probabile che alcune sequenze si spostino da una parte all'altra del genoma . Questi sono gli elementi genetici mobili . Questi elementi sono mutageni e possono alterare il genoma delle cellule . Tra questi vi sono in particolare trasposoni e retrotrasposoni , questi ultimi che agiscono, a differenza del primo, attraverso un RNA intermedio restituendo una sequenza di DNA sotto l'azione di una trascrittasi inversa . Si muovono all'interno del genoma sotto l'effetto di trasposasi , particolari enzimi che li staccano da un punto e li incollano di nuovo in un altro punto del genoma cellulare, e si ritiene che siano responsabili della migrazione di non meno del 40% del genoma umano durante l'evoluzione dell'Homo sapiens .
Questi elementi trasponibili costituiscono una frazione importante del genoma degli esseri viventi, in particolare nelle piante dove spesso rappresentano la maggior parte del DNA nucleare , come nel mais dove dal 49 al 78% del genoma è costituito da retrotrasposoni. Nel grano , quasi il 90% del genoma è costituito da sequenze ripetute e il 68% da elementi trasponibili. Nei mammiferi , quasi la metà del genoma - 45-48% - è costituita da elementi trasponibili o loro rimanenti, e circa il 42% del genoma umano è costituito da retrotrasposoni, mentre dal 2 al 3% è formato da trasposoni di DNA. Sono quindi elementi importanti nel funzionamento e nell'evoluzione del genoma degli organismi.
I cosiddetti introni di gruppo I e II sono altri elementi genetici mobili. Sono ribozimi , cioè sequenze di RNA dotate di proprietà catalitiche come enzimi , capaci di autocatalisi del proprio splicing . Quelli del gruppo I hanno bisogno dei nucleotidi della guanina per funzionare, a differenza di quelli del gruppo II . Gli introni del gruppo I, ad esempio, si trovano sporadicamente nei batteri , in modo più significativo negli eucarioti semplici e in un numero molto elevato di piante superiori. Infine, si trovano nei geni di un gran numero di batteriofagi di batteri Gram-positivi , ma solo in pochi fagi di batteri Gram-negativi , ad esempio il fago T4 .
L'informazione genetica di una cellula può evolversi sotto l'effetto dell'incorporazione di materiale genetico esogeno assorbito attraverso la membrana plasmatica . Parliamo di trasferimento genico orizzontale , in contrapposizione al trasferimento verticale risultante dalla riproduzione di esseri viventi. È un importante fattore evolutivo in molti organismi, specialmente negli unicellulari . Questo processo spesso coinvolge batteriofagi o plasmidi .
È probabile che i batteri capaci di giurisdizione assorbano direttamente una molecola di DNA esterna e la incorporino nel proprio genoma , un processo chiamato trasformazione genetica . Possono anche ottenere questo DNA come plasmide da un altro batterio attraverso il processo di coniugazione batterica . Infine, possono ricevere questo DNA tramite un batteriofago (un virus ) per trasduzione . Gli eucarioti possono anche ricevere materiale genetico esogeno attraverso un processo chiamato trasfezione .
Il DNA contiene tutte le informazioni genetiche che consentono agli esseri viventi di vivere, crescere e riprodursi. Tuttavia, non è noto se, durante i 4 miliardi di anni di storia della vita sulla Terra , il DNA abbia sempre svolto questo ruolo. Una teoria suggerisce che fosse un altro acido nucleico , l' RNA , il vettore delle informazioni genetiche delle prime forme di vita apparse sul nostro pianeta. L'RNA avrebbe svolto un ruolo centrale in una forma precoce di metabolismo cellulare nella misura in cui è probabile che trasmetta informazioni genetiche e catalizzi le reazioni chimiche che formano i ribozimi . Questo mondo dell'RNA , in cui l'RNA sarebbe servito sia come supporto all'ereditarietà che come enzimi , avrebbe influenzato l'evoluzione del codice genetico a quattro basi nucleiche , che offre un compromesso tra la precisione della codifica dell'informazione genetica favorita da un piccolo numero di basi da un lato e l'efficienza catalitica degli enzimi favorita da un maggior numero di monomeri dall'altro.
Tuttavia, non ci sono prove dirette dell'esistenza passata di sistemi metabolici e genetici diversi da quelli che conosciamo oggi poiché rimane impossibile estrarre materiale genetico dalla maggior parte dei fossili . Il DNA non persiste per più di un milione di anni prima di essere scomposto in brevi frammenti. È stata proposta l'esistenza di un DNA più antico intatto, in particolare un batterio vitale estratto da un cristallo di sale vecchio 150 milioni di anni, ma queste pubblicazioni rimangono controverse.
Alcuni componenti del DNA - adenina , guanina e composti organici correlati - potrebbero essersi formati nello spazio . I costituenti del DNA e dell'RNA come l' uracile , la citosina e la timina sono stati ottenuti anche in laboratorio in condizioni che riproducono quelli incontrati nell'ambiente interplanetario e interstellare da composti più semplici come la pirimidina , che si trova nei meteoriti . La pirimidina, come alcuni idrocarburi policiclici aromatici (IPA), i composti di carbonio più ricchi rilevati nell'universo, potrebbe formarsi nelle stelle giganti rosse o nelle nuvole interstellari .
Sono stati sviluppati metodi per purificare il DNA da esseri viventi, come l' estrazione con fenolo-cloroformio , e manipolarlo in laboratorio, come gli enzimi di restrizione e la PCR . La biologia e la biochimica moderna fanno ampio uso di queste tecniche nella clonazione molecolare (in) . Il DNA ricombinante è una sequenza di DNA sintetico assemblato da altre sequenze di DNA. Tale DNA può trasformare organismi sotto forma di plasmidi o con l'aiuto di un vettore virale . Gli organismi geneticamente modificati (OGM) risultanti possono essere utilizzati per produrre, ad esempio , proteine ricombinanti, utilizzate nella ricerca medica o in agricoltura .
Il DNA estratto da sangue , sperma , saliva , un frammento di pelle o capelli prelevati da una scena del crimine può essere utilizzato in medicina legale per determinare l' impronta digitale del DNA di un sospetto. A tal fine, la sequenza di segmenti di DNA come sequenze di microsatelliti o minisatelliti viene confrontata con quella di individui scelti per l'occasione o già elencati in banche dati. Questo metodo è generalmente molto affidabile per identificare il DNA corrispondente a quello di un individuo sospetto. L'identificazione può, tuttavia, essere resa più complessa se la scena del crimine è contaminata dal DNA di più di una persona. L'identificazione del DNA è stata sviluppata nel 1984 dal genetista britannico Sir Alec Jeffreys ed è stata utilizzata per la prima volta nel 1987 per scambiare uno stupratore per un serial killer .
Nella misura in cui il DNA accumula nel tempo mutazioni trasmesse per eredità , contiene informazioni storiche che, analizzate dai genetisti confrontando sequenze di organismi con storie diverse, consentono di tracciare la storia dell'evoluzione di questi organismi, cioè , la loro filogenesi . Questa disciplina, mettendo la genetica al servizio della paleobiologia , offre un potente strumento di indagine nella biologia evolutiva . Confrontando le sequenze di DNA della stessa specie , i genetisti delle popolazioni possono studiare la storia di particolari popolazioni di esseri viventi, un campo che va dalla genetica ecologica all'antropologia . Pertanto, lo studio del DNA mitocondriale all'interno delle popolazioni umane viene utilizzato per tracciare le migrazioni di Homo sapiens . L' aplogruppo X è stato ad esempio studiato la paleodemografia per valutare la possibile parentela dei Paleo-Indiani con le popolazioni europee del Paleolitico superiore .
( fr ) Albero filogenetico che enfatizza le tre aree della vita: gli eucarioti sono rappresentati in rosso, gli archei in verde e i batteri in blu.
Mappa delle migrazioni umane dedotte da studi filogenetici del genoma mitocondriale umano .
La bioinformatica implica la manipolazione, la ricerca e l' esplorazione di dati biologici, che includono sequenze di DNA. Lo sviluppo di tecniche per l'archiviazione e la ricerca di sequenze di DNA ha portato a progressi del computer ampiamente utilizzati altrove, soprattutto per quanto riguarda gli algoritmi di ricerca di sottostringhe , l'apprendimento automatico e la teoria dei database . Gli algoritmi di ricerca delle stringhe di caratteri , che consentono di trovare una sequenza di lettere inclusa in una sequenza di lettere più lunghe, sono stati sviluppati per cercare specifiche sequenze di nucleotidi . La sequenza di DNA può essere allineata con altre sequenze di DNA al fine di identificare sequenze omologhe e individuare le mutazioni specifiche che le distinguono. Queste tecniche, compreso l' allineamento di più sequenze , vengono utilizzate per studiare le relazioni e le funzioni filogenetiche delle proteine .
I repository di dati che rappresentano la sequenza completa di un genoma, come quelli prodotti dal Progetto Genoma Umano , raggiungono dimensioni tali da essere difficili da utilizzare senza le annotazioni che identificano la posizione dei geni e degli elementi regolatori su ciascun cromosoma . Le regioni delle sequenze di DNA che hanno i motivi caratteristici associati ai geni che codificano per proteine funzionali o RNA possono essere identificate mediante algoritmi di predizione genica , che consentono ai ricercatori di prevedere la presenza di particolari prodotti genici e la loro possibile funzione nel corpo all'interno di un organismo anche prima che essi sono isolati sperimentalmente. È anche possibile confrontare interi genomi, il che può evidenziare la storia evolutiva di particolari organismi e consentire lo studio di eventi evolutivi complessi.
La nanotecnologia del DNA utilizza le proprietà uniche del DNA di riconoscimento molecolare (en) e più in generale degli acidi nucleici per creare complessi di DNA ramificati autoassemblati dotati di proprietà interessanti. Da questo punto di vista, il DNA viene utilizzato come materiale strutturale piuttosto che come vettore di informazioni biologiche. Ciò ha portato alla creazione di array periodici bidimensionali, siano essi assemblati in mattoni o mediante il processo di origami del DNA , o tridimensionali di forma poliedrica . Sono state anche prodotte nanomacchine e costruzioni di DNA mediante autoassemblaggio algoritmico . Tali strutture di DNA potrebbero essere utilizzate per organizzare la disposizione di altre molecole come nanoparticelle d'oro e molecole di streptavidina , una proteina che forma complessi molto resistenti con la biotina . La ricerca nell'elettronica molecolare basata sul DNA ha portato l'azienda Microsoft a sviluppare un linguaggio di programmazione chiamato DNA Strand Displacement (DSD) utilizzato in alcune forme di realizzazione di componenti nanoelettronici molecolari basati sul DNA.
Poiché il DNA viene utilizzato dagli esseri viventi per memorizzare le proprie informazioni genetiche , alcuni gruppi di ricerca lo stanno anche studiando come mezzo per memorizzare informazioni digitali allo stesso modo della memoria del computer . Gli acidi nucleici presenterebbero infatti il vantaggio di immagazzinare una densità di informazioni notevolmente superiore a quella dei media tradizionali - teoricamente più di dieci ordini di grandezza - con una durata di vita anche molto più alta.
È teoricamente possibile codificare due bit di dati per nucleotide , consentendo la capacità di memorizzazione che raggiunge 455 milioni di terabyte per grammo di DNA a filamento singolo che rimane leggibile per diversi millenni anche in condizioni di archiviazione non ideali e la tecnica di codifica fino a 215.000 terabyte per grammo di DNA è stato proposto nel 2017; In confronto, un DVD a doppio strato a doppia faccia contiene solo 17 gigabyte per una massa tipica di 16 g , ovvero 400 miliardi di volte in meno di capacità di archiviazione per unità di massa. Un team dell'Istituto europeo di bioinformatica è così riuscito nel 2012 a codificare 757.051 byte su 17.940.195 nucleotidi , che corrispondono a una densità di archiviazione di circa 2.200 terabyte per grammo di DNA. Da parte sua, un team svizzero ha pubblicato nel febbraio 2015 uno studio che dimostra la robustezza del DNA incapsulato nella silice come mezzo durevole per le informazioni.
Inoltre, altri team stanno lavorando sulla possibilità di memorizzare informazioni direttamente nelle cellule viventi, ad esempio per codificare contatori sul DNA di una cellula per determinare il numero di divisioni o differenziazioni , che potrebbero trovare applicazioni nella ricerca sul cancro e sull'invecchiamento .
Il DNA fu isolato per la prima volta nel 1869 dal biologo svizzero Friedrich Miescher come sostanza ricca di fosforo dal pus delle bende chirurgiche usate. Poiché questa sostanza è stata trovata nel nucleo delle cellule , Miescher l'ha chiamata nucleina . Nel 1878, il biochimico tedesco Albrecht Kossel isolò la componente non proteica di questa "nucleina" - gli acidi nucleici - quindi identificò le cinque basi nucleiche . Nel 1919, il biologo americano Phoebus Levene identificato i costituenti di nucleotidi , cioè la presenza di una base di un ose e un fosfato gruppo . Ha suggerito che il DNA fosse costituito da una catena di nucleotidi uniti dai loro gruppi fosfato. Pensava che le catene fossero corte e che le basi si susseguissero ripetutamente in un ordine fisso. Nel 1937, il fisico e biologo molecolare britannico William Astbury produsse il primo modello di diffrazione del DNA mediante cristallografia a raggi X , dimostrando che il DNA ha una struttura ordinata.
Nel 1927 , il biologo russo Nikolai Koltsov intuì che l' ereditarietà si basava su una "molecola ereditaria gigante" composta da "due fili speculari l'uno dell'altro che si sarebbero riprodotti in modo semi-conservatore usando ogni filo come modello". Tuttavia, credeva che queste fossero proteine che trasportavano informazioni genetiche. Nel 1928 il batteriologo inglese Frederick Griffith eseguì un famoso esperimento che ora porta il suo nome e con il quale dimostrò che i batteri viventi non virulenti messi a contatto con i batteri virulenti uccisi dal calore potevano essere trasformati in batteri virulenti. Questo esperimento ha aperto la strada per l'identificazione nel 1944 del DNA come vettore di informazione genetica attraverso l' esperimento di Avery, MacLeod e McCarty . Il biochimico belga Jean Brachet dimostrò nel 1946 che il DNA è un costituente dei cromosomi , e il ruolo del DNA nell'ereditarietà fu confermato nel 1952 dagli esperimenti di Hershey e Chase che dimostrarono che il materiale genetico del fago T2 è costituito da DNA.
La prima struttura antiparallela a doppia elica riconosciuta oggi come il modello corretto di DNA è stata pubblicata nel 1953 dal biochimico americano James Watson e dal biologo britannico Francis Crick in un articolo ormai classico sulla rivista Nature . Lavoravano sull'argomento dal 1951 al Cavendish Laboratory dell'Università di Cambridge , e mantennero come tale corrispondenza privata con il biochimico austriaco Erwin Chargaff , originariamente delle regole di Chargaff , pubblicato nella primavera del 1952, in base al quale, all'interno di una molecola di DNA , il livello di ciascuna delle basi puriniche è sostanzialmente uguale al livello di una delle due basi pirimidiniche , più precisamente il livello di guanina è uguale a quello della citosina e che il livello di adenina è uguale a quello della timina , che ha suggerito l'idea di un accoppiamento di adenina con timina e guanina con citosina.
Nel maggio 1952, lo studente britannico Raymond Gosling , che lavorava sotto Rosalind Franklin nel team di John Randall , scattò un'immagine di diffrazione di raggi X ( tavola 51 ) di un cristallo di DNA altamente idratato. Questa istantanea è stata condivisa con Crick e Watson all'insaputa di Franklin ed è stata determinante per stabilire la corretta struttura del DNA. Franklin aveva anche indicato ai due ricercatori che la struttura in fosforo della struttura doveva trovarsi al di fuori di essa, e non vicino all'asse centrale come si pensava allora. Aveva ulteriormente identificato l' ammasso spaziale di cristalli di DNA, che ha permesso a Crick di determinare che i due filamenti di DNA erano antiparalleli. Mentre Linus Pauling e Robert Corey hanno pubblicato un modello molecolare di un acido nucleico formato da tre catene intrecciate con, in linea con le idee del tempo, i gruppi fosfato vicino all'asse centrale e le basi nucleiche rivolte verso l'esterno, Crick e Watson hanno finalizzato a febbraio 1953 il loro modello antiparallelo a due catene con i gruppi fosfato all'esterno e le basi nucleiche all'interno della doppia elica, un modello oggi considerato la prima struttura di DNA corretta mai proposta.
Questo lavoro è stato pubblicato nel numero del 25 aprile 1953 della rivista Nature attraverso cinque articoli che descrivono la struttura messa a punto da Crick e Watson, nonché le prove a sostegno di questo risultato. Nel primo articolo, intitolato Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid , Crick e Watson affermano: "Non è sfuggito alla nostra attenzione che l'abbinamento specifico che abbiamo postulato suggerisce immediatamente un possibile meccanismo per la replicazione del materiale. Genetica ". Questo articolo è stato seguito da una pubblicazione del britannico Maurice Wilkins et al. indagare la diffrazione dei raggi X da B-DNA in vivo , che ha sostenuto l'esistenza della struttura a doppia elica nelle cellule viventi e non solo in vitro , e la prima pubblicazione del lavoro di Franklin e Goslin sui dati che avevano ottenuto dalla diffrazione dei raggi X e il proprio metodo di analisi.
Rosalind Franklin morì nel 1958 di cancro e quindi non riceve il Premio Nobel per la Fisiologia o la Medicina assegnato nel 1962 , "per le loro scoperte riguardanti la struttura molecolare degli acidi nucleici e la loro importanza per il trasferimento di informazioni genetiche nella materia vivente", a Francis Crick, James Watson e Maurice Wilkins, che non ebbero una parola per dare credito a Franklin con il suo lavoro; il fatto che non fosse associata a questo premio Nobel continua a essere dibattuto.
Nel 1957 , Crick pubblicò un articolo che plasmò quella che oggi è conosciuta come la teoria fondamentale della biologia molecolare descrivendo le relazioni tra DNA, RNA e proteine , articolate attorno all '"adattatore". La conferma della modalità di replicazione semi-conservativa della doppia elica arrivò nel 1958 con l' esperimento di Meselson e Stahl . Crick et al. hanno continuato il loro lavoro e hanno dimostrato che il codice genetico si basa su successive triplette di basi nucleiche chiamate codoni , che hanno permesso la decifrazione del codice genetico stesso da Robert W. Holley , Har Gobind Khorana e Marshall W. Nirenberg . Queste scoperte hanno segnato la nascita della biologia molecolare .
La struttura elicoidale del DNA ha ispirato diversi artisti, il più famoso è il pittore surrealista Salvador Dalí , che si è ispirato ad esso in nove dipinti tra il 1956 e il 1976 , tra cui Paysage de papillon (Il grande masturbatore in un paesaggio surrealista con DNA) (1957 -1958) e Galacidalacidesoxyribonucleicacid (1963).
“ Abbiamo recuperato 757.051 byte di informazioni da 337 pg di DNA, fornendo una densità di memorizzazione delle informazioni di 2,2 PB / g (= 757.051 / 337 × 10 −12 ) . Notiamo che questa densità di informazioni è sufficiente per archiviare il totale 2011 degli archivi elettronici dei record della US National Archives and Records Administration di ~ 100 TB in < 0,05 g di DNA, l'archivio di 2 PB di siti Web di Internet Archive Wayback Machines in ~ 1 g di DNA e il sistema 80 PB CASTOR del CERN per i dati LHC in ~ 35 g di DNA. "
" Ich habe mich daher später mit meinen Versuchen an die ganzen Kerne gehalten, die Trennung der Körper, die ich einstweilen ohne weiteres Präjudiz als lösliches und unlösliches Nuclein bezeichnen will, einem günstigeren Material überlassend. "
“Penso che la dimensione dei cromosomi nelle ghiandole salivari [della Drosophila ] sia determinata dalla moltiplicazione dei genonemi. Indico con questo termine il filo assiale del cromosoma, in cui i genetisti individuano la combinazione lineare dei geni; … Nel cromosoma normale di solito c'è un solo genonema; prima della divisione cellulare, questo genonema è diviso in due filoni. "
“ Butterfly Landscape (The Great Masturbator in Surreallist Landscape with DNA) mostra il punto di vista di Dalì. Sebbene questo fosse il primo, creato solo pochi anni dopo l'annuncio della doppia elica da parte di Watson e Crick, il DNA sarebbe apparso in molti dei lavori futuri di Dalì. Come agente della creazione, è forse facile capire perché le farfalle spuntano dalla struttura iconica di questo dipinto. Ma sembra anche che Dalì usasse il DNA per simboleggiare non solo la creazione, ma l'idea più grande di Dio, e questo potrebbe essere il motivo per cui parte della struttura molecolare sporge visibilmente dalle nuvole. "
“Salvador Dalì evoca il suo rapporto con la scienza, in particolare con il DNA, come fonte di ispirazione per il suo lavoro. Dà alla scienza una dimensione poetica e la devia per scopi plastici. Lo mette in scena e lo usa al servizio delle sue fantasie e del metodo “paranoico-critico”. "