Proteomica

La Proteomica è la scienza che studia il proteoma , cioè tutte le proteine in una cellula, un organello , un tessuto, un organo o un organismo ad un certo punto e in determinate condizioni.

In pratica, la proteomica tenta di identificare in modo globale le proteine estratte da una coltura cellulare, da un tessuto o da un fluido biologico, la loro posizione nei compartimenti cellulari, le loro possibili modificazioni post-traduzionali e la loro quantità.

Permette di quantificare le variazioni del loro livello di espressione in funzione del tempo, del loro ambiente, del loro stato di sviluppo, del loro stato fisiologico e patologico , della specie di origine. Studia anche le interazioni che le proteine hanno con altre proteine, con DNA o RNA o altre sostanze.

La proteomica funzionale studia le funzioni di ciascuna proteina.

La proteomica esamina anche la struttura delle proteine primarie , secondarie e terziarie .

Storia

Il termine proteomica è recente. È stato utilizzato per la prima volta in una pubblicazione scientifica nel 1997 da P. James. nel suo articolo Identificazione delle proteine nell'era post-genomica: la rapida ascesa della proteomica . Deriva da proteoma , termine coniato nel 1995 , per analogia con la genomica che a sua volta deriva dal termine genoma , l'insieme dei geni in un organismo. L'analisi proteomica è uno studio dinamico. Un singolo genoma può portare a differenti proteomi a seconda degli stadi del ciclo cellulare, del differenziamento, della risposta a differenti segnali biologici o fisici, dello stato fisiopatologico ... Il proteoma riflette le ripercussioni di questi eventi cellulari sia a livello traslazionale che post -translazionale. Da questo punto di vista, solo un'analisi diretta delle proteine può fornire un quadro globale dei sistemi biomolecolari nella loro complessità.

Gli scienziati erano interessati alle proteine molto prima della nascita della proteomica. Già nel 1833 , Anselme Payen e Jean-François Persoz isolati da un estratto di malto un enzima in grado di catalizzare la degradazione dell'amido in zucchero. nel 1965, André Lwoff , François Jacob e Jacques Monod hanno ricevuto il Premio Nobel per la fisiologia o la medicina "per le loro ricerche sul modo in cui la produzione di enzimi è regolata a livello di geni" , pubblicato nel 1961.

Molte tecniche, ancora ampiamente utilizzate, sono state sviluppate.

La tecnica dell'elettroforesi è stata sviluppata nel 1892 da SE Linder e H. Picton. Il principio della cromatografia risale al 1861 da Friedrich Goppelsröder .

// metto un affresco che mostra la cronologia dello studio delle proteine

Negli ultimi dieci anni, la proteomica è diventata una scienza a sé stante, con tecniche e metodi propri. La proteomica è stata premiata nel 2002 ottenendo un premio Nobel per la chimica

Ha preso in prestito molte tecnologie, precedentemente utilizzate in altre discipline, e le ha applicate allo studio delle proteine. Si può citare, ad esempio, l'uso della spettrometria di massa , derivata dall'analisi fisica e chimica , nell'identificazione di proteine , nella quantificazione dell'espressione proteica , nella localizzazione di peptidi in un tessuto, nella ricerca di specifiche biomarcatori di patologie .

Perché il proteoma?

Le proteine di grandi dimensioni hanno spesso una struttura spaziale complessa, in cui le subunità compatte sono collegate tra loro da catene flessibili che svolgono un ruolo nelle interazioni tra proteine o con altre sostanze. L'analisi strutturale a raggi X delle proteine mostra che sono costruite attorno a un reticolo cristallino rigido, che impedisce o riduce la flessibilità delle subunità.

La somma delle informazioni risultanti dall'analisi genomica non risponde a tutte le domande finalizzate all'analisi proteomica (difficile e costosa).
Gli eventi chiave porteranno dallo stock di informazioni che costituisce il genoma alla produzione di molecole che determineranno e regoleranno la vita cellulare, le proteine. In teoria, la sequenza di ciascun gene verrà trascritta (o meno) in un RNA messaggero (mRNA), a sua volta tradotto in una proteina. Infatti, i geni nelle cellule eucariotiche sono spesso frammentati e contengono regioni ( introni ) assenti dall'mRNA. La trascrizione parziale sarà consentita dallo splicing di un RNA precursore, una copia del gene, che può dare origine a diversi mRNA, ognuno dei quali può portare a più proteine. Possiamo quindi avanzare una serie di ragioni a favore dello sviluppo dell'analisi proteomica:

- Identificare e stimare i livelli di proteine è fondamentale per ottenere un quadro completo di molti processi biologici.
- Tuttavia, l'abbondanza di proteine all'interno della cellula non è regolata solo a livello trascrizionale, ma anche a livello traduzionale e post-traduzionale, in modo che non sia possibile stabilire una semplice relazione tra il livello di d. MRNA e la proteina. Il fatto che un singolo gene, e anche un singolo mRNA, possa portare a diverse proteine distinte dalla loro funzione (i) rende questa correlazione pericolosa.
- Infine, alcune proteine hanno una lunga durata, vale a dire che anche sintetizzate a bassa velocità possono accumularsi nella cellula pur rimanendo funzionali, mentre altre - con una breve durata - vengono rapidamente eliminate. Quindi, anche se la loro sintesi è veloce e finiranno a un ritmo basso.

Una proteina in base al suo stato cellulare (differenziazione, proliferazione, apoptosi ) si troverà in un dato compartimento ( citoplasma , nucleo, mitocondri ) o sarà secreta dalla cellula. Senza l'analisi del proteoma, una modifica della localizzazione della proteina necessaria per la sua attività biologica passerà inosservata.

La maggior parte delle proteine diventa biologicamente attiva solo dopo fasi di maturazione co- e post-traduzionale (come glicosilazione , fosforilazione , deaminazione, ecc.). Sono anche indicatori dello stato del macchinario cellulare.

Infine, le sfide ei risultati dei progetti di sequenziamento (del genoma umano in particolare) giustificano uno studio approfondito del proteoma. La " sorprendente " scoperta che questo genoma conteneva molti meno geni di quanto previsto dimostra l'importanza delle proteine come attori centrali nei processi biologici.

Diversi approcci alla proteomica

Le metodologie implementate per l'analisi del proteoma possono essere schematicamente separate in due grandi gruppi: nel primo si possono raggruppare i metodi sperimentali svolti nel "laboratorio reale" (laboratorio umido), basati principalmente sulle tecniche di separazione ed proteine d analisi. Un secondo gruppo di metodi, implementato nel “laboratorio virtuale” (laboratorio a secco), riguarda l'analisi delle immagini e la bioinformatica . I laboratori reali e virtuali vengono utilizzati durante le fasi principali dell'analisi.

In pratica, le proteine vengono prima estratte da una popolazione cellulare o da un tessuto, quindi separate prima di essere identificate.

Estrazione

Il primo passo è solitamente quello di estrarre le proteine da un campione biologico. Questo passaggio è fondamentale: un'estrazione impropria può produrre la degradazione delle proteine e rendere difficile o addirittura impossibile identificare le proteine. Le proteine di membrana aventi molti amminoacidi idrofobici e quindi scarsamente solubili, sono difficili da studiare.

Alcune tecniche non richiedono l'estrazione di proteine dal tessuto studiato. In immunolocalizzazione , il tessuto viene fissato e quindi tagliato in strisce sottili dello spessore di pochi micron. Le proteine vengono quindi rilevate in situ da anticorpi marcati. Nell'imaging in spettrometria di massa , le sezioni di tessuto vengono analizzate direttamente da uno spettrometro di massa di tipo MALDI-TOF .

Per semplificare l'analisi, l'estrazione viene spesso eseguita eliminando le modifiche post-traduzionali . Viene preservata solo la struttura primaria delle proteine, vale a dire le loro sequenze. Ma se l'oggetto dell'analisi è lo studio di queste modificazioni post-traduzionali , è necessario prendere le precauzioni necessarie per mantenerle.

Separazione

La seconda fase consente di separare le proteine in base alle loro caratteristiche fisiche o chimiche o in base alle loro affinità per un ligando.

L' elettroforesi separa le proteine in un gel di poliacrilammide in base al loro peso molecolare quando sottoposte a un campo elettrico. Il metodo di elettroforesi standard per la proteomica è l' elettroforesi bidimensionale .

La cromatografia utilizza la differenza di affinità della proteina tra una fase mobile e una fase stazionaria.

Principio di separazione delle proteine mediante elettroforesi bidimensionale

L' elettroforesi bidimensionale consente a miscele proteiche complesse di separare e visualizzare centinaia o addirittura migliaia di proteine come macchie o "macchie". La risoluzione ottenuta è sufficiente per dimostrare la presenza di isoforme.

Il suo principio consiste nell'eseguire inizialmente una separazione delle proteine in base alla loro carica ( focalizzazione isoelettrica ), seguita da una separazione ortogonale, in base al loro peso molecolare. La risoluzione della prima dimensione è dell'ordine di 0,01 unità di pH.

I gel ottenuti vengono quindi colorati e quindi digitalizzati. Il risultato è una semi-quantizzazione.

Ricerca di proteine di interesse mediante analisi di immagini

Oggi esistono due approcci principali a partire dall'analisi dell'immagine di gel 2-DE che consentono di avvicinarsi alla proteomica quantitativa. Uno di questi metodi utilizza un confronto statistico tra diversi gel e l'altro utilizza un metodo chimico di derivazione di proteine mediante sonde fluorescenti che consente l'analisi combinata di più campioni su un unico gel. A tale scopo, in entrambi i casi viene utilizzato un software di imaging. Infatti, è impossibile apprendere individualmente il numero considerevole di macchie (a volte fino a 2000) risolte su un gel 2D (Fig. 5). Questi punti multipli corrispondono alle isoforme delle proteine separate in due dimensioni. La posizione sul gel delle macchie polipeptidiche è riproducibile nei sistemi di separazione a gradiente di Immobilin. Un cambiamento di posizione è quindi un indicatore di una modifica post-traduzionale che influisce sul suo carico e / o dimensione.

L'analisi dell'immagine si basa sulla digitalizzazione dell'immagine del gel 2-DE dopo la colorazione. Durante questa fase il software taglia l'immagine in pixel (contrazione dell'elemento dell'immagine) per la trasmissione e l'archiviazione dei dati. Ogni pixel dell'immagine viene registrato in una posizione xey associata a un valore di densità ottica (OD) proporzionale all'intensità del segnale registrato dalla fotocamera o dallo scanner. Affinché la DO sia un buon parametro di misurazione e un riflesso dell'espressione della proteina, la colorazione applicata deve avere un ampio intervallo dinamico e, se possibile, lineare. In un gel, in termini di OD, il rapporto di intensità tra il punto più piccolo rilevabile e il punto più grande è dell'ordine di 104 mentre la dinamica di espressione delle proteine nella cellula è compresa tra 105 e 106 Vi è quindi un deficit significativo nella intervallo analitico che deve essere preso in considerazione durante l'analisi.

La colorazione delle proteine nel gel 2-DE si basa principalmente sull'utilizzo di coloranti organici come il blu di Coomassie , metalli come il nitrato d'argento, oppure mediante sonde fluorescenti. L'intervallo di rilevamento varia di un fattore di circa 10.000 tra i metodi che utilizzano il blu di Coomassie (rilevamento di macchie contenenti una quantità di proteine dell'ordine di µg) e quelli che utilizzano nitrato d'argento che consentono di ottenere 0,1 ng. I coloranti fluorescenti sono meno sensibili del nitrato d'argento, tuttavia hanno una maggiore riproducibilità e gamma dinamica.

L'attuale software di analisi delle immagini incorpora elementi di visualizzazione 3D dei punti di gel, consentendo modifiche negli angoli x, yez che sono estremamente utili per separare i punti vicini. La quantificazione è così migliorata. L'utilizzo di tali strumenti consente di ampliare notevolmente il collo di bottiglia associato all'analisi dei gel. Tuttavia, un'analisi differenziale affidabile richiede un confronto tra serie di almeno tre o quattro gel. Test statistici come l'analisi euristica o l'analisi delle corrispondenze consentono oggettivamente di determinare la dispersione tra i gel di diverse serie sperimentali.

La moltiplicazione di gel 2D necessaria per ottenere una quantificazione differenziale statisticamente affidabile è tuttavia un handicap per analisi ad alto rendimento per le quali la tecnica del gel singolo è interessante. Analisi differenziale su un singolo gel: (la tecnologia DIGE per il differenziale nell'elettroforesi su gel) è stata introdotta sul mercato da GE (ex) Amersham Biosciences. Il principio si basa sull'etichettatura covalente mediante cianine fluorescenti (es. Cy2, Cy3 e Cy5) delle proteine contenute in due estratti da analizzare. Sono disponibili tre strutture con diversi spettri di fluorescenza. Hanno anche un gruppo estere N-idrossi-succinimidilico che consente, mediante una reazione di sostituzione nucleofila con il gruppo amminico in epsilon delle lisine delle proteine, di formare un'ammide. L'analisi delle immagini di un gel DIGE è più semplice poiché i due campioni sono migrati sullo stesso gel. Le immagini acquisite alle due lunghezze d'onda vengono sovrapposte e confrontate quantitativamente mediante apposito software con l'aggiunta di un riferimento interno. Lo studio comparativo a due colori ha mostrato la dimostrazione di proteine che differiscono o che sono identiche nei due campioni. La possibilità di avere uno standard interno aumenta l'affidabilità delle misurazioni quantitative. Qualunque sia il metodo di analisi utilizzato, gli spot di interesse una volta rilevati vengono asportati dal gel per poter essere identificati con metodi spettrometrici (spettrometria di massa in modalità MALDI-TOF o in modalità tandem MS / MS). Oltre all'analisi differenziale, l'analisi delle immagini consente di costruire e annotare mappe di riferimento che servono da base per database consultabili sul WEB.

Identifica, caratterizza e quantifica le proteine

La massa effettiva delle proteine viene spesso misurata mediante spettrometria di massa , con un'accuratezza che va da 0,1 dalton a 10 dalton; La digestione di una proteina da parte di un enzima come la tripsina produce frammenti di dimensioni specifiche. La massa dei frammenti viene quindi misurata mediante spettrometria di massa (tecnica del fingerprinting ).
Con la tecnica della spettrometria di massa tandem e il sequenziamento di Edman , è possibile sequenziare i peptidi. Ma questi metodi considerano le proteine come strutture fisse, mentre sono in movimento, e che a volte possono associarsi brevemente a sostanze reattive legandosi ad esse, prima di separarsi da esse.
Un nuovo metodo fornisce migliori informazioni sulla struttura spaziale delle proteine, studiandole in soluzione e combinando metodi noti, inclusa la classica analisi a raggi X o NMR, con la spettroscopia NMR associata a un nuovo software di analisi che fornisce l'accesso a dettagli atomici fini del struttura spaziale. I gruppi nitroxilici con un elettrone spaiato vengono introdotti nella proteina stessa. Questi vengono utilizzati per misurare le differenze tra le subunità e quindi per dedurre la struttura tridimensionale della proteina o di più proteine associate (complessi proteici, anche di grandi dimensioni). Ciò consente di studiare meglio il legame delle proteine con i loro partner e di dedurre alcuni complessi meccanismi di regolazione biologica.

Identificazione mediante spettrometria di massa (MS)

L'identificazione mediante SM si basa su una misurazione accurata della massa dei peptidi ionizzati. In generale, le proteine vengono digerite da un'endopeptidasi (il più delle volte tripsina) e quindi analizzate da SM.

Uno degli approcci utilizzati è la creazione di mappe peptidiche di massa (in inglese, peptide mass fingerprinting , francese peptide mass fingerprint (in) o peptide mass fingerprint). La massa dei peptidi ottenuta dopo la digestione con proteasi viene confrontata con le mappe di massa teoriche delle proteine elencate nei database. Sono stati sviluppati diversi algoritmi per facilitare questa ricerca. Il software di analisi dei dati MS cercherà una serie di proteine (secondo criteri definiti dallo sperimentatore) in un database di sequenze e genererà per ciascuna uno spettro teorico per vedere quale è più vicina allo spettro sperimentale.
Secondo logiche differenti per ogni algoritmo, stabiliranno un punteggio per ogni sequenza analizzata " in silico " che porterà ad una classifica delle proteine candidate. Tuttavia, questo approccio soffre di limitazioni oggettive e, in caso di identificazioni difficili, diversi software forniranno elenchi di diverse proteine candidate. Ad esempio, un software che tenga conto del numero di masse comuni tra lo spettro teorico della proteina candidata e lo spettro sperimentale favorirà proteine ad alta massa molecolare per le quali è possibile dedurre dalla sequenza un numero maggiore di peptidi virtuali.

Il problema viene aggirato sequenziando parzialmente le proteine mediante spettrometria di massa tandem (MS / MS). Alcuni frammenti peptidici analizzati durante un primo MS vengono quindi scelti e frammentati. I picchi di massa ottenuti costituiscono una rappresentazione della sequenza proteica, in cui due picchi adiacenti differiscono per la massa di un amminoacido persa durante la frammentazione del peptide analizzato. È quindi possibile cercare nei database un'analogia con la sequenza proteica breve. Se queste sequenze sono comuni a un gruppo di proteine, il punto isoelettrico e la massa apparente determinata durante la separazione per elettroforesi permettono di decidere. Il controllo incrociato delle informazioni (brevi sequenze di pochi amminoacidi, posizione di una finestra comprendente lo spot nell'elettroforesi 2D, le specie animali e il tipo di cellula da cui proviene il campione) aumenta l'affidabilità dell'identificazione di un polipeptide.

Invece di determinare semplicemente una sequenza peptidica dallo spettro di massa di un peptide e usarla per estrarre un database di proteine o DNA, lo spettro MS / MS può essere paragonato a una serie di spettri MS. / MS virtuale derivato da sequenze proteiche da database . In base allo stesso principio, è possibile prima separare i peptidi risultanti dalla digestione triptica mediante un nano-metodo di cromatografia liquida (nanoLC) ed eseguire una MS / MS su questi diversi peptidi. La moltiplicazione delle informazioni su diversi segmenti della proteina consentirà quindi non solo di consolidare l'identificazione, ma anche di ottenere informazioni strutturali in particolare sulle modificazioni post-traduzionali, come l'aggiunta di gruppi fosfato (fosforilazione) o di catene oligosaccaridiche (glicosilazione). Da un punto di vista funzionale, questa informazione è fondamentale. Le fosforilazioni sono alla base della conduzione dei segnali nella cellula, dall'esterno attraverso i suoi recettori di membrana al nucleo dove sono centralizzate le informazioni che regolano la vita cellulare. Per quanto riguarda le catene oligosaccaridiche, svolgono un ruolo cruciale nel modulare le proprietà chimiche di alcune proteine (glicoproteine) e talvolta ne regolano l'attività biologica. Per identificare questi gruppi, MS utilizzerà i frammenti risultanti dalla loro separazione dalla catena peptidica o dalla loro stessa frammentazione.

Interrogazione di database

Questo è l'ultimo passo per il proteomicista, reso possibile dai progressi della bioinformatica .
Le varie informazioni raccolte sulle proteine (massa apparente, massa reale, punto isoelettrico, dimensione dei frammenti dopo digestione enzimatica, sequenze parziali) vengono confrontate con database genomici o proteomici online. Il software fornisce quindi un elenco di proteine e le loro probabilità associate.

Casi di organismi il cui genoma non è stato ancora sequenziato;
Solo alcuni organismi, noti come " organismi modello ", hanno un genoma completamente sequenziato e sono disponibili online. gli altri organismi sono studiati per omologia con gli organismi conosciuti.

Quantificazione dell'espressione proteica

Permette di quantificare le variazioni dei loro livelli di espressione in funzione del tempo, dei loro ambienti, dei loro stati di sviluppo, dei loro stati fisiologici e patologici e delle specie di origine.

Le tecniche più comunemente utilizzate sono:

Interazioni proteiche

Studia anche le interazioni che le proteine hanno con altre proteine, con DNA o RNA, con sostanze.

Un altro modo per esaminare le interazioni proteiche è fare un doppio ibrido . Selezionando una libreria di cDNA con la sua proteina come esca, tutti gli interrattanti possono essere rilevati in uno specifico organismo o tessuto (animale o pianta). Se usata correttamente, questa tecnica è molto efficace. La qualità dei risultati dipende spesso dalla qualità della libreria e dall'efficienza della trasformazione del lievito o dei batteri.

Proteomica funzionale

La proteomica funzionale studia le funzioni di ciascuna proteina.

Proteomica strutturale

La proteomica studia infine le strutture primarie , secondarie e terziarie delle proteine.

Problemi di proteomica

Ricerca sui biomarcatori

Nuovi strumenti terapeutici

Studi comparativi sui cinomi delle cellule tumorali consentono di studiare i meccanismi di resistenza e identificare nuovi bersagli terapeutici.

Note e riferimenti

P. James , " Identificazione delle proteine nell'era post-genoma: la rapida ascesa della proteomica. ", Revisioni trimestrali di biofisica , vol. 30, n o 4,1997, p. 279–331
Il Premio Nobel per la fisiologia o la medicina nel 1965 .
" Premio Nobel per la chimica 2002: proteomica premiata " , un articolo CultureSciences-Chimie - Ecole Normale Supérieure / DGESCO
Simon B, Madl T, Mackereth CD, Nilges M e Sattler M. (2010); Un protocollo efficiente per la determinazione della struttura basata su NMR di complessi proteici in soluzione ; Angew. Chem. Int. Ed. Engl. in corso di stampa, in linea DOI: 10.1002 / anie.200906147 sintesi in inglese
Comunicato stampa della Technische Universität München , 2010/09/19, ripreso da BE Germany numero 472 (24/02/2010) - Ambasciata di Francia in Germania / ADIT
Governo del Canada, "Peptide Mass Fingerprinting", su TERMIUM Plus (pagina consultata il 23 giugno 2017).

Vedi anche

Bibliografia

Greg Gibson , Spencer V. Muse , Sommario della genomica , Edizioni della De Boeck University , 2004, ( ISBN 2804143341 ) .
Reiner Westermeier , Tom Naven , Proteomics in practice , Wiley-VCH , 2002, ( ISBN 3527303545 ) .
Thierry Rabilloud , Ricerca sul proteoma : elettroforesi su gel bidimensionale e metodi di identificazione , Springer Verlag Berlin Heidelberg , 2000, ( ISBN 3540657924 )
Marc R. Wilkins , Keith L. Williams , Ron D. Appel , Denis F. Hochstrasser , Proteome research: New frontiers in functional genomics , Springer Verlag Berlin Heidelberg , 1997, ( ISBN 3540627537 ) .

link esterno

Congresso della Società francese di elettroforesi e analisi proteomica , borse di studio, elettroforo
Society of BioChromatography and Nanoseparations Incontri scientifici, informazioni. È particolarmente interessato alla separazione di peptidi e proteine mediante cromatografia o mediante micro e nano metodi
Sito web del master in proteomica di Lille Notizie scientifiche, date delle conferenze, presentazione del master.
Lo stato dell'arte nell'analisi di immagini di elettroforesi su gel bidimensionale