La Proteomica è la scienza che studia il proteoma , cioè tutte le proteine in una cellula, un organello , un tessuto, un organo o un organismo ad un certo punto e in determinate condizioni.
In pratica, la proteomica tenta di identificare in modo globale le proteine estratte da una coltura cellulare, da un tessuto o da un fluido biologico, la loro posizione nei compartimenti cellulari, le loro possibili modificazioni post-traduzionali e la loro quantità.
Permette di quantificare le variazioni del loro livello di espressione in funzione del tempo, del loro ambiente, del loro stato di sviluppo, del loro stato fisiologico e patologico , della specie di origine. Studia anche le interazioni che le proteine hanno con altre proteine, con DNA o RNA o altre sostanze.
La proteomica funzionale studia le funzioni di ciascuna proteina.
La proteomica esamina anche la struttura delle proteine primarie , secondarie e terziarie .
Il termine proteomica è recente. È stato utilizzato per la prima volta in una pubblicazione scientifica nel 1997 da P. James. nel suo articolo Identificazione delle proteine nell'era post-genomica: la rapida ascesa della proteomica . Deriva da proteoma , termine coniato nel 1995 , per analogia con la genomica che a sua volta deriva dal termine genoma , l'insieme dei geni in un organismo. L'analisi proteomica è uno studio dinamico. Un singolo genoma può portare a differenti proteomi a seconda degli stadi del ciclo cellulare, del differenziamento, della risposta a differenti segnali biologici o fisici, dello stato fisiopatologico ... Il proteoma riflette le ripercussioni di questi eventi cellulari sia a livello traslazionale che post -translazionale. Da questo punto di vista, solo un'analisi diretta delle proteine può fornire un quadro globale dei sistemi biomolecolari nella loro complessità.
Gli scienziati erano interessati alle proteine molto prima della nascita della proteomica. Già nel 1833 , Anselme Payen e Jean-François Persoz isolati da un estratto di malto un enzima in grado di catalizzare la degradazione dell'amido in zucchero. nel 1965, André Lwoff , François Jacob e Jacques Monod hanno ricevuto il Premio Nobel per la fisiologia o la medicina "per le loro ricerche sul modo in cui la produzione di enzimi è regolata a livello di geni" , pubblicato nel 1961.
Molte tecniche, ancora ampiamente utilizzate, sono state sviluppate.
La tecnica dell'elettroforesi è stata sviluppata nel 1892 da SE Linder e H. Picton. Il principio della cromatografia risale al 1861 da Friedrich Goppelsröder .
// metto un affresco che mostra la cronologia dello studio delle proteine
Negli ultimi dieci anni, la proteomica è diventata una scienza a sé stante, con tecniche e metodi propri. La proteomica è stata premiata nel 2002 ottenendo un premio Nobel per la chimica
Ha preso in prestito molte tecnologie, precedentemente utilizzate in altre discipline, e le ha applicate allo studio delle proteine. Si può citare, ad esempio, l'uso della spettrometria di massa , derivata dall'analisi fisica e chimica , nell'identificazione di proteine , nella quantificazione dell'espressione proteica , nella localizzazione di peptidi in un tessuto, nella ricerca di specifiche biomarcatori di patologie .
Infine, le sfide ei risultati dei progetti di sequenziamento (del genoma umano in particolare) giustificano uno studio approfondito del proteoma. La " sorprendente " scoperta che questo genoma conteneva molti meno geni di quanto previsto dimostra l'importanza delle proteine come attori centrali nei processi biologici.
Le metodologie implementate per l'analisi del proteoma possono essere schematicamente separate in due grandi gruppi: nel primo si possono raggruppare i metodi sperimentali svolti nel "laboratorio reale" (laboratorio umido), basati principalmente sulle tecniche di separazione ed proteine d analisi. Un secondo gruppo di metodi, implementato nel “laboratorio virtuale” (laboratorio a secco), riguarda l'analisi delle immagini e la bioinformatica . I laboratori reali e virtuali vengono utilizzati durante le fasi principali dell'analisi.
In pratica, le proteine vengono prima estratte da una popolazione cellulare o da un tessuto, quindi separate prima di essere identificate.
Il primo passo è solitamente quello di estrarre le proteine da un campione biologico. Questo passaggio è fondamentale: un'estrazione impropria può produrre la degradazione delle proteine e rendere difficile o addirittura impossibile identificare le proteine. Le proteine di membrana aventi molti amminoacidi idrofobici e quindi scarsamente solubili, sono difficili da studiare.
Alcune tecniche non richiedono l'estrazione di proteine dal tessuto studiato. In immunolocalizzazione , il tessuto viene fissato e quindi tagliato in strisce sottili dello spessore di pochi micron. Le proteine vengono quindi rilevate in situ da anticorpi marcati. Nell'imaging in spettrometria di massa , le sezioni di tessuto vengono analizzate direttamente da uno spettrometro di massa di tipo MALDI-TOF .
Per semplificare l'analisi, l'estrazione viene spesso eseguita eliminando le modifiche post-traduzionali . Viene preservata solo la struttura primaria delle proteine, vale a dire le loro sequenze. Ma se l'oggetto dell'analisi è lo studio di queste modificazioni post-traduzionali , è necessario prendere le precauzioni necessarie per mantenerle.
La seconda fase consente di separare le proteine in base alle loro caratteristiche fisiche o chimiche o in base alle loro affinità per un ligando.
L' elettroforesi separa le proteine in un gel di poliacrilammide in base al loro peso molecolare quando sottoposte a un campo elettrico. Il metodo di elettroforesi standard per la proteomica è l' elettroforesi bidimensionale .
La cromatografia utilizza la differenza di affinità della proteina tra una fase mobile e una fase stazionaria.
Principio di separazione delle proteine mediante elettroforesi bidimensionaleL' elettroforesi bidimensionale consente a miscele proteiche complesse di separare e visualizzare centinaia o addirittura migliaia di proteine come macchie o "macchie". La risoluzione ottenuta è sufficiente per dimostrare la presenza di isoforme.
Il suo principio consiste nell'eseguire inizialmente una separazione delle proteine in base alla loro carica ( focalizzazione isoelettrica ), seguita da una separazione ortogonale, in base al loro peso molecolare. La risoluzione della prima dimensione è dell'ordine di 0,01 unità di pH.
I gel ottenuti vengono quindi colorati e quindi digitalizzati. Il risultato è una semi-quantizzazione.
Ricerca di proteine di interesse mediante analisi di immaginiOggi esistono due approcci principali a partire dall'analisi dell'immagine di gel 2-DE che consentono di avvicinarsi alla proteomica quantitativa. Uno di questi metodi utilizza un confronto statistico tra diversi gel e l'altro utilizza un metodo chimico di derivazione di proteine mediante sonde fluorescenti che consente l'analisi combinata di più campioni su un unico gel. A tale scopo, in entrambi i casi viene utilizzato un software di imaging. Infatti, è impossibile apprendere individualmente il numero considerevole di macchie (a volte fino a 2000) risolte su un gel 2D (Fig. 5). Questi punti multipli corrispondono alle isoforme delle proteine separate in due dimensioni. La posizione sul gel delle macchie polipeptidiche è riproducibile nei sistemi di separazione a gradiente di Immobilin. Un cambiamento di posizione è quindi un indicatore di una modifica post-traduzionale che influisce sul suo carico e / o dimensione.
L'analisi dell'immagine si basa sulla digitalizzazione dell'immagine del gel 2-DE dopo la colorazione. Durante questa fase il software taglia l'immagine in pixel (contrazione dell'elemento dell'immagine) per la trasmissione e l'archiviazione dei dati. Ogni pixel dell'immagine viene registrato in una posizione xey associata a un valore di densità ottica (OD) proporzionale all'intensità del segnale registrato dalla fotocamera o dallo scanner. Affinché la DO sia un buon parametro di misurazione e un riflesso dell'espressione della proteina, la colorazione applicata deve avere un ampio intervallo dinamico e, se possibile, lineare. In un gel, in termini di OD, il rapporto di intensità tra il punto più piccolo rilevabile e il punto più grande è dell'ordine di 104 mentre la dinamica di espressione delle proteine nella cellula è compresa tra 105 e 106 Vi è quindi un deficit significativo nella intervallo analitico che deve essere preso in considerazione durante l'analisi.
La colorazione delle proteine nel gel 2-DE si basa principalmente sull'utilizzo di coloranti organici come il blu di Coomassie , metalli come il nitrato d'argento, oppure mediante sonde fluorescenti. L'intervallo di rilevamento varia di un fattore di circa 10.000 tra i metodi che utilizzano il blu di Coomassie (rilevamento di macchie contenenti una quantità di proteine dell'ordine di µg) e quelli che utilizzano nitrato d'argento che consentono di ottenere 0,1 ng. I coloranti fluorescenti sono meno sensibili del nitrato d'argento, tuttavia hanno una maggiore riproducibilità e gamma dinamica.
L'attuale software di analisi delle immagini incorpora elementi di visualizzazione 3D dei punti di gel, consentendo modifiche negli angoli x, yez che sono estremamente utili per separare i punti vicini. La quantificazione è così migliorata. L'utilizzo di tali strumenti consente di ampliare notevolmente il collo di bottiglia associato all'analisi dei gel. Tuttavia, un'analisi differenziale affidabile richiede un confronto tra serie di almeno tre o quattro gel. Test statistici come l'analisi euristica o l'analisi delle corrispondenze consentono oggettivamente di determinare la dispersione tra i gel di diverse serie sperimentali.
La moltiplicazione di gel 2D necessaria per ottenere una quantificazione differenziale statisticamente affidabile è tuttavia un handicap per analisi ad alto rendimento per le quali la tecnica del gel singolo è interessante. Analisi differenziale su un singolo gel: (la tecnologia DIGE per il differenziale nell'elettroforesi su gel) è stata introdotta sul mercato da GE (ex) Amersham Biosciences. Il principio si basa sull'etichettatura covalente mediante cianine fluorescenti (es. Cy2, Cy3 e Cy5) delle proteine contenute in due estratti da analizzare. Sono disponibili tre strutture con diversi spettri di fluorescenza. Hanno anche un gruppo estere N-idrossi-succinimidilico che consente, mediante una reazione di sostituzione nucleofila con il gruppo amminico in epsilon delle lisine delle proteine, di formare un'ammide. L'analisi delle immagini di un gel DIGE è più semplice poiché i due campioni sono migrati sullo stesso gel. Le immagini acquisite alle due lunghezze d'onda vengono sovrapposte e confrontate quantitativamente mediante apposito software con l'aggiunta di un riferimento interno. Lo studio comparativo a due colori ha mostrato la dimostrazione di proteine che differiscono o che sono identiche nei due campioni. La possibilità di avere uno standard interno aumenta l'affidabilità delle misurazioni quantitative. Qualunque sia il metodo di analisi utilizzato, gli spot di interesse una volta rilevati vengono asportati dal gel per poter essere identificati con metodi spettrometrici (spettrometria di massa in modalità MALDI-TOF o in modalità tandem MS / MS). Oltre all'analisi differenziale, l'analisi delle immagini consente di costruire e annotare mappe di riferimento che servono da base per database consultabili sul WEB.
L'identificazione mediante SM si basa su una misurazione accurata della massa dei peptidi ionizzati. In generale, le proteine vengono digerite da un'endopeptidasi (il più delle volte tripsina) e quindi analizzate da SM.
Uno degli approcci utilizzati è la creazione di mappe peptidiche di massa (in inglese, peptide mass fingerprinting , francese peptide mass fingerprint (in) o peptide mass fingerprint). La massa dei peptidi ottenuta dopo la digestione con proteasi viene confrontata con le mappe di massa teoriche delle proteine elencate nei database. Sono stati sviluppati diversi algoritmi per facilitare questa ricerca. Il software di analisi dei dati MS cercherà una serie di proteine (secondo criteri definiti dallo sperimentatore) in un database di sequenze e genererà per ciascuna uno spettro teorico per vedere quale è più vicina allo spettro sperimentale.
Secondo logiche differenti per ogni algoritmo, stabiliranno un punteggio per ogni sequenza analizzata " in silico " che porterà ad una classifica delle proteine candidate. Tuttavia, questo approccio soffre di limitazioni oggettive e, in caso di identificazioni difficili, diversi software forniranno elenchi di diverse proteine candidate. Ad esempio, un software che tenga conto del numero di masse comuni tra lo spettro teorico della proteina candidata e lo spettro sperimentale favorirà proteine ad alta massa molecolare per le quali è possibile dedurre dalla sequenza un numero maggiore di peptidi virtuali.
Il problema viene aggirato sequenziando parzialmente le proteine mediante spettrometria di massa tandem (MS / MS). Alcuni frammenti peptidici analizzati durante un primo MS vengono quindi scelti e frammentati. I picchi di massa ottenuti costituiscono una rappresentazione della sequenza proteica, in cui due picchi adiacenti differiscono per la massa di un amminoacido persa durante la frammentazione del peptide analizzato. È quindi possibile cercare nei database un'analogia con la sequenza proteica breve. Se queste sequenze sono comuni a un gruppo di proteine, il punto isoelettrico e la massa apparente determinata durante la separazione per elettroforesi permettono di decidere. Il controllo incrociato delle informazioni (brevi sequenze di pochi amminoacidi, posizione di una finestra comprendente lo spot nell'elettroforesi 2D, le specie animali e il tipo di cellula da cui proviene il campione) aumenta l'affidabilità dell'identificazione di un polipeptide.
Invece di determinare semplicemente una sequenza peptidica dallo spettro di massa di un peptide e usarla per estrarre un database di proteine o DNA, lo spettro MS / MS può essere paragonato a una serie di spettri MS. / MS virtuale derivato da sequenze proteiche da database . In base allo stesso principio, è possibile prima separare i peptidi risultanti dalla digestione triptica mediante un nano-metodo di cromatografia liquida (nanoLC) ed eseguire una MS / MS su questi diversi peptidi. La moltiplicazione delle informazioni su diversi segmenti della proteina consentirà quindi non solo di consolidare l'identificazione, ma anche di ottenere informazioni strutturali in particolare sulle modificazioni post-traduzionali, come l'aggiunta di gruppi fosfato (fosforilazione) o di catene oligosaccaridiche (glicosilazione). Da un punto di vista funzionale, questa informazione è fondamentale. Le fosforilazioni sono alla base della conduzione dei segnali nella cellula, dall'esterno attraverso i suoi recettori di membrana al nucleo dove sono centralizzate le informazioni che regolano la vita cellulare. Per quanto riguarda le catene oligosaccaridiche, svolgono un ruolo cruciale nel modulare le proprietà chimiche di alcune proteine (glicoproteine) e talvolta ne regolano l'attività biologica. Per identificare questi gruppi, MS utilizzerà i frammenti risultanti dalla loro separazione dalla catena peptidica o dalla loro stessa frammentazione.
Interrogazione di databaseQuesto è l'ultimo passo per il proteomicista, reso possibile dai progressi della bioinformatica .
Le varie informazioni raccolte sulle proteine (massa apparente, massa reale, punto isoelettrico, dimensione dei frammenti dopo digestione enzimatica, sequenze parziali) vengono confrontate con database genomici o proteomici online. Il software fornisce quindi un elenco di proteine e le loro probabilità associate.
Casi di organismi il cui genoma non è stato ancora sequenziato;
Solo alcuni organismi, noti come " organismi modello ", hanno un genoma completamente sequenziato e sono disponibili online. gli altri organismi sono studiati per omologia con gli organismi conosciuti.
Permette di quantificare le variazioni dei loro livelli di espressione in funzione del tempo, dei loro ambienti, dei loro stati di sviluppo, dei loro stati fisiologici e patologici e delle specie di origine.
Le tecniche più comunemente utilizzate sono:
Studia anche le interazioni che le proteine hanno con altre proteine, con DNA o RNA, con sostanze.
Un altro modo per esaminare le interazioni proteiche è fare un doppio ibrido . Selezionando una libreria di cDNA con la sua proteina come esca, tutti gli interrattanti possono essere rilevati in uno specifico organismo o tessuto (animale o pianta). Se usata correttamente, questa tecnica è molto efficace. La qualità dei risultati dipende spesso dalla qualità della libreria e dall'efficienza della trasformazione del lievito o dei batteri.
La proteomica funzionale studia le funzioni di ciascuna proteina.
La proteomica studia infine le strutture primarie , secondarie e terziarie delle proteine.
Studi comparativi sui cinomi delle cellule tumorali consentono di studiare i meccanismi di resistenza e identificare nuovi bersagli terapeutici.