Memoria virtuale

Nell'informatica, il meccanismo della memoria virtuale è stato sviluppato negli anni '60 . Si basa sull'utilizzo della traduzione al volo degli indirizzi (virtuali) visti dal software, in indirizzi fisici nella RAM . La memoria virtuale consente:

utilizzare la memoria di massa come estensione della memoria ad accesso casuale ;
aumentare il tasso di multiprogrammazione ;
mettere in atto meccanismi di protezione della memoria ;
condividere la memoria tra i processi .

Storico

L'articolo del 1962 di James Kilburn descrive il primo computer con un sistema di gestione della memoria virtuale a pagine che utilizza un tamburo come estensione della memoria del nucleo di ferrite : l' Atlas .

Oggi tutti i computer dispongono di un meccanismo di gestione della memoria virtuale, ad eccezione di alcuni supercomputer o sistemi di bordo in tempo reale.

Memoria virtuale impaginata

Il principio è il seguente:

Gli indirizzi di memoria inviati dal processore sono indirizzi virtuali, che indicano la posizione di una parola nella memoria virtuale.
Questa memoria virtuale è composta da aree della stessa dimensione, chiamate pagine . Un indirizzo virtuale è quindi una coppia (numero di pagina, movimento nella pagina). La dimensione delle pagine è una potenza intera di due, in modo da determinare senza calcolo lo spostamento (10 bit meno significativi dell'indirizzo virtuale per pagine di 1.024 parole), e il numero di pagina (gli altri bit).
La RAM è composta anche dalle stesse aree di dimensione, chiamate frame ( frame in inglese), in cui si svolgono le pagine (un frame contiene una pagina: un frame size = dimensione di una pagina). La dimensione del set di frame RAM utilizzato da un processo è chiamata Resident set size .
Un meccanismo di traduzione ( traduzione o generazione di indirizzo) prevede la traduzione di indirizzi virtuali in indirizzi fisici, consultando una tabella delle pagine ( tabella delle pagine in inglese) per trovare il numero di frame che contiene la pagina desiderata. L'indirizzo fisico ottenuto è la coppia (numero di frame, spostamento).
Possono esserci più pagine che frame (questo è il punto): le pagine che non sono in memoria vengono archiviate su un altro supporto (disco), verranno riportate in un frame quando necessario.

La tabella delle pagine è indicizzata dal numero di pagina. Ogni riga è chiamata "voce nella tabella delle pagine " (voce nella tabella delle pagine , abbreviato PTE) e contiene il numero del frame. Poiché la tabella delle pagine può essere posizionata ovunque nella memoria, un registro speciale (PTBR per registro di base della tabella delle pagine ) mantiene il suo indirizzo.

In pratica, il meccanismo di traduzione fa parte di un circuito elettronico denominato MMU ( memory management unit ) che contiene anche parte della tabella delle pagine, immagazzinata in una memoria associativa formata da registri veloci. Ciò evita di dover consultare la tabella delle pagine (in memoria) per ogni accesso alla memoria.

Ecco un esempio reale di macchina il cui processore genera indirizzi virtuali a 32 bit, potendo così accedere a 4 GiB di memoria. La dimensione della pagina è 4KiB . Da ciò si deduce che il campo di spostamento occupa i 12 bit meno significativi e il campo del numero di pagina i 20 bit più significativi.

Notare la presenza di un campo speciale appartenente a ciascuna PTE. Per semplificare, abbiamo ridotto la larghezza di questo campo a un bit: il bit di validità . Se è 0, significa che il numero di frame non è valido. È quindi necessario acquisire una tecnica che permetta di aggiornare questo PTE per renderlo valido.

Possono verificarsi tre casi:

La voce è valida: sostituisce il numero di pagina per formare l'indirizzo fisico.
La voce nella tabella delle pagine non è valida. In questo caso, devi trovare un frame libero nella RAM e inserire il suo numero in questa voce nella tabella delle pagine.
La voce nella tabella delle pagine è valida ma corrisponde ad un indirizzo della memoria di massa dove si trovano i contenuti del frame. Un meccanismo dovrà riportare questi dati per inserirli nella RAM.

Allocazione su richiesta

Negli ultimi due casi, un'interruzione - chiamata pagina predefinita (o talvolta page fault , traduzione dall'inglese page fault ) viene generata dal materiale e dà la mano al sistema operativo. Questo è responsabile della ricerca di un frame disponibile nella memoria principale per assegnarlo al processo responsabile di questo errore di pagina, ed eventualmente ricaricare il contenuto di questo frame con il contenuto salvato sulla memoria di massa (attualmente il disco rigido su un'area chiamata area di scambio o scambio ).

Potrebbero non esserci più frame liberi nella memoria principale: questa sarà quindi occupata al 100%. In questo caso, un algoritmo di impaginazione è responsabile della scelta di una pagina "vittima". Questa pagina verrà immediatamente riassegnata al processo di richiesta, oppure verrà prima salvata su disco rigido e verrà aggiornata la voce nella tabella delle pagine che fa riferimento ad essa. La pagina della vittima può benissimo appartenere al processo che manca di spazio.

Di seguito sono elencati alcuni esempi di algoritmi. La prima riga corrisponde alla catena di riferimenti , vale a dire l'ordine in cui il processo accederà alle pagine. Si presume che la memoria principale sia composta da tre frame . La cornice della vittima apparirà sottolineata. Gli errori di pagina iniziale non vengono conteggiati (sono identici in numero indipendentemente dall'algoritmo scelto).

L'algoritmo ottimale : il numero di page fault è ridotto a 6. La regola di sostituzione è "sostituire il frame che non verrà utilizzato per il tempo più lungo". Sfortunatamente, questo algoritmo richiederebbe la conoscenza del futuro. Gli altri algoritmi cercheranno quindi di avvicinarsi a questa soluzione ottimale.

7		0		1		2		0	3		0	4		2	3	0		3	2	1		2	0	1	7		0	1
	7		7		7		2			2			2				2				2					7
			0		0		0			0			4				0				0					0
					1		1			3			3				3				1					1

FIFO ( First in, first out o “First in, first out”): il frame della vittima è quello che è stato riportato in memoria da più tempo (il “più vecchio”). Si noti che non è necessario mantenere l'istante in cui un frame è stato sostituito: è sufficiente mantenere una struttura FIFO, sostituire il frame il cui numero compare in testa, e inserire il numero del nuovo frame in Last Position. Questo algoritmo dà luogo a 12 sostituzioni:

7		0		1		2		0	3		0		4		2		3		0		3	2	1		2		0	1	7		0		1
	7		7		7		2			2		2		4		4		4		0				0		0				7		7		7
			0		0		0			3		3		3		2		2		2				1		1				1		0		0
					1		1			1		0		0		0		3		3				3		2				2		2		1

L'algoritmo più utilizzato è chiamato LRU ( Meno utilizzato di recente ). Consiste nello scegliere come vittima il framework a cui non si fa riferimento da più tempo. Può essere implementato sia aggiungendo bit in ogni voce della tabella della pagina che indicano quando è avvenuto l'ultimo riferimento a questa voce, sia tramite una struttura a lista in cui il frame a cui si fa riferimento di recente verrà portato in prima posizione, i dirigenti della vittima rimangono quindi nelle ultime posizioni. Questo algoritmo dà luogo a 9 sostituzioni:

7		0		1		2		0	3		0	4		2		3		0		3	2	1		2	0		1	7		0	1
	7		7		7		2			2			4		4		4		0				1			1			1
			0		0		0			0			0		0		3		3				3			0			0
					1		1			3			3		2		2		2				2			2			7

Altri algoritmi:
- Sostituzione casuale: dove il frame della vittima viene scelto a caso.
- LFU ( Meno frequentemente usato o "il meno usato"): teniamo un contatore che viene incrementato ogni volta che si fa riferimento al frame e la vittima sarà il frame con il contatore più basso. Svantaggio: all'avvio del programma alcune pagine possono essere utilizzate intensamente, poi mai più. Il valore del contatore sarà così alto che non verranno sostituiti se non troppo tardi. È inoltre necessario gestire il caso di superamento della capacità del contatore ...

Può essere relativamente facile trovare casi patologici che rendono inutilizzabile un algoritmo. Ad esempio, per l'algoritmo LRU, questo sarebbe un programma che utilizza 5 pagine in un loop su una macchina che ha solo 4 frame '. Per prima cosa utilizzerà i primi 4 frame in sequenza (1, 2, 3, 4), quindi si verificherà un errore di pagina ed è la pagina 1, la più vecchia caricata, che sarà la vittima. Le pagine utilizzate sono ora (5, 2, 3, 4). Poiché il programma si ripete, necessita della pagina 1 (continua da pagina 5). Questa volta, la pagina della vittima è la pagina 2, sostituita da 1: (5, 1, 3, 4), quindi (5, 1, 2, 4), (5, 1, 2, 3), ecc. Ad ogni iterazione viene generato un errore di pagina ...

L'anomalia di Belady

Intuitivamente, aumentando il numero di frame di pagina (cioè aumentando la memoria principale) si dovrebbe ridurre il numero di errori di pagina.

L' anomalia di Belady (1970) è un controesempio che mostra che questo non è assolutamente vero con l'algoritmo FIFO , anzi il lettore potrà verificare da solo che la sequenza dei riferimenti (3, 2, 1, 0, 3, 2 , 4, 3, 2, 1, 0, 4) porta a

9 errori di pagina con 3 frame,
10 errori di pagina con 4 frame.

Nota : la portata di questa curiosità non deve essere esagerata. Certamente mostra che l'algoritmo FIFO in generale non ha una proprietà che ci si aspetterebbe (l'aggiunta di memoria riduce gli errori di pagina) ma non mostra che in media non ce l'ha . E comunque l'algoritmo FIFO non viene mai utilizzato per la sostituzione della pagina.

Inoltre, si può dimostrare che alcuni algoritmi di sostituzione della pagina ( ad esempio LRU ) non sono soggetti a questo tipo di anomalia.

Metodo di assegnazione in un sistema multiprogrammato

Le modalità di selezione della pagina vittima sopra citate possono essere applicate sia alle pagine appartenenti ad un processo (si parla quindi di “allocazione locale”), oppure a tutte le pagine e quindi a tutta la memoria (in questo caso la tecnica di allocazione è si dice che sia "globale").

In un sistema di allocazione globale, il tempo di esecuzione di un processo può variare notevolmente da istanza a istanza perché il numero di errori di pagina non dipende dal processo stesso. D'altra parte, questo sistema consente al numero di dirigenti assegnati a un processo di evolversi.

Condivisione della memoria in un sistema a pagine

Il diagramma seguente mostra tre processi in esecuzione, ad esempio un editor di testo denominato Ed. Le tre istanze si trovano tutte negli stessi indirizzi virtuali (1, 2, 3, 4, 5). Questo programma utilizza due distinte aree di memoria: le pagine che contengono il codice, cioè le istruzioni che descrivono il programma, e l'area dati, il file in editazione. È sufficiente mantenere le stesse voci nella tabella delle pagine affinché le tre istanze condividano l'area del codice. D'altra parte, le voci corrispondenti alle pagine di dati sono distinte.

Protezione

Alcune protezioni bit vengono aggiunte a ciascuna voce nella tabella delle pagine. Quindi possiamo facilmente distinguere tra le pagine allocate al kernel, di sola lettura, ecc. Vedi l'esempio sotto.

Efficienza

Ci sono tre problemi principali:

La dimensione della tabella delle pagine: per un'architettura in cui sono riservati 20 bit per il numero di pagina, la tabella occuperà un minimo di 4 milioni di memoria (2 20 = 1 milione di PTE, ogni PTE con una lunghezza di 4 byte). Questo problema viene risolto utilizzando più tabelle di pagina: il campo del numero di pagina verrà suddiviso in più tabelle, ciascuna indicante uno spostamento alla tabella di livello più basso. Il VAX e il Pentium supportano due livelli, lo SPARC tre, quattro ... Motorola 680x0 può anche segmentare la tabella delle pagine.
Tempo di accesso: essendo la tabella delle pagine in memoria, sarebbero necessari due accessi alla memoria per richiesta dal processore. Per ovviare a questo problema, le voci utilizzate più di frequente vengono conservate in una memoria associativa ( memoria cache ) denominata TLB per Translation Lookaside Buffer . Ogni indirizzo virtuale proveniente dal processore viene ricercato nel TLB; se c'è una corrispondenza, viene utilizzata la voce TLB, altrimenti viene attivato un interrupt e il TLB deve essere aggiornato dalla voce della tabella di pagine memorizzata prima che l'istruzione incriminata venga riavviata. Tutti i microprocessori attuali hanno un TLB.
Fenomeno thrashing : più aumenta la velocità di multiprogrammazione , meno pagine vengono assegnate a ciascun processo. Dopo un po ', il sistema si sovraccarica perché vengono generati troppi errori di pagina. Il fenomeno del trashing si manifesta ogni volta che, in un sistema di stoccaggio gerarchico, uno dei livelli è sovraccarico. Questo è il caso, ad esempio, se la memoria cache è troppo piccola. A questo punto, l'incessante avanti e indietro di dati su e giù per la gerarchia ridurrà notevolmente le prestazioni del computer. È possibile ridurre gli effetti di questo comportamento aggiungendo risorse hardware (aggiungendo memoria), riducendo la velocità di multiprogrammazione o modificando la priorità dei processi.

Principio di località

Il comportamento dei programmi non è caotico: il programma si avvia, chiama funzioni (o parti di codice) che a loro volta ne chiamano altre, ecc. Ciascuna di queste chiamate definisce una regione. È probabile che il programma possa impiegare molto tempo in alcune regioni: questo è il principio della località. Lo stesso principio può essere applicato alle pagine contenenti dati.

In altre parole, un programma accede frequentemente a un piccolo insieme di pagine e quell'insieme di pagine cambia lentamente nel tempo.

Se siamo in grado di mantenere in memoria questi spazi a cui si accede spesso, riduciamo le possibilità di vedere un programma iniziare a cestinare , vale a dire rivendicare pagine che sono state appena rimosse da esso di recente.

Il set di lavoro: spazio di lavoro

Possiamo definire un parametro, Δ, che è il numero di riferimenti alle pagine a cui il processo accede durante un certo periodo di tempo. La figura seguente mostra il valore dell'area di lavoro in due momenti diversi:

Il valore di Δ deve essere scelto con cura: troppo piccolo non copre lo spazio di lavoro nominale del processo; troppo grande include pagine non necessarie. Se Δ è uguale a infinito, ovviamente copre l'intero programma.

Per un singolo processo, possiamo rappresentare graficamente come viene allocata la memoria e visualizzare gli spazi di lavoro:

I “vassoi” sono aree in cui non ci sono errori di pagina: lo spazio allocato è sufficientemente ampio da contenere tutti i frame di cui il processo necessita per un tempo relativamente lungo. Gli errori di pagina si verificano nella parte ascendente della transizione, mentre la memoria si libera quando la curva ritorna allo spazio di lavoro successivo: la zona di equilibrio.

Spetta al sistema operativo implementare gli algoritmi in modo che il valore di Δ sia ottimale in modo da massimizzare la velocità di multiprogrammazione e l'utilizzo dell'unità centrale . In altre parole: evita di cestinare . Se la somma degli spazi di lavoro di ogni processo è maggiore del numero di frame disponibili, ci sarà necessariamente un collasso.

Prepaginazione

Uno dei vantaggi della memoria virtuale è quello di poter avviare l'esecuzione di un programma non appena la sua prima tabella codici viene caricata in memoria. La prepaginazione non caricherà solo la prima pagina, ma anche le successive, che hanno un'elevata probabilità di essere accedute.

Dimensioni della pagina per alcuni computer

Qui è indicato in bit, lo spazio indirizzabile totale, la larghezza dei campi, il numero di pagina e lo spostamento.

Macchina	Spazio indirizzabile	Campi numero di pagina	Campi "Spostamento"
Atlante	$2 ^ {{20}}$	11	9
PDP-10	$2 ^ {{18}}$	9	9
IBM-370	$2 ^ {{24}}$	13 o 12	11 o 12
Pentium Pro	$2 ^ {32}$	12 o 20	20 o 12
Alpha 21064	$2 ^ {{43}}$	13	30

Esempio

Ecco un esempio, tratto dal manuale Tahoe , un clone VAX :

Gli indirizzi sono codificati su 32 bit (4 GiB di spazio totale) La dimensione della pagina è 1 KiB (codificato a 10 bit ). Le voci nella tabella delle pagine sono in questo formato: 3 3 2 2 2 2 2 1 0 7 3 2 1 0 0 +---+------+-----+---+---+---+------------------------------------------------+ | V | PROT | | N | M | U | NDP | +---+------+-----+---+---+---+------------------------------------------------+

I campi M, U, N e NDP sono validi solo se il bit V è 1. Quando V è 0, il campo NDP contiene l'indirizzo sul disco rigido in cui si trova la pagina.

Il campo PROT deve essere interpretato come segue (il valore del campo è dato in binario su 4 bit):

Valore	Protezione
0000	Nessun accesso
1000	Lettura per il kernel
1100	Lettura / scrittura per il kernel
1010	Lettura utente e kernel
1110	Lettura dell'utente, lettura / scrittura del kernel
1111	Lettura / scrittura utente e kernel

Bit 24, N ( N on-nascosto), significa che la pagina non è memorizzata nella cache e il sistema dovrebbe leggere o scrivere direttamente da o nella memoria.

Il bit M ( M odificato) viene modificato dall'hardware se viene modificato il contenuto della pagina.

Il bit U ( U tilisée) indica se la pagina è stata letta o scritta da un processo. È utile, in associazione con gli altri, per determinare il Working Set di un processo (vedi sopra).

La chiamata di sistema vfork (2) del sistema operativo Unix crea un nuovo contesto ( processo ) duplicando la tabella delle pagine del processo che effettua la chiamata (suo padre ). La parte della tabella delle pagine contrassegnata come di sola lettura (il codice) verrà duplicata così com'è. Le pagine che corrispondono ai dati vengono contrassegnate come copia in scrittura . Quando Unix deve scrivere su una pagina contrassegnata come copia durante la scrittura , allocherà un nuovo frame , copierà il contenuto del frame originale e infine apporterà la modifica richiesta su questo nuovo frame . In definitiva vfork (2) è quindi una chiamata di sistema poco costosa perché non fa molto ...
Per coloro che sanno leggere i sorgenti Unix C , la definizione di PTE è data nel file <… / pte.h> di varie architetture. Un eccellente esempio di come utilizzare le PTE dall'interno di un programma utente è fornito nel codice sorgente del programma ps 4.3BSD .

Segmentazione

La segmentazione fornisce una visualizzazione della memoria più coerente con quella dell'utente. In effetti, questa non considera (o raramente!) La memoria come una serie di pagine ma piuttosto come spazi, o regioni, destinati ad un uso particolare ad esempio: il codice di un programma, i dati, lo stack, un insieme di subroutine, moduli, un array, ecc. La segmentazione riflette questa organizzazione.

Ogni oggetto logico sarà designato da un segmento. In un segmento l'indirizzamento verrà eseguito utilizzando uno spostamento. La coppia (segmento, cilindrata) verrà tradotta in un indirizzo di memoria mediante una tabella dei segmenti contenente due campi, limite e base . La base è l'indirizzo iniziale del segmento e limita l'ultimo indirizzo dello stesso segmento:

Problema di frammentazione

I sistemi impaginati hanno un problema di frammentazione interna : lo spazio viene sprecato alla fine di una pagina. I sistemi segmentati hanno un problema di frammentazione esterna : gli spazi tra i segmenti sono troppo piccoli per accogliere nuovi frammenti, quindi lo spazio viene sprecato.

È possibile recuperarlo compattando la memoria, cioè spostando i segmenti - riflettendo queste modifiche nelle tabelle dei segmenti - in modo che siano contigui. Tuttavia, questa operazione è costosa.

Condivisione di segmenti

È possibile condividere segmenti tra processi, come mostrato nella figura seguente, dove due processi Ed1 e Ed2 condividono lo stesso segmento di codice (programma) ma hanno segmenti di dati disgiunti di dimensioni diverse.

Protezione in un sistema segmentato

Questa protezione sarà assicurata da bit aggiuntivi aggiunti nella tabella dei segmenti, come per un sistema paginato.

Esempio di microprocessori con architettura di memoria segmentata

L'esempio più noto è l' Intel 8086 e i suoi quattro registri:

CS to C ode S egment: punta al segmento contenente il programma corrente.
DS, per D ata S egment: punta al segmento contenente i dati del programma in esecuzione.
ES per E xtra S egment: punta al segmento il cui utilizzo è lasciato al programmatore.
SS, per S tack S egment: punta al segmento che contiene la pila .

Anche i successori dell'8086 sono segmentati:

l' 80286 può gestire 16 milioni di RAM e 1 Gio di memoria virtuale, o 16.384 segmenti da 64 KiB .
la 80386 4 Gio RAM, 64 Tio memoria virtuale o 16.384 segmenti 4 Gio .

Sistemi misti impaginati / segmentati

È possibile combinare le due modalità precedenti:

la paginazione segmentata in cui verrà segmentata la tabella delle pagine. In altre parole, il numero di pagina p della coppia (p, d) dell'indirizzo virtuale verrà interpretato come un segmento (s, p '). Questo sistema risolve il problema delle dimensioni della tabella delle pagine.
la segmentazione per pagine , dove ogni segmento è numerato. In altre parole, il campo di spostamento d della coppia (s, d) dell'indirizzo virtuale verrà interpretato come un numero di pagina e uno spostamento (p, d ').

Scambio

A volte è necessario eliminare tutte le pagine o segmenti di un processo dalla memoria principale. In questo caso si dirà che il processo è stato scambiato e tutti i dati ad esso appartenenti verranno memorizzati nella memoria di massa. Ciò può accadere per processi inattivi a lungo quando il sistema operativo deve allocare memoria per i processi attivi. Le pagine o segmenti di codice (programma) non verranno mai scambiati , ma semplicemente riassegnati, perché si trovano nel file corrispondente al programma ( il file eseguibile ). Per questo motivo, il sistema operativo proibisce l'accesso in scrittura a un file eseguibile in uso; simmetricamente, non è possibile avviare l'esecuzione di un file mentre è tenuto aperto per l'accesso in scrittura da un altro processo.

Compressione della memoria virtuale

La compressione della memoria virtuale può migliorare le prestazioni di un sistema di memoria virtuale. Questa tecnica di gestione della memoria virtuale utilizza la compressione dei dati per ridurre la dimensione o il numero di richieste di paging da e verso la memoria ausiliaria.

In un sistema di compressione della memoria virtuale, le pagine vengono compresse e archiviate nella memoria fisica, in genere RAM , o inviate compresse a una memoria ausiliaria, come un disco rigido o un SSD . In entrambi i casi, l'intervallo di memoria virtuale i cui contenuti sono stati compressi è inaccessibile, quindi i tentativi di accedere alle pagine compresse generano errori di pagina e invertono il processo di compressione (recupero della memoria ausiliaria e decompressione). Il footprint dei dati di paging viene ridotto dal processo di compressione e la memoria RAM liberata viene restituita al pool di memoria fisica disponibile. Nel caso in cui le pagine compresse siano conservate nella memoria RAM, le pagine compresse ovviamente occupano meno spazio rispetto alle pagine originali. Nel caso in cui le pagine compresse siano conservate nella memoria ausiliaria, la memoria RAM viene completamente liberata e le operazioni di scrittura e lettura sulla memoria ausiliaria sono più veloci che se le pagine non fossero state compresse.

Riferimenti

Brevetto USA 5559978

Vedi anche

Bibliografia

Sistema di archiviazione a un livello , Kilburn, Edwards, Lanigan, Summer, IRE Transactions on elecronic computer, EC-11, vol. 2,Aprile 1962, p. 223-235.
Computer Organization and Design , Hennessy, Patterson, Morgan Koffman, ( ISBN 1558604286 ) .
Concetti del sistema operativo , Patterson, Silberschatz, ( ISBN 020151379X ) .
Computer Organization & Architecture , Hennessy, Patterson, Morgan Koffman, ( ISBN 0333645510 ) .
Architettura del computer: un approccio quantitativo
Strutture di calcolo , Stephen A. Ward, Robert H. Halstead, ( ISBN 026273088X ) .
Organizzazione informatica strutturata
Manuale di riferimento VAX
Sperry 7000/40 Architecture and Assembly Language Manual

7		0		1		2		0	3		0		4		2		3		0		3	2	1		2		0	1	7		0		1
	7		7		7		2			2		2		4		4		4		0				0		0				7		7		7
			0		0		0			3		3		3		2		2		2				1		1				1		0		0
					1		1			1		0		0		0		3		3				3		2				2		2		1

7		0		1		2		0	3		0		4		2		3		0		3	2	1		2		0	1	7		0		1
	7		7		7		2			2		2		4		4		4		0				0		0				7		7		7
			0		0		0			3		3		3		2		2		2				1		1				1		0		0
					1		1			1		0		0		0		3		3				3		2				2		2		1