{{ Il nome di immagine digitale designa qualsiasi immagine ( disegno , icona , fotografia, ecc.) acquisita , creata , elaborata e archiviata in forma binaria :
È composto da una matrice ( tabella ) di punti con più dimensioni, ciascuna dimensione rappresentando una dimensione spaziale (altezza, larghezza, profondità), temporale (durata) o altro (ad esempio, un livello di risoluzione).
Immagini 2DNel caso di immagini bidimensionali (le più comuni), i punti sono chiamati pixel . Dal punto di vista matematico , l'immagine è considerata una funzione in cui l'input verso è considerato una posizione spaziale, l'output singleton come una codifica.
Questo tipo di immagine si presta bene alla visualizzazione sullo schermo di un computer (anche pixel oriented); non è invece molto adatta alla stampa , perché la risoluzione degli schermi dei computer, generalmente da 72 a 96 dpi ("dots per inch", in inglese dots per inch o dpi ) è molto inferiore a quella raggiunta dalle stampanti, a meno 600 dpi oggi. L'immagine stampata, se non ha un'alta risoluzione, sarà quindi più o meno sfocata o mostrerà pixel quadrati visibili.
Immagini 2D + t (video), immagini 3D, immagini multi-risoluzioneQuesti casi sono una generalizzazione del caso 2D, la dimensione aggiuntiva che rappresenta rispettivamente il tempo, una dimensione spaziale o una scala di risoluzione.
Da un punto di vista matematico, è una funzione di in .
Immagini stereoscopicheQuesto è un caso particolare in cui si lavora per coppie di immagini, quest'ultime potendo essere di uno qualsiasi dei tipi precedenti.
Esistono molti tipi di immagini stereoscopiche e ancora più modi di visualizzarle in rilievo, ma la codifica raccomandata dalle organizzazioni stereoscopiche internazionali è denominata "jps" , vale a dire un formato jpg in cui le due viste sinistra e destra sono giustapposte nello stesso file, il più delle volte 2.048 × 768, ciascuna delle due viste essendo inscritta in un rettangolo 1.024 × 768 e , se le sue proporzioni non è 4/3, ogni vista è completata in questo rettangolo da due bande nere simmetriche, in alto e in basso, o a sinistra e a destra.
Il principio è quello di rappresentare i dati dell'immagine mediante formule geometriche che possano essere descritte da un punto di vista matematico . Ciò significa che invece di memorizzare un mosaico di punti elementari, viene memorizzata la successione delle operazioni che portano alla trama. Ad esempio, un disegno può essere memorizzato dal computer come "una linea tracciata tra i punti (x 1 , y 1 ) e (x 2 , y 2 )", quindi "un cerchio tracciato dal centro (x 3 , y 3 ) e raggio 30 in rosso”.
Il vantaggio di questo tipo di immagine è la possibilità di ingrandirla all'infinito senza perdere la qualità iniziale, nonché un ingombro ridotto. L'utilizzo preferito di questo tipo di immagine riguarda i diagrammi che possono essere generati con alcuni software CAD (Computer Aided Drawing) come AutoCAD o CATIA . Questo tipo di immagine viene utilizzato anche per le animazioni Flash , utilizzate su Internet per la creazione di banner pubblicitari, l'introduzione di siti Web , anche siti Web completi.
Poiché i mezzi di visualizzazione delle immagini correnti come gli schermi dei computer si basano principalmente su immagini raster, le descrizioni vettoriali (File) devono prima essere convertite in descrizioni raster prima di essere visualizzate come immagini.
Le immagini raster sono anche definite dalla loro definizione e risoluzione .
La definizione di un'immagine è definita dal numero di punti che la compongono. In un'immagine digitale, questo corrisponde al numero di pixel che compongono l'immagine in altezza (asse verticale) e in larghezza (asse orizzontale): ad esempio 200 pixel per 450 pixel , abbreviati in “200 × 450”.
La risoluzione di un'immagine è definita da un numero di pixel per unità di lunghezza della struttura da digitalizzare (convenzionalmente in dpi ). Questo parametro viene definito durante la digitalizzazione (passaggio dell'immagine in forma binaria ), e dipende principalmente dalle caratteristiche del materiale utilizzato durante la digitalizzazione. Maggiore è il numero di pixel per unità di lunghezza della struttura da digitalizzare, maggiore è la quantità di informazioni che descrivono tale struttura e maggiore è la risoluzione. La risoluzione di un'immagine digitale definisce il grado di dettaglio dell'immagine. Pertanto, maggiore è la risoluzione, migliore è la riproduzione.
Tuttavia, per la stessa dimensione dell'immagine, maggiore è la risoluzione, maggiore è il numero di pixel che compongono l'immagine. Il numero di pixel è proporzionale al quadrato della risoluzione, data la natura bidimensionale dell'immagine: se la risoluzione viene moltiplicata per due, il numero di pixel viene moltiplicato per quattro. L'aumento della risoluzione può comportare tempi di visualizzazione e stampa più lunghi e portare a dimensioni troppo grandi del file contenente l'immagine e spazio di memoria eccessivo.
Esistono diverse modalità di codifica dei colori del computer , la più utilizzata per la gestione delle immagini è lo spazio colore rosso, verde, blu ( RGB o RGB- rosso verde blu ). Questo spazio si basa su una sintesi additiva di colori, vale a dire che la miscela dei tre componenti R, G e B al loro valore massimo dà il bianco, come la luce . La miscelazione di questi tre colori in varie proporzioni permette di riprodurre sullo schermo gran parte dello spettro visibile , senza dover specificare una moltitudine di frequenze luminose.
Esistono altri modi per rappresentare i colori:
Le bitmap a colori possono essere rappresentate sia da un'immagine in cui il valore del pixel è una combinazione lineare dei valori delle tre componenti di colore, sia da tre immagini che rappresentano ciascuna una componente di colore. Nel primo caso, a seconda del numero di bit (unità di informazione elementare che può assumere due valori distinti) allocati per la memorizzazione di un colore di pixel, si distinguono generalmente i seguenti diversi tipi di immagini:
Questo è un nome fuorviante perché il mondo digitale (finito, limitato) non può rendere pienamente conto della realtà (infinita). La codifica dei colori viene eseguita su tre byte , ogni byte rappresenta il valore di un componente di colore con un numero intero compreso tra 0 e 255. Questi tre valori codificano generalmente il colore nello spazio RGB. Il numero di colori diversi che possono essere rappresentati in questo modo è 256 × 256 × 256 possibilità, ovvero circa 16,7 milioni di colori. Poiché la differenza di tonalità tra due colori molto vicini ma diversi in questa modalità di rappresentazione è quasi impercettibile all'occhio umano, è conveniente considerare che questo sistema consente una riproduzione esatta dei colori, motivo per cui si parla di "colori veri" .
R | V | B | Colore |
---|---|---|---|
0 | 0 | 0 | nero |
255 | 0 | 0 | rosso |
0 | 255 | 0 | verde |
0 | 0 | 255 | blu |
128 | 128 | 128 | grigio medio |
255 | 255 | 255 | bianca |
Le bitmap basate su questa rappresentazione possono occupare rapidamente un notevole spazio di archiviazione, con ogni pixel che richiede tre byte per codificare il suo colore.
Per ridurre lo spazio occupato dalle informazioni sul colore, utilizziamo una tavolozza di colori "attaccata" all'immagine. Parliamo poi di colori indicizzati: il valore associato ad un pixel non trasmette più il colore effettivo del pixel, ma fa riferimento alla voce corrispondente a questo valore in una tabella (o tavolozza) di colori chiamata look-up table o LUT in inglese , in cui abbiamo la rappresentazione completa del colore considerato.
A seconda del numero di colori presenti nell'immagine, è così possibile risparmiare una notevole quantità di spazio: in pratica si ritiene che 256 colori tra i 16 milioni di colori a 24 bit siano sufficienti. Per codificarli avremo quindi una tavolozza che occuperà 24 bit × 256 voci, ovvero 3 × 256 byte, e i pixel dell'immagine saranno associati a indici codificati su un byte. L'occupazione di tale immagine è quindi di 1 byte per pixel più la LUT, che rappresenta poco più di un terzo dello spazio occupato da un'immagine a colori a 24 bit (più l'immagine contiene pixel, maggiore è lo spazio di guadagno è importante , il limite è un terzo dello spazio occupato dall'immagine a colori reali).
Un altro metodo esistente consiste nel fare a meno di una tavolozza, e nel codificare direttamente i tre colori utilizzando un byte: ogni componente colore è codificato su due bit, il bit rimanente può essere utilizzato sia per gestire più colori su uno dei componenti, sia per gestire trasparenza dei pixel. Con questo metodo si ottengono immagini bitmap con una codifica a colori effettivamente limitata a 8 bit, sebbene la gamma di colori possibili sia molto ridotta rispetto a quella offerta dal metodo che utilizza una tavolozza.
Nel caso di immagini a colori indicizzate, è possibile specificare che i pixel che utilizzano uno dei colori nella tavolozza non vengano visualizzati durante la lettura dei dati dell'immagine. Questa proprietà di trasparenza è ampiamente utilizzata (e utile) per le immagini delle pagine Web , in modo che il colore di sfondo dell'immagine non impedisca la visualizzazione dello sfondo della pagina.
Qui si codifica solo il livello dell'intensità luminosa, generalmente su un byte (256 valori). Per convenzione, il valore zero rappresenta il nero (intensità luminosa zero) e il valore 255 bianco (intensità luminosa massima):
000 | 008 | 016 | 024 | 032 | 040 | 048 | 056 | 064 | 072 | 080 | 088 | 096 | 104 | 112 | 120 | 128 | 136 | 144 | 152 | 160 | 168 | 176 | 184 | 192 | 200 | 208 | 216 | 224 | 232 | 240 | 248 | 255 |
Questo processo viene spesso utilizzato per riprodurre foto o testo in bianco e nero in determinate condizioni (con l'uso di un filtro per ammorbidire i contorni per caratteri più uniformi).
Questa codifica di intensità luminosa semplice viene utilizzata anche per la codifica di immagini a colori: l'immagine è rappresentata da tre immagini di intensità luminosa, ciascuna situata in una distinta componente dello spazio colore (ad esempio, intensità di rosso, verde e blu).
Un canale aggiuntivo, chiamato canale alfa , può essere assegnato a un'immagine , che definisce il grado di trasparenza dell'immagine. Questo è un canale simile ai canali tradizionali che definiscono le componenti del colore, codificato su un numero fisso di bit per pixel (solitamente 8 o 16). La traslucenza di un pixel viene quindi scalata linearmente, dalla piena opacità alla trasparenza.
Sono stati utilizzati altri formati originali:
Un formato immagine è una rappresentazione computerizzata dell'immagine, associata a informazioni su come l'immagine è codificata e che può fornire indicazioni su come decodificarla e manipolarla.
La maggior parte dei formati è costituita da un'intestazione contenente attributi (dimensioni dell'immagine, tipo di codifica, LUT, ecc.), seguita da dati (l'immagine stessa). La struttura degli attributi e dei dati è diversa per ogni formato di immagine.
Inoltre, i formati attuali includono spesso un'area di metadati ( metadati in inglese) utilizzata per specificare informazioni sull'immagine come:
Questi metadati sono ad esempio ampiamente utilizzati nel formato Exif (estensione del formato JPEG ), che è il formato più utilizzato nelle fotocamere digitali .
Alcune precauzioni da prendere riguardo ai formati immagine:
Tipo (matrice/ vettore) |
Compressione dei dati |
Numero di colori supportati |
Visualizzazione progressiva |
Animazione | Trasparenza | |
JPEG | matrice | Sì, regolabile (con perdita) |
16,1 milioni | sì | No | No |
JPEG2000 | matrice | Sì, con o senza perdita |
4,4 miliardi | sì | sì | sì |
GIF | matrice | Sì, senza perdite |
256 max (pallet) | sì | sì | sì |
PNG | matrice | Sì, senza perdite |
Pallettizzato (256 colori o meno) o 16 milioni |
sì | No | Sì (livello alfa) |
TIFF | matrice | Compressione o meno con o senza perdite |
da monocromatico a 16 milioni | No | No | Sì (livello alfa) |
SVG | vettore | possibile compressione | 16 milioni | * Non applicabile * | sì | Sì (per natura) |
Il formato TIFF è considerato un formato proprietario, il brevetto è controllato dalla società Aldus che si è fusa con Adobe nel 1994.
In passato il formato GIF era soggetto al brevetto Unisys controllato dalla società CompuServe , quindi era un formato proprietario. Ma i brevetti di Unisys sono scaduti. Questo formato è quindi diventato da allora un formato royalty-free.
Nel tentativo di far rispettare il copyright (in Francia) e il copyright (in quasi tutti gli altri paesi), esistono tecniche per contrassegnare digitalmente un'immagine. Queste tecniche, che chiamiamo fingerprinting, vengono utilizzate sempre di più. L'impronta dovrebbe conservare la prova dell'origine dell'immagine, sotto forma di una firma visibile o invisibile, che deve resistere ai trattamenti che possono essere applicati all'immagine. Tale “filigrana” può essere realizzata secondo due modalità, generalmente designate con lo stesso termine di filigrana .
Questa tecnica consiste nell'integrare un'indicazione sull'immagine, ad esempio l'organizzazione o l'autore a cui l'immagine appartiene, per dissuadere i pirati dall'utilizzarla. Lo svantaggio di questo metodo è che è molto facile rimuovere questo tipo di tatuaggio con uno strumento di elaborazione delle immagini, poiché il tatuaggio è visibile.
Questa tecnica consiste nel nascondere la filigrana nei dati dell'immagine. Questo approccio ha il vantaggio di non ostacolare la lettura dell'immagine da parte del semplice spettatore pur consentendo una facile identificazione. L'autore trae un ulteriore vantaggio: l'eventuale hacker distratto non sarà tentato di ritirare o modificare la firma; il pirata più caparbio vedrà la sua attività illegale resa un po' più difficile o facilmente dimostrabile (dalla sola presenza del tatuaggio).