L' algoritmo t-SNE ( incorporamento del vicino stocastico distribuito t ) è una tecnica di riduzione delle dimensioni per la visualizzazione dei dati sviluppata da Geoffrey Hinton e Laurens van der Maaten. Questo è un metodo non lineare per rappresentare un insieme di punti da uno spazio di grandi dimensioni in uno spazio bidimensionale o tridimensionale , i dati possono quindi essere visualizzati con una nuvola di punti . L'algoritmo t-SNE cerca di trovare una configurazione ottimale secondo un criterio di teoria dell'informazione per rispettare le distanze tra i punti: due punti che sono vicini (risp. Distanti) nello spazio originale devono essere vicini (risp. Distanti) in bassa dimensionale spazio.
L'algoritmo t-SNE si basa su un'interpretazione probabilistica delle distanze. Una distribuzione di probabilità è definita su coppie di punti nello spazio originale in modo tale che i punti vicini l'uno all'altro abbiano un'alta probabilità di essere scelti mentre i punti distanti hanno una bassa probabilità di "essere selezionati". Allo stesso modo viene definita anche una distribuzione di probabilità per lo spazio di visualizzazione. L'algoritmo t-SNE consiste nell'abbinare le due densità di probabilità, minimizzando la divergenza Kullback-Leibler tra le due distribuzioni rispetto alla posizione dei punti sulla mappa.
L'algoritmo t-SNE è stato utilizzato per molte applicazioni: analisi musicale, ricerca sul cancro , bioinformatica ed elaborazione del segnale biomedico. Questo metodo viene spesso utilizzato per la visualizzazione di rappresentazioni di alto livello apprese da una rete neurale artificiale .