Visualizzatore Ngram

Logo Ngram Viewer
Indirizzo https://books.google.com/ngrams
Descrizione Servizio di analisi statistica
Commerciale
Pubblicità No
Lingua Multilingue
La sede principale Mountain View Stati Uniti
Proprietario Google
Creato da Google
Lanciare Giugno 2010
Stato attuale In attività

Ngram Viewer è un'applicazione linguistica offerta daGoogle, che permette di osservare l'evoluzione della frequenza di una o più parole o gruppi di parole nel tempo nelle fonti stampate. Lo strumento è entrato in servizio nel 2010. L'ultimo aggiornamento è stato nel febbraio 2020.

Il termine ngram designa in questo contesto una serie di "n" parole, che è un caso particolare della nozione di n-gram .

Principio di funzionamento

Lo strumento Ngram di Google si basa sul database di testo di Google Libri . I testi di Google Libri sono classificati in base alla frequenza delle sequenze di parole (chiamate ngram ) per anno di pubblicazione, a ciascuna sequenza di parole viene quindi assegnato un "peso".

Quando l'utente richiede un confronto di più sequenze di parole , lo strumento disegna quindi curve che consentono di confrontare la loro frequenza di utilizzo nel tempo.

Interesse e limiti

L'interesse di Ngram è essenzialmente quello di realizzare studi storico- linguistici o socio-culturali, noti come culturisti .

Lo strumento contiene i seguenti limiti (soprattutto per il francese ). Prima del 1790, la "s" nel mezzo delle parole era ancora scritta "ſ" (detta s lunga ), imperfetta "ay" era scritta "oit", e queste poche piccole specificità così come una tipografia irregolare ne compromettono la rilevanza. OCR sulle opere del XVI °  secolo XVIII °  secolo. Pertanto, il team del progetto OCRization della Biblioteca Nazionale di Francia ritiene che, senza l'intervento umano nel processo di digitalizzazione, non si possa fare una ricerca full-text affidabile in opere risalenti a prima del 1800. Questa analisi è stata tuttavia rivista: falsi positivi o falsi negativi rappresentano spesso una percentuale bassa rispetto a tutti i dati. Inoltre, Google Ngram viene utilizzato per delineare le tendenze nell'uso di un termine e non per fornire cifre di utilizzo assolute e precise.

Un altro difetto sta nel fatto che un piccolo lavoro modificato sarà rappresentato come un'opera ampiamente distribuita. Inoltre, la frequenza d'uso di una parola nello stesso testo può nuovamente dare troppo peso a questa parola, in particolare se è rara.

Note e riferimenti

  1. (in) "  Google Books Ngram Viewer  " su books.google.com (visitato il 14 gennaio 2021 )
  2. (en) https://books.google.com/ngrams/info
  3. Roth, S. (2014), "Fashionable functions. A Google ngram view of trends in functional differenziation (1800-2000)", International Journal of Technology and Human Interaction , Band 10, Nr. 2, S. 34-58 ( in linea: http://ssrn.com/abstract=2491422 ).
  4. [PDF] "  BnF Archives Digitization Project  " ( ArchiveWikiwixArchive.isGoogle • What to do? ) Pubblicato nel 2006.

Vedi anche

Articoli Correlati

Link esterno