Co-occorrenza

La co-occorrenza (senza trattino in francese) è la presenza simultanea di due o più parole o altre unità linguistiche nella stessa affermazione, ad esempio frase, paragrafo, estratto.

Discipline come la storia o la geografia sono interessate anche alla co-occorrenza di parole o nomi di luoghi nel tempo e nello spazio.

Un concetto correlato è "  collocazione " che è una forma di espressione idiomatica causata da una co-occorrenza sistematica.

Definizione di elementi

La parola co-occorrenza può avere diversi significati.

Le parole “co-occorrenze” non sono necessariamente legate da relazioni formali o sintattiche (sintagmi fissi, espressioni, collocazioni ), da sinonimia , antonimia o volto ( iperonimia o meronimia ) ma hanno comunque necessariamente qualche legame linguistico.

Quando le due parole - o altre unità linguistiche - hanno una relazione semantica stretta o distante, la nozione di co-occorrenza è alla base di quella di campo tematico, lessicale o isotopia .

Problemi, usi

Questa nozione viene utilizzata in campi vari come

Rilevazione, analisi testuale

Quando le due parole - o altre unità linguistiche - hanno una relazione semantica stretta o distante, la nozione di co-occorrenza è alla base di quella di campo tematico, lessicale o isotopia .

L' analisi dei dati testuali insiste sulle relazioni statistiche che le due co-occorrenze devono mantenere, e ha proposto numerosi indizi per calcolare adeguatamente l'attrazione osservata. La co-occorrenza diventa quindi la co-presenza statisticamente significativa di due o più unità nella stessa finestra pop-up.

Esistono software per il rilevamento automatico di idiomi e altre occorrenze; sono software lessicometrici, testometrici e logometrici che offrono numerose rappresentazioni di co-occorrenze in corpora testuali etichettati o testi semplici (estraggono co-occorrenze sotto forma di semplici elenchi, grafici, reti o reti ). Tra questi software, ad esempio, ci sono:

eccetera.

Ricerca

I ricercatori stanno cercando di definire meglio questo concetto e le sue sfide in base ai campi di applicazione (scienze esatte, umane e sociali) e alla sua scala di valutazione (spaziale, temporale, astratta). Stanno anche cercando di sviluppare metodi per valutare meglio la co-occorrenza qualitativamente e misurarla meglio quantitativamente.

Esempi di parole ricorrenti

Note e riferimenti

  1. Matthias Tauveron (2012) Dalla co-occorrenza generalizzata alla variazione nel significato lessicale , in Co-occorrenza, da fatto statistico a fatto testuale , (Damon Mayaffre e Jean-Marie Viprey, a cura di), CORPUS, 11, 2012
  2. Manning C., Schütze H (1999) Fondamenti dell'elaborazione statistica del linguaggio naturale , Cambridge (Mass.); Londra: MIT Press
  3. Foltête Jean-Christophe (2003) Ricostruzione di una diffusione spaziale da una successione di stati ; spazio geografica, 2003/2 (volume 32), p.  171–183
  4. Salazar-orvig Anne, I movimenti del discorso. Stile, riferimento e dialogo nelle interviste cliniche , Parigi, L'Harmattan, 1999, 294 p.
  5. Xu, J., & Croft, WB (1998) derivazione basata su corpus utilizzando la cooccorrenza di varianti di parole . Transazioni ACM sui sistemi informativi (TOIS), 16 (1), 61-81.
  6. Veyne Paul (1971) Come scrivere la storia. Saggio epistemologico Parigi, Ed. Du Seuil 352 pagine.
  7. Pisetta Vincent, Hacid Hakim, Bellal Fazia, Ritschard Gilbert e A. Zighed Djamel (2006) Elaborazione automatica di testi giuridici , in R. Lehn, M. Harzallah, N. Aussenac-Gilles, J. Charlet (a cura di), Weeks of conoscenza , SdC 2006, Nantes 26-30 giugno (Atti digitali su Cd-Rom)
  8. Matthias Tauveron (2012) Dalla co-occorrenza generalizzata alla variazione nel significato lessicale, in Co-occorrenza, da fatto statistico a fatto testuale , (Damon Mayaffre e Jean-Marie Viprey, a cura di), CORPUS, 11, 2012
  9. Moalla Koubaa Ikram (2009) Caratterizzazione degli scritti medievali con metodi statistici basati su co-occorrenze . Tesi di informatica, INSA Lyon.
  10. Moscovici Serge e Henry Paul (1968) Problems of content analysis (, Languages, socio-linguistics, Vol. 3, n o  11, p.  36-60
  11. Schütze, H., & Pedersen, JO (1997) Un thesaurus basato sulla coincidenza e due applicazioni per il recupero delle informazioni . Elaborazione e gestione delle informazioni, 33 (3), 307-318.
  12. Matsuo, Y. e Ishizuka, M. (2004). Estrazione di parole chiave da un singolo documento utilizzando informazioni statistiche sulla ricorrenza di parole . Rivista internazionale sugli strumenti di intelligenza artificiale, 13 (01), 157-169.
  13. Globerson Amir, Chechik Gal, Pereira fernando, Naftali Tishby (2007) Euclidean Embedding of Co-occorrenza dati , Journal of Machine Learning Research 8 (2007), p.  2265-2295
  14. Manning C., Schütze H. (1999) Fondamenti dell'elaborazione statistica del linguaggio naturale , Cambridge (Mass.); Londra: MIT Press
  15. Prévost Marie e Debruille Jacques Bruno (2013) Co-occorrenza di credenze religiose, superstiziose e deliranti , Santé Mental au Québec, Volume 38, numero 1, primavera 2013, p.  279-296
  16. "  Alceste software  " , su www.image-zafar.com (accesso 18 agosto 2016 )
  17. Josselin D (2014) Annuncio del seminario transdisciplinare “ Cooccurrences & co. "(Avignon 5 dicembre 2014), pubblicato nell'ottobre 2014

Vedi anche

Articoli Correlati

Nozioni simili

A seconda del campo, questa nozione è più o meno simile o collegata a nozioni simili, tra cui ad esempio

Bibliografia