Collegamento non funzionante

Un collegamento morto , un collegamento interrotto , un collegamento interrotto o un collegamento interrotto è un collegamento ipertestuale che reindirizza a un sito Web o una pagina Web non esiste più. Su scala web , il fenomeno corrisponde al decadimento dei link , noto in inglese come link rot .

Cause

Un collegamento può interrompersi per diversi motivi. La spiegazione più semplice e comune è che la pagina web non esiste più, il che la maggior parte delle volte porta a un errore HTTP 404 , che indica che il server ha risposto bene ma non è stato possibile trovare la pagina specifica. Sono possibili anche altri codici di ritorno , la pagina potrebbe essere stata spostata o rinominata sul server oppure il server stesso potrebbe essere stato spostato o rinominato.

Altri motivi per cui un collegamento è interrotto includono:

Prevalenza

Diversi studi hanno esaminato la prevalenza di collegamenti interrotti sul web, tra la letteratura accademica e le biblioteche digitali . Nel 2003, l'esperimento condotto da Fetterly et al. ha scoperto che ogni settimana circa un link su 200 cessava di essere valido. Nelson e Allen (2002) hanno esaminato il decadimento dei collegamenti nelle biblioteche digitali e hanno scoperto che il 3% degli oggetti non era più accessibile dopo un anno.

Nel 2004, un altro studio ha mostrato che sottoinsiemi di collegamenti Internet (che prendono di mira tipi di file specifici o che sono ospitati da istituzioni accademiche) potrebbero avere vite effettive radicalmente diverse. Gli URL delle pubblicazioni sembrano avere una durata maggiore su Internet rispetto ad altri URL. Uno studio del 2015 di Weblock ha analizzato oltre 180.000 collegamenti a risorse nel corpus di tre principali editori ad accesso aperto e ha rilevato una durata media di 14 anni, confermando uno studio del 2005 che ha rilevato che la metà degli URL trovati negli articoli di D-Lib Magazine erano ancora attivi 10 anni dopo la pubblicazione. Altri studi hanno rilevato un tasso più elevato di collegamenti marci nella letteratura accademica, ma mostrano un'aspettativa di vita di almeno quattro anni Uno studio di BMC Bioinformatics ha analizzato quasi 15.000 collegamenti in abstract di citazioni indicizzate da Thomson Reuteur Web of Science e ha concluso che la mediana la durata di una pagina web era di 9,3 anni e solo il 62% delle pagine è stato archiviato.

Uno studio condotto nel 2016-2017 su Yahoo! Directory (la directory Yahoo! che ha interrotto l'aggiornamento nel 2014, dopo 21 anni di sviluppo), ha concluso che la durata effettiva dei collegamenti era di due anni.

Prevenzione e rilevamento

Le strategie per prevenire i collegamenti errati possono concentrarsi su dove collocare il contenuto in modo che sia più probabile che rimanga lì, nonché utilizzare collegamenti di autorità che hanno meno probabilità di essere interrotti o riparare collegamenti il ​​cui obiettivo è stato eliminato o riposizionato.

La creazione di URL che non cambieranno nel tempo è il modo fondamentale per prevenire collegamenti errati. Tim Berners-Lee e altri pionieri di Internet sono campioni della pianificazione preventiva.

Le strategie di autorità di collegamento includono:

Le strategie per proteggere i collegamenti esistenti includono:

Il rilevamento di collegamenti interrotti può essere eseguito manualmente o automaticamente. I metodi automatici includono plug-in per i sistemi di gestione, nonché strumenti di controllo dei collegamenti interrotti indipendenti, come Link Sleuth di Xenu. Il controllo automatico potrebbe non rilevare i collegamenti che puntano a 404 o i collegamenti che restituiscono una risposta 202 OK ma puntano al contenuto che è stato modificato.

Riferimenti

  1. (in) P. Habibzadeh, "  Decadimento dei riferimenti ai siti web negli articoli pubblicati su riviste mediche generali: Mainstream vs Small Journals  " , Applied Clinical Informatics , vol.  4, n o  4,2013( DOI  10.4338 / aci-2013-07-ra-0055 , letto online , accesso 7 settembre 2015 )
  2. "  La morte di un TLD  " [ archivio di26 luglio 2018] , su blog.benjojo.co.uk (consultato il 27 luglio 2018 )
  3. P. Habibzadeh , "  Decadimento dei riferimenti ai siti Web negli articoli pubblicati su riviste mediche generali: Mainstream vs Small Journals  ", Applied Clinical Informatics , vol.  4, n o  4,2013, p.  455–464 ( PMID  24454575 , PMCID  3885908 , DOI  10.4338 / aci-2013-07-ra-0055 )
  4. "  Hiberlink  " [ archivio di29 gennaio 2015] , Hiberlink.org (consultato il 15 gennaio 2015 )
  5. (in) Dennis Fetterly, Mark Manasse, Mark e Janet Najork Wiener, "  A wide-scale study of the Evolution of Web pages  " , WWW '03 Proceedings of the 12th international conference on World Wide Web ,2003, p.  669-678 ( ISBN  1-58113-680-3 , DOI  10.1145 / 775152.775246 , leggi online )
  6. (a) Michael L. Nelson e Danette B. Allen , "  Object Persistence and Availability in Digital Libraries  " , D-Lib Magazine , vol.  8, n o  1,gennaio 2002( DOI  10.1045 / gennaio2002-nelson )
  7. Wallace Koehler , "  Continua uno studio longitudinale delle pagine web: una considerazione sulla persistenza dei documenti  ", Information Research , vol.  9, n o  22004( leggi online [ archivio di11 settembre 2017] , accesso 31 gennaio 2019 )
  8. "  All-Time Weblock Report  " [ archivio di4 marzo 2016] ,agosto 2015(visitato il 12 gennaio 2016 )
  9. Frank McCown, Sheffan Chan, Michael L. Nelson e Johan Bollen (2005) “  La disponibilità e la persistenza dei riferimenti Web in D-Lib Magazine  ” Atti del 5 ° Internazionale Web Archiving workshop e la conservazione digitale (IWAW'05) . Accesso 2005-10-12. 
  10. Diomidis Spinellis , "  The Decay and Failures of Web References  ", Communications of the ACM , vol.  46, n o  1,2003, p.  71-77 ( DOI  10.1145 / 602421.602422 , leggi in linea )
  11. Steve Lawrence , David M. Pennock , Gary William Flake , Robert Krovetz , Frans M. Coetzee , Eric Glover , Finn Arup Nielsen , Andries Kruger e C. Lee Giles , "  Persistence of Web References in Scientific Research  ", Computer , vol.  34, n o  22001, p.  26–31 ( DOI  10.1109 / 2.901164 )
  12. Jason Hennessey e Steven Xijin Ge , "  A Cross Disciplinary Study of Link Decay and the Effectiveness of Mitigation Techniques  ", BMC Bioinformatics , vol.  14,2013, S5 ( PMID  24266891 , PMCID  3851533 , DOI  10.1186 / 1471-2105-14-S14-S5 )
  13. Hans van der Graaf , "  L'emivita di un collegamento è di due anni  " [ archivio du17 ottobre 2017] , sul blog di ZOMDir (consultato il 31 gennaio 2019 )
  14. Tim Berners-Lee , "  Cool URIs Don't Change  " [ archivio di2 marzo 2000] ,1998(visitato il 31 gennaio 2019 )
  15. Leighton Walter Kille , "  il crescente problema della Internet" Link Rot "e Best Practices per i media e Editori Online  ' [ archivio12 gennaio 2015] , Journalist's Resource, Harvard Kennedy School,8 novembre 2014(visitato il 16 gennaio 2015 )
  16. sistemi potrebbero subire interruzioni nel loro servizio, rendendo temporaneamente non disponibili gli URL.
  17. Parham Habibzadeh , "Gli  attuali sistemi di archiviazione sono sufficientemente affidabili?  ", International Urogynecology Journal , vol.  26, n o  10,30 luglio 2015, p.  1553 ( ISSN  0937-3462 , PMID  26224384 , DOI  10.1007 / s00192-015-2805-7 )
  18. "  Internet Archive: Digital Library of Free Books, Movies, Music & Wayback Machine  " [ archivio26 gennaio 1997] ,10 marzo 2001(visitato il 7 ottobre 2013 )
  19. Gunther Eysenbach e Mathieu Trudel , "  Andare, andare, ancora lì: usare il servizio WebCite per archiviare permanentemente le pagine web citate  ", Journal of Medical Internet Research , vol.  7, n o  5,2005, e60 ( PMID  16403724 , PMCID  1550686 , DOI  10.2196 / jmir.7.5.e60 )
  20. Jonathan Zittrain , Kendra Albert e Lawrence Lessig , "  Perma: Scoping and Addressing the Problem of Link and Reference Rot in Legal Citations  ", Legal Information Management , vol.  14, n o  212 giugno 2014, p.  88–99 ( DOI  10.1017 / S1472669614000255 , leggi in linea )
  21. "  Il Berkman Center dell'Università di Harvard rilascia Amber, uno strumento di" aiuto reciproco "per blogger e proprietari di siti web per aiutare a mantenere il web disponibile | Berkman Center  ” [ archivio di2 febbraio 2016] , su cyber.law.harvard.edu (consultato il 28 gennaio 2016 )
  22. John Mueller , "  FYI sulle ultime funzionalità di Google Toolbar  " [ archivio13 settembre 2008] , Blog del Centro webmaster di Google,14 dicembre 2007(visitato il 9 luglio 2008 )
  23. Ziv Bar-Yossef, Andrei Z. Broder, Ravi Kumar e Andrew Tomkins (2004) "Sic transit gloria telae: verso una comprensione del decadimento del Web" Atti della 13a conferenza internazionale sul World Wide Web - WWW '04 : 328– 337 p. ( DOI : 10.1145 / 988672.988716 ). 

Vedi anche

Articoli Correlati

Bibliografia