I database bibliografici orientano qualsiasi classe di oggetti libri bibliografici, collezioni, recensioni, articoli di riviste attraverso i loro metadati come il titolo , l'autore, l'abstract, il descrittore del soggetto. Sono il risultato dell'informatizzazione dei cataloghi delle biblioteche e consentono ricerche tramite parole chiave e analisi di dati ( bibliometrici , ecc.). WorldCat è un esempio di tale database.
A partire dagli anni '60 sono stati creati database bibliografici o più precisamente database di riferimento bibliografico.
Negli anni 1960-70 è privilegiato il termine banca dati . Designa quindi le banche dati, all'epoca frequentemente di riferimenti bibliografici, relative a "un'area di conoscenza definita e organizzata per essere offerta alle consultazioni degli utenti". Questo termine ha permesso di distinguere questi sistemi documentari dal software stesso o dai sistemi di gestione di database (DBMS).
Le banche dati bibliografiche si sono evolute, in particolare a partire dagli anni 2000, lungo due assi combinabili:
Il termine database qui utilizzato deve essere interpretato con cautela. Piuttosto, è più una raccolta di dati o record bibliografici. Questa struttura apparentemente semplice può nascondere fattori di complessità.
La struttura dei record può essere relativamente elementare (semplice raccolta di campi), più complessa con i formati MARC (o conforme allo standard ISO 2709 ), e ora di qualsiasi struttura con XML .
Rispetto ai database relazionali , un fattore di complessità deriva dall'impossibilità di congelare la dimensione dei dati. Quasi tutti i campi sono di lunghezza variabile con fattori di ripetizione che possono diventare molto grandi. Ad esempio, il nome di un autore è in media inferiore a 10 caratteri, ma ci sono autori di più di 100 caratteri. Un articolo scientifico ha in media 2 o 3 autori ma si possono trovare articoli di fisica con 500 autori.
Molti database bibliografici contengono informazioni che descrivono il contenuto utilizzando un elenco di termini o parole chiave dell'indice . Queste parole chiave appartengono spesso a archivi terminologici la cui natura è variabile: semplice elenco di parole controllate, piano di classificazione, thesaurus documentario o ontologia .
Oltre all'indicizzazione, una grande quantità di dati può fare riferimento a archivi specializzati, come i titoli di periodici o affiliazioni.
Infine, alcune banche dati codificano anche i riferimenti bibliografici della bibliografia degli articoli elaborati, come l'Indice delle citazioni scientifiche, e la banca dati bibliografica diventa quindi un proprio archivio.
Anche le banche dati bibliografiche sono definite in base ai temi scelti. Possono influenzare notevolmente la struttura della base (ad esempio, nelle scienze della vita la codificazione dei geni).
Una base è definita anche dalla sua copertura, o più precisamente dal modo in cui è composta la base. In molti casi (Medline, Pascal) la copertura è definita da una serie di recensioni che vengono analizzate sistematicamente.