I dati grezzi (noti anche come dati primari) sono dati non interpretati da una fonte primaria , con caratteristiche ad essa associate e che sono stati sottoposti a qualsiasi trattamento o altra manipolazione.
I dati grezzi possono essere inseriti in un programma per computer o utilizzati in procedure manuali come l'analisi statistica di un sondaggio.
Può trattarsi di dati binari da dispositivi di archiviazione elettronici come le unità disco rigido .
I dati grezzi contengono informazioni più o meno fattuali . Sono spesso quantitativi , ritenuti affidabili se lo strumento che li ha prodotti è stato opportunamente calibrato e se il processo di raccolta non è sbilanciato e se sono correttamente contestualizzati.
Nel campo della ricerca scientifica (dove è necessario poter ripetere un esperimento per verificarlo o validarlo), i fatti presentati o convalidati senza fornire accesso a dati grezzi sono sempre più soggetti a cautela. Sta diventando sospettoso non tenerli perché negli ultimi anni i costi di archiviazione sono diminuiti e si è assistito ad un aumento degli scandali relativi ad errori di conoscenza indotti da dati grezzi.
Tuttavia, secondo Geoffrey C. Bowker (2005), "Dobbiamo aprire il dibattito - anche se attualmente non ce n'è di serio - sulle diverse temporalità , spazialità e materialità che probabilmente rappresenteremo grazie alle nostre basi. Dati , con, in vista, un design che consente la massima flessibilità, e che consente, per quanto possibile, l'emergere di polifonia e policronia . L'espressione "dati grezzi" è tanto un ossimoro quanto una cattiva idea; al contrario, i dati dovrebbero essere preparati con cura. " .