Il BI ( Business Intelligence inglese ( BI ) e supporto del sistema decisionale ( DSS )) è il computer utilizzato dai responsabili delle politiche e dai leader aziendali. Indica i mezzi, gli strumenti e i metodi che consentono di raccogliere, consolidare, modellare e ripristinare i dati , materiali o immateriali , di un'azienda al fine di offrire supporto decisionale e consentire a un decisore di avere una visione d'insieme dell'attività svolta elaborato.
Questo tipo di applicazione si basa su un'architettura comune le cui basi teoriche provengono principalmente da Ralph Kimball , Bill Inmon e DanLinstedt.
La business intelligence fa parte dell'architettura più ampia di un sistema informativo , ma non è un concetto in competizione con la gestione del sistema informativo . Allo stesso modo in cui la gestione è una questione di sociologia ed economia , la gestione attraverso l'IT è costitutiva di due campi radicalmente diversi, vale a dire la gestione e l' IT . Per arricchire il concetto con questi due modi di pensare, è possibile considerare un lato orientato all'ingegneria informatica chiamato business intelligence , e un altro lato che serve più in particolare approcci gestionali chiamati system management .
Il termine inglese business intelligence (BI) può portare a confusione con la nozione di intelligenza economica (IE). Business intelligence non significa " intelligenza economica ", contrariamente a quanto suggerirebbe una traduzione letterale (Cfr. Questa discussione) .
BI differisce da EI in tre modi:
Attualmente, i dati delle applicazioni aziendali sono archiviati in uno (o più) database relazionali o non relazionali.
Questi dati vengono estratti, trasformati e caricati in un data warehouse generalmente da uno strumento di tipo ETL ( Extract-Transform-Load ).
Un data warehouse può assumere la forma di un data warehouse o di un data mart . Come regola generale, il data warehouse aggrega tutti i dati applicativi dell'azienda, mentre i data mart (generalmente alimentati dai dati del data warehouse ) sono sottoinsiemi di informazioni riguardanti un particolare business dell'azienda (marketing, rischio, controllo di gestione, ecc.), usi specifici (analisi, reportistica, ecc.) o addirittura soddisfano requisiti o vincoli specifici (partizionamento dei dati, volume, ecc.). Il termine contatore o archivio dati viene utilizzato anche per designare un datamart.
I data warehouse consentono di produrre report che rispondono alla domanda "Che cosa è successo?" Ma possono anche essere progettati per rispondere alla domanda analitica "Perché è successo?" "E alla domanda prognostica" Cosa succederà? ". In un contesto operativo, rispondono anche alla domanda "Cosa sta succedendo in questo momento?" ", O anche nel caso di una soluzione di data warehouse attiva" Cosa dovrebbe accadere? ".
La reportistica è probabilmente la più utilizzata oggi e l'applicazione di BI, consente ai manager:
I programmi utilizzati per la refertazione permettono ovviamente di riprodurre le stesse selezioni e gli stessi trattamenti di periodo in periodo e di variare alcuni criteri per affinare l'analisi. Ma il reporting non è strettamente parlando un'applicazione di supporto decisionale. Il futuro appartiene piuttosto a strumenti di tipo cruscotto dotati di funzioni di analisi multidimensionale di tipo Olap. Funzione OLAP che può essere ottenuta in diversi modi, ad esempio tramite un database relazionale R-OLAP, o database M-OLAP multidimensionale, o anche in H-OLAP.
Datamart e / o data warehouse possono così consentire, tramite OLAP, un'analisi molto approfondita dell'attività dell'azienda, grazie a statistiche che combinano informazioni relative ad attività apparentemente molto diverse o molto distanti tra loro, ma lo studio di che spesso rivela disfunzioni, correlazioni o possibilità di miglioramenti molto significativi.
L' interoperabilità tra il data warehouse dei sistemi , le applicazioni informatiche o la gestione dei contenuti e i sistemi di reporting è ottenuta tramite metadati di gestione .
La business intelligence si concentra sulla misurazione:
Ad esempio, potremmo voler misurare:
Si ottiene così una tabella con due voci:
A titolo illustrativo, le tabelle incrociate dei principali fogli di calcolo consentono di costruire questo tipo di dashboard da un database .
Se siamo interessati a una terza dimensione di analisi, ad esempio, la gerarchia geografica dei punti vendita (per paese, regione, punto vendita) ci spostiamo quindi su un cubo . Le tabelle pivot di Excel possono rappresentare questo tipo di cubo con la "pagina", che rappresenta i dati aggregati per ogni livello gerarchico e per ogni dimensione.
Se siamo interessati a un ulteriore asse di analisi, ad esempio la segmentazione della clientela (per categoria, professione, cliente), otteniamo quindi un cubo con più di 3 dimensioni, chiamato ipercubo . Il termine cubo viene spesso utilizzato al posto di ipercubo .
Gli strumenti del mondo decisionale offrono possibilità di "navigazione" nelle diverse dimensioni del cubo o dell'ipercubo:
Ciascuna di queste viste parziali del cubo si traduce in ultima analisi in una tabella a doppia immissione (ordinamento incrociato) o in un grafico generalmente bidimensionale .
Pertanto, sebbene la navigazione nel cubo sia multidimensionale, il decisore non ha, in realtà, accesso a una sintesi, ma a una moltitudine di viste incrociate o bidimensionali la cui esplorazione, lunga e noiosa, a volte è breve. - circuito per mancanza di tempo. Ciò può portare a costosi errori decisionali.
Può quindi essere utile coniugare questo approccio con un'iconografia delle correlazioni , che consenta una visione d'insieme veramente multidimensionale , libera da ridondanze.
Un sistema informativo sulle decisioni (CIS) deve essere in grado di fornire quattro funzioni di base: raccolta, integrazione, distribuzione e presentazione dei dati . A queste quattro funzioni si aggiunge una funzione di amministrazione , ovvero il controllo del SID stesso.
La funzione di raccolta (a volte chiamata datapumping ) copre tutte le attività consistenti nel rilevare, selezionare, estrarre e filtrare i dati grezzi dagli ambienti rilevanti dato l'ambito coperto dal SID. Poiché è comune che le fonti di dati interne e / o esterne siano eterogenee - sia dal punto di vista tecnico che semantico - questa funzione è la più difficile da impostare in un sistema decisionale complesso. Si basa in particolare su strumenti ETL ( extract-transform-load per estrazione-trasformazione-caricamento).
I dati di origine che alimentano il SID provengono da sistemi di produzione transazionale, molto spesso sotto forma di:
La funzione di raccolta svolge anche un ruolo di ricodifica, se necessario. Un dato rappresentato in modo diverso da una fonte all'altra richiede la selezione di un'unica rappresentazione e quindi un patrimonio utile per analisi future.
La funzione di integrazione consiste nel concentrare i dati raccolti in uno spazio unificato, la cui base informatica essenziale è il data warehouse . Elemento centrale del sistema, consente alle applicazioni di business intelligence di nascondere la diversità dell'origine dei dati e di beneficiare di una fonte di informazioni comune, omogenea, standardizzata e affidabile, all'interno di un sistema unico e se possibile standardizzato.
Di passaggio, i dati vengono purificati o trasformati da:
È anche in questa funzione che vengono eseguiti i calcoli e le aggregazioni (accumulazioni) comuni all'intero progetto.
La funzione di integrazione è generalmente fornita dalla gestione dei metadati , che garantisce l' interoperabilità tra tutte le risorse del computer , siano esse dati strutturati ( database a cui si accede da pacchetti software o applicazioni), o dati non strutturati (documenti e altre risorse non strutturate, manipolate dal contenuto sistemi di gestione ).
La funzione di disseminazione mette i dati a disposizione degli utenti , secondo schemi corrispondenti ai profili o alle professioni di ciascuno, sapendo che l'accesso diretto al data warehouse generalmente non corrisponde alle specifiche esigenze di un decisore o manager. 'Un analista. L'obiettivo prioritario è quindi quello di segmentare i dati in contesti informativi altamente coerenti, di facile utilizzo e corrispondenti ad una particolare attività decisionale. Mentre un data warehouse può ospitare centinaia o migliaia di variabili o indicatori, un contesto di rilascio ragionevole ne ha al massimo poche dozzine. Ogni contesto può corrispondere a un datamart , sebbene non ci siano regole generali per l'archiviazione fisica. Molto spesso, un contesto di diffusione è multidimensionale , cioè può essere modellato sotto forma di ipercubo ; può quindi essere reso disponibile utilizzando uno strumento OLAP .
I diversi contesti dello stesso sistema decisionale non richiedono tutti lo stesso livello di dettaglio. Molti aggregati o accumulazioni interessano solo alcune applicazioni e quindi non necessitano di essere gestiti come aggregati comuni dalla funzione di integrazione: la gestione di questo tipo di specificità può essere affidata alla funzione broadcast. Questi aggregati possono essere facoltativamente archiviati in modo persistente o calcolati dinamicamente su richiesta.
In questa fase e quando si tratta di progettare un sistema di segnalazione, devono essere sollevati tre livelli di interrogazione:
Questa quarta funzione, la più visibile all'utente, regola le condizioni di accesso dell'utente alle informazioni, nell'ambito di una determinata interfaccia uomo-macchina ( HMI ). Assicura il controllo degli accessi e il funzionamento della postazione di lavoro , la gestione delle richieste, la visualizzazione dei risultati in una forma o nell'altra. Utilizza tutte le possibili tecniche di comunicazione: strumenti d' ufficio , richiedenti e generatori di report specializzati, infrastruttura web , telecomunicazioni mobili, ecc.
È la funzione trasversale che sovrintende alla corretta esecuzione di tutte le altre. Controlla i dati del processo di aggiornamento , la documentazione dei dati (i metadati ), la sicurezza , il backup e la gestione degli incidenti.
In un'azienda, il volume dei dati elaborati cresce rapidamente nel tempo. Questi dati possono provenire da fornitori, clienti, ambiente, ecc. Questa quantità di dati aumenta a seconda del settore e dell'attività dell'azienda. Ad esempio, nei supermercati , la quantità di dati raccolti ogni giorno è enorme (soprattutto quando i negozi raccolgono le ricevute di pagamento).
L'azienda dispone di diverse opzioni per elaborare questo flusso di dati:
Il progetto decisionale corrisponde a quest'ultima opzione. Si tratta di elaborare i dati e archiviarli in modo coerente man mano che arrivano. Ecco perché il progetto decisionale è un progetto senza limiti di tempo. Vale a dire che non appena l'azienda avvia questo progetto, non si ferma (tranne in casi eccezionali). Wal-Mart (una catena di supermercati ) è una delle aziende che immagazzina più dati (ha moltiplicato i suoi dati per 100 in pochi anni) e raggiungerà negli anni a venire I petabyte (1.000 terabyte ).
Per realizzare questi progetti decisionali, ci sono una moltitudine di strumenti, ciascuno più o meno adattato alle dimensioni dell'azienda, alla struttura dei dati esistenti e al tipo di analisi desiderato.
Tre aree dovrebbero essere particolarmente documentate:
Questo porta alla scelta di tecnologie precise e di un modello particolare.