NATURA DEI DATI ANALIZZABILI E CAMBIAMENTI DI SCENARIO DELLE SOLUZIONI D'ANALISI
2 premesse fondamentali:
- affrontiamo il tema in una logica di Information Technology;
- partiamo da un dato che ci è stato fornito da indagini globali sulla struttura dei dati che sono potenzialmente disponibili in giro per il mondo: l’80% di questi sono non strutturati.
Innanzitutto, abbiamo le idee chiare su come possano essere suddivisi i dati in relazione alla loro struttura e, non meno, cosa sia la struttura dei dati?
Sulla base delle premesse indicate, i dati strutturati sono i dati conservati in database, organizzati secondo schemi e tabelle rigide e conosciute.
Questa è la tipologia di dati che consente la creazione immediata di modelli di gestione relazionale delle informazioni.
I dati non strutturati sono i dati conservati, ammesso lo siano, al di fuori di database e senza alcuno schema. Parliamo, esemplificando, di file di testo e/o file multimediali.
Anche quando la conservazione fosse sistematizzata, i sistemi utilizzabili di gestione di dati sono quelli dell’information retrieval (IR).
L’ IR, il reperimento delle informazioni, secondo Wikipedia, è l’insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l’organizzazione e l’accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali.
Esiste, poi, una categoria intermedia di dati: i dati semi strutturati.
Nei dati semi strutturati, s’incontrano alcune delle caratteristiche dei dati strutturati e alcune delle caratteristiche dei dati non strutturati. Pensiamo ai file XML, ad esempio, nei quali, nonostante non vi siano limiti strutturali all’inserimento dei dati, le informazioni vengono, comunque, organizzate secondo logiche strutturate e interoperabili.
.
Abbiamo già affrontato il tema big data/analytics/business intelligence.
Qui riflettiamo sul fatto di come sia sfidante la conquista del 100% dei dati potenzialmente disponibili (e delle conseguenti informazioni) e di come il viatico sia l’acquisizione di modelli d’analisi che vadano oltre le soluzioni di business intelligence.
La potenza e le prestazioni delle tecniche analitiche impiegate avvalora il processo decisionale e consente una valutazione puntuale (e tempestiva) degli esiti futuri delle decisioni assunte.
Questo consente un approccio alla progettualità d’impresa meno condizionato dal fattore tempo, poiché i decisori aziendali possono valutare in tempi rapidi quali siano le ricadute delle scelte operate, e non solo in termini strettamente economico-finanziari.
.
Business Intelligence vs Advanced Analytics
Ci proponiamo di definire, in modo sintetico, i confini delle due modalità d’analisi, sia per una corretta capacità comunicativa, sia per un altrettanto precisa capacità interpretativa.
Se confrontiamo i sistemi di business intelligence con i sistemi di advanced analytics, secondo 2 logiche sostanziali:
- quali obiettivi si propongono (o a quali esigenze rispondono);
- quali strumenti utilizzino;
quello che segue potrebbe essere un quadro comparativo che ci consente, con buona approssimazione, di mettere in relazione le problematiche che fossimo in grado d’indagare con la tipologia di soluzione coerente, avendo un riferimento agli strumenti da attivare:
Business Intelligence | Advanced Analytics | |
Obiettivi e domande a cui rispondono | Cos’è accaduto?
Quando? Di chi sono i dati/risultati in esame? Quanto/quanti? |
Perché è accaduto?
Potrebbe accadere di nuovo? Cosa accadrebbe se cambiassimo X o Y? Cos’altro ci dicono i dati che non abbiamo mai pensato di chiedere? |
Strumenti utilizzati/bili |
Reportistica, inclusi KPI – Key Performance Indicators Costruzione di query ad hoc Tecniche OLAP, come cubi multidimensionali, strumenti di segmentazione bidimensionale di dati (slice & dice), drilling Cruscotti di sintesi e pannelli d’analisi (scorecards) Analisi dati in tempo reale – Operational BI Sistemi automatici di monitoraggio ed allerta |
Analisi statistiche per la individuazione dei trend, sino a…
Modelli ed analisi predittive Estrazioni di specifiche conoscenze dallo scrutinio (automatico o semiautomatico) di grandi quantità di dati – Data Mining Modelli ed analisi predittive Analisi di relazioni, tendenze, preferenze, ecc. – Big Data Analytics Analisi dei dati contenuti in testi di linguaggio naturale – Text Analytics/Mining Statistiche multivariate (a più dimensioni) e relativi test |
.