Per DATA MANAGEMENT intendiamo lo sviluppo e l’esecuzione di architetture, politiche, pratiche e procedure che consentono di raccogliere, conservare e utilizzare i dati in modo sicuro ed efficiente, per creare valore.
I dati costituiscono, infatti, uno dei maggiori asset aziendali, ma la vera sfida è come raccoglierli da fonti eterogenee, in tempi differenti, e organizzarli, integrarli, certificarli, renderli accessibili e utili alle decisioni.
Il data management è la soluzione! Infatti racchiude l’intero processo, dalla pianificazione all’esecuzione fino al monitoraggio.
La DATA preparation, o preparazione dei dati, è l’attività che serve a organizzare i dati provenienti da fonti eterogenee e non ancora elaborati, prima dell’inserimento in database/Data Warehouse.
Si divide a propria volta in diverse fasi:
1. Data cleaning: (unisce i dati doppi, riconosce le eccezioni, elimina i dati non completi e i valori non utili all’analisi)
2. Feature selection: (fase in cui vengono definite le caratteristiche dei dati più rilevanti rispetto agli scopi di analisi, escludendo quelle irrilevanti)
3. Feature trasformation: (fase di trasformazione dei dati nel formato più utile, rendendoli integrabili e utili agli scopi aziendali).
La Data preparation è fondamentale per un data management efficace e richiede la maggior parte del tempo dell’intero processo di gestione: i dati non elaborati vengono così trasformati in output pronti per essere analizzati.
Importante in un’architettura di Data Management è il DATA Access, comprende tutte quelle attività che favoriscono l’accesso ai dati, ovvero la capacità di recuperare dati da qualsiasi fonte e in qualsiasi formato: file di testo, database, email, feed dei social, ecc. Fanno parte delle tecnologie di Data access i driver di database e i convertitori di documenti, come anche i Connettori dei vari tools per la data integration o dei prodotti di Business Intelligence e di Analytics.
La DATA Quality racchiude tutte le operazioni che servono a garantire che il dato sia accurato e utilizzabile per gli scopi previsti. La Data Quality monitora i diversi processi del ciclo di vita del dato, dall’accesso al database aziendale ai punti di integrazione con dati differenti fino al caricamento nei sistemi di destinazione.
Proprio della combinazione dei dati si occupa la DATA Integration, che unisce, integra, manipola e trasforma i dati provenienti da sistemi diversi per una visione complessiva del fenomeno da analizzare.
Tra i più comuni processi di data integration ci sono gli ETL (Extract, Transform, Load) e gli ELT (Extract, Load & Transform), differenti solo per i tempi e le modalità di trasformazione dei dati. I più importanti strumenti e tools di Data integration, oggi disponibili sul mercato, riescono a racchiudere quasi tutte le azioni e le procedure, che costituiscono il concetto di Data Management
La DATA Governance allinea la gestione dei dati alle strategie aziendali: dagli obiettivi di sviluppo alla compliance normativa, detta le regole di funzionamento e monitoraggio dei processi, automatizza processi operativi, ma garantisce la tracciabilità della filiera di gestione all’interno e all’esterno dell’organizzazione.