I vantaggi della Data Virtualization

Di Roberto Grassi - pubblicato il 03/03/2022

I vantaggi della Data Virtualization

Di Roberto Grassi - pubblicato il 03/03/2022

Di Roberto Grassi
pubblicato il 03/03/2022

La data virtualization è una tecnologia di sintesi dei dati che fornisce un livello logico unitario per acquisire e integrare informazioni provenienti da differenti fonti dati aziendali (database, datawarehouse, sistemi legacy).

La data virtualization è una tecnologia di sintesi dei dati che fornisce un livello logico unitario per acquisire e integrare informazioni provenienti da differenti fonti dati aziendali (database, datawarehouse, sistemi legacy).

Diciamo che integra “informazioni” e non “dati” per connotare il focus verso il contenuto di business del dato piuttosto che le sue caratteristiche tecniche.  

Con gli attuali strumenti di data virtualizzazione apriamo infatti una porta agli utenti business (ovvero quelli che “non sanno scrivere query in sql”)  per renderli autonomi, in sicurezza, nell’elaborare le informazioni che servono loro.

Il punto chiave è “in sicurezza”.

Per spiegarlo ripartiamo da cosa è la “virtualizzazione dei dati”.

In altri termini consiste nel costruire delle viste, ovvero dei legami fra dati provenienti da origini diverse senza riscriverli mai, tenendo tutto “in memoria”.

Si possono “estrarre” i risultati finali, salvarli da qualche parte nel proprio PC o in rete (anche se sarebbe meglio non farlo), incollarli in un file excel o in una presentazione. Il dato o l’informazione prodotta da questa operazione non rimane però a disposizione di nessun altro come fonte dati.

Chiusa la sessione si butta via tutto.

E non è un concetto nuovo, magari senza la formalità di un nome proprio, era una “cosa” che si provava a fare anche 2 o 3 lustri fa.

Il problema era che la virtualizzazione mangiava (e mangia) computazione e memoria, ben più di quanta ne avevamo.

Ora che abbiamo l’hardware a disposizione la virtualizzazione è “tecnicamente” possibile.  

Perché dovremmo farla?

Non ci aiuta nelle prestazioni, in sé non è condizione necessaria per elaborare dati in real-time (anzi, piuttosto è il contrario). Tutto sommato lo spazio disco (rispetto a memoria a computazione) è relativamente economico. Nonostante ciò sembra che tutto il mondo si sia concentrato per impedire a un analista di materializzarsi una tabella con i dati che gli servono per un obiettivo di business specifico.

Perché?

Il quid della questione non è più tecnico, ma relativo a compliance, sicurezza, qualità del dato.

Ogni volta che creiamo un dato (o lo riscriviamo da un’altra parte) dobbiamo assicurarne la compliance normativa, dobbiamo verificarne la qualità, dobbiamo normarne l’accesso, dobbiamo manutenerlo. Se leggiamo un dato c’è un unico responsabile, quello che l’ha prodotto. Se lo duplichiamo noi diventiamo responsabili della replica.

La data virtualization ci permette di mettere a disposizione i dati di tutta l’azienda a tutte le funzioni di business, lasciando ampia libertà di analisi e produzione di informazioni specifiche senza mettere a rischio l’integrità della base dati.

Da qui il nascere di software per creare e gestire strati virtualizzati, tra i cui principali punti di forza c’è la rigidità: il singolo utente/analista può realizzare in autonomia processi di trasformazione del dato, senza però potersi allontanare da quanto definito nelle linee guida di data governance e senza alcuna possibilità di materializzare dati anche quando è preso dallo sconforto o dalla fretta.

Ed eccoci quindi a parlare di data virtualization in tutte quelle situazioni dove il dato - l’informazione - è nel cuore del processo produttivo (banche e assicurazioni, chimico farmaceutico).

In Sidesoft, per i nostri clienti, stiamo costruendo strati di dati virtualizzati per fornire agli utenti delle funzioni IT la possibilità di elaborare informazioni dedicate in completa sicurezza.