<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=270060846955571&amp;ev=PageView&amp;noscript=1">

Data Lake di Neodata: la soluzione che genera valore

Novembre 2019

 

Per estrarre insight di valore dai dati e supportare il business nelle nuove sfide dell’era digitale è necessario prevedere nuove architetture a partire dal Data Lake. È una scelta di efficienza, di flessibilità, ma soprattutto di lungimiranza nei confronti di un fenomeno inarrestabile. Volumi, variabilità, varietà e velocità dei dati sono destinati ad aumentare esponenzialmente nei prossimi anni. Continuare a utilizzare architetture tradizionali come il classico Data Warehouse non è una scelta funzionale né all'adozione di applicazioni di nuova generazione – che in modalità on demand necessitano della massima agilità per soddisfare le richieste degli utenti – né all'utilizzo di piattaforme analitiche, vero cuore degli approcci customer-centric e data-driven. Nel momento in cui bisogna supportare attività basate sulla raffinazione di Big Data, sia l'una che l'altra tipologia di strumenti hanno bisogno di accedere ai record localizzando e riconoscendo immediatamente i dati necessari a mettere in moto una determinata elaborazione o a erogare una serie di servizi. Ridurre ai minimi termini le ridondanze nella lettura e nella riscrittura delle informazioni è essenziale per evitare il rallentamento delle operazioni e la congestione dei workflow. Ma si rivela indispensabile pure nell'ottica di contenere le dimensioni e la complessità dello storage il cui impatto economico si fa sentire sempre con più forza.

 


 

La logica del Data Lake

 

Al contrario del database di stampo tradizionale, il Data Lake si contraddistingue per una conformazione logica e per una serie di caratteristiche che si prestano perfettamente alle nuove esigenze di applicativi e piattaforme analitiche. Come suggerisce il nome stesso, nel Data Lake gli input confluiscono in maniera fluida e a prescindere dalla sorgente, non seguendo le regole rigide di un'architettura pre-strutturata. Ciascun dato è acquisito nel suo formato nativo e non viene classificato né riconosciuto per la posizione o l'estensione che ha, bensì in funzione di una serie di tag e metadati che gli vengono assegnati in base alle policy dell'amministratore di sistema, e che permettono alle applicazioni di identificarlo e accedervi dinamicamente in base a query specifiche. In altre parole, è il quesito di analisi a determinare di volta in volta i dati da scegliere per estrarre informazioni, superando il tipico schema dei database preconfigurati per determinati tipi di operazioni e lasciando massima libertà di accesso a tutti i record disponibili. Questo non solo fa aumentare l'accuratezza di ciascuna elaborazione, ma consente anche al sistema di non replicare i dataset nel momento in cui diverse applicazioni accedono contemporaneamente allo stesso dato.

 


 

Il Data Lake secondo Neodata

 

Più velocità nelle analisi e minor dispendio di risorse: è esattamente ciò di cui hanno bisogno oggi i business che puntano a diventare digital company. Neodata lo sa, ed è per questo che in ambito Data Lake ha sviluppato una metodologia che standardizza le procedure di inserimento di nuove sorgenti dati. Ciò consente di ridurre ulteriormente i tempi per l’onboarding di nuove sorgenti dati, ma anche di limitare notevolmente i rischi di bug. La fase di analisi, che prende vita in un ambiente Hadoop Spark, aiuta i data scientist a esplorare i dati attraverso strumenti avanzati, sviluppando modelli di machine learning in grado di supportare e semplificare le operazioni più complesse. I risultati delle analisi compiute in questa fase sono poi utilizzati nei flussi di processing, per estrarre valore dai dati in maniera automatizzata e continua.

 


 

Un metodo di lavoro nuovo, a tutto vantaggio del business

 

Neodata non si limita a fornire alle imprese un potente strumento di storage, ma le accompagna nella messa a punto di un metodo di lavoro innovativo basato sul Data Lake. Iniziando dall’analisi degli obiettivi strategici aziendali, i consulenti di Neodata definiscono i processi di governance dei dati e analizzano la struttura del team, le sorgenti dati, i flussi informativi per scattare una fotografia nitida del punto di partenza e, solo a questo punto, iniziare a progettare un’architettura Data Lake ad hoc. Una soluzione disegnata su misura per rispondere alle specifiche esigenze del business. Le modalità di accesso al Data Lake vengono quindi regolate in base ai ruoli assegnati a ciascun operatore, definiti a loro volta da licenze e permessi configurabili a livello di amministrazione. Solo in questo modo si ottengono, oltre a velocità ed efficienza, anche trasparenza e sicurezza totali. A tutto vantaggio del business.