<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=270060846955571&amp;ev=PageView&amp;noscript=1">

¿Cómo cambia la gestión de datos entre el Big Data, Analytics, Business Intelligence y Data Lake?

Julio 2019

 

Comenzar a utilizar plataformas y análisis para emprender proyectos de business intelligence, no quiere decir adoptar solamente nuevas herramientas de trabajo. Ante todo es desarrollar una estrategia distinta de trabajo, en el modo de archivar, gestionar y consultar los datos. Básicamente, necesitamos garantizar el acceso a la información de la forma más rápida y fluida posible, procurando de reducir al mínimo la redundanza y repeticiones de datos al momento de su utilizo para los diferentes análisis.

 


 

Por qué el Data Warehouse no permite de pensar en “Big”

 

La expresión Big data non es peregrina y el “big” existe expresamente para subrayar la gran cantidad de datos que vienen generados en la empresa (a través de procesos, compras, relaciones con los clientes, monitorización de las máquinas ) o que se pueden recopilar más allá del perímetro de la organización. Una cantidd de informaciónde que se expande en modo vertiginoso, exponencial y en una increíble variedad de formas: el desafío es proprio el de intentar comprimir y optimizar el volumen, garantizando la velocidad de accesos, pasando por alto la variabilidad. Acabamos de citar las tres famosas “V” del Big Data ( a las que algunos añaden una cuarta “V” que corresponde con verdad y una quinta con valor), es la dimensión las que les define y circunscribe permitiendo a los operadores que se ocupan de ello de cuantificarlos. Moverse a través de estas direcrices para alimentar la Business Intelligence y mazimizar sus beneficios, supone un cambio radical en la lógica con la que se almacenan y se llaman entre sí los datos. En los Data Warehouse clásicos los registros son procesados y archivados en modo estructurado, con formatos predefinidos que permite a los agentes orientar la búsqueda y la respuesta. Rige la práctica del mecanismo por el cuál a cada aplicación o perfil del usuario pueden corresponder dataset concretos que contienen los mismos datos necesarios quizás e otras operaciones y por ello vienen duplicados, creando una redundancia de datos y una conseguente ralentización de los procesos. Éste sistema continua a ser funcional si la necesidad es la de interrogar sobre actividades habituales del database, pero ineficaz cuando se hace necesario profundizar con análisis más complejos ( con la interccesion de más fuentes) y especialmente si se debe realizar en real time o casi.

 


 

La flexibilidad y la rapidez del Data Lake

 

Entra en juego el concepto de Data Lake, un modelo de organización del patrimonio informático que va más allá de las lógicas tradicionales y que habilita , de hecho, el intercambio simultáneo de datos no estructurados, almacenados en formatos original y que poseen tag y metadata que permiten su identificación. El sistema de éste modo es capaz de encontrar e orientarse no tanto en función de su taxonomía, sino en cuanto a las caracteristicas y contenidos que transmite, resultando más adeguados, rápidos y sobretodo más eficaces, no teniendo que duplicar dataset por dataset. Es evidente que la adopción de un planteamiento Data Lake se presenta sumamente útil considerado la cantidad de datos en aumento disponibles : utilizando el Data Warehouse todas las informaciones a completar van por fuerza adecuada a las ya presentes, modificando su extensión y convitiendo el formato. Mientras con el Data Lake, los datos originarios pueden ser introproyectados o solamente consultados ( si por ejemplo se encuentran físicamente en otros repository o cloud) originales, sin necesidad de modificarlos. La estrategia se presenta sobretodo útil no sólo para gestionar una gran cantidad en aumento de información, sino que puede también satisfacer las necesidades de negocio dónde se necesistan resultados o respuestas tempestivas: basta pensar a un lanzamiento de un nuevo producto, para el cuál es indispensable una rápido estudio de mercado o de verificar la utilidad de un procedimento apenas introducido, en el cuál poder corregir en marcha un cambio en caso de consideraciones equivocadas. Naturalmente una estrategia de este tipo no responde a las necesidad de cualquier tipo de organización. Data Lake se revela sumamente eficaz sólo en el caso que exista una gran cantidad de datos que tienen que ser procesados de manera rápida y en profundidad . Hay que saber entonces valorar caso por caso en base a las concretas necesidades. Sólo una cosa es segura, si queremos realmente jugar la carta del Business intelligence basada en Big Data, la adopción de éste sistema es fundamental.

 

 

Attachments