Data Lake

Archiviazione dei dati per la successiva analisi e correlazione

Il primo passo per poter prendere decisioni sempre più informate è raccogliere i dati. Il Data Lake è il contenitore in cui i dati provenienti da fonti eterogenee vengono conservati per essere successivamente elaborati.

Cos'è il Data Lake? Caratteristiche e Vantaggi

Il Data Lake è un sistema di archiviazione dei dati centralizzato e flessibile, i dati provenienti da sorgenti eterogenee sono conservati in formato grezzo. Il Data Lake può contenere dati strutturati, semi-strutturati e non strutturati che generalmente sono indicizzati in modo da velocizzarne il successivo recupero per future elaborazioni. Il Data Lake:

  • conserva quantità di dati grezzi enormi
  • permette un rapido accesso ai dati
  • si avvale di storage distribuito a costi limitati

Cos'è il Data Lake? Caratteristiche e Vantaggi

Azure Data Lake

Azure Data Lake è la soluzione Cloud di Microsoft articolata su due livelli, storage e analisi. Azure Data Lake Storage è il livello di archiviazione e presenta alcune caratteristiche tali che lo posizionano come leader di mercato:

  • storage basato sullo standard HDFS
  • sicurezza di livello enterprise
  • capacità di scalare massivamente
  • nessun limite alla dimensione dei dati

Approfondisci nella nostra sezione dedicata a Microsoft Azure.

Azure Data Lake

Archiviazione e Big Data

Le fonti di dati sono moltissime e continuano ad aumentare e ciò che caratterizza il big data non è solo la quantità davvero enorme di dati raccolti ma anche la loro complessità e varietà. L'archiviazione di questi dati è pertanto un aspetto fondamentale e servono sistemi in grado di gestirli in modo efficiente ed a costi competitivi.