Un "data lake" est un emplacement central qui conserve de grandes quantités de données dans leur forme originale et non traitée. Contrairement à un entrepôt de données hiérarchique qui stocke les données en fichiers ou dossiers, un data lake utilise une architecture plate et un stockage objet. Les données y sont conservées avec des tags de métadonnées et un identifiant unique, ce qui améliore les performances et facilite la recherche et la récupération inter-régions. Les data lakes permettent à de nombreuses applications d'utiliser les données grâce à des standards ouverts et un stockage objet économique. Leur structure ouverte évite le verrouillage propriétaire typique des entrepôts de données, un enjeu de plus en plus important dans les architectures data modernes. Les data lakes sont durables, économiques, scalables et tirent parti du stockage objet.
Qu'est-ce qu'un lac de données ?
Lacs de données
Un « data lake » est un emplacement central qui conserve de grandes quantités de données dans leur forme originale et non traitée. Contrairement à un entrepôt de données hiérarchique qui stocke les données en fichiers ou dossiers, un data lake utilise une architecture plate et un stockage objet. Les données y sont conservées avec des tags de métadonnées et un identifiant unique, ce qui améliore les performances et facilite la recherche et la récupération inter-régions. Les data lakes permettent à de nombreuses applications d'utiliser les données grâce à des standards ouverts et un stockage objet économique. Leur structure ouverte évite le verrouillage propriétaire typique des entrepôts de données, un enjeu de plus en plus important dans les architectures data modernes. Les data lakes sont durables, économiques, scalables et tirent parti du stockage objet.