Ir para o conteúdo principal
Piloterr

O que são data lakes

Um local central chamado "data lake" armazena uma grande quantidade de dados em seu formato original e não processado. Um data lake utiliza uma arquitetura plana e armazenamento de objetos para guardar os dados, ao contrário de um data warehouse hierárquico, que armazena dados em arquivos ou pastas. Os dados são armazenados em armazenamento de objetos com tags de metadados e um identificador único, o que melhora o desempenho e facilita a localização e recuperação de dados em diferentes regiões. Os data lakes permitem que várias aplicações utilizem os dados ao empregar padrões abertos e armazenamento de objetos de baixo custo. Devido à sua estrutura aberta, os data lakes permitem que os usuários evitem ficar presos a sistemas proprietários, como os data warehouses, o que se tornou cada vez mais crucial nas arquiteturas de dados modernas. Os data lakes não são apenas incrivelmente duráveis e econômicos, mas também podem escalar e utilizar armazenamento de objetos.