Skip to main content
Piloterr

Qu'est-ce qu'Apache Hadoop ?

Apache Hadoop

Apache Hadoop est une plateforme logicielle open source basée sur Java qui gère le traitement et le stockage de données pour les applications big data. La plateforme fonctionne en décomposant les volumes massifs de données et les tâches analytiques de Hadoop en charges parallèles gérables, puis en les distribuant entre les nœuds d'un cluster de calcul. La scalabilité, la résilience et l'adaptabilité comptent parmi les principaux avantages de Hadoop. Pour se prémunir contre les pannes matérielles ou logicielles, le Hadoop Distributed File System (HDFS) réplique chaque nœud du cluster vers les autres nœuds, ce qui garantit fiabilité et résilience. La polyvalence de Hadoop permet de stocker tout type de format de données, structurées comme non structurées.