Zum Hauptinhalt springen
Piloterr

Was ist Apache Hadoop?

Apache Hadoop

Apache Hadoop ist eine Open-Source-Java-basierte Softwareplattform, die die Datenverarbeitung und -speicherung für Big-Data-Anwendungen steuert. Die Plattform funktioniert, indem sie die enormen Daten- und Analyseaufgaben von Hadoop in handhabbare, parallele Workloads aufteilt. Diese Workloads werden dann auf Knoten in einem Computing-Cluster verteilt. Skalierbarkeit, Ausfallsicherheit und Anpassungsfähigkeit sind einige der Hauptvorteile von Hadoop. Um Hardware- oder Softwareausfälle zu vermeiden, repliziert das Hadoop Distributed File System (HDFS) jeden Cluster-Knoten auf die anderen Cluster-Knoten. Dies sorgt für Zuverlässigkeit und Robustheit. Hadoop ist vielseitig einsetzbar und kann jede Art von Datenformat speichern, einschließlich strukturierter und unstrukturierter Daten.

Verwandte Begriffe