Qu'est-ce qu'Apache Spark ?

Question

Accepted Answer

Apache Spark est un moteur open source de traitement de données ultra-rapide pour les applications de machine learning et d'IA, soutenu par la plus grande communauté open source du big data. Apache Spark (Spark) est un moteur open source de traitement de données pour des jeux de données massifs. En particulier, les données en streaming, les graphes, le machine learning et l'intelligence artificielle (IA) bénéficient de sa capacité à scaler horizontalement et d'offrir la vitesse de calcul et la programmabilité requises pour le Big Data. Apache Spark est rapide. Le temps de calcul compte beaucoup lorsque l'on travaille avec le Big Data. Il utilise le calcul en mémoire (RAM). Comparé à Hadoop, il peut traiter des pétaoctets de données plus rapidement. Il peut résoudre des problèmes analytiques et de calcul grâce à des capacités de traitement en mémoire à faible latence. Il a développé des bibliothèques pour le machine learning et les algorithmes de graphes.

Termes associés