O que é Apache Spark?

Question

Accepted Answer

A maior comunidade de código aberto em big data apoia o Apache Spark, um mecanismo de processamento de dados de código aberto super rápido para aplicações de machine learning e IA. O Apache Spark (Spark) é um mecanismo de processamento de dados de código aberto para grandes conjuntos de dados. Em particular, dados em streaming, dados de grafos, machine learning e aplicações de inteligência artificial (IA) se beneficiarão de sua capacidade de escalar e fornecer a velocidade de computação e programabilidade necessárias para o Big Data. O Apache Spark é rápido. Além disso, o tempo de cálculo é muito importante ao trabalhar com Big Data. Ele usa computação em memória (RAM). Em comparação com o Hadoop, pode processar petabytes de dados mais rapidamente. Pode resolver problemas analíticos e computacionais, pois oferece capacidades de processamento de dados em memória de baixa latência. Criou bibliotecas para algoritmos de machine learning e grafos.

Termos relacionados