¿Qué es Apache Spark?

Question

Accepted Answer

La mayor comunidad de código abierto en big data respalda Apache Spark, un motor de procesamiento de datos de código abierto y ultra rápido para aplicaciones de machine learning e IA. Apache Spark es un motor de procesamiento de datos de código abierto para grandes conjuntos de datos. En particular, los datos en streaming, los datos gráficos, el machine learning y las aplicaciones de inteligencia artificial (IA) se beneficiarán de su capacidad para escalar y proporcionar la velocidad de computación y la programabilidad necesarias para el Big Data. Apache Spark es rápido. Además, el tiempo de cálculo es muy importante cuando se trabaja con Big Data. Utiliza computación en memoria (RAM). En comparación con Hadoop, puede procesar petabytes de datos más rápidamente. Puede abordar problemas analíticos y computacionales ya que ofrece capacidades de procesamiento de datos en memoria de baja latencia. Ha creado bibliotecas para algoritmos de machine learning y gráficos.

Términos relacionados