Spark est un outil de calcul distribué, permettant de lancer de gros calcul sur un cluster. D'après ses développeurs, Spark est 40 fois plus rapide qu'Hadoop pour effectuer le même genre de taches. Spark repose sur HDFS (Hadoop Distributed File System) mais les calculs se font en mémoire pour accélérer les traitements.

Commentaires

Désolé fausse manip j'ai laissé le titre du blog dans le titre de la news...

Il y a environ 5 ans
Vous devez vous inscrire ou vous connecter pour poster un commentaire