mapreduce

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
mapreduce [2025/06/22 22:06] administratormapreduce [2025/06/22 22:21] (Version actuelle) administrator
Ligne 4: Ligne 4:
  
 ====== MapReduce ====== ====== MapReduce ======
 +MapReduce est un modèle de programmation conçu pour traiter de manière efficace et à grande échelle des ensembles de données distribués sur un cluster de calculateurs. Il a été initialement développé par Google et est largement utilisé dans les systèmes de big data tels que Hadoop.
 +
 +Le modèle MapReduce se compose de deux phases principales : la phase Map et la phase Reduce.
 +
 +Dans la phase Map, les données sont traitées en parallèle sur chaque nœud du cluster. Chaque nœud prend en entrée une partie des données, les traite et produit une série de paires clé-valeur.
 +
 +Dans la phase Reduce, les paires clé-valeur produites pendant la phase Map sont regroupées par clé et traitées en parallèle sur chaque nœud du cluster. Le résultat final est une collection de paires clé-valeur qui représente le résultat du traitement.
 +
 +Le modèle MapReduce permet de distribuer automatiquement le traitement des données sur un cluster de calculateurs, ce qui permet de traiter des ensembles de données très volumineux de manière efficace et performante. Il est particulièrement adapté aux applications de big data telles que le traitement de logs, l'analyse de données, le machine learning, etc.