données massives
Définition
Version française de l'expression usuelle Big Data, l'expression données massives désigne plus généralement les traitements effectués sur des jeux de données au-delà de la capacité de traitement d'un système courant, quel que soit l'époque: le big data d'un jour devient généralement la donnée ordinaire quelques années plus tard.
Les problèmes liés à la volumétrie sont traités en répartissant le stockage sur des systèmes multiples, généralement dans le nuage privé ou public, et en répartissant les travaux en lots portant sur une partie seulement des données, répartis sur une grappe d'ordinateurs: dans un premier temps, les travaux et un sous-ensemble des données sont distribués sur la grappe (opération "map"), puis dans un second temps, les résultats intermédiaires de chaque sous-ensemble sont agrégés (opération "reduce") sur un nombe plus réduit de système. Cette technique Map/Reduce a été popularisée par Google, et est notamment mise en œuvre par le cadre de programmation Hadoop.
Cas d'utilisation
L'application la plus visible concerne l'extraction de signaux faibles dans les données marketing, mais les plus gros environnements de données massives opèrent sur les données scientifiques.
Terminologie
On trouve quelquefois l'expression "datamasse" dans le même sens.
Epoque du terme
depuis 2001