Manuel de suivi dynamique Solaris

Fonctions de groupement

Une fonction de groupement se caractérise par les propriétés suivantes :

f(f(x0) U f(x 1) U ... U f(xn)) = f(x 0 U x1  U ... U xn)

xn est un jeu de données arbitraires. En bref, appliquer une fonction de groupement à des sous-ensembles puis la réappliquer aux résultats obtenus revient à l'appliquer à l'intégralité des données. Par exemple, prenons une fonction SUM permettant d'additionner un jeu de données. Si les données brutes se composent des éléments {2, 1, 2, 5, 4, 3, 6, 4, 2}, on obtient {29} en appliquant la fonction SUM à l'intégralité du jeu. De la même façon, l'application de SUM au sous-ensemble comprenant les trois premiers éléments donne comme résultat {5}, l'application de SUM à l'ensemble comprenant les trois éléments suivants donne comme résultat {12} et l'application de SUM aux trois éléments restants donne également comme résultat {12}. SUM est une fonction de groupement car son application à l'ensemble formé par les résultats {5, 12, 12} donne le même résultat, {29}, que l'application de SUM aux données d'origine.

Toutes les fonctions ne sont pas des fonctions de groupement. C'est notamment le cas de la fonction MEDIAN : elle détermine la valeur médiane d'un jeu de données. (La médiane se caractérise comme l'élément d'un ensemble ayant une valeur telle qu'il existe autant d'éléments dont la valeur est supérieure à la sienne que d'éléments dont la valeur est inférieure à la sienne.) La fonction MEDIAN est calculée en triant l'ensemble et en sélectionnant l'élément central. Si l'on revient aux données brutes d'origine, l'application de la fonction MEDIAN à l'ensemble comprenant les trois premiers éléments donne comme résultat {2}. (L'ensemble trié donne {1, 2, 2} ; {2} constitue l'élément central de l'ensemble.) De même, l'application de la fonction MEDIAN aux trois éléments suivants donne comme résultat {4} et son application aux trois derniers éléments donne comme résultat {4}. L'application de MEDIAN à chacun des sous-ensembles donne donc {2, 4, 4}. Le résultat donné par l'application de MEDIAN à cet ensemble est {4}. Toutefois, le tri de l'ensemble d'origine donne comme résultat {1, 2, 2, 2, 3, 4, 4, 5, 6}. L'application de MEDIAN à cet ensemble donne donc comme résultat {3}. Étant donné que les résultats ne correspondent pas, MEDIAN n'est pas une fonction de groupement.

De nombreuses fonctions courantes permettant d'interpréter un jeu de données sont des fonctions de groupement. Ces fonctions permettent entre autres de compter le nombre d'éléments dans un ensemble, de calculer les valeurs minimale et maximale d'un ensemble et d'additionner l'ensemble des éléments au sein de cet ensemble. Il est possible de déterminer la signification arithmétique à partir de la fonction permettant de compter le nombre d'éléments dans l'ensemble et celle permettant d'additionner le nombre d'éléments dans l'ensemble.

Toutefois, plusieurs fonctions utiles ne sont pas des fonctions de groupement, comme par exemple les fonctions permettant de calculer le mode (l'élément le plus courant) d'un ensemble, sa valeur médiane ou son écart type.

L'application de fonctions de groupement à des données alors qu'elles font l'objet d'un suivi présente de nombreux avantages :