En statistique descriptive, la dispersion, la moyenne et la médiane sont trois mesures importantes qui permettent de décrire les caractéristiques d’un ensemble de données.
La dispersion est une mesure de la variation ou de la répartition des données autour de leur valeur centrale, qui est généralement représentée par la moyenne. Elle peut être mesurée de différentes manières, en utilisant des mesures telles que l’écart-type, la variance, l’étendue, le coefficient de variation et le quantile.
La moyenne est la mesure de tendance centrale la plus couramment utilisée pour représenter un ensemble de données. Elle est calculée en faisant la somme de toutes les valeurs de l’ensemble de données et en divisant le résultat par le nombre total de valeurs. La moyenne est sensible aux valeurs aberrantes, ce qui signifie que si une valeur très élevée ou très basse est présente dans l’ensemble de données, elle peut affecter considérablement la valeur de la moyenne.
La médiane est une autre mesure de tendance centrale couramment utilisée pour représenter un ensemble de données. Elle est définie comme la valeur qui divise l’ensemble de données en deux parties égales, de sorte que la moitié des valeurs sont supérieures à la médiane et l’autre moitié sont inférieures. Contrairement à la moyenne, la médiane n’est pas sensible aux valeurs aberrantes, ce qui la rend utile pour décrire la répartition des données lorsque ces valeurs sont présentes.
En général, la moyenne est utilisée pour décrire la répartition des données lorsqu’il n’y a pas de valeurs aberrantes dans l’ensemble de données, tandis que la médiane est utilisée lorsque des valeurs aberrantes sont présentes ou lorsque la répartition des données est asymétrique. Cependant, il est important de noter que la moyenne et la médiane ne donnent qu’une vue partielle de l’ensemble de données et qu’il est souvent utile d’utiliser d’autres mesures de dispersion pour obtenir une image plus complète.