Médiane et quartiles d’une série statistique
1. Médiane d’une série statistique
On considère une série statistique à une variable quantitative (caractère quantitatif), observée sur $N$ individus d’une population $E$ et prenant k valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des effectifs partiels $n_1$, $n_2$,$\ldots$, $n_k$ respectivement.
Cette série statistique peut être représentée dans un tableau de données suivant : $$\begin{array}{|l|5*{|c|}} \hline \text{Valeurs }~x_i &x_1&x_2&x_3&\cdots&x_N\\ \hline
%\text{Effectifs }~n_i &n_1&n_2&n_3&\cdots&n_N\\ \hline
\end{array}$$
Définition 1.
On appelle médiane de la série statistique, toute valeur $m$ du caractère qui partage la
série en deux parties de même effectif. Il y a donc autant de valeurs inférieures que
de valeurs supérieures à la médiane.
Notation. La médiane est notée généralement : Me .
Remarque
Dans cette définition, une médiane pourrait prendre plusieurs valeurs possibles dans
certaines situations. Nous allons voir que nous allons donner une méthode qui permet
à tous de trouver la même médiane.
2. Comment calculer la médiane d’une série statistique ?
2.1. Calcul direct de la médiane sur un nombre fini de valeurs
On considère une série statistique à une variable quantitative, observée sur $N$ individus d’une population $E$ et prenant $k$ valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des effectifs partiels $n_1$, $n_2$,$\ldots$, $n_k$ respectivement.
On suppose que les valeurs de la série sont rangées par ordre croissant.
Propriété 1. (Très importante).
On procède en plusieurs étapes :
$\bullet$ On commencer par ranger les valeurs la série statistique dans l’ordre croissant (avec répétition si nécessaire) ;
$\bullet$ Déterminer l’effectif total. Ici $N$ ;
$\bullet$ Déterminer le rang de la médiane dans la série ;
$\bullet$ La médiane est la valeur correspondante à ce rang trouvé.
On distingue deux cas possibles :
$\quad$ 1°) Si l’effectif total N est impair, alors la médiane est égale à la valeur centrale
de la série ; son rang est $$\boxed{\;\;\dfrac{N +1}{2}\;\;}$$
$\quad$ 2°) Si l’effectif total N est pair, alors toute valeur comprise entre les deux valeurs
centrales est une médiane de la série. En général, on prend pour médiane la
moyenne des deux valeurs centrales, de rangs $$\boxed{\;\;\dfrac{N}{2}\;\;}\quad\text{et}\quad\boxed{\;\; \dfrac{N}{2}+1\;\;}$$
Exemples modèles
Exercice résolu n°1.
On considère les deux séries statistiques suivantes. Calculer la médiane de chacune des deux séries :
1°) Série $A$ : 8 ; 9 ; 9 ; 10 ; 11 ; 12 ; 13 ; 14 ; 15.
2°) Série $B$ : 8 ; 9 ; 9 ; 10 ; 11 ; 12 ; 13 ; 14 ; 15 et 16.
3. Quartiles
Définition 8.
On considère une variable statistique quantitative dont les valeurs sont rangées, avec répétition, par ordre croissant : $$x_1\leqslant x_2\leqslant x_3\leqslant \ldots \leqslant x_N$$
Le premier quartile est égal à la plus petite valeur Q1 des termes de la série pour
laquelle au moins 25% des données sont inférieures ou égales à Q1.
Le troisième quartile est égal à la plus petite valeur Q3.
des termes de la série pour laquelle au moins 75% des données sont inférieures ou
égales à Q3.
Remarque
Le deuxième quartile n’est autre que la médiane, qui correspond à 50% des effectifs
de la série statistique : $\boxed{\;\;Q2 = Me\;\;}$.
Méthode pratique
Étant donné une série statistique à une variable quantitative, d’effectif total $N$ et dont les valeurs sont rangées, avec répétition, par ordre croissant. (Sinon, on commence par les ranger par ordre croissant).
Pour déterminer les deux quartiles, on partage la série en 4 groupes de même effectif.
On calcule $\dfrac{N}{4}$, qui correspond à 25% des valeurs. Le rang de Q1 est le premier entier supérieur ou égal à $\dfrac{N}{4}$. De même, pour déterminer Q3, on calcule $3\times\dfrac{N}{4}$ qui correspond à 75% des valeurs. Le rang de Q3 est le premier entier supérieur ou égal à $3\times\dfrac{N}{4}$.
Exercice résolu n°2.
Déterminer l’étendue, la médiane, le premier et le troisième quartiles de la série
statistique suivante :
20 ; 52 ; 31 ; 4 ; 78 ; 5 ; 62 ; 34 ; 4 ; 9 ; 10 ; 45 ; 12.
4. Diagramme en boîte
Le diagramme en boîte ou la boîte à moustaches résume seulement quelques indicateurs de position du caractère étudié (médiane, quartiles, minimum, maximum ou déciles). Ce diagramme est utilisé principalement pour comparer un même caractère dans deux populations de tailles différentes.
Il s’agit de tracer un rectangle sur une droite graduée allant du premier quartile au troisième quartile et coupé par la médiane. Ce rectangle suffit pour le diagramme en boîte. On ajoute alors des segments aux extrémités menant jusqu’aux valeurs extrêmes $x_{\text{min}}$ et $x_{\text{max}}$, ou jusqu’aux premier et neuvième déciles ($D-1$ et $D_9$), voire aux cinquième et quatre-vingt-quinzième centiles ($C_5$ et $C_{95}$). On parle alors de diagramme en boîte à moustaches ou de diagramme à pattes.
Wikipédia

4. Déciles et centiles
D’une manière analogue, on pourrait définir les déciles d’une série statistique correspondant aux $10\%$, $20\%,\ldots$ $90\%$ de la série statistique, $D_1$ à $10\%$, $D_2$ à $20\%$,… et $D_9$ à $90\%$ de l’effectif total de la série statistique.
Les deux déciles les plus importants sont : $D_1$ et $D_9$. Par exemple, on s’intéresse aux $10\%$ les plus pauvres d’une population, ou les $10\%$ les plus riches, etc.
D’une manière analogue, on pourrait définir les centiles d’une série statistique correspondant aux $1\%$, $2\%,\ldots$ $99\%$ de la série statistique, $C_1$ à $1\%$, $C_2$ à $20\%$,… et $C_9$ à $90\%$ de l’effectif total de la série statistique. Les deux centiles les plus importants sont : $C_5$ et $C_{95}$.
On retrouve les égalités évidentes : $C_{10}=D_1$, $C_{25}=Q_1$, $C_{50}=Me$, $C_{75}=Q_3$, etc.
Vues : 336