L’objet de cette page est de calculer la moyenne arithmétique d’une série statistique, la moyenne pondérée et la moyenne lorsque les valeurs de la série sont groupées en classe.
1. Moyenne arithmétique d’une série statistique
On considère une série statistique à une variable quantitative observée sur $N$ individus d’une population $E$. Cette série statistique peut être représentée dans un tableau de données suivant : $$\begin{array}{|l|5*{|c|}}\hline
\text{Individus}~i &1&2&3&\cdots&N\\ \hline
\text{Valeurs }~x_i &x_1&x_2&x_3&\cdots&x_N\\ \hline
\end{array}$$
$N$ est l’effectif total de la population.
$x_i$ représente la valeur du caractère pour l’individu $i$.
Ici, nous avons $N$ individus avec $N$ valeurs $x_i$ distinctes ou confondues.
Le nombre entier $i$ peut être interprété comme un « indice » qui indique le rang de l’individu $i$.
Définition 1.
La moyenne notée $\overline{x}$ des $N$ valeurs $x_1$, $x_2$,$\ldots$, $x_N$ d’une série statistique, est égale à la somme de toutes les valeurs $x_i$, divisée par l’effectif total, ici $N$. On a alors : $$\boxed{\;\;\overline{x}=\dfrac{x_1+x_2+x_3+\cdots+x_N}{N}\;\;}$$
$\overline{x}$ s’appelle la moyenne arithmétique des $N$ valeurs $x_i$.
Ici, nous n’avons affecté aucun coefficient à ces notes, donc toutes les valeurs ont un coefficient $=1$). On dit aussi que $\overline{x}$ représente la moyenne brute de la série. Par exemple la moyenne des notes dans une matière.
Exercice résolu n°1.
On considère la série statistique suivante : 9 ; 10 ; 11 ; 12 ; 16 ; 20. Par exemple, les notes de mathématiques d’un élève au 1er trimestre. Calculer la moyenne brute de cette série statistique.
2. Moyenne pondérée (avec coefficients ou effectifs partiels)
On suppose maintenant que dans la série statistique à une variable quantitative observée sur $N$ individus d’une population $E$, chacune des $k$ valeurs possibles $x_1$, $x_2$,$\ldots$, $x_k$ apparaît une ou plusieurs fois ou bien que chaque valeur $x_i$ est affectée d’un coefficient $n_i$.
On note :
$n_1$ le coefficient (ou l’effectif partiel) de $x_1$, donc $x_1$ se répète $n_1$ fois.
$n_2$ le coefficient (ou l’effectif partiel) de $x_2$, donc $x_2$ se répète $n_2$ fois,
etc…
et $n_k$ le coefficient (ou l’effectif partiel) de $x_k$.
On obtient alors la formule de l’effectif total qui est égal à la somme des effectifs partiels : $$\boxed{\phantom{\dfrac{k}{n}}N=n_1+n_2+n_3+\cdots+n_k \;\;}$$
On obtient alors une série statistique à une variable que l’on peut présenter dans un tableau de données : $$\begin{array}{|l|5*{|c|}}\hline \text{Valeurs }~x_i &x_1&x_2&x_3&\cdots&x_k&\text{Total}\\ \hline \text{Effectifs }~n_i &n_1&n_2&n_3&\cdots&n_k&N\\ \hline \end{array}$$
Ici, $x_i$ représente la $i$-ème valeur du caractère et note $n_i$ l’effectif partiel de $x_i$.
Propriété et définition
Propriété n°1.
Soit une série statistique à une variable quantitative observée sur $N$ individus d’une population $E$. La moyenne notée $\overline{x}$ des $k$ valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des coefficients (ou effectifs partiels) $n_1$, $n_2$,$\ldots$, $n_k$ respectivement est donnée par : $$\boxed{\;\;\overline{x}=\dfrac{n_1x_1+n_2x_2+n_3x_3+\cdots+n_kx_k}{N}\;\;}$$
$\overline{x}$ s’appelle aussi la moyenne pondérée ou simplement moyenne de la série. Ce qui revient à affecter un coefficient $n_i$ à chaque valeurs $x_i$.
Exemple
Exercice résolu n°2.
On considère les deux séries statistique suivante :
Série $A$ : 8 ; 8 ; 12 ; 12 ; 14 ; 12
et Série $B$ : 9 ; 10 ; 11 ; 12 ; 16 ; 20.
Par exemple, les notes de mathématiques d’un élève au 1er trimestre.
$\quad$1°) Calculer la moyenne de la série $A$ de deux manières.
$\quad$2°) Calculer la moyenne brute de la série $B$, puis la moyenne pondérée sachant que les deux dernières notes correspondent à un DM – devoir maison – donc de coefficient 1 ; et que les autres notes correspondent à des DS – devoirs surveillés – donc de coefficient 2.
3. Moyenne d’une série statistique dont les valeurs sont groupées en classes
Si on étudie la taille des personnes dans une population de 100, 1000 ou 10.000 habitants, il est plus facile de les regrouper en classes de 5cm en 5cm, on obtient des classes du type : $[140;145[$ ; $[145;150[$ ; $[150;155[$,… etc.
On peut aussi les regrouper en classes de 10cm en 10cm : $[140;150[$ ; $[150;160[$ ; $[160;170[$, etc.
Signification des crochets : dans $[150;160[$, $[150$ signifie que la valeur 150 est comprise et $160[$ signifie que la valeur $160$ est exclue.
Définition 3.
Lorsque les valeurs d’une série statistique sont groupées en classes $[x_0;x_1[$ ; $[x_1;x_2[$, on appelle centre de la $i$-ème classe $[a_i~;~b_i]$, la moyenne des deux bornes de la classe : $$\boxed{\;\;c_i=\dfrac{a_i+b_i}{2} \;\;}$$
Propriété n°2.
On considère une série statistique à une variable quantitative dont les valeurs sont groupées en $k$ classes $[x_0;x_1[$ ; $[x_1;x_2[$;$\ldots$ ; $[x_{k−1};x_k]$; affectées des effectifs partiels $n_1$, $n_2,\ldots$, $n_k$, et de centres $c_1$, $c_2,\ldots$, $c_k$ respectivement.
Alors la moyenne de la série statistique dont les valeurs sont groupées en classes, est approchée par la moyenne pondérée des $k$ centres $c_1$, $c_2$,$\ldots$, $c_k$, dont les effectifs partiels correspondants sont $n_1$, $n_2$,$\ldots$, $n_k$, respectivement. Ce qui donne : $$\boxed{\;\;\overline{x}\approx \dfrac{n_1c_1+n_2c_2+n_3c_3+\cdots+n_kc_k}{N}\;\;}$$
Exemple
Exercice résolu n°3.
On considère la série statistique suivante, représentant la répartition des temps mis pour aller à l’école des élèves dans une classe de Seconde de 35 élèves :
$$\begin{array}{|l|5*{|c|}} \hline
\text{Temps }t_i~\text{(en min)} & [0;5[ &[5;10[ &[10;15[ &[15;20[ &[20;25[ &[25;30] &\text{Total}\\ \hline
\text{Effectifs }n_i & 3 &7 &8 &12 &4 &1 &35\\ \hline \end{array}$$
Calculer le temps moyen que met un élève ce cette classe pour aller à l’école.
4. Calcul de la moyenne pondérée en utilisant les fréquences
On considère une série statistique à une variable quantitative, observée sur $N$ individus d’une population $E$ et prenant $k$ valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des effectifs partiels $n_1$, $n_2$,$\ldots$, $n_k$ respectivement.
Les fréquences correspondantes sont $f_1$, $f_2$,$\ldots$, $f_k$ avec : $f_i=\dfrac{n_i}{N}$.
Propriété 3.
La moyenne notée $\overline{x}$ des valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des $f_1$, $f_2$,$\ldots$, $f_k$ respectivement se calcule comme suit :
$$\boxed{\phantom{\dfrac{n}{k}}\overline{x}= f_1 x_1+ f_2 x_2+\cdots+ f_k x_k\;\;}$$
Cette propriété est fondamentale car elle servira à calculer une moyenne dans le chapitre des probabilités.
Démontration
$$\begin{array}{rl}
\overline{x} &=\dfrac{n_1x_1+n_2x_2+n_3x_3+\cdots+n_kx_k}{N} \\
&=\dfrac{n_1x_1}{N}+\dfrac{n_2x_2}{N}+\dfrac{n_3x_3}{N}+\cdots+\dfrac{n_kx_k}{N} \\
&=\dfrac{n_1}{N}x_1+\dfrac{n_2}{N}x_2+\dfrac{n_3}{N}x_3+\cdots+\dfrac{n_k}x_k{N} \\
&=f_1 x_1+ f_2 x_2+\cdots+ f_k x_k\\ \end{array}$$
CQFD.$\blacktriangle$
Exercice résolu n°4.
Dans la classe de 2de3, 10% des élèves ont obtenu 4/20 à un DM – devoir-maison – , 20% ont obtenu 8/20, 50% ont obtenu 12/20, 15% ont obtenu 16/20 et les autres ont obtenu 20/20.
Calculer la moyenne de la classe.