L’objet de cette page est de calculer la moyenne arithmétique d’une série statistique, la moyenne pondérée et la moyenne lorsque les valeurs de la série sont groupées en classe.

1. Moyenne arithmétique d’une série statistique

On considère une série statistique à une variable quantitative observée sur $N$ individus d’une population $E$. Cette série statistique peut être représentée dans un tableau de données suivant : $$\begin{array}{|l|5*{|c|}}\hline
\text{Individus}~i &1&2&3&\cdots&N\\ \hline
\text{Valeurs }~x_i &x_1&x_2&x_3&\cdots&x_N\\ \hline
\end{array}$$
$N$ est l’effectif total de la population.
$x_i$ représente la valeur du caractère pour l’individu $i$.
Ici, nous avons $N$ individus avec $N$ valeurs $x_i$ distinctes ou confondues.
Le nombre entier $i$ peut être interprété comme un « indice » qui indique le rang de l’individu $i$.

Définition 1.
La moyenne notée $\overline{x}$ des $N$ valeurs $x_1$, $x_2$,$\ldots$, $x_N$ d’une série statistique, est égale à la somme de toutes les valeurs $x_i$, divisée par l’effectif total, ici $N$. On a alors : $$\boxed{\;\;\overline{x}=\dfrac{x_1+x_2+x_3+\cdots+x_N}{N}\;\;}$$
$\overline{x}$ s’appelle la moyenne arithmétique des $N$ valeurs $x_i$.

Ici, nous n’avons affecté aucun coefficient à ces notes, donc toutes les valeurs ont un coefficient $=1$). On dit aussi que $\overline{x}$ représente la moyenne brute de la série. Par exemple la moyenne des notes dans une matière.

Exercice résolu n°1.
On considère la série statistique suivante : 9 ; 10 ; 11 ; 12 ; 16 ; 20. Par exemple, les notes de mathématiques d’un élève au 1er trimestre. Calculer la moyenne brute de cette série statistique.

Corrigé.
Ici, il y a $6$ notes, donc $N=6$. La moyenne de ces $6$ notes est : $$\overline{x}=\dfrac{9+10+11+12+16+20}{6}=\dfrac{78}{6}=13$$
Conclusion. La moyenne brute (sans coefficients) de ces $6$ notes est donc égale à $13$.
CQFD.$\blacktriangle$

2. Moyenne pondérée (avec coefficients ou effectifs partiels)

On suppose maintenant que dans la série statistique à une variable quantitative observée sur $N$ individus d’une population $E$, chacune des $k$ valeurs possibles $x_1$, $x_2$,$\ldots$, $x_k$ apparaît une ou plusieurs fois ou bien que chaque valeur $x_i$ est affectée d’un coefficient $n_i$.

On note :
$n_1$ le coefficient (ou l’effectif partiel) de $x_1$, donc $x_1$ se répète $n_1$ fois.
$n_2$ le coefficient (ou l’effectif partiel) de $x_2$, donc $x_2$ se répète $n_2$ fois,
etc…
et $n_k$ le coefficient (ou l’effectif partiel) de $x_k$.

On obtient alors la formule de l’effectif total qui est égal à la somme des effectifs partiels : $$\boxed{\phantom{\dfrac{k}{n}}N=n_1+n_2+n_3+\cdots+n_k \;\;}$$

On obtient alors une série statistique à une variable que l’on peut présenter dans un tableau de données : $$\begin{array}{|l|5*{|c|}}\hline \text{Valeurs }~x_i &x_1&x_2&x_3&\cdots&x_k&\text{Total}\\ \hline \text{Effectifs }~n_i &n_1&n_2&n_3&\cdots&n_k&N\\ \hline \end{array}$$
Ici, $x_i$ représente la $i$-ème valeur du caractère et note $n_i$ l’effectif partiel de $x_i$.

Propriété et définition

Propriété n°1.
Soit une série statistique à une variable quantitative observée sur $N$ individus d’une population $E$. La moyenne notée $\overline{x}$ des $k$ valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des coefficients (ou effectifs partiels) $n_1$, $n_2$,$\ldots$, $n_k$ respectivement est donnée par : $$\boxed{\;\;\overline{x}=\dfrac{n_1x_1+n_2x_2+n_3x_3+\cdots+n_kx_k}{N}\;\;}$$
$\overline{x}$ s’appelle aussi la moyenne pondérée ou simplement moyenne de la série. Ce qui revient à affecter un coefficient $n_i$ à chaque valeurs $x_i$.

Exemple

Exercice résolu n°2.
On considère les deux séries statistique suivante :
Série $A$ : 8 ; 8 ; 12 ; 12 ; 14 ; 12
et Série $B$ : 9 ; 10 ; 11 ; 12 ; 16 ; 20.
Par exemple, les notes de mathématiques d’un élève au 1er trimestre.
$\quad$1°) Calculer la moyenne de la série $A$ de deux manières.
$\quad$2°) Calculer la moyenne brute de la série $B$, puis la moyenne pondérée sachant que les deux dernières notes correspondent à un DM – devoir maison – donc de coefficient 1 ; et que les autres notes correspondent à des DS – devoirs surveillés – donc de coefficient 2.

Corrigé.
1°) Ici, il y a 6 notes, donc N = 6.
1ère manière : On calcule la moyenne brute de ces $6$ notes. On obtient :
$$\overline{x_A}=\dfrac{8+8+12+12+14+12}{6}=\dfrac{66}{6}=\boxed{\;\;11 \;\;}$$
Conclusion. La moyenne brute de la série $A$ est $\boxed{\;\;\overline{x_A}= \;\;}$
2ème manière : On remarque que les notes se répètent. Sur les six notes il n’y a que
trois notes différentes. Le $8$ qui se répète $2$ fois ; le $12$ se répète $3$ fois et le $14$ apparaît $1$ fois. On calcule alors une moyenne pondérée :
$$\overline{x_A}=\dfrac{2\times 8+3\times 12+1\times 14}{6}=\dfrac{66}{6}=\boxed{\;\;11 \;\;}$$ On obtient bien le même résultat.

2°) Moyenne brute de la série $B$ : Comme pour la série $A$, on a : $$\overline{x_B}=\dfrac{9+10+11+12+16+20}{6}=\dfrac{78}{6}=\boxed{\;\;13 \;\;}$$
Moyenne pondérée de la série $B$ :
Dans cette question, les notes sont affectées de différents coefficients : $1$ pour les DM et $2$ pour les DS. Donc : $$\overline{x’_B}=\dfrac{2\times 9+2\times 10+2\times 11+2\times 12+1\times 16+1\times 20}{2+2+2+2+1+1}$$
$$\boxed{\;\;\overline{x’_B}=\dfrac{66}{6}=12 \;\;}$$
Conclusion. Cet élève avait obtenu une moyenne brute $\overline{x_B}=13$ et si on tient compte des coefficients, sa moyenne baisse à $\overline{x’_B}=12$.
CQFD.$\blacktriangle$

3. Moyenne d’une série statistique dont les valeurs sont groupées en classes

Si on étudie la taille des personnes dans une population de 100, 1000 ou 10.000 habitants, il est plus facile de les regrouper en classes de 5cm en 5cm, on obtient des classes du type : $[140;145[$ ; $[145;150[$ ; $[150;155[$,… etc.
On peut aussi les regrouper en classes de 10cm en 10cm : $[140;150[$ ; $[150;160[$ ; $[160;170[$, etc.
Signification des crochets : dans $[150;160[$, $[150$ signifie que la valeur 150 est comprise et $160[$ signifie que la valeur $160$ est exclue.

Définition 3.
Lorsque les valeurs d’une série statistique sont groupées en classes $[x_0;x_1[$ ; $[x_1;x_2[$, on appelle centre de la $i$-ème classe $[a_i~;~b_i]$, la moyenne des deux bornes de la classe : $$\boxed{\;\;c_i=\dfrac{a_i+b_i}{2} \;\;}$$

Propriété n°2.
On considère une série statistique à une variable quantitative dont les valeurs sont groupées en $k$ classes $[x_0;x_1[$ ; $[x_1;x_2[$;$\ldots$ ; $[x_{k−1};x_k]$; affectées des effectifs partiels $n_1$, $n_2,\ldots$, $n_k$, et de centres $c_1$, $c_2,\ldots$, $c_k$ respectivement.
Alors la moyenne de la série statistique dont les valeurs sont groupées en classes, est approchée par la moyenne pondérée des $k$ centres $c_1$, $c_2$,$\ldots$, $c_k$, dont les effectifs partiels correspondants sont $n_1$, $n_2$,$\ldots$, $n_k$, respectivement. Ce qui donne : $$\boxed{\;\;\overline{x}\approx \dfrac{n_1c_1+n_2c_2+n_3c_3+\cdots+n_kc_k}{N}\;\;}$$

Exemple

Exercice résolu n°3.
On considère la série statistique suivante, représentant la répartition des temps mis pour aller à l’école des élèves dans une classe de Seconde de 35 élèves :
$$\begin{array}{|l|5*{|c|}} \hline
\text{Temps }t_i~\text{(en min)} & [0;5[ &[5;10[ &[10;15[ &[15;20[ &[20;25[ &[25;30] &\text{Total}\\ \hline
\text{Effectifs }n_i & 3 &7 &8 &12 &4 &1 &35\\ \hline \end{array}$$
Calculer le temps moyen que met un élève ce cette classe pour aller à l’école.

Corrigé.
Les valeurs de cette série sont groupées en classes. Autrement dit, on ne connaît pas
avec précision les valeurs de la série.
Pour calculer la moyenne pondérée d’une telle série, on doit calcule les centres des
classes : $c_i ={}$ moyenne des valeurs extrêmes de chaque classe $[a;b[$ : $c_i=\dfrac{a+b}{2}$.
On obtient ainsi le tableaux des effectifs avec les centres des classes :
$$\begin{array}{|l|5*{|c|}} \hline
\text{Temps }t_i~\text{(en min)} & [0;5[ &[5;10[ &[10;15[ &[15;20[ &[20;25[ &[25;30] &\text{Total}\\ \hline
\text{Effectifs }n_i & 3 &7 &8 &12 &4 &1 &35\\ \hline
\text{Centres }c_i & 2,5 &7,5 &12,5 &17,5 &22,5 &27,5 &{\Large \times}\\ \hline
\end{array}$$
La moyenne est alors égale à : $$\begin{array}{l}
\overline{x}=\dfrac{n_1c_1+n_2c_2+n_3c_3+\cdots+n_kc_k}{N}\\
\overline{x} =\dfrac{3\times2,5+7\times7,5+8\times12,5+12\times17,5+4\times22,5+\times27,5}{35}\\
\overline{x} =\dfrac{487,5}{35}\\
\boxed{\;\; \overline{x} =13,928\ldots\;\;}\\
\end{array}$$
Conclusion. Le temps moyen que met un élève de cette classe, entre son domicile et
le lycée est d’environ $14$ minutes.
CQFD.$\blacktriangle$

4. Calcul de la moyenne pondérée en utilisant les fréquences

On considère une série statistique à une variable quantitative, observée sur $N$ individus d’une population $E$ et prenant $k$ valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des effectifs partiels $n_1$, $n_2$,$\ldots$, $n_k$ respectivement.
Les fréquences correspondantes sont $f_1$, $f_2$,$\ldots$, $f_k$ avec : $f_i=\dfrac{n_i}{N}$.

Propriété 3.
La moyenne notée $\overline{x}$ des valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des $f_1$, $f_2$,$\ldots$, $f_k$ respectivement se calcule comme suit :
$$\boxed{\phantom{\dfrac{n}{k}}\overline{x}= f_1 x_1+ f_2 x_2+\cdots+ f_k x_k\;\;}$$

Cette propriété est fondamentale car elle servira à calculer une moyenne dans le chapitre des probabilités.

Démontration

$$\begin{array}{rl}
\overline{x} &=\dfrac{n_1x_1+n_2x_2+n_3x_3+\cdots+n_kx_k}{N} \\
&=\dfrac{n_1x_1}{N}+\dfrac{n_2x_2}{N}+\dfrac{n_3x_3}{N}+\cdots+\dfrac{n_kx_k}{N} \\
&=\dfrac{n_1}{N}x_1+\dfrac{n_2}{N}x_2+\dfrac{n_3}{N}x_3+\cdots+\dfrac{n_k}x_k{N} \\
&=f_1 x_1+ f_2 x_2+\cdots+ f_k x_k\\ \end{array}$$
CQFD.$\blacktriangle$

Exercice résolu n°4.
Dans la classe de 2de3, 10% des élèves ont obtenu 4/20 à un DM – devoir-maison – , 20% ont obtenu 8/20, 50% ont obtenu 12/20, 15% ont obtenu 16/20 et les autres ont obtenu 20/20.
Calculer la moyenne de la classe.

Tout d’abord, si on écrit $10\%=0,1$, $20\%=0,2$,$\ldots$, alots on obtient le tableau des notes et des fréquences suivantes :
$$\begin{array}{|l|5*{|c|}} \hline
\text{Notes }x_i~& 4 & 8 & 12 & 16 & 20 &\text{Total}\\ \hline
\text{Fréquances }f_i & 0,1 & 0,2 & 0,5 & 0,15 & f_5 &1\\ \hline \end{array}$$
La somme des pourcentages étant égale à $100$%. Donc la somme des fréquences est égale à 1.
Donc, on peut calculer la dernière fréquence manquante :
$$\begin{array}{rcl}
0,1+0,2+0,5+0,15+f_5&=&1\\
0,95+f_5&=&1\\ f_5&=&0,05.\\ \end{array}$$
$$\begin{array}{rcl}
\overline{x} &=&f_1x_1+f_2x_2+f_3x_3+f_4x_4+f_5x_5\\
\overline{x} &=& 0,1\times4+0,2\times8+0,5\times12+0,15\times16+0,05\times20\\
\end{array}$$
Par conséquent, la moyenne de la classe est : $$ \boxed{\;\;\overline{x}=11,4\;\;}$$
CQFD.$\blacktriangle$