Moyenne d’une série statistique

1. Moyenne arithmétique d’une série statistique

On considère une série statistique à une variable quantitative (caractère quantitatif), observé(e) sur $N$ individus d’une population $E$. Cette série statistique peut être représentée dans un tableau de données suivant : $$\begin{array}{|l|5*{|c|}}\hline
\text{Individus}~i &1&2&3&\cdots&N\\ \hline
\text{Valeurs }~x_i &x_1&x_2&x_3&\cdots&x_N\\ \hline
\end{array}$$
$N$ est l’effectif total de la population.
$x_i$ représente la valeur du caractère pour l’individu $i$.
Ici, nous avons $N$ individus avec $N$ valeurs $x_i$ distinctes ou confondues.
Le nombre entier $i$ peut être interprété comme un « indice » qui indique le rang de l’individu $i$.

Définition 1.
La moyenne notée $\overline{x}$ des $N$ valeurs $x_1$, $x_2$,$\ldots$, $x_N$ d’une série statistique, est égale à la somme de toutes les valeurs $x_i$, divisée par l’effectif total, ici $N$. On a alors : $$\boxed{\;\;\overline{x}=\dfrac{x_1+x_2+x_3+\cdots+x_N}{N}\;\;}$$
$\overline{x}$ s’appelle aussi la moyenne arithmétique des $N$ valeurs $x_i$.

Ici, nous n’avons affecté aucun coefficient à ces notes, donc toutes les valeurs ont un coefficient $=1$). On dit aussi que $\overline{x}$ représente la moyenne brute de la série. Par exemple la moyenne des notes dans une matière.

Exercice résolu n°1.
On considère la série statistique suivante : 9 ; 10 ; 11 ; 12 ; 16 ; 20. Par exemple, les notes de mathématiques d’un élève au 1er trimestre. Calculer la moyenne brute de cette série statistique.

Corrigé.
Ici, il y a $6$ notes, donc $N=6$. La moyenne de ces $6$ notes est : $$\overline{x}=\dfrac{9+10+11+12+16+20}{6}=\dfrac{78}{6}=13$$
Conclusion. La moyenne brute (sans coefficients) de ces $6$ notes est donc égale à $13$.
CQFD.$\blacktriangle$


2. Moyenne pondérée (avec coefficients ou effectifs partiels)

On considère une série statistique à une variable quantitative (caractère quantitatif), observée sur $N$ individus d’une population $E$. On relève $k$ valeurs possibles $x_1$, $x_2$,$\ldots$, $x_k$ du caractère dans cette population.

On note $n_1$ l’effectif partiel de $x_1$, donc $x_1$ se répète $n_1$ fois.
$n_2$ l’effectif partiel de $x_2$, donc $x_1$ se répète $n_2$ fois, etc. et $n_k$ l’effectif partiel de $x_k$.

On obtient alors la formule de l’effectif total qui est égal à la somme des effectifs partiels : $$\boxed{\phantom{\dfrac{k}{n}}N=n_1+n_2+n_3+\cdots+n_k \;\;}$$

On obtient alors une série statistique à une variable que l’on peut présenter dans un tableau de données : $$\begin{array}{|l|5*{|c|}}\hline \text{Valeurs }~x_i &x_1&x_2&x_3&\cdots&x_k&\text{Total}\\ \hline \text{Effectifs }~n_i &n_1&n_2&n_3&\cdots&n_k&N\\ \hline \end{array}$$
Ici, $x_i$ représente la $i$-ème valeur du caractère et note $n_i$ l’effectif partiel de $x_i$.

Propriété n°1.
On considère une série statistique à une variable quantitative, observée sur $N$ individus d’une population $E$. La moyenne notée $\overline{x}$ des $k$ valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des effectifs partiels $n_1$, $n_2$,$\ldots$, $n_k$ respectivement est donnée par : $$\boxed{\;\;\overline{x}=\dfrac{n_1x_1+n_2x_2+n_3x_3+\cdots+n_kx_k}{N}\;\;}$$
$\overline{x}$ s’appelle aussi la moyenne pondérée ou simplement moyenne de la série. Ce qui revient à affecter un coefficient $n_i$ à chaque valeurs $x_i$.

Exercice résolu n°2.
On considère les deux séries statistique suivante :
Série $A$ : 8 ; 8 ; 12 ; 12 ; 14 ; 12
et Série $B$ : 9 ; 10 ; 11 ; 12 ; 16 ; 20.
Par exemple, les notes de mathématiques d’un élève au 1er trimestre.
$\quad$1°) Calculer la moyenne de la série $A$ de deux manières.
$\quad$2°) Calculer la moyenne brute de la série $B$, puis la moyenne pondérée sachant que les deux dernières notes correspondent à un DM – devoir maison – donc de coefficient 1 ; et que les autres notes correspondent à des DS – devoirs surveillés – donc de coefficient 2.

Corrigé.
1°) Ici, il y a 6 notes, donc N = 6.
1ère manière : On calcule la moyenne brute de ces $6$ notes. On obtient :
$$\overline{x_A}=\dfrac{8+8+12+12+14+12}{6}=\dfrac{66}{6}=\boxed{\;\;11 \;\;}$$
Conclusion. La moyenne brute de la série $A$ est $\boxed{\;\;\overline{x_A}= \;\;}$
2ème manière : On remarque que les notes se répètent. Sur les six notes il n’y a que
trois notes différentes. Le $8$ qui se répète $2$ fois ; le $12$ se répète $3$ fois et le $14$ apparaît $1$ fois. On calcule alors une moyenne pondérée :
$$\overline{x_A}=\dfrac{2\times 8+3\times 12+1\times 14}{6}=\dfrac{66}{6}=\boxed{\;\;11 \;\;}$$ On obtient bien le même résultat.

2°) Moyenne brute de la série $B$ : Comme pour la série $A$, on a : $$\overline{x_B}=\dfrac{9+10+11+12+16+20}{6}=\dfrac{78}{6}=\boxed{\;\;13 \;\;}$$
Moyenne pondérée de la série $B$ :
Dans cette question, les notes sont affectées de différents coefficients : $1$ pour les DM et $2$ pour les DS. Donc : $$\overline{x’_B}=\dfrac{2\times 9+2\times 10+2\times 11+2\times 12+1\times 16+1\times 20}{2+2+2+2+1+1}$$
$$\boxed{\;\;\overline{x’_B}=\dfrac{66}{6}=12 \;\;}$$
Conclusion. Cet élève avait obtenu une moyenne brute $\overline{x_B}=13$ et si on tient compte des coefficients, sa moyenne baisse à $\overline{x’_B}=12$.
CQFD.$\blacktriangle$


3. Moyenne d’une série statistique dont les valeurs sont groupées en classes

Définition 3.
Lorsque les valeurs d’une série statistique sont groupées en classes $[x_0;x_1[$ ; $[x_1;x_2[$, on appelle centre de la $i$-ème classe $[a~;~b]$, la moyenne des deux bornes de la classe : $$\boxed{\;\;c_i=\dfrac{a+b}{2} \;\;}$$

Exemple

Si on étudie la taille des personnes dans une population de 1000 ou 10.000 habitants, il est plus facile de les regrouper en classe de 5cm en 5cm ou de 10m en 10cm : $[150;160[$ ; $[160;70[$, etc.
Signification des crochets : dans $[150;160[$, $[150$ signifie que la valeur 150 est comprise et $160[$ signifie que la valeur $160$ est exclue.

Propriété n°2.
On considère une série statistique à une variable quantitative, dont les valeurs sont groupées en $k$ classes $[x_0;x_1[$ ; $[x_1;x_2[$;$\ldots$ ; $[x_{k−1};x_k]$; affectées des effectifs partiels $n_1$, $n_2,\ldots$, $n_k$, et de centres $c_1$, $c_2,\ldots$, $c_k$ respectivement.
Alors la moyenne de la série statistique dont les valeurs sont groupées en classes, est approchée par la moyenne des $k$ centres $c_1$, $c_2$,$\ldots$, $c_k$, dont les effectifs partiels correspondants sont $n_1$, $n_2$,$\ldots$, $n_k$, respectivement. Ce qui donne : $$\boxed{\;\;\overline{x}\approx \dfrac{n_1c_1+n_2c_2+n_3c_3+\cdots+n_kc_k}{N}\;\;}$$

Exercice résolu n°3.
On considère la série statistique suivante, représentant la répartition des temps mis pour aller à l’école des élèves dans une classe de Seconde de 35 élèves :
$$\begin{array}{|l|5*{|c|}} \hline
\text{Temps }t_i~\text{(en min)} & [0;5[ &[5;10[ &[10;15[ &[15;20[ &[20;25[ &[25;30] &\text{Total}\\ \hline
\text{Effectifs }n_i & 3 &7 &8 &12 &4 &1 &35\\ \hline \end{array}$$
Calculer le temps moyen que met un élève ce cette classe pour aller à l’école.

Corrigé.
Les valeurs de cette série sont groupées en classes. Autrement dit, on ne connaît pas
avec précision les valeurs de la série.
Pour calculer la moyenne pondérée d’une telle série, on doit calcule les centres des
classes : $c_i ={}$ moyenne des valeurs extrêmes de chaque classe $[a;b[$ : $c_i=\dfrac{a+b}{2}$.
On obtient ainsi le tableaux des effectifs avec les centres des classes :
$$\begin{array}{|l|5*{|c|}} \hline
\text{Temps }t_i~\text{(en min)} & [0;5[ &[5;10[ &[10;15[ &[15;20[ &[20;25[ &[25;30] &\text{Total}\\ \hline
\text{Effectifs }n_i & 3 &7 &8 &12 &4 &1 &35\\ \hline
\text{Centres }c_i & 2,5 &7,5 &12,5 &17,5 &22,5 &27,5 &{\Large \times}\\ \hline
\end{array}$$
La moyenne est alors égale à : $$\begin{array}{l}
\overline{x}=\dfrac{n_1c_1+n_2c_2+n_3c_3+\cdots+n_kc_k}{N}\\
\overline{x} =\dfrac{3\times2,5+7\times7,5+8\times12,5+12\times17,5+4\times22,5+\times27,5}{35}\\
\overline{x} =\dfrac{487,5}{35}\\
\boxed{\;\; \overline{x} =13,928\ldots\;\;}\\
\end{array}$$
Conclusion. Le temps moyen que met un élève de cette classe, entre son domicile et
le lycée est d’environ $14$ minutes.
CQFD.$\blacktriangle$


4. Calcul de la moyenne en utilisant les fréquences

On considère une série statistique à une variable quantitative, observée sur $N$ individus d’une population $E$ et prenant $k$ valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des effectifs partiels $n_1$, $n_2$,$\ldots$, $n_k$ respectivement.
Les fréquences correspondantes sont $f_1$, $f_2$,$\ldots$, $f_k$ avec : $f_i=\dfrac{n_i}{N}$.

Propriété 3.
La moyenne notée $\overline{x}$ des valeurs $x_1$, $x_2$,$\ldots$, $x_k$ affectées des $f_1$, $f_2$,$\ldots$, $f_k$ respectivement se calcule comme suit :
$$\boxed{\phantom{\dfrac{n}{k}}\overline{x}= f_1 x_1+ f_2 x_2+\cdots+ f_k x_k\;\;}$$

Cette propriété est fondamentale car elle servira à calculer une moyenne dans le chapitre des probabilités.

Démontration.

$$\begin{array}{rl}
\overline{x} &=\dfrac{n_1x_1+n_2x_2+n_3x_3+\cdots+n_kx_k}{N} \\
&=\dfrac{n_1x_1}{N}+\dfrac{n_2x_2}{N}+\dfrac{n_3x_3}{N}+\cdots+\dfrac{n_kx_k}{N} \\
&=\dfrac{n_1}{N}x_1+\dfrac{n_2}{N}x_2+\dfrac{n_3}{N}x_3+\cdots+\dfrac{n_k}x_k{N} \\
&=f_1 x_1+ f_2 x_2+\cdots+ f_k x_k\\ \end{array}$$
CQFD.$\blacktriangle$

Exercice résolu n°4.

CQFD.$\blacktriangle$



Vues : 39