1. Un échantillon et échantillon représentatif ?

Dans le langage courant, le mot « échantillon » est utilisé dans deux sens distincts :

  1. Un échantillon peut désigner une petite quantité d’une marchandise ou d’un produit ou d’une population qu’on montre pour donner une idée sur ce produit ou cette marchandise ou cette population. Par exemple, un échantillon de parfum,…
  2. Un échantillon représentatif d’un groupe ou d’une population est un sous-ensemble de de cette population dont les caractéristiques reflètent fidèlement celles du groupe initial. Par conséquent, les conclusions tirées sur l’échantillon devraient être valables pour l’ensemble.
    Par exemple, pour faire des sondages pour les élections ou de satisfaction sur un produit. Déterminer la proportion de personnes vaccinées qui tombent malades,… etc.

Remarque

Et si on tombe sur la même personne [par exemple, des appels téléphoniques dans un Call-Center] ?
En réalité, ce cas est presque inexistant. Si la population est de plusieurs millions d’individus et l’échantillon est de 1100. Si le cas se produit, on recommence jusqu’à atteindre la taille $n$.

2. Méthodes et objectifs

Pour le contrôle-qualité dans une entreprise de fabrication de pièces automobiles, On prélève au hasard des pièces à la sortie de la chaîne de production de centaines de milliers de pièces détachées.
Puis, une fois le prélèvement des 1100 pièces est terminé, on contrôle si chacune des pièces est saine ou défectueuse et on note la fréquence des pièces défectueuses dans l’échantillon. Deux objectifs pour cette étude :

1er objectif : A partir de plusieurs échantillons

Si on change d’échantillon, il est clair que la fréquence va changer. On dit que les fréquences observées fluctuent. On cherche alors à déterminer « L’intervalle de fluctuation des fréquences » en prenant plusieurs échantillons. On sait que la proportion réelle de pièces défectueuses est forcément dans cet intervalle.

  • On obtient une première fréquence observée $f_{obs1}$ donnant la proportion de pièces défectueuses dans l’échantillon 1.
  • On refait un nouveau prélèvement d’un deuxième échantillon de taille $n$. Avec la même procédure, on obtient une deuxième fréquence observée $f_{obs2}$ donnant la proportion de pièces défectueuses dans l’échantillon 2.
  • Puis un troisième échantillon, on obtient une troisième fréquence observée $f_{obs3}$ donnant la proportion de pièces défectueuses dans l’échantillon 3.
  • Et ainsi de suite…

2ème objectif : On cherche la proportion effective, à partir d’un seul échantillon. [Les sondages]

A partir d’un seul échantillon, on peut « estimer la proportion » de pièces défectueuses dans toute la production. Bien sûr, cette estimation est une valeur approchée de la proportion réelle de pièces défectueuses. Plus la taille de l’échantillon est grande, plus l’amplitude de l’intervalle d’estimation qu’on appelle l’intervalle de confiance, est petite ; et plus on a de précision sur la valeur exacte de la proportion exacte dans l’ensemble de la population.
On parle alors d’une estimation au seuil de 95% ou de 99% …