Sondages

ESTIMATION D'UNE PROPORTION A PARTIR D'UN SONDAGE

Dans le programme de seconde appliqué depuis la rentrée 2000 :

Simulations d'un sondage : à l'issue de nombreuses simulations, pour des échantillons de taille variable, on pourra introduire la notion de fourchette de sondage, sans justification théorique. La notion de niveau de confiance 0,95 de la fourchette peut être introduite en terme de « chances » (il y a 95 chances sur 100 pour que la fourchette contienne la proportion que l'on cherche à estimer) ; on pourra utiliser les formules des fourchettes aux niveaux 0,95, 0,90 et 0,99 pour une proportion observée voisine de 0,5 afin de voir qu'on perd en précision ce qu'on gagne en niveau de confiance. On incitera les élèves à connaître l'approximation usuelle de la fourchette au niveau de confiance 0,95, issue d'un sondage sur n individus (n>30) dans le cas où la proportion observée est comprise entre 0,3 et 0,7, à savoir : ..

Le problème : on cherche à estimer au sein d'une population la proportion d'individus qui sont "pour" (les autres étant "contre"). Le paramètre à estimer (inconnu par essence) est noté p. On prélève (au hasard avec remise) un échantillon de taille n dans la population. Le nombre d'individus de l'échantillon qui sont "pour" est une variable aléatoire de loi binomiale B(n,p) dont l'espérance mathématique est np et la variance np(1-p).

Approximation d'une loi binomiale par une loi normale :

Sous certaines conditions (dans la pratique on préconise souvent : n>30, np>5 et n(1-p)>5), on peut approximer la loi binomiale B(n,p) par la loi normale de même espérance et de même variance c'est à dire la loi N(np,racine(np(1-p)).

Le graphique ci contre illustre les deux distributions pour n=30 et p=0.2 qui est un cas où l'approximation est assez médiocre.

Pour une probabilité p plus proche de 0.5, l'approximation est plus satisfaisante.

Le graphique ci-contre correspond à

n=30 et p=0.5

On passe du nombre d'individus qui sont "pour" à la proportion en divisant par la taille de l'échantillon n. Dans les conditions préconisées ci-dessus la proportion P d'individus "pour" dans un échantillon de taille n est une variable aléatoire dont la loi est approximativement N(p,racine(p(1-p)/n)).

Chaque échantillon va permettre de calculer une proportion réalisation de la variable aléatoire P.

Intervalles de confiance de la proportion p :

En fait si la proportion observée est la fourchette d’estimation au niveau de confiance 0.95 est : qui est contenue dans l’intervalle puisque le maximum de est .

Pour les niveaux de confiance 0.90 et 0.99 le coefficient 1.96 est a remplacer respectivement par 1.64 et 2.58 ce qui montre qu'avec une taille d'échantillon fixée, une fourchette plus étroite (plus précise) ne peut s'obtenir qu'au prix d'une dégradation du niveau de confiance.

L’abaque ci dessous permet de lire en ordonnée les limites de l’intervalle de confiance correspondant au niveau de confiance 0.95 en fonction de la proportion observée x= et de la taille de l’échantillon.

La droite verticale passant en abscisse par la graduation correspondant à la proportion observée, coupe les deux courbes relatives à la taille de l'échantillon en des points dont les ordonnées sont les extrémités de l'intervalle de confiance.

Retour au menu statistique