Fréquence

Les limites des probabilités

Nous savons maintenant qu’il y a une chance sur 36 de tirer une paire de dés sur la face six. Est-ce que cela veut dire que si on tire deux dés 36 fois, on obtiendra deux faces sur six une fois ?
Le diagramme de Venn semblerait indiquer que oui. Après tout, il compte le nombre de fois qu’un événement se produit pour un nombre d’essais égal à l’univers de l’expérience. Mais ce diagramme de sert qu’à estimer des probabilités, pas des nombres d’événements.
La fréquence est le nombre de fois qu’un événement se produit par nombre d’essais.

La différence avec une probabilité est dans le nombre d’essais : au lieu de se limiter au nombre d’événements possibles dans l’univers, on effectue un nombre aléatoire d’essais.
Supposons qu’on effectue 50 essais. On note le nombre de fois que les deux dés tombent sur six, et on calcule la fréquence. On effectue 50 autres essais, on calcul la fréquence. On continu ainsi jusqu’à atteindre un total de 3000 essais. En reportant les résultats dans un graphique, on peut tirer des conclusions cruciales lorsqu’on calcule des probabilités.

Fréquences pour différentes tailles d'échantillon

Tout d'abord, le pouvoir de prédiction d'une probabilité n'existe que pour un grand nombre d'essais. L'écart entre la probabilité et la fréquence est grand pour de petits nombres d'essais, mais s'amenuise à mesure qu'on ajoute des essais.

Ensuite, la fréquence n’est jamais parfaitement égale à la probabilité. Il existe une intervalle de confiance qui est d’autant plus petite que le nombre d’essais est grand.

La formule ci-dessous donne cette intervalle pour une fréquence f et un échantillon de taille n.

En général, on donne le résultat sous forme de moyenne entre la limite haute et la limite basse.

En appliquant l’idée d’intervalle de confiance à notre expérience, on peut souligner un troisième point important.

Fréquence et intervalle

Comme on aurait pu le deviner, plus l’échantillon est important, plus l’intervalle de confiance est petit. Mais la réduction de l’intervalle de confiance est beaucoup plus important lorsqu’on passe de 50 à 500 essais que lorsqu’on passe de 2000 à 3000 essais. On en déduit qu’il existe une taille d’échantillon au dessus de laquelle l’intervalle de confiance ne se réduit pas significativement.

Pour se faire une idée plus précise, on peut comparer l’intervalle de confiance pour 750, 1500 et 3000 essais. A l’aide de la formule, compléter le tableau suivant (arrondir au centième) :

n	f	Limite basse	Limite haute	Moyenne et intervalle
750	0,03	Remplir les blancs (1):	Remplir les blancs (2): JXUwMDY4JXUwMDFjJXUwMDFjJXUwMDA3	Remplir les blancs (3): JXUwMDY4JXUwMDFjJXUwMDFjJXUwMDAz ± Remplir les blancs (4): JXUwMDY4JXUwMDFjJXUwMDFjJXUwMDA0
1500	0,03	Remplir les blancs (5): JXUwMDY4	Remplir les blancs (6): JXUwMDY4JXUwMDFjJXUwMDFjJXUwMDA1	Remplir les blancs (7): ± Remplir les blancs (8):
3000	0,03	Remplir les blancs (9): JXUwMDY4JXUwMDFjJXUwMDFjJXUwMDAx	Remplir les blancs (10): JXUwMDY4JXUwMDFjJXUwMDFjJXUwMDA0	Remplir les blancs (11): ± Remplir les blancs (12):

Activer le JavaScript

En doublant l’échantillon une première fois, on réduit l’intervalle de confiance de 62 %. En le doublant à nouveau, on ne le réduit que de 60 %. En effet, comme on l’a vu lorsqu’on analysait les fonction de référence, l’inverse d’une fonction décroît rapidement, puis doucement à mesure que l’échantillon augmente en taille.

Fonction inverse d'une racine

Régi par la licence Creative Commons: Licence d'attribution en partage identique 4.0