Ignorer la navigation

Fréquence

Les limites des probabilités

Nous savons maintenant qu’il y a une chance sur 36 de tirer une paire de dés sur la face six. Est-ce que cela veut dire que si on tire deux dés 36 fois, on obtiendra deux faces sur six une fois ?
Le diagramme de Venn semblerait indiquer que oui. Après tout, il compte le nombre de fois qu’un événement se produit pour un nombre d’essais égal à l’univers de l’expérience. Mais ce diagramme de sert qu’à estimer des probabilités, pas des nombres d’événements.
La fréquence est le nombre de fois qu’un événement se produit par nombre d’essais.

Fréquence: définition

La différence avec une probabilité est dans le nombre d’essais : au lieu de se limiter au nombre d’événements possibles dans l’univers, on effectue un nombre aléatoire d’essais.
Supposons qu’on effectue 50 essais. On note le nombre de fois que les deux dés tombent sur six, et on calcule la fréquence. On effectue 50 autres essais, on calcul la fréquence. On continu ainsi jusqu’à atteindre un total de 3000 essais. En reportant les résultats dans un graphique, on peut tirer des conclusions cruciales lorsqu’on calcule des probabilités.

Fréquences pour différentes tailles d'échantillon

Tout d'abord, le pouvoir de prédiction d'une probabilité n'existe que pour un grand nombre d'essais. L'écart entre la probabilité et la fréquence est grand pour de petits nombres d'essais, mais s'amenuise à mesure qu'on ajoute des essais.

Ensuite, la fréquence n’est jamais parfaitement égale à la probabilité. Il existe une intervalle de confiance qui est d’autant plus petite que le nombre d’essais est grand.

La formule ci-dessous donne cette intervalle pour une fréquence f et un échantillon de taille n.

Fréquence: définition

En général, on donne le résultat sous forme de moyenne entre la limite haute et la limite basse.

Moyenne et intervalle

En appliquant l’idée d’intervalle de confiance à notre expérience, on peut souligner un troisième point important.

Fréquence et intervalle

Comme on aurait pu le deviner, plus l’échantillon est important, plus l’intervalle de confiance est petit. Mais la réduction de l’intervalle de confiance est beaucoup plus important lorsqu’on passe de 50 à 500 essais que lorsqu’on passe de 2000 à 3000 essais. On en déduit qu’il existe une taille d’échantillon au dessus de laquelle l’intervalle de confiance ne se réduit pas significativement.

 

Pour se faire une idée plus précise, on peut comparer l’intervalle de confiance pour 750, 1500 et 3000 essais. A l’aide de la formule, compléter le tableau suivant (arrondir au centième) :

n

f

Limite basse

Limite haute

Moyenne et intervalle

750

0,03

±

1500

0,03

±

3000

0,03

±

Activer le JavaScript

En doublant l’échantillon une première fois, on réduit l’intervalle de confiance de 62 %. En le doublant à nouveau, on ne le réduit que de 60 %. En effet, comme on l’a vu lorsqu’on analysait les fonction de référence, l’inverse d’une fonction décroît rapidement, puis doucement à mesure que l’échantillon augmente en taille.

Fonction inverse d'une racine