Les limites des probabilités
Nous savons maintenant qu’il y a une chance sur 36 de tirer une paire de dés sur la face six. Est-ce que cela veut dire que si on tire deux dés 36 fois, on obtiendra deux faces sur six une fois ?
Le diagramme de Venn semblerait indiquer que oui. Après tout, il compte le nombre de fois qu’un événement se produit pour un nombre d’essais égal à l’univers de l’expérience. Mais ce diagramme de sert qu’à estimer des probabilités, pas des nombres d’événements.
La fréquence est le nombre de fois qu’un événement se produit par nombre d’essais.
La différence avec une probabilité est dans le nombre d’essais : au lieu de se limiter au nombre d’événements possibles dans l’univers, on effectue un nombre aléatoire d’essais.
Supposons qu’on effectue 50 essais. On note le nombre de fois que les deux dés tombent sur six, et on calcule la fréquence. On effectue 50 autres essais, on calcul la fréquence. On continu ainsi jusqu’à atteindre un total de 3000 essais. En reportant les résultats dans un graphique, on peut tirer des conclusions cruciales lorsqu’on calcule des probabilités.
Tout d'abord, le pouvoir de prédiction d'une probabilité n'existe que pour un grand nombre d'essais. L'écart entre la probabilité et la fréquence est grand pour de petits nombres d'essais, mais s'amenuise à mesure qu'on ajoute des essais.
Ensuite, la fréquence n’est jamais parfaitement égale à la probabilité. Il existe une intervalle de confiance qui est d’autant plus petite que le nombre d’essais est grand.
La formule ci-dessous donne cette intervalle pour une fréquence f et un échantillon de taille n.
En général, on donne le résultat sous forme de moyenne entre la limite haute et la limite basse.
En appliquant l’idée d’intervalle de confiance à notre expérience, on peut souligner un troisième point important.
Comme on aurait pu le deviner, plus l’échantillon est important, plus l’intervalle de confiance est petit. Mais la réduction de l’intervalle de confiance est beaucoup plus important lorsqu’on passe de 50 à 500 essais que lorsqu’on passe de 2000 à 3000 essais. On en déduit qu’il existe une taille d’échantillon au dessus de laquelle l’intervalle de confiance ne se réduit pas significativement.