Si on pouvait exposer la fonctionnalité à TOUS les visiteurs potentiels du site, ce serait le pourcentage de visiteurs qui convertiraient
c'est un job pour ...
Description non déterministe du monde.
Si on veut prédire le lancer d'une pièce de monnaie :
On étudie l'ensemble de lois physiques qui nous diront pourquoi on aura pile ou face.
Explication probabiliste :
Je ne sais pas si je vais avoir pile ou face.
Mais ...
Je sais que si je répète l'expérience assez de fois, j'aurai 50% de piles et 50% de faces.
La fréquence d'un résultat, si on pouvait répéter une expérience
"La probabilité d'avoir pile est de 50%"
=
"Si je répète l'expérience assez de fois, j'aurai pile 50% des fois".
Ce vrai taux est impossible à calculer !
Nous sommes dans le domaine de l'inférence statistique
Comment la valeur de $\hat p$ varie-t-elle ? Quelle est sa loi de probabilité ?
Une fourchette de valeurs "probables" pour $p$, étant donné $\hat p$
Intervalle de confiance à 95%:
$$ p \in \left[\hat p - 1.96 \cdot \sigma_{\hat p}, \hat p + 1.96 \cdot \sigma_{\hat p}\right] $$¶
"Il y a 95% de probabilité que cet intervalle contienne le vrai paramètre p"
Au lieu de dire:
"D'après mon test, le taux de conversion du bouton est de 0.02"
On peut maintenant dire:
"D'après mon test, le taux de conversion du bouton est entre 0.01 et 0.03, avec 95% de certitude"
$\hat p = 0.02$ et $p \in [0.0002, 0.038]$
$\hat p = 0.02$ et $p \in [0.018, 0.022]$
Supposez que vous faîtes un test AB, et vous obtenez le résultat suivant:
Quelle variante choisissez-vous ?
Et si vous calculez les intervalles de confiance suivants ?
Variante A: $ \hat p_A = 0.2 $, et $p_A \in [0.01, 0.39]$
Variante B: $ \hat p_B = 0.25 $, et $p_B \in [0.2, 0.3]$
Quelle variante choisissez-vous?
Et maintenant ?
Quelle variante choisissez-vous ?
On peut facilement ajouter de la science à tous nos tests
merci