Introduction au test A/B bayésien
Le testing A/B bayésien est une approche statistique pour comparer deux ou plusieurs versions d'un produit, d'un onglet web ou d'une application pour déterminer laquelle fonctionne mieux. Cette méthode a gagné en popularité en raison de sa simplicité, de sa flexibilité et de son aptitude à fournir des résultats intuitifs, notamment lors du traitement de petit échantillons.
Principales différences par rapport aux approches fréquentistes
-
Interprétation de la probabilité:
- Approche fréquentiste : La probabilité est considérée comme la probabilité d'un événement se produisant lors de répétés expériences. Cette approche repose sur l'analyse des hypothèses avec des échantillons fixes et des valeurs-p pour déterminer la signification statistique [2].
- Approche bayésienne : La probabilité est considérée comme une mesure de croyance qui est mise à jour avec de nouveaux données et de la connaissance antérieure. Cela permet la mise à jour continue des croyances à mesure que de nouvelles données deviennent disponibles [2].
-
Taille d'échantillon:
- Approche fréquentiste : Exige une taille d'échantillon préalablement définie pour assurer la signification statistique.
- Approche bayésienne : Ne nécessite pas une taille d'échantillon fixe, ce qui permet des tests plus flexibles et adaptatifs [2].
-
Coupe au-dessus des données:
- Approche fréquentiste : La coupe du data pour surveiller les résultats du test est généralement interdite pour éviter la biais [2].
- Approche bayésienne : Permet la coupe du data, bien que avec prudence, pour prendre des décisions plus informées [2].
Étapes du testing A/B bayésien
-
Sélection de votre distribution:
- Choisissez une distribution en fonction du métrique d'intérêt. Les distributions couramment utilisées comprennent la binomiale (pour les résultats booléens), le multinomiale (pour les résultats catégoriels) et exponentielle (pour les résultats temporels) [1].
-
Calculation of your prior:
- Sélectionnez un prior conjugué qui correspond à la distribution choisie. Ce prior reflète les données ou les croyances préalables. Les paramètres peuvent être choisis manuellement ou en utilisant des bibliothèques statistiques [1].
-
Exécutez l'expérience:
- Collectez des données de l'expérience, en veillant à l'affectation aléatoire des participants aux différents variants.
-
Calculation of key metrics:
- Utilisez des simulations de Monte Carlo pour calculer les métriques clés telles que le pourcentage de gain, la probabilité que l'une des variations soit meilleure que l'autre et la perte attendue [1].
Avantages du testing A/B bayésien
-
Petites tailles d'échantillon:
- Les méthodes bayésiennes peuvent souvent atteindre des résultats fiables avec des petites tailles d'échantillon, réduisant le temps et les ressources nécessaires pour les tests [1].
-
Résultats intuitifs:
- Le testing A/B bayésien fournit des résultats qui sont plus faciles à interpréter, tels que la probabilité que l'une des variations soit meilleure que l'autre, au lieu de se baser sur les valeurs-p [2].
-
Flexibilité:
- Les méthodes bayésiennes permettent la mise à jour continue des croyances à mesure que de nouvelles données arrivent, ce qui les rend plus adaptatives aux conditions changeantes [2].
-
Intégration de la connaissance antérieure:
- Les statistiques bayésiennes intègrent naturellement la connaissance antérieure dans l'analyse, ce qui peut être particulièrement utile lors de l'utilisation d'informations précédemment acquises dans des expériences précédentes [5].
Considérations pratiques
-
Intensité de calcul:
- Alors que les méthodes bayésiennes offrent plusieurs avantages, elles sont plus intensives en calcul que les méthodes fréquentistes. Cependant, ces calculs sont généralement exécutés hors connexion, ce qui réduit les exigences de performance [1].
-
Sélection d'effets priaux:
- Le choix de la distribution prioritaire est crucial. Il est judicieux de choisir un prior faible (valeurs d'hypothèse plus petites) pour éviter de trop influencer les résultats avec des croyances antérieures [1].
-
Arrêt précoce et analyse de puissance:
- Les considérations pratiques incluent l'équilibre entre le besoin de détecter des différences réelles rapidement et la minimisation des faux découverte (le problème d'arrêt précoce) et la planification de la longueur et de la taille des tests A/B en utilisant l'analyse de puissance [3].
Conclusion
Le testing A/B bayésien offre une approche puissante et flexible pour l'experimentation, ce qui permet des décisions plus informées et plus données-driven. Sa capacité à gérer les petites tailles d'échantillon, à incoprporer la connaissance antérieure et à fournir des mises à jour continues en fait une option attractive pour de nombreux secteurs, notamment dans les technologies où l'experimentation rapide est commune. Cependant, cela nécessite une attention soignée en ce qui concerne les distributions priaux et les ressources de calcul. À mesure que l'industrie continue de se tourner vers les méthodes bayésiennes, comprendre ces principes est essentiel pour prendre des décisions éclairées en fonction des données.
Références:
- [1] https://towardsdatascience.com/bayesian-a-b-testing-and-its-benefits-a7bbe5cb5103
- [2] https://www.dynamicyield.com/lesson/bayesian-testing/
- [3] https://www.pymc.io/projects/examples/en/latest/causal_inference/bayesian_ab_testing_introduction.html
- [4] https://www.youtube.com/watch?v=nRLI_KbvZTQ
- [5] https://matteocourthoud.github.io/post/bayes_reg/