lundi 2 mai 2016

Pourquoi X9.99€ est un bon prix ?

Comment sont créés les prix pratiqués dans les magasins ou en e-commerce ?

Afficher l'image d'origineIntroduction : Naïvement on peut penser que le prix dépend principalement du coût de fabrication et le coût de vente... Mais de plus en plus le prix est plutôt calculé en fonction de ce qu'on appelle le "willingness to pay" ou "propension à payer". Schématiquement il s'agit d'une approche plus psychologique qu'économique. En particulier, l'étude de perception des prix à montré que le cerveau humain est surtout sensible aux "digits de poids fort".

C'est à dire que quand on voit 12.50€, on voit surtout le 1 et on simplifie en se disant "c'est environ 10€"... Ça peut paraître stupide, mais c'est très fonctionnel, et vous allez voir que c'est très utilisé!

Qu'est ce que ça change ?

Je vais montrer l'impact que cela a sur les distributions de valeur de panier.

Qu'est ce que la distributions de valeur de panier ? il s'agit d'un graphique qui permet de voir comment se repartit la valeur de panier d'un magasin. Sur l'axe des X (abscisse) il s'agit de valeur de panier, sur l'axe Y (ordonnée) il s'agit de la proportion de paniers ayant eu cette valeur.

Un moyen simple de faire ce calcul est de faire un histogramme. On découpe les valeur possible de panier en zones (exemple : 1 à 9.99€, 10€ à 19.99€, etc...) et on compte le nombre de paniers correspondants.

Pour l'intérêt de l'étude ce découpage de l'histogramme est fait de 1 € en 1€. En temps normal on déconseille de faire des zones aussi petites car apparaissent alors des pics qui gênent la lecture, et surtout qui ne sont pas statistiquement significatif car calculés sur de trop petits échantillons.
Nous allons voir que cette approche un peu 'extrême' est pourtant instructive...


Prix "psychologiques", préférant les prix "ronds" et "demi-ronds"
Voici l'histogramme des valeurs de panier d'un site d'e-commerce de détail.
On peut y voir que les valeurs les plus probables se situent entre 10 et 50€, et que les valeurs les plus faibles sont aussi les plus fréquentes.
On y voit surtout des  pics qui sont très loin d'être disposés aléatoirement :
  • les pics élevés sont placés sur des prix ronds, 10 €, 20€, 30€, etc...
  • les pics moins élevés sont placé sur les prix "demi-ronds" : 15€, 25€, 35€, etc...
Cela est bien la preuve qu'il y a notablement plus de prix de produits à dont le dernier digit est environ 5€ ou 0€. Si ces pics étaient dus à un effet de sous-échantillonnage, ils seraient disposés aléatoirement, ce qui n'est pas le cas. La règle du prix psychologique conseille au marchant que si il peut vendre un article à 12.50€, il le vendra aussi bien à 14.99€ car l'attention de l'acheteur s'est arrêté au digit de poids fort : 1. Donc autant pousser les prix vers le prix rond (ou demi-rond) supérieur. 

Cette sur-représentation des prix ronds et demi-ronds est encore plus visible sur cet agrandissement de histogramme précédent.
Zoom du schéma précédent.

Prix "réels"
Pour être sur qu'il ne s'agit pas simplement de fluctuations aléatoires, voyons un autre exemple. Le graphique à droite correspond à la distribution de valeur de panier d'un site de vente en ligne de séjours de vacances.Il s'agit donc de prix plus élevés que pour le commerce de détail. Il y a ici un intérêt bien moindre de gagner quelques euros en arrondissant au prix rond supérieur.

De plus ces "paniers" ne contiennent qu'un seul produit. Ainsi l'effet des prix finissant en 0 ou 5€ ne peut pas s'amplifier comme dans l'exemple d'un magasin de détails où l'on achète souvent plusieurs produits.
On voit bien que ces pics sont disposés aléatoirement. La courbe en bleu représentant la distribution est donc dans le vrai en lissant ces détails qui ne correspondent à aucune réalité.
Une telle "simplification" pour approcher la distribution de probabilité de valeur de panier pour le site de e-commerce de détail serait alors fausse car il lisserai des pics qui existent vraiment.

Conclusion

Il y a un véritable défi dans l'analyse des données des sites de e-commerce car aucune loi statistique classique ne colle à ces spécificités. Il faut donc être très critique quand aux stratégies classiques d'analyse de données statistique pour ce genre de données.