Bayessche Conversion Rate Optimierung

verteilung-bayes

Conversion Rate Optimierung nach Bayesscher Statistik kam bereits 2013 einmal auf. Damals hat Chris Stucchio in seinem Beitrag dargelegt, wie man mithilfe von Wahrscheinlichkeitsverteilungen die Optimierung von CTR-Raten realisieren kann.

Wir gehen von einem unbekannten \Theta-Parameter aus, der Werte zwischen [0,1] annehmen kann. Dieser \Theta-Parameter repräsentiert den wahren Wert – die wahre Konversionsrate. Das Ziel ist es, eine A-posteriori-Verteilung nach \Theta zu entwickeln.

Die Funktion hat die Form:

    \[    P(a<\Theta<b) = \int_{a}^{b} f(\Theta)d\Theta \]

Grafisch gesehen grenzt das Intervall [b,a] eine Fläche unterhalb des Graphen der Funktion f(\Theta).

f(\Theta):

Bayes Verteilung

Nun ist es möglich, zwei Wesentliches zu ermitteln:

  • Die Anzahl an erreichbaren Konversionszielen für ein gegebenes Intervall
  • a und b können so gewählt werden, dass die Fläche unterhalb des Graphen 0.95 annimmt. Wir können dann statistisch signifikante Aussagen treffen (z.B. mit 95% Sicherheit liegt der wahre Wert der Conversion-Rate zwischen a und b).
  • Für mehrere Handlungsalternativen Verteilungen schätzen und so die CTR verbessern (Best-Expected-CTR-Heuristik)

Funktionsgestaltung mithilfe des Satz von Bayes

Wir wollen uns nun dem wahren Wert von \Theta widmen. Dazu benötigen wir den Satz von Bayes:

 

    \[    P(\Theta|E) = \frac{P(E|\Theta)P(\Theta)}{P(E)} \]

 

Stucchio wählt hier geschickt die Binomialverteilung, um die Wahrscheinlichkeit für das Ereignis P(E|\Theta) zu schätzen. Da \Theta unbekannt ist, könn(t)en wir P(E|\Theta) wie folgt berechnen:

 

    \[    P(\Theta|E) = \binom{conversions}{visitors}\Theta^c^o^n^v^e^r^s^i^o^n^s(1-\Theta)^v^i^s^i^t^o^r^s^-^c^o^n^v^e^r^s^i^o^n^s \]

 

Wie berechnen wir nun P(\Theta)? Hier gilt es nun, einen Schätzwert festzulegen. Wir sind dabei frei, welche Art der Wahrscheinlichkeitsverteilung wir für \Theta wählen. Intuitiv ist die Konversionsrate nicht gleichverteilt. In der Regel ist eine Konversionsrate im E-Commerce über 50% unrealistisch. Gehen wir davon aus, dass sich die Konversionsrate zwischen 0% und 10% bewegt, wobei die Häufigkeit in die Höhe stark abnimmt und die Funktion demnach einen extremen Peak und im Anschluss stark fallend gestaltet sein soll. Zur Kalkulation verwenden wir daher eine Beta-Verteilung mit Alpha = 1,1 und Beta = 30. Chris hat in seinem Ursprungsartikel diese Form gewählt, da sie die oben beschriebenen Eigenschaften gut abbildet.

Fügt man nun die Formell der Binomialverteilung für P(E|\Theta) und unsere angenommene A-priori-Verteilung für P(\Theta) ein, so erhält man nach Ausklammern aller konstanten Werte ohne \Theta die Form der A-posteriori-Verteilung. Bei der A-posteriori-Verteilung handelt es sich ebenfalls um eine Beta-Verteilung, jedoch sind dabei Alpha- und Beta-Wert verändert – um genau diese Werte:

 

    \[    Posterior = f_\alpha_+_K_,_\beta_+_N_-_K \]

 

Nun können wir auf Basis dieser Formell Wahrscheinlichkeitswerte für Conversion-Intervalle berechnen (N = Anzahl der Besucher, K = Anzahl der Konversionen).

 

    \[    P(0.01<\Theta<1) = \int_{0.01}^{1} f_\alpha_+_K_,_\beta_+_N_-_K(\Theta)d(\Theta) \]

 

Mit welcher Wahrscheinlichkeit beträgt die echte Conversion-Rate mind. 1%?

Mithilfe solcher Wahrscheinlichkeitswerte lassen sich Simulationen und Schätzungen über die mögliche Anzahl an Conversions treffen. Mit der Anzahl an Stichproben verkleinert sich die Varianz der Verteilungen und die Schätzwerte werden präziser. Vergleicht man die geschätzten CTRs mehrerer Alternativen, so kreiert man ein fortlaufendes Optimierungscluster. Es ist dabei stets die Option zu wählen, die die höchste erwartete CTR besitzt.

Marvin Jörs

Marvin Jörs ist Gründer und geschäftsführender Gesellschafter der Skyscraper Marketing UG. Bereits mit 14 Jahren absolvierte Jörs sein erstes Schulpraktikum bei der Deutschen Telekom mit Aspekten aus der Suchmaschinenoptimierung. Seitdem erfolgten mehrere berufliche Stationen sowie Aktivitäten als freiberuflicher Webdesigner. Er hat an der Technischen Universität in Darmstadt einen B.Sc. in Wirtschaftsinformatik abgeschlossen.