Targeting von Marketingkampagnen mit Daten aus neuronalen Netzen

Der Erfolg einer Marketingkampagne steht und fällt mit einer detaillierten Zieldefinition und realistischer Zielsetzung. An folgendem Beispiel wird die Effektivitätssteigerung durch den Einsatz von neuronalen Netzen bei Newsletter Kampagnen gezeigt. Ein spannendes Projekt von Gianluigi Guido und seinen Kollegen.

 
Neuronale Netze im Einsatz
 
Im Zeitalter des E-Commerce sind die operativen Kosten für Marketingmaßnahmen so gering geworden, sei es durch intelligentere Managementsyseme, Automatisierung und ähnlicher Weiterentwicklungen, dass die Profitabilität von E-Mail Marketingkampagnen bspw. bereits ab einer Konversionsrate von 0,5% beginnen kann.

Wie identifiziert man nun die Kunden mit den höchsten Konversionsraten? Ein Lösungsansatz ist das Marketing basierend auf einer Datenbank („database marketing“). Die Anwendung von statistischen Methoden und Informationsmodellen resultiert in getrennten Datensets an Nutzerdaten, die zum (Re-)targeting genutzt werden können. Besitzt man diese Datengrundlage nicht, so müssen zunächst die Faktoren identifiziert werden, die für eine Kaufentscheidung relevant sein können. An dieser Stellen helfen uns neuronale Netze, um die Antwortrate der Nutzer zu schätzen.

Datengrundlage: Welche Daten nutzen wir für das neuronale Netz?

In der Regel verwendet man soziodemographische Daten, Daten zum Kaufverhalten, Vertiebszahlen, Sentiment-Daten über Feedbacksysteme und Metriken der Webanalyse (Verweildauer, Seiten pro Nutzer, Absprungsrate,…). Die Verwendung von Transaktionsdaten wird klassischerweise über das RFM-Modell analysiert und wiederverwendet. Im Bezug auf die Genauigkeit der Methodik sind die modernen Data Mining Techniken jedoch um einiges besser. Klassisch verwendet man die multiple lineare Regression, Diskriminanzanalyse (Maximum-Likelihood-Methode) und logische Ansätze (binäre Bäume), um Nutzerentscheidungen nachzubilden. Der Nachteil der Regression ist das Unterstellen eines linearen Zusammenhangs und die Verletzungen von wesentlichen Annahmen (Autokorrelation, Heteroskedastizität, unstetige Funktion, Strukturbrüche oder sogar funktionale Fehlspezifikation), die im Folgenden nicht weiter vertieft werden, da sie für die meisten Leser womöglich zu fachfremd und daher unverständlich sind. Die Limitation des linearen Schätzmodells lässt uns keine andere Wahl als die Anwendung von neuronalen Netzen zu probieren.

Neuronales Netz – eine nichtlineare Funktion, die aus unseren Daten lernt

Neuronale Netze punkten mit hoher Flexibilität und Anpassungsfähigkeit an neue Einflussfaktoren durch das simple Vergrößern des neuronalen Netzes um weitere Knoten. Nachteile sind zum einen der hohe Zeitfaktor, der zur Verarbeitung von Inputdaten nötig ist und zum anderen existiert keine alternative Teststatistik, die eine isolierte Ermittlung von Signifikanz von einzelnen Knoten anhand einer Verteilung ermöglicht. Jedoch hilft man sich hier z.B. mit einem Sensitivitätstest.

Für den Einsatz von neuronalen Netzen ist zunächst eine Testgröße notwendig, um das neuronale Netz zu trainieren. Die Backpropagation verbessert stets unsere Gewichtungen.

Studie: Effiktivität von E-Mail Marketing Kampagnen mit neuronalen Netzen

Die Studie hat zum Ziel, die Einflussfaktoren für eine Kaufentscheidung zu identifizieren und die tatsächliche Antwortrate zu schätzen. Die folgenden Variablen wurden für die Untersuchung von Buchbestellungen über das Web berücksichtigt.

Inputvariablen:

  1. Der letzte Buchkauf
  2. Der erste Buchkauf
  3. Die Frequenz an Buchkäufen über Mail-Kampagnen
  4. Die vollständige Kaufsumme für Bücher
  5. Die Anzahl an verkauften Krimis
  6. Die Anzahl an verkauften Romanen
  7. Die Anzahl an verkauften Thrillers
  8. Die Anzahl an verkauften Lehrinhalten/Handbüchern
  9. Altersgruppe: 19-23 Jahre
  10. Altersgruppe: >23 Jahre
  11. männlich
  12. weiblich

Outputvariable: (Nicht-)Kaufbereitschaft für das Buch X.
 
Ergebnis: Das neuronale Netz konnte die Antwortrate zu 83% richtig vorhersagen. Für drei Testgrößen kann das neuronale Netz die Variationen der Testdaten besser erklären als die multiple oder logistische Regression.

Welche Implikationen ergeben sich jetzt für Marketer?

Die Gewichtungen können Aufschluss darüber geben, welche Knotenpunkte signifikanten Einfluss auf die Antwortrate haben. So lassen sich die Einflussfaktoren für das Profiling von Retargeting-Maßnahmen verwenden, um so das Budget effizient zu allokieren. So erhält man nicht nur einen intelligenten Prädiktor für zukünftige Antwortraten, sondern auch wertvolle Informationen für ein datenbasiertes Retargeting.
 
 
Vielen Dank an Pietro Jeng für das Beitragsbild.

Marvin Jörs

Marvin Jörs ist Gründer und geschäftsführender Gesellschafter der Skyscraper Marketing UG.

Hinterlassen Sie einen Kommentar