A/B Test Hintergrundbild

Um den Absatz, die Kundenbindung oder die Bekanntheit zu erhöhen, investieren Unternehmen oft hohe Summen in Marketingkampagnen. Doch erzielen diese ĂŒberhaupt die gewĂŒnschte Wirkung? Und wenn ja, in welchem Maße können sie zum Unternehmenserfolg beitragen? HĂ€ufig lĂ€sst sich das an monetĂ€ren Ergebnissen ablesen. Doch worauf muss dabei geachtet werden? Was sind die ausschlaggebenden Kennzahlen, auf welche man bei der Kampagnenauswertung achten muss?

Dieser Artikel gibt einen Einblick in verschiedene Test- und Auswertungsmethoden, welche Dir helfen werden, zukĂŒnftige Kampagnen erfolgreicher zu gestalten. Indem Du jede Kampagne als wissenschaftliches Experiment angehst, erhĂ€lst Du tiefere Einblicke. Und durch tieferes VerstĂ€ndnis maximierst Du Deinen Erfolg!

Beispielsweise gehört zur Auswertung eines Newsletter nicht nur die Opening-Raten. Haben die aktiven Kunden denn auch einen höheren Umsatz generiert? Der Erfolg einer Kampagne setzt sich aus verschiedenen Faktoren zusammen.

Testmethoden

Um tiefere Einblicke in eine Kampagne zu bekommen, gibt es verschiedene AnsÀtze. Je nach Art passen jeweils verschiedene Kampagnenauswertungen besser.

Generell empfiehlt es sich beim Testaufbau von Kampagnen mit Kontrollgruppen zu arbeiten. Damit schafft man eine Vergleichsgrundlage fĂŒr die Ergebnisse. Bei dieser handelt es sich um eine kleine Gruppe der Kunden, an die sich die Kampagne richtet. Sie Ă€hnelt in ihrer Struktur der Zielgruppe und reprĂ€sentiert diese in ihrer Zusammensetzung an demographischen Merkmalen, Kaufverhalten, Geschlecht, etc… Diese sollte in etwa 5-10% Ihrer Zielgruppe umfassen. Bei kleineren Zielgruppen mit wenigen Tausenden Personen ein wenig mehr, ca. 10-20%.

A/B Test – unterschiedliches Angebot, gleiche Kunden

Der A/B-Test ist eine der gĂ€ngigsten Testmethoden, um der Wirkung von Kampagnen auf den Zahn zu fĂŒhlen. Dazu gibt es zwei AnsĂ€tze: entweder wird mit einer Nullgruppe oder mit zwei verschiedenen Kampagnen gearbeitet. Bei der ersten Methode kommt der eine Teil der Kunden mit einer Marketingkampagne in BerĂŒhrung, beispielsweise mit einem Zusatzkatalog oder einem Sonderangebot. Die andere Gruppe erhĂ€lt hingegen nichts. Vergleicht man nun die Perfomance der beiden Gruppen, so lĂ€sst sich daraus der Erfolg der Kampagne ablesen.

A/B Test

Möchte man nun aber Kampagnen optimieren und herausfinden, was diese erfolgreich macht, so arbeitet man ebenfalls mit zwei Kundengruppen der gleichen Struktur. Dieses Mal bekommen beide Gruppen eine Kampagnen – allerdings zwei unterschiedliche. Um beim Beispiel des Zusatzkataloges zu bleiben, Ă€ndern wir an diesem fĂŒr die zweite Kundengruppe nun ein Merkmal ab – etwa das Titelbild. Nun lĂ€sst sich wieder die Perfomance der beiden Gruppen untereinander vergleichen. Dadurch kann ermittelt werden, welche Kampagne erfolgreicher verlief. Wichtig ist hierbei, dass sich die Kampagnen nur in einer Variablen unterscheiden, um so gezielte Schlussfolgerungen ziehen zu können.
Diese Tests können auch als A/B/n-Tests durchgefĂŒhrt werden, „n“ steht dabei fĂŒr eine weitere Variante, also eine weitere Gestaltungsmöglichkeit eines Titelbildes zum Beispiel. Das Testen mehrerer Varianten parallel erfordert allerdings einen grĂ¶ĂŸeren Pool an Kunden, um valide Ergebnisse erzielen zu können.

Diese Tests finden vor allem Anwendung, um verschiedene Werbemaßnahmen zu vergleichen. Anschließend kann das beste Ergebnis ausgewĂ€hlt und dadurch die Kampagne optimiert werden.

Die Ergebnisse eines solchen Tests können beispielsweise wie folgt aussehen:

KundenanzahlResponse-QuoteØ Umsatz
Angebot A5003%110 Euro
Angebot B5004%114 Euro

Der Test lĂ€sst sich aber auch umkehren. Du stellst Dir die Frage, welche Kundengruppen am besten auf Dein Angebot reagieren, um besseres Targeting dafĂŒr einsetzten zu können? Dazu muss man zunĂ€chst mit heterogenen Kundengruppen arbeiten und deren Resonanz auf das Angebot messen. Quasi in Form eines umgekehrten A/B-Testes. Wie das funktioniert, erklĂ€ren wir im nĂ€chsten Absatz anhand einer speziellen Form des A/B-Testes, nĂ€mlich dem Champion-Challenger Ansatz.

Champion Challenger – unterschiedliche Kunden, gleiches Angebot

Dieser Testaufbau lĂ€sst sich am besten an einem Beispiel beschreiben. Gehen wir einmal davon aus, dass wir unseren besten Kunden ein Sonderangebot zukommen lassen wollen. Doch wer sind eigentlich die besten Kunden? Um diese zu ermitteln wenden wir unser ĂŒbliches, schon oft erprobtes Vorgehen an – das ist der aktuelle Champion. Dem gegenĂŒber steht nun aber eine neue Methode, welche den Champion herausfordert – der sogenannte Challenger.

Bei dem jeweils ausgewĂ€hlten Kundenkreis stellt man fest, dass sich ein Großteil ĂŒberschneidet, also von beiden Modellen ausgewĂ€hlt wurde. Daher betrachtet man fĂŒr die Auswertung der Ergebnisse nur jene Kunden und deren UmsĂ€tze, welche sich nicht in der Schnittmenge befunden haben.

Die Ergebnisse diesen Tests könnten so aussehen.

KundenanzahlResponse-Quote Ø Umsatz
Kundengruppe Champion5005%100 Euro
Kundengruppe Challenger5007%130 Euro

Diese Methode ist ein guter Ansatz um neue Ideen und Entwicklungen im kleinen, kostensparenden Rahmen zu erproben. Dadurch wird das Risiko gesenkt, dass eine Innovation nicht den gewĂŒnschten Erfolg erzielt. Im Grunde funktioniert der Ansatz auf dieselbe Weise wie der A/B-Test, wird aber eher fĂŒr Strategien angewandt, um diese auszutesten.

Nach dem nun beschriebenen Tests von Marketingkampagnen liegen uns nun einige Ergebnisse vor. Doch was nun? ZunĂ€chst sollte man die Ergebnisse nicht vorschnell als bare MĂŒnze nehmen. Um tatsĂ€chlich valide Schlussfolgerungen ziehen zu können, ist es wichtig, ein wenig tiefer in die Materie einzutauchen und sich intensiver mit den Auswertungsergebnissen zu befassen.

Auswertungsmethoden

Meist erkennt man relativ schnell mit einfachen Auswertungstool erste Ergebnisse einer Marketingkampagne. Wie viele Kunden haben einen Newsletter geöffnet, wie viele sind dadurch auf die Webseite gelangt und wie viel Umsatz wurde dadurch generiert. Doch blickt man ein wenig tiefer in die DatensĂ€tze, so erkennt man, dass die Durchschnittswerte, welche man zunĂ€chst grob ausgerechnet hat, durch einzelne Daten verzogen und somit verfĂ€lscht werden können. Ausreißer beeinflussen Ergebnisse oft. Vor allem im Business-to-Business-Sektor ist die Wahrscheinlichkeit nicht gering, dass mehrere Tausend Euro Umsatz durch einen einzigen Kunden generiert worden sind, welcher das Ergebnis zunĂ€chst sehr positiv erscheinen lĂ€sst, die Durchschnittswerte aber in eine unrealistische Richtung verzerrt.
Um mit diesen Daten richtig umzugehen, können sie isoliert betrachtet werden oder es erfolgt eine Deckelung der Umsatzhöhe.

t-Tests

Der t-Test ist die gebrÀuchlichste Methode in der Statistik, um Mittelwerte zweier Gruppen zu vergleichen.
Mit dem t-Test lĂ€sst sich ermitteln, ob zwei verschiedene Stichproben signifikant unterschiedlich sind. Hierzu werden also zwei Stichproben benötigt – perfekt fĂŒr die Ergebnisse der bereits beschrieben A/B-Tests. Gehen wir beispielsweise davon aus, dass Gruppe A, welche einen Katalog mit einem roten Titelbild erhalten hat, höhere UmsĂ€tze erzielt, als Gruppe B, welche ein blaues Titelbild zugesendet bekam. Doch ist dieser Effekt wirklich statistisch signifikant? Dies kann durch den Test ĂŒberprĂŒft werden.

Schauen wir uns als Beispiel nochmal unseren ersten A/B-Test an, so ist das Ergebnis nicht signifikant, da Gruppe B zwar im Schnitt einen höheren Umsatz generiert, die Abweichungen innerhalb dieser Ergebnisse aber sehr schwanken. Hier kann man also schlussfolgern, dass Angebot B keine besseren Ergebnisse liefert als Angebot A.

Auswertung A/B Test

Bei unserem zweiten Test hingegen unterscheiden sich die Mittelwerte des Umsatzes deutlicher, zudem sind die Abweichungen innerhalb der UmsĂ€tze nicht so groß. Das Ergebnis ist daher signifikant, was bedeutet, dass das Angebot in Kundengruppe B (Challenger) relevant bessere Ergebnisse erzielt.

Auswertung Champion/Challenger
Signifikanz Champion/Challenger

Generell muss man darauf achten, dass bei einer großen Datenmenge, also bei vielen Kundendaten, bereits kleine Abweichungen ausreichen, damit der Test signifikant ist. Bei wenigen Kunden sind dafĂŒr grĂ¶ĂŸere Abweichungen nötig.

Aber keine Sorge, Du musst kein Mathefreak sein und auch keinen Taschenrechner zĂŒcken, um einen t-Test anzuwenden. Mit Excel und Online-Rechnern lĂ€sst sich das ganz einfach lösen. Auch wir haben fĂŒr unser Beispiel einen Online-Rechner benutzt. Diesen findest Du hier:

https://www.graphpad.com/quickcalcs/ttest1.cfm

Voraussetzung fĂŒr die Anwendung des t-Testes ist, dass die Grundgesamtheiten normalverteilt vorliegen. Ist dies nicht der Fall, so muss auf andere statistische Verfahren zurĂŒckgegriffen werden – beispielsweise  Bootstrapping.

Bootstrapping

Wie funktioniert das? Grob gesagt werden dabei immer wieder kleinere Stichproben aus der Gesamtdatenmenge gezogen, es wird ein Resampling durchgefĂŒhrt. Es werden also durch die Annahme, dass die Verteilungsfunktion ihrer empirischen Verteilungsfunktion entspricht, weitere DatensĂ€tze generiert.

Üblicherweise werden zwischen 1000 und 10.000 weitere Stichproben aus der vorhandenen Datenmenge gezogen. Logischerweise mit zurĂŒcklegen, anderenfalls hĂ€tte man das exakt selbe Ergebnis der ursprĂŒnglichen Datenmenge vorliegen. Durch die Ziehungen liegen also manche Datenpunkte mehrfach vor, andere dafĂŒr möglicherweise gar nicht.

Der Name Bootstrapping leitet sich ĂŒbrigens von einem englischen Sprichwort ab: „Sich an den eigenen FĂŒĂŸen aus dem Sumpf ziehen.“ Der Bedarf an weiteren Stichproben wird nĂ€mlich aus der eigenen, bereits vorhandenen Stichprobe gedeckt. Dadurch wird die ZuverlĂ€ssigkeit von Signifikanztests und die Konfidenzintervalle verbessert.

Um Bootstrapping anwenden zu können muss man in Statistik nicht mit einer 1,0 abgeschnitten haben. Kontaktiere uns gerne fĂŒr einen Auszug eines Codes von Paraboost, durch welchen sich Bootstrapping ganz leicht umsetzten lĂ€sst.

Folge uns!
onpost_follow
Tweet