G
Statistiken

Statistische Leistung

Die Fähigkeit eines A/B-Tests zur Erkennung eines tatsächlichen Effekts vorhersagen

📌 Definition der statistischen Aussagekraft im A/B-Test

Die statistische Aussagekraft ist die Wahrscheinlichkeit, dass ein A/B-Test einen tatsächlichen Effekt erkennt, wenn dieser tatsächlich vorhanden ist.
Mit anderen Worten: Sie bewertet die Fähigkeit des Tests, ein falsches Negativ zu vermeiden – also nicht fälschlicherweise zu dem Schluss zu kommen, dass eine Variation unwirksam ist, obwohl sie tatsächlich eine Wirkung hat.

Im Zusammenhang mitder Conversion-Rate-Optimierung (CRO) gewährleistet eine ausreichende Aussagekraft, dass die aus einem Test resultierenden Entscheidungen fundiert und umsetzbar sind.

🎯 Empfohlenes Niveau

In den meisten Fällen wird eine statistische Aussagekraft von 80 % als akzeptables Minimum angesehen.
Das bedeutet, dass der Test mit einer Wahrscheinlichkeit von 80 % einen tatsächlichen Effekt erkennt und nur ein Risiko von 20 % besteht, dass er diesen übersieht (Fehler vom Typ II).

⚖️ Faktoren, die die Leistung beeinflussen

Die Leistung hängt von drei Schlüsselparametern ab:

  1. Stichprobengröße
    → Je mehr Traffic oder Conversions du hast, desto mehr kleine Effekte kannst du erkennen.
  2. Minimum Detectable Effect (MDE)
    → Dies istdie minimale Effektstärke, die Sie erkennen möchten (z. B. +5 % Konversion).
    → Je geringer der erwartete Effekt ist, desto mehr Traffic ist erforderlich, um ihn mit ausreichender Aussagekraft zu erkennen.
  3. Konfidenzniveau (z. B. 95 %):
    → Es bestimmt den Schwellenwert, ab dem ein Ergebnis als statistisch signifikant angesehen wird.
    → Je anspruchsvoller das Niveau, desto geringer die Aussagekraft (bei konstanter Stichprobengröße).

❗ Warum dies beim A/B-Testing entscheidend ist

Ohne ausreichende Leistung:

  • Du riskierst, eine gewinnbringende Variante aufgrund unzureichender Beweise abzulehnen,
  • Dein Test kann als „neutral“ eingestuft werden, obwohl der Effekt vorhanden ist, aber durch fehlende Daten verdeckt wird.
  • Du verlierst Zeit, Traffic und Optimierungsmöglichkeiten.

💡 Umgekehrt stärkt eine gute Aussagekraft die Zuverlässigkeit des Lernens, selbst wenn das Ergebnis nicht signifikant ist.

🧪 Konkrete Beispiele

Situation Geringe Aussagekraft Risiko Sie testen eine Variation mit einem MDE von 3 %, aber wenig Traffic 40 % Sie haben eine 60-prozentige Chance, einen tatsächlichen Effekt zu übersehen Siestreben eine Variation von +10 % bei 20.000 Sitzungen an 85 % Gute Aussagekraft → zuverlässige Schlussfolgerung bei Erfolg oder Misserfolg

✅ Bewährte Praktiken im Bereich CRO

  • Berechnen Sie die Leistung vor dem Test mit einem Tool (Optimizely, AB Tasty, Evan Miller) oder einem benutzerdefinierten Modell (BigQuery, R).
  • Definieren Sie einen realistischen MDE entsprechend den geschäftlichen Herausforderungen (z. B.: 2 % auf einer Homepage ≠ 10 % auf einem Produktblatt).
  • Verlängerung der Testdauer oder Bündelung des Datenverkehrs, um eine ausreichende Leistung zu erzielen,
  • Interpretieren Sie niemals einen „neutralen“ Test, ohne dessen tatsächliche Aussagekraft überprüft zu haben.

Tauschen Sie sich mit einem Welyft-Experten aus

Die Data-Marketing-Agentur, die den ROI Ihrer Customer Journeys steigert

Termin vereinbaren
Teilen Sie diesen Artikel auf

Erzählen Sie uns mehr über Ihr Projekt

Wir wissen, wie Sie die Leistung Ihrer digitalen Kanäle steigern können.
CRO
Data
User Research
Experimente
Kontaktieren Sie uns