Statistische Leistung
.webp)
Die Fähigkeit eines A/B-Tests zur Erkennung eines tatsächlichen Effekts vorhersagen
📌 Definition der statistischen Aussagekraft im A/B-Test
Die statistische Aussagekraft ist die Wahrscheinlichkeit, dass ein A/B-Test einen tatsächlichen Effekt erkennt, wenn dieser tatsächlich vorhanden ist.
Mit anderen Worten: Sie bewertet die Fähigkeit des Tests, ein falsches Negativ zu vermeiden – also nicht fälschlicherweise zu dem Schluss zu kommen, dass eine Variation unwirksam ist, obwohl sie tatsächlich eine Wirkung hat.
Im Zusammenhang mitder Conversion-Rate-Optimierung (CRO) gewährleistet eine ausreichende Aussagekraft, dass die aus einem Test resultierenden Entscheidungen fundiert und umsetzbar sind.
🎯 Empfohlenes Niveau
In den meisten Fällen wird eine statistische Aussagekraft von 80 % als akzeptables Minimum angesehen.
Das bedeutet, dass der Test mit einer Wahrscheinlichkeit von 80 % einen tatsächlichen Effekt erkennt und nur ein Risiko von 20 % besteht, dass er diesen übersieht (Fehler vom Typ II).
⚖️ Faktoren, die die Leistung beeinflussen
Die Leistung hängt von drei Schlüsselparametern ab:
- Stichprobengröße
→ Je mehr Traffic oder Conversions du hast, desto mehr kleine Effekte kannst du erkennen. - Minimum Detectable Effect (MDE)
→ Dies istdie minimale Effektstärke, die Sie erkennen möchten (z. B. +5 % Konversion).
→ Je geringer der erwartete Effekt ist, desto mehr Traffic ist erforderlich, um ihn mit ausreichender Aussagekraft zu erkennen. - Konfidenzniveau (z. B. 95 %):
→ Es bestimmt den Schwellenwert, ab dem ein Ergebnis als statistisch signifikant angesehen wird.
→ Je anspruchsvoller das Niveau, desto geringer die Aussagekraft (bei konstanter Stichprobengröße).
❗ Warum dies beim A/B-Testing entscheidend ist
Ohne ausreichende Leistung:
- Du riskierst, eine gewinnbringende Variante aufgrund unzureichender Beweise abzulehnen,
- Dein Test kann als „neutral“ eingestuft werden, obwohl der Effekt vorhanden ist, aber durch fehlende Daten verdeckt wird.
- Du verlierst Zeit, Traffic und Optimierungsmöglichkeiten.
💡 Umgekehrt stärkt eine gute Aussagekraft die Zuverlässigkeit des Lernens, selbst wenn das Ergebnis nicht signifikant ist.
🧪 Konkrete Beispiele
Situation Geringe Aussagekraft Risiko Sie testen eine Variation mit einem MDE von 3 %, aber wenig Traffic 40 % Sie haben eine 60-prozentige Chance, einen tatsächlichen Effekt zu übersehen Siestreben eine Variation von +10 % bei 20.000 Sitzungen an 85 % Gute Aussagekraft → zuverlässige Schlussfolgerung bei Erfolg oder Misserfolg
✅ Bewährte Praktiken im Bereich CRO
- Berechnen Sie die Leistung vor dem Test mit einem Tool (Optimizely, AB Tasty, Evan Miller) oder einem benutzerdefinierten Modell (BigQuery, R).
- Definieren Sie einen realistischen MDE entsprechend den geschäftlichen Herausforderungen (z. B.: 2 % auf einer Homepage ≠ 10 % auf einem Produktblatt).
- Verlängerung der Testdauer oder Bündelung des Datenverkehrs, um eine ausreichende Leistung zu erzielen,
- Interpretieren Sie niemals einen „neutralen“ Test, ohne dessen tatsächliche Aussagekraft überprüft zu haben.
.avif)
