Marketing

Wie erkenne ich in 14 tagen, ob mein crm‑datenmodell das lead scoring verfälscht

Wie erkenne ich in 14 tagen, ob mein crm‑datenmodell das lead scoring verfälscht

Lead Scoring ist ein mächtiges Werkzeug — aber nur, wenn die Datenbasis stimmt. In den letzten Jahren habe ich oft erlebt, dass Teams nach Monaten feststellen, dass ihr Scoring „merkwürdig“ läuft. Dabei lassen sich die größten Fehlerquellen schon in zwei Wochen erkennen, wenn man strukturiert vorgeht. Ich zeige dir, wie ich innerhalb von 14 Tagen prüfe, ob das CRM‑Datenmodell das Lead Scoring verfälscht — mit konkreten Tests, Metriken und schnellen Korrekturansätzen.

Tag 0–2: Hypothesen bilden und Datenlandschaft kartieren

Bevor ich in die Daten eintauche, formuliere ich klare Hypothesen. Typische Verdächtige sind:

  • Duplikate oder Merge‑Probleme
  • Fehlende Timestamps / falsche Zeitstempel
  • Unterschiedliche Identitätsquellen (z. B. Marketing‑Formular vs. Sales‑Import)
  • Falsche Feldtypen (z. B. Text statt Datumsfeld für "letzte Aktivität")
  • Dann erstelle ich eine schnelle Übersicht der relevanten Quellen: CRM (z. B. Salesforce, HubSpot, Pipedrive), Marketing Automation (z. B. Marketo, Pardot), Web/Analytics (Google Analytics, GA4), Eventstreams (Segment, RudderStack). Ziel: Verstehen, welche Datensätze in welchen Systemen landen und wie sie verknüpft werden.

    Tag 3–5: Integritätschecks — sind die Rohdaten sauber?

    Ich führe einfache Prüfungen aus, die schnell Auffälligkeiten zeigen:

  • Duplikatsrate: Anteil gleicher E‑Mails oder Telefonnummern pro Woche. Erwartung: < 2–3%. Höher? Merge‑Regeln prüfen.
  • Fehlende Pflichtfelder: Anteil Leads mit fehlendem Country, Source, CreatedAt oder Email. Erwartung: < 5–10% je nach System.
  • Zeitstempel‑Konsistenz: Vergleiche CreatedAt vs. FirstTouch vs. LastActivity. Wenn CreatedAt nach LastActivity liegt, stimmt etwas nicht.
  • Quellenüberlapp: Anteil Leads, die in Marketing Automation andere IDs haben als im CRM. Hohe Abweichungen deuten auf fehlerhafte ID‑Mapping‑Regeln.
  • Typische SQL‑Queries (vereinfacht) helfen mir, diese Checks in einem Data Warehouse schnell zu laufen zu lassen:

    SELECT COUNT(*) FROM leads WHERE email IS NULL;

    SELECT email, COUNT(*) FROM leads GROUP BY email HAVING COUNT(*) > 1;

    Wenn du kein Warehouse hast, lassen sich die gleichen Checks mit Listenexporten aus dem CRM und Excel/Sheets machen.

    Tag 6–8: Scoring‑Inputs evaluieren

    Nun schaue ich mir an, welche Felder ins Scoring einfließen und wie robust diese Felder sind.

  • Feldtypen prüfen: Sind Aktivitätsfelder numerisch und aggregierbar? Oder werden Texte verwendet (z. B. "Letzte Aktion: Formular ausgefüllt")?
  • Coverage: Wie viele Leads haben Werte für jedes Scoring‑Feld? Ein Feld mit 10% Coverage bringt kaum Aussagekraft.
  • Skalierung: Sind Werte zwischen Systemen konsistent? Beispiel: E‑Mail‑Öffnungen aus Mailchimp vs. HubSpot — zählen beide gleich? Wenn nicht, müssen wir normalisieren.
  • Ich erstelle zudem eine Korrelationsmatrix zwischen Scoring‑Score und Zielmetrik (z. B. SQL‑Creation, Deal‑Conversion). Wenn der Score kaum korreliert, ist entweder das Modell schwach oder die Daten verzerren es.

    Tag 9–11: Schnelle Experimente im Feld

    Theorie ist gut — ich will sehen, wie das Score‑Ranking in der Praxis performt. Dafür mache ich zwei schnelle Experimente:

  • A/B‑Sampling der Top‑Scored Leads: Wähle die Top 5% Scored Leads der letzten 30 Tage und vergleiche Conversion‑Rate mit einem randomisierten Matched‑Sample.
  • Feature‑Drop Test: Entferne ein kritisches Feature (z. B. "Seitenaufrufe letzte 7 Tage") aus dem Score und beobachte, ob die Priorisierung sich stark ändert.
  • Erwartung: Wenn die Top‑Scored Leads nicht signifikant bessere Conversion‑Raten zeigen, liegt das Problem entweder am Modell oder an den Inputdaten. Wenn das Entfernen eines Features die Reihenfolge kaum verändert, ist dieses Feature entweder redundant oder fehlerhaft.

    Tag 12: Technische Ursachenpunktuntersuchung

    Jetzt grabe ich tiefer in Integration und Transformation:

  • ETL‑Jobs prüfen: Werden Felder während ETL anonymisiert, aggregiert oder zeitverschoben? Ein häufiges Problem ist vs. UTC/Local Time‑Mismatch, der "letzte Aktivität" verfälscht.
  • Mapping‑Regeln: Werden Leads aus mehreren Quellen gemerged? Ich prüfe Merge‑Keys (Email vs. Cookie vs. ContactID). Falsche Priorisierung von Merge‑Regeln erzeugt falsche Historien.
  • Event‑Deduplication: Event‑Streams ohne Dedup führen zu überhöhten Aktivitätsklauseln im Score (z. B. 1000 Seitenaufrufe in 10 Minuten wegen fehlerhaftem Tracking).
  • Tools wie Segment, Fivetran oder Airbyte ersparen viele Fehler — aber nur, wenn die Konfiguration sauber ist. Ich prüfe auch, ob Webhooks mehrfach feuern (z. B. bei Retry‑Mechanismen).

    Tag 13: Validierung mit Sales

    Technik ist nur die halbe Miete. Ich sprich mit Sales‑Colleagues und frage direkt:

  • Fühlt sich die Lead‑Priorisierung sinnvoll an?
  • Kommen Leads mit hohem Score tatsächlich zum Gespräch oder sind es Spam/irrelevante Anfragen?
  • Welche Information fehlt im CRM, die sie zur Bewertung bräuchten?
  • Meist zeigen die Sales‑Insights Lücken auf, die reine Datenchecks übersehen — z. B. fehlende Branche oder Zielgrösse in Profilfeldern.

    Tag 14: Ergebnis zusammenfassen und Sofortmaßnahmen

    Am Ende der zwei Wochen habe ich drei Dinge:

  • Eine Liste der identifizierten Datenprobleme (z. B. Duplikatsrate 8%, 15% Leads ohne Zeitstempel).
  • Konkrete Quick Wins (Sofortmaßnahmen) und mittelfristige Fixes.
  • Ein Testplan zur weiteren Validierung.
  • Typische Quick Wins, die ich empfehle:

  • Striktere Merge‑Regeln (Email + Domain + Source) und dedizierte Merge‑Logs.
  • Normalisierung von Aktivitätsmetriken (z. B. 1 Mailopen = 1, egal, welches Tool).
  • ETL‑Job: Timestamps auf UTC standardisieren und auf korrekte Reihenfolge prüfen.
  • Einführen eines einfachen "Data Health Dashboard" (Anteil fehlender Felder, Duplikate, fehlerhafte Events).
  • CheckSollwertMaßnahme bei Abweichung
    Duplikatrate< 3%Merge‑Regeln anpassen, dedup‑Job
    Coverage essentieller Felder> 90%Formularvalidierung, Pflichtfelder
    Time‑stamping konsistentAlle UTCETL korrigieren, Logging
    Score vs. Conversion KorrealtionPearson > 0,3Feature‑Engineering, Reweighting

    Wenn du möchtest, kann ich dir eine Checkliste und ein SQL‑Snippet schicken, mit dem du die wichtigsten Prüfungen automatisiert in deinem Data Warehouse laufen lassen kannst. In vielen Fällen reicht eine Woche zusätzlicher Automatisierung, um das Scoring wieder verlässlich zu machen — vorausgesetzt, man hat zuerst die Datenmodelle sauber geprüft.

    Sie sollten auch die folgenden Nachrichten lesen:

    Wie rette ich binnen sechs wochen einen sales‑funnel, in dem qualifizierte leads unerwartet abspringen
    Marketing

    Wie rette ich binnen sechs wochen einen sales‑funnel, in dem qualifizierte leads unerwartet abspringen

    Als Beraterin habe ich schon mehrere Male erlebt, wie ein eigentlich funktionierender...

    Wie implementiere ich ein low‑cost user‑testing‑programm, das in zwei wochen valide produkt‑hypothesen liefert
    Wachstum

    Wie implementiere ich ein low‑cost user‑testing‑programm, das in zwei wochen valide produkt‑hypothesen liefert

    Wenn ich ein Low‑Cost User‑Testing‑Programm aufsetze, verfolge ich ein klares Ziel: in zwei...