Wie erkenne ich in 14 tagen, ob mein crm‑datenmodell das lead scoring verfälscht

Lead Scoring ist ein mächtiges Werkzeug — aber nur, wenn die Datenbasis stimmt. In den letzten Jahren habe ich oft erlebt, dass Teams nach Monaten feststellen, dass ihr Scoring „merkwürdig“ läuft. Dabei lassen sich die größten Fehlerquellen schon in zwei Wochen erkennen, wenn man strukturiert vorgeht. Ich zeige dir, wie ich innerhalb von 14 Tagen prüfe, ob das CRM‑Datenmodell das Lead Scoring verfälscht — mit konkreten Tests, Metriken und schnellen Korrekturansätzen.

Tag 0–2: Hypothesen bilden und Datenlandschaft kartieren

Bevor ich in die Daten eintauche, formuliere ich klare Hypothesen. Typische Verdächtige sind:

Duplikate oder Merge‑Probleme

Fehlende Timestamps / falsche Zeitstempel

Unterschiedliche Identitätsquellen (z. B. Marketing‑Formular vs. Sales‑Import)

Falsche Feldtypen (z. B. Text statt Datumsfeld für "letzte Aktivität")

Dann erstelle ich eine schnelle Übersicht der relevanten Quellen: CRM (z. B. Salesforce, HubSpot, Pipedrive), Marketing Automation (z. B. Marketo, Pardot), Web/Analytics (Google Analytics, GA4), Eventstreams (Segment, RudderStack). Ziel: Verstehen, welche Datensätze in welchen Systemen landen und wie sie verknüpft werden.

Tag 3–5: Integritätschecks — sind die Rohdaten sauber?

Ich führe einfache Prüfungen aus, die schnell Auffälligkeiten zeigen:

Duplikatsrate: Anteil gleicher E‑Mails oder Telefonnummern pro Woche. Erwartung: < 2–3%. Höher? Merge‑Regeln prüfen.

Fehlende Pflichtfelder: Anteil Leads mit fehlendem Country, Source, CreatedAt oder Email. Erwartung: < 5–10% je nach System.

Zeitstempel‑Konsistenz: Vergleiche CreatedAt vs. FirstTouch vs. LastActivity. Wenn CreatedAt nach LastActivity liegt, stimmt etwas nicht.

Quellenüberlapp: Anteil Leads, die in Marketing Automation andere IDs haben als im CRM. Hohe Abweichungen deuten auf fehlerhafte ID‑Mapping‑Regeln.

Typische SQL‑Queries (vereinfacht) helfen mir, diese Checks in einem Data Warehouse schnell zu laufen zu lassen:

SELECT COUNT(*) FROM leads WHERE email IS NULL;

SELECT email, COUNT(*) FROM leads GROUP BY email HAVING COUNT(*) > 1;

Wenn du kein Warehouse hast, lassen sich die gleichen Checks mit Listenexporten aus dem CRM und Excel/Sheets machen.

Tag 6–8: Scoring‑Inputs evaluieren

Nun schaue ich mir an, welche Felder ins Scoring einfließen und wie robust diese Felder sind.

Feldtypen prüfen: Sind Aktivitätsfelder numerisch und aggregierbar? Oder werden Texte verwendet (z. B. "Letzte Aktion: Formular ausgefüllt")?

Coverage: Wie viele Leads haben Werte für jedes Scoring‑Feld? Ein Feld mit 10% Coverage bringt kaum Aussagekraft.

Skalierung: Sind Werte zwischen Systemen konsistent? Beispiel: E‑Mail‑Öffnungen aus Mailchimp vs. HubSpot — zählen beide gleich? Wenn nicht, müssen wir normalisieren.

Ich erstelle zudem eine Korrelationsmatrix zwischen Scoring‑Score und Zielmetrik (z. B. SQL‑Creation, Deal‑Conversion). Wenn der Score kaum korreliert, ist entweder das Modell schwach oder die Daten verzerren es.

Tag 9–11: Schnelle Experimente im Feld

Theorie ist gut — ich will sehen, wie das Score‑Ranking in der Praxis performt. Dafür mache ich zwei schnelle Experimente:

A/B‑Sampling der Top‑Scored Leads: Wähle die Top 5% Scored Leads der letzten 30 Tage und vergleiche Conversion‑Rate mit einem randomisierten Matched‑Sample.

Feature‑Drop Test: Entferne ein kritisches Feature (z. B. "Seitenaufrufe letzte 7 Tage") aus dem Score und beobachte, ob die Priorisierung sich stark ändert.

Erwartung: Wenn die Top‑Scored Leads nicht signifikant bessere Conversion‑Raten zeigen, liegt das Problem entweder am Modell oder an den Inputdaten. Wenn das Entfernen eines Features die Reihenfolge kaum verändert, ist dieses Feature entweder redundant oder fehlerhaft.

Tag 12: Technische Ursachenpunktuntersuchung

Jetzt grabe ich tiefer in Integration und Transformation:

ETL‑Jobs prüfen: Werden Felder während ETL anonymisiert, aggregiert oder zeitverschoben? Ein häufiges Problem ist vs. UTC/Local Time‑Mismatch, der "letzte Aktivität" verfälscht.

Mapping‑Regeln: Werden Leads aus mehreren Quellen gemerged? Ich prüfe Merge‑Keys (Email vs. Cookie vs. ContactID). Falsche Priorisierung von Merge‑Regeln erzeugt falsche Historien.

Event‑Deduplication: Event‑Streams ohne Dedup führen zu überhöhten Aktivitätsklauseln im Score (z. B. 1000 Seitenaufrufe in 10 Minuten wegen fehlerhaftem Tracking).

Tools wie Segment, Fivetran oder Airbyte ersparen viele Fehler — aber nur, wenn die Konfiguration sauber ist. Ich prüfe auch, ob Webhooks mehrfach feuern (z. B. bei Retry‑Mechanismen).

Tag 13: Validierung mit Sales

Technik ist nur die halbe Miete. Ich sprich mit Sales‑Colleagues und frage direkt:

Fühlt sich die Lead‑Priorisierung sinnvoll an?

Kommen Leads mit hohem Score tatsächlich zum Gespräch oder sind es Spam/irrelevante Anfragen?

Welche Information fehlt im CRM, die sie zur Bewertung bräuchten?

Meist zeigen die Sales‑Insights Lücken auf, die reine Datenchecks übersehen — z. B. fehlende Branche oder Zielgrösse in Profilfeldern.

Tag 14: Ergebnis zusammenfassen und Sofortmaßnahmen

Am Ende der zwei Wochen habe ich drei Dinge:

Eine Liste der identifizierten Datenprobleme (z. B. Duplikatsrate 8%, 15% Leads ohne Zeitstempel).

Konkrete Quick Wins (Sofortmaßnahmen) und mittelfristige Fixes.

Ein Testplan zur weiteren Validierung.

Typische Quick Wins, die ich empfehle:

Striktere Merge‑Regeln (Email + Domain + Source) und dedizierte Merge‑Logs.

Normalisierung von Aktivitätsmetriken (z. B. 1 Mailopen = 1, egal, welches Tool).

ETL‑Job: Timestamps auf UTC standardisieren und auf korrekte Reihenfolge prüfen.

Einführen eines einfachen "Data Health Dashboard" (Anteil fehlender Felder, Duplikate, fehlerhafte Events).

Check	Sollwert	Maßnahme bei Abweichung
Duplikatrate	< 3%	Merge‑Regeln anpassen, dedup‑Job
Coverage essentieller Felder	> 90%	Formularvalidierung, Pflichtfelder
Time‑stamping konsistent	Alle UTC	ETL korrigieren, Logging
Score vs. Conversion Korrealtion	Pearson > 0,3	Feature‑Engineering, Reweighting

Wenn du möchtest, kann ich dir eine Checkliste und ein SQL‑Snippet schicken, mit dem du die wichtigsten Prüfungen automatisiert in deinem Data Warehouse laufen lassen kannst. In vielen Fällen reicht eine Woche zusätzlicher Automatisierung, um das Scoring wieder verlässlich zu machen — vorausgesetzt, man hat zuerst die Datenmodelle sauber geprüft.

Wie erkenne ich in 14 tagen, ob mein crm‑datenmodell das lead scoring verfälscht

Tag 0–2: Hypothesen bilden und Datenlandschaft kartieren

Tag 3–5: Integritätschecks — sind die Rohdaten sauber?

Tag 6–8: Scoring‑Inputs evaluieren

Tag 9–11: Schnelle Experimente im Feld

Tag 12: Technische Ursachenpunktuntersuchung

Tag 13: Validierung mit Sales

Tag 14: Ergebnis zusammenfassen und Sofortmaßnahmen

Sie sollten auch die folgenden Nachrichten lesen:

Wie rette ich binnen sechs wochen einen sales‑funnel, in dem qualifizierte leads unerwartet abspringen

Wie implementiere ich ein low‑cost user‑testing‑programm, das in zwei wochen valide produkt‑hypothesen liefert

Wie etabliere ich ein risikofreies pilotprogramm für generative ai im marketing, das echte conversion daten liefert

Wie erstelle ich ein procurement playbook für digitale agenturen, das versteckte kosten und redundanzen eliminiert

Wie überzeuge ich den aufsichtsrat in dreißig tagen, einer digitalen transformation mit klaren business cases zuzustimmen

Wie wähle ich zwischen sap, microsoft dynamics und netsuite für mittelstand ohne langfristige angebotsfallen

Wie setze ich einen risikofreien a/b‑test für pricing in b2b‑saas auf, der wirklich umsatzrelevant ist

Wie rette ich binnen sechs wochen einen sales‑funnel, in dem qualifizierte leads unerwartet abspringen