1. Einleitung

Der Google Consent Mode soll mehr Flexibilität in der Verwaltung von Cookie-Einwilligungen in Verbindung mit Google-Produkten wie Google Analytics oder Google Ads bieten. Was auf den ersten Blick nach einer datenschutzfreundlichen Lösung für den restriktiven europäischen Raum klingt, wurde in den vergangenen Monaten von einigen Datenschützern in der Digital Analytics Szene kontrovers diskutiert. Gründe dafür sind die fehlende Transparenz des Conversion Modeling und der Datentransfer zwischen Browser (Client) und Google-Server.

In seinen Standardeinstellungen verfehlt das Konzept des Google Consent Mode demnach seinen eigentlichen Zweck zur Sicherstellung des Datenschutzes nach europäischem Recht. In diesem Blogbeitrag stellen wir Lösungsansätze für ein transparentes Conversion Modeling sowie einen anonymisierten Datentransfer der Conversion vor.

2. Über den Google Consent Mode

Der Google Consent Mode steuert das Verhalten der Tags von Google-Produkten wie Google Analytics und Google Ads unter Nutzung der Google Consent API. Abhängig davon, ob Nutzer dem Tracking zustimmen oder nicht, wird das Verhalten der Tags angepasst. Erfolgt keine explizite Einwilligung durch den Nutzer oder erlauben Browser-Restriktionen das Tracking nicht (Safari ITP, Ad-Blocker, etc.), entstehen Datenlücken in den Tools, die auf Basis der Signale über das Consent Modeling der Consent API und mithilfe maschinellen Lernens geschlossen werden sollen. Das folgende Kapitel gewährt eine Einführung in die technische Funktionsweise und die aktuellen datenschutzrechtlichen Schwachstellen des Google Consent Mode.

2.1 Funktionsweise und Abgrenzung

Wie eingangs erwähnt, handelt es sich beim Google Consent Mode um eine API-Schnittstelle für das Consent Management. Allerdings übernimmt oder ersetzt dieser nicht den Funktionsumfang einer Consent Management Platform (CMP) und muss klar von ihr abgegrenzt werden. Die Aufgabe des Consent Mode beschränkt sich lediglich darauf, den Consent-Status des Nutzers für einzelne Tags von Google Tools (Google Analytics, Google Ads, Floodlights) zu verwalten, um sicherzustellen, dass ohne Einwilligung keine Cookies gesetzt werden. Er dient dementsprechend nicht der Einhaltung der Informations- und Dokumentationspflichten von Einwilligungen. Liegt keine Einwilligung vor, werden für “not-consented clicks” und “not-consented conversions” sogenannte Pings an den Server Endpunkt des jeweiligen Tools gesendet, die aus ihrem Dateninhalt keinen Personenbezug zulassen. Diese Pings werden anschließend in Google Analytics oder Google Ads genutzt, um Daten zu modellieren. Zum Schließen von Attributions-Lücken nutzt Google das Conversion Modeling, das den Datenverlust durch den nicht vorhandenen Consent oder Browser-Restriktionen ausbessert.

Wie genau Google das Conversion Modeling für den Google Consent Mode nutzt, um Attributions-Lücken zu schließen, und wie modellierte Daten zu deuten sind, wird in den folgenden Schaubildern vereinfacht dargestellt.

Abbildung 1: Conversion Modeling des Google Consent Mode (Linking)

Im ersten Schritt werden Ad Clicks und Conversions, für die eine Einwilligung vorhanden ist und die anhand ihres Timestamps, Device Types und Browser-Profils eindeutig einem Nutzer zugeordnet werden können, zusammengeführt. Anschließend folgt die Zuordnung zu spezifischen Gruppen (observed) mit ähnlichem Profil und somit die Trennung von Ad Clicks und Conversions, für die keine Einwilligung durch den Nutzer vorliegt.

Abbildung 2: Conversion Modeling des Google Consent Mode (Modeling)

Diese Gruppen (observed) werden verwendet, um Ad Clicks und Conversions mit fehlender Einwilligung zu sortieren. Mithilfe genannter Merkmale aus den Gruppen (observed) verknüpft das maschinelle Lernen nun Ad Clicks und Conversions zu Gruppen (notobserved), die Ähnlichkeiten aufweisen, und klassifiziert sie als neue Gruppe (modeled). Observed und modeled Conversions werden nun zu einem gesamten Conversion-Wert zusammengeführt. In der Praxis basieren die Berechnungen aus den beobachteten Daten auf einer Vielzahl von Dimensionen, darunter Standort, Timestamp sowie Browser oder Device Type. Diese werden mit Daten aus Plattform-APIs, Umfragen und Nutzer-Panels kombiniert, um die Modellierung weiter zu verfeinern. Übertragen auf ein konkretes Praxis-Beispiel würde das Conversion Modeling wie in der folgenden Abbildung aussehen.

Abbildung 3: Conversion Modeling des Google Consent Mode (Google Ads Beispiel)

Das Schaubild zeigt eine Google Ads Anzeige, die insgesamt 100 Ad Clicks auf die Gesamtzahl von Impressionen erhält. Für 30 Ad Clicks wurde vom Consent Mode eine Einwilligung vom Nutzer registriert. Für die anderen 70 Ad Clicks liegt keine Einwilligung vor.

Von den ursprünglich 30 Ad Clicks (consented) werden wiederum nur 8 Conversions tatsächlich gezählt (observed) bzw. von Google Ads erfasst und reportet. Von den 70 Ads Click (not-consented), für die keine Einwilligung besteht, errechnet das Conversion Modeling anhand von Lookalike-Profiles mit vorhandener Einwilligung einen modellierten Conversion-Wert. In unserem Beispiel werden 4 Conversions (not-observed) modelliert und der Gesamtzahl von Conversions hinzugerechnet. Dies sind jedoch Schätzwerte, die auf Basis ähnlicher Nutzerbewegungen berechnet werden. Somit können massive Abweichungen zwischen den modellierten Conversions (modeled: not-observed) und den tatsächlichen nicht erfassten Conversions (not-observed) bestehen. Google selbst trifft hierzu folgende Aussage:

“Google kann nicht feststellen, ob es vor der Conversion eines Nutzers, der der Cookieverwendung nicht zugestimmt hat, eine Anzeigeninteraktion gab. Mit unseren Modellen lassen sich die Lücke zwischen Anzeigeninteraktionen und Conversion-Ereignissen weitgehend schließen. Allerdings möchten wir unrealistische Prognosen vermeiden, deshalb werden einige Conversions möglicherweise nicht berücksichtigt, weil sie ohne Cookies keinen Anzeigenklicks zugeordnet werden können.”

Im Conversion Modeling von Google wird sinnvollerweise berücksichtigt, dass Nutzer, welche keine Zustimmung erteilen, tendenziell auch mit einer geringeren Wahrscheinlichkeit konvertieren. Die der Modellierung zugrunde liegende Conversion Rate wird daher immer unter der tatsächlich gemessenen liegen und differenziert sich im Hintergrund auf Basis der Daten des Consent Mode (Browser, Tageszeit etc.).

2.2 Auswirkung auf die Attribution in GA4

Für eine kanalübergreifende Auswertung und Bewertung von Marketing-Kampagnen wird häufig das Default Channel Grouping in GA4 genutzt. Der Vorteil ist, dass die Optimierung des MarketingBudgets auf einer ganzheitlichen Datengrundlage stattfinden kann. Tools wie Google Ads reporten Conversions auf einer internen Datengrundlage und ignorieren weitere Marketing-Kontaktpunkte, die an dem Ergebnis (Conversion) beteiligt waren. Da der Google Consent Mode das Conversion-Ergebnis aller Kanäle beeinflusst und ändert, beeinflusst er auch deren Bewertung in Google Analytics. Die Erweiterung der Abbildung 3 in den folgenden zwei Schaubildern soll zu einem besseren Verständnis der ConversionUmverteilung in GA4 beitragen.

Abbildung 4: Attribution von Conversions in GA4 (ohne Consent Mode)

Ist der Consent Mode deaktiviert, werden lediglich 8 (observed) von den tatsächlich 30 Conversions (consented) in Google Ads erfasst und über das Google Ads Linking im Default Channel Grouping von GA4 reportet. Insgesamt wurden für die Kampagne in gesamten Betrachtungszeitraum 133 Conversions in GA4 verbucht. Mit 75 Conversions (not set) kann ein Großteil der in GA4 erfassten Conversions jedoch keinem spezifischen Kanal im Betrachtungszeitraum zugewiesen werden. Wird nun der Google Consent Mode aktiviert, ergeben sich Änderungen wie in der nächsten Abbildung.

Abbildung 5: Attribution von Conversions in GA4 (mit Consent Mode)

Wie in Abbildung 3 bereits aufgeführt, werden durch die Nutzung der Consent Mode API in Google Ads auch die Ad Clicks und Conversions ohne Einwilligung über cookieless Pings erfasst. Auf Kanalebene ergibt sich demnach ein modellierter Conversion-Wert von 12, welcher sich aus 8 observed und 4 modeled Conversions zusammensetzt. Durch das Google Ads Product Linking stehen diese Daten ebenfalls in den Google Ads Conversion Reports und dem Default Channel Grouping in GA4 zur Verfügung.

Bei Verwendung der Consent Mode API findet eine Umverteilung der Conversions aller Kanäle in GA4 nach den Klassifikationen observed und modeled durch die Consent Mode API statt. Conversions, die aufgrund mangelnder Informationen nicht durch GA4 einem spezifischen Kanal zugeordnet werden konnten (not set), werden durch das Conversion Modeling anhand von Gemeinsamkeiten hinsichtlich genannter Merkmale aus den beobachteten Conversions einem Kanal zugeordnet. Der Consent Mode beeinflusst somit das Conversion-Ergebnis jedes MarketingKanals, ändert aber nicht die Gesamtzahl der Conversions.

Um die Anpassung der Attribution durch den Consent Mode in der Praxis besser zu verstehen, wurde das Conversion Modeling in einer Testumgebung untersucht. Hierzu wurden in einem Demo-Shop mehrere Nutzer simuliert, die Conversions erzeugen. Anschließend wurden diese jeweils mit und ohne Consent Mode in zwei unterschiedlichen GA4 Properties erfasst.

Abbildung 6: Conversion Modeling in GA4 (Sandbox)

Die Praxis zeigt, dass sich auch in der Testumgebung die Anzahl der Conversions nicht ändert. Lediglich die Zuweisung der Conversions zu einzelnen Kanälen wird durch das Conversion Modeling des Consent Mode geändert. Bei der Gegenüberstellung der beiden Ergebnisse in einer Tabelle ergibt sich folgendes Bild:

Abbildung 7: Conversion Modeling in GA4 (Sandbox Delta)

In Abbildung 7 wird ersichtlich, wie die Umverteilung technisch stattfindet. 28 Conversions, für welche die Quelle ohne Consent Mode und Conversion Modeling unbekannt war, konnten MarketingKanälen zugewiesen werden. Conversion Modeling sorgt folglich für eine höhere Zuordnungsrate von Conversions zu MarketingKanälen, wodurch ein besseres Bild zur Wirkung von MarketingAktivitäten entsteht. Klar ist hingegen nicht, welche Conversions Teil des Conversion Modeling sind.

3. Kritik am Consent Mode

Die Idee hinter dem Google Consent Mode, das Verwalten von Einwilligungen zu erleichtern und Lücken in der MarketingAttribution zu schließen, adressiert eine aktuell schwerwiegende Problematik. Es bestehen allerdings noch zwei wesentliche Hürden, die den sinnvollen Einsatz des Consent Mode im europäischen Raum verhindern.

3.1 Datentransfer

Auch wenn keine Zustimmung zum Tracking gegeben wurde, wird bei Verwendung des Consent Mode die IP-Adresse des Nutzers (cookieless Pings) an die Google-Server übertragen. Laut Google wird die IP-Adresse zwar nicht gespeichert, dennoch findet in diesem Zuge ein sogenannter Drittlandstransfer von Daten statt, was die DSGVO bzw. das TTDSG streng reglementiert.

3.2 Fehlende Transparenz

Für das Reporting in Google Analytics verspricht der Consent Mode eine verbesserte Datenqualität, indem die Zuweisung der MarketingKanäle für die gemessenen Conversions auf Basis der Informationen des Consent Mode ergänzt wird. Das bedeutet aber nicht, dass dadurch mehr Conversions für die Analyse zur Verfügung stehen, sondern lediglich die Zuweisung der mit vorhandenen Consents messbaren Conversions angepasst wird. Leider ist nicht ersichtlich, was im Hintergrund genau passiert ist und welche Conversions Teil des Conversion Modeling von Google sind. Ernüchternd ist, dass die zusätzlich erfassten Conversions nicht sichtbar sind, obwohl diese über die Conversion Pings des Consent Mode auch bei nicht vorhandenem Consent an Google geschickt werden.

4. Lösungsansatz

Der Google Consent Mode bietet das Potenzial, eine gute Lösung für die Modellierung von Attributions-Lücken zu sein. Durch die direkte Übermittlung der IP-Adresse an die Google-Server ist die Nutzung des Google Consent Mode im europäischen Raum in seinen Standardeinstellungen jedoch grundsätzlich nicht zu empfehlen.

Der im folgenden Kapitel vorgestellte Ansatz zum serverseitigen Hosting der Google Consent Mode API soll dieses Problem lösen und eine datenschutzkonforme Nutzung des Google Consent Mode nach europäischem Standard ermöglichen.

4.1 Server-side GTM als Gateway für Datentransfer

Abbildung 8: Server-side GTM als Gateway für Datentransfer

Durch die Nutzung eines GTM-Servers als Kommunikationsschnittstelle können von der Consent Mode API gesendete Daten vor ihrer Übermittlung kontrolliert und Informationen verändert werden, bevor eine Übertragung an den Endpoint des GoogleServers erfolgt. Die Server-Domain fungiert als Proxy (Gateway), in dem die IP-Adresse vollständig anonymisiert wird, sodass kein Personenzug mehr herstellbar ist. Bei Bedarf lässt sich die Übermittlung der IP-Adresse vollständig unterbinden. Mit diesem Ansatz besteht vollständige Flexibilität, um den Consent Mode den eigenen Datenschutz-Bedürfnissen entsprechend einzusetzen.

4.2 Vollständiges Conversion Reporting in BigQuery

Wie in Punkt 2.2 beschrieben, werden die durch das Conversion Modeling umverteilten Conversions im GA4 Reporting nicht ausgewiesen. Somit ist keine strikte Trennung zwischen Conversions mit bestehender Einwilligung und modellierten Conversions im Interface gegeben. Allerdings ermöglicht der Consent Mode mittels GA4 BigQuery Export volle Transparenz und Kennzeichnung der cookieless Pings.

Wird Google Data Studio mit den Rohdaten aus GA4 verknüpft, können wir zwischen den Ereignissen aus den cookieless Pings und dem Cookie-basierten Tracking mit User-Consent unterscheiden und die fehlenden Conversions reporten:

Abbildung 9: Conversion Export Rohdaten – consented und modeled (purchases)

Abbildung 10: Conversion Export Rohdaten – consented und modeled (visits)

5. Fazit

Das Conversion Modeling des Google Consent Mode ist grundsätzlich ein guter Ansatz. In seiner Standardeinstellung ist es im europäischen Raum jedoch nicht einsetzbar, da die Übermittlung der IP-Adresse auch ohne Consent an die Google-Server erfolgt (cookieless Ping). Dieses Problem lässt sich zwar durch die Nutzung eines GTM-Servers in erster Linie lösen, dennoch verfehlt es den Grundgedanken des Tools und ist eher als eine Art Workaround zu betrachten. Auch ist ein Interface Reporting bei Verwendung des Consent Mode nutzlos, da keine Unterscheidung zwischen Conversions mit Consent und modellierten Conversions durch den Consent Mode möglich ist. Über den GA4 BigQuery Export stehen diese Daten zwar zur Verfügung, dennoch ist die Funktionsweise des Consent Mode und seine Umverteilung immer noch eine Blackbox. Aus genannten Gründen ist die Nutzung des Google Consent Mode nicht zu empfehlen. Sofern sich für einen Einsatz entschieden wird, sollte auf den vorgestellten Implementierungsansatz zurückgegriffen werden, um das maximale Potenzial des Tools in einer datenschutzfreundlichen Umgebung zu nutzen.

Dieser Beitrag steht Ihnen ebenfalls in hochwertiger Form eines Whitepapers als PDF zum Download zur Verfügung.