Zuverlässiges Website-Tracking mit serverseitigem Google Tag Manager

Published in Data Privacy, Tracking | 19.05.2021

Ein zuverlässiges Website-Tracking wird angesichts strenger werdender Präventiv-Maßnahmen durch Browser sowie weitere Anti-Tracking-Tools zunehmend schwieriger. Seit kurzem bietet der serverseitige Google Tag Manager die Möglichkeit, ein First-Party-Tracking einzurichten, bei dem die Daten über einen eigenen Server umgeleitet werden. Entsprechend konfiguriert, kann dies gewährleisten, dass ein Website-Tracking nicht den gleichen Maßnahmen wie Third-Party-Skripten zum Opfer fällt.

Warum wird das Tracking blockiert?

Ähnlich wie bei eindeutig datenschutzwidrigen Skripten (etwa dem Facebook Pixel oder anderen Marketing-Tags) wird inzwischen auch der Aufruf eines Tracking-Skripts, wie bspw. analytics.js für Google Analytics, von Firefox oder AdBlockern verhindert. Auch Safari blockiert entsprechende Skripte unter bestimmten Umständen.

Der Grund für die ähnliche Behandlung ist auch, dass Google selbst zugibt, die so erfassten Daten dafür zu nutzen, gezielte Werbeanzeigen zu schalten. Technisch lässt sich beim gewöhnlichen Tracking mit Google Analytics eine Übermittlung persönlicher identifizierbarer Informationen (PIIs) nicht verhindern.

Vermutlich nutzt ein Großteil der Websitebetreiber Google Analytics allerdings nicht selbst mit dem Ziel, dadurch Werbekunden zu akquirieren. Stattdessen dient das Website-Tracking in erster Linie dem Ziel, die Reichweite einer Website zu erfassen.

Mithilfe des neuen serverseitigen Google Tag Managers lassen sich beliebig viele sensible Informationen aus Tracking-Requests entfernen, bevor Daten an Google weiter gesendet werden. So kann ein Website-Tracking mit Google Analytics beibehalten und der Datenschutz gleichzeitig gewährleistet werden.

Welche Lösung bietet serverseitiges Tracking?

Der serverseitige Google Tag Manager ermöglicht es, Tracking-Daten an eigenen Endpunkt zu senden (aka einem Server), von wo sie – um sensible Daten bereinigt – an das jeweiligen Analytics-Tool weitergeleitet werden.

Dadurch wird ein wesentlicher Schwachpunkt der Website-Analyse überwunden: Beim Aufruf einer Seite, die mit Google Analytics und dem clientseitigen Google Tag Manager getrackt wird, geht zuerst eine Anfrage an https://googletagmanager.com raus, um das Skript des Containers zu laden. Anschließend wird eine Verbindung zu https://www.google-analytics.com/ hergestellt, um das Tracking-Skript abzurufen.

Diese Adressen stehen offenkundig in keiner Beziehung zu dem Inhalt der Seite, sondern signalisieren: Hier soll getrackt werden. Also unterbinden Anti-Tracking-Tools und AdBlocker kurzerhand den Abruf dieser Skripte und schützen damit die Privatssphäre der Nutzer.

Wird jedoch eine Verbindung zu einem Endpunkt hergestellt, der auf den gleichen Namen wie dem Domainnamen der Website lautet, lässt sich erst mal kein Unterschied zu anderen Inhalten feststellen, die für die Websitedarstellung erforderlich sind.

Somit erfasst ein serverseitiges Tracking auch Aufrufe, die unter normalen Umständen unsichtbar geblieben wären. (Dabei können auch unerwünschte "Besucher" wie Bots und Crawler miterfasst werden, die demnach eigenhändig erkannt und gefiltert werden müssen.)

Verantwortung für die Daten

Mit dieser hinzugewonnenen Kontrolle über die Daten geht auch ein höheres Maß an Verantwortung einher: Nehmen wir die Informationen über Interaktionen der Nutzer einmal in Empfang, obliegt es unserer Entscheidung, was wir mit ihnen machen – und vor allem, mit wem wir sie teilen. Theoretisch ließen sich Nutzer auf dem eigenen Endpunkt um weitere Information anreichern und mit Parteien teilen, die sonst keinen Zugriff auf sie hätten. Die Nutzer würden davon nichts mehr mitbekommen.

Gleichzeitig erhalten wir nun die Möglichkeit, die Daten so zu verallgemeinern, dass sie bedenkenlos für die Webanalyse genutzt werden können. Denn Parameter eines gewöhnlichen Tracking-Requests enthalten sensible Informationen wie bspw. die IP-Adresse und den User-Agent. Werden diese Parameter entfernt, unterscheidet sich ein einzelner Tracking-Request nicht mehr stark von anderen – kann aber gezählt werden.

Datenschutzfreundliche Konfiguration des serverseitigen Google Tag Managers

Datenschutzfreundliche Konfiguration des serverseitigen Google Tag Managers

Durch weitere Einstellungen kann auch auf Cookies vollständig verzicht werden, um die Identität eines Nutzers weiter zu verschleiern.

Zusammenfassung

Da client-seitige Skripte und Cookies in den letzten Jahren zunehmend eingeschränkt wurden, war es nur noch eine Frage der Zeit, bis alternative Tracking-Verfahren massentauglicher angeboten werden. Mit dem serverseitigen Tag Manager von Google ist es in wenigen Schritten möglich, eine Tracking-Infrastruktur aufzusetzen, die den meisten gegenwärtigen Tracking-Präventionen trotzt. So kann die Reichweite einer Website weiterhin zuverlässig erfasst werden.

Aus Sicht des Datenschutzes ist dadurch zwar einerseits eine größere Souveränität durch den Betreiber einer Website erreicht, der nun die Daten selbständig anonymisieren kann, bevor er sie mit Dritten teilt. Für den Nutzer ist das jedoch nicht mehr einsehbar und daher intransparent.

Share post: Copied!

Weitere Posts zu diesem Thema

    An anderer Stelle habe ich bereits beschrieben, welche Vorteile der neue serverseitige Google Tag Manager gegenüber dem bisherigen Web-Container durch einen besseren Datenschutz und eine höhere Kontrolle über die erfassten Daten hat. In diesem Beitrag soll es darum gehen, wie ein eigener Server-Container auf einem Debian-System mit Docker eingerichtet werden kann.

    Due to its new data model, cookieless tracking with GA4 needs some additional configurations to work properly. Unlike Universal Analytics, this feature is not provided by default. In his blog, Mark Edmondson has already made a suggestion of what a solution might look like. However, this approach is of limited use because the GA4 protocol is based on additional parameters that Mark does not take into account.

    In the following, I will present an approach that enables functional cookie-less GA4 tracking using the Consent Mode, the server-side Google Tag Manager, and a database accessible via a REST API.