Zurück zur Artikelliste Artikel
6 Leseminuten

SQL lernen mit echten GA4-Daten: Ein praktischer Leitfaden für Einsteiger

Sind Sie neugierig, wie echte E-Commerce-Daten in SQL aussehen? In diesem Artikel werden Sie Google Analytics 4 (GA4)-Ereignisse aus dem Google Merchandise Store mit BigQuery analysieren und dabei praktische SQL-Kenntnisse erwerben.

Möchten Sie Ihre SQL-Kenntnisse mit echten E-Commerce-Daten verbessern? In diesem Artikel werden Sie Google Analytics 4(GA4)-Daten mithilfe von SQL in BigQuery - dem cloudbasierten Data Warehouse von Google - untersuchen. GA4 ist die Webanalyseplattform von Google, die von Millionen von Websites und Anwendungen verwendet wird, um zu verfolgen, wie Nutzer mit ihren Inhalten interagieren. Sie ist in der digitalen Analytik weit verbreitet, was GA4-Kenntnisse auf dem Arbeitsmarkt und in vielen Unternehmen sehr wertvoll macht. Wenn Sie Ihre GA4-Eigenschaft mit BigQuery verbinden, können Sie diese rohen Ereignisdaten speichern und sie mit SQL abfragen. So können Sie über die integrierten GA4-Berichte hinausgehen und das Nutzerverhalten viel detaillierter analysieren.

Google bietet einen kostenlosen GA4-Datensatz in BigQuery an: ga4_obfuscated_sample_ecommerce.events_20210113. Er enthält echte Ereignisdaten aus dem Google Merchandise Store - Googles offiziellem Online-Shop für Markenprodukte wie T-Shirts, Tassen und Accessoires - die am 13. Januar 2021 erfasst wurden. Sie finden dort Produktansichten, Warenkorbergänzungen, Käufe und Nutzerinformationen wie Standort oder Gerätetyp. Es handelt sich um einen leichten, realen Datensatz, der sich perfekt zum Erlernen von SQL eignet.

Brauchen Sie eine schnelle Auffrischung von SQL? Probieren Sie unseren interaktiven Kurs SQL für Datenanalyse aus. Das ist der schnellste Weg, die Grundlagen zu erlernen, die Sie in diesem Handbuch verwenden werden.

Lernen Sie das Dataset kennen

In diesem Leitfaden verwenden wir ein kostenloses öffentliches Dataset in BigQuery:
bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113 .

GA4 verwendet ein ereignisbasiertes Modell, bei dem jede Benutzerinteraktion - wie das Betrachten eines Produkts, das Hinzufügen zum Warenkorb oder der Abschluss eines Kaufs - als separates Ereignis verfolgt wird. Jede Zeile im Datensatz repräsentiert eine dieser Interaktionen und enthält sowohl Standardfelder (wie Ereignisname und Zeitstempel) als auch verschachtelte Strukturen (wie Produktdetails oder Ereignisparameter).

Hier sind einige Schlüsselspalten, mit denen Sie arbeiten werden:

  • event_namedie Art der Benutzeraktion, z. B. page_view, view_item, add_to_cart, begin_checkout, oder purchase
  • user_pseudo_idAnonymisierter Benutzeridentifikator
  • event_timestampDatum, an dem das Ereignis eingetreten ist
  • event_paramsDetails im Zusammenhang mit dem Ereignis (gespeichert als Schlüssel-Wert-Paare)
  • itemsverschachtelte Produktdaten für Ereignisse wie view_item oder Kauf

Welche Ereignisse sind am häufigsten?

Sehen wir uns zunächst an, was die Nutzer auf der Website tun. Diese Abfrage zeigt die häufigsten Ereignistypen und wie viele Nutzer sie ausgelöst haben:

SELECT
  event_name,
  COUNT(DISTINCT user_pseudo_id) AS unique_users,
  COUNT(*) AS total_events
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
GROUP BY event_name
ORDER BY total_events DESC;

Diese Abfrage zeigt die häufigsten Benutzeraktionen. Wie erwartet führt page_view mit über 15.000 Ereignissen. Nur 34 Nutzer schlossen einen Kauf ab, während viele andere die Produkte ansahen oder in den Warenkorb legten - ein deutlicher Abfall, der typisch für E-Commerce-Trichter ist.

event_nameunique_userstotal_events
page_view403415653
user_engagement32669698
scroll19445091
session_start40434478
first_visit34393440
view_item7312990
view_promotion14632127
add_to_cart168665
begin_checkout79398
purchase3436

Verfolgen Sie den Einkaufstrichter

Als Nächstes wollen wir einen einfachen Trichter erstellen, um zu verstehen, wie viele Benutzer vom Stöbern zum Kauf übergehen. Wir zählen, wie viele einzelne Nutzer jedes der wichtigsten E-Commerce-Ereignisse ausgelöst haben:

SELECT
  event_name,
  COUNT(DISTINCT user_pseudo_id) AS users
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
WHERE event_name IN ('view_item', 'add_to_cart', 'begin_checkout', 'purchase')
GROUP BY event_name
ORDER BY users DESC;

Dies zeigt Ihnen, wie die Nutzer in jeder Phase der Shopping-Reise absteigen. Wahrscheinlich werden Sie feststellen, dass sich mehr Nutzer Artikel ansehen als tatsächlich einen Kauf abschließen - wie in den meisten Online-Shops.

event_nameusers
view_item731
add_to_cart168
begin_checkout79
purchase34

Analysieren Sie, was die Kunden gekauft haben

Möchten Sie wissen, welche Produkte die Nutzer am häufigsten kaufen? Viele E-Commerce-Ereignisse enthalten Produktdetails in einem verschachtelten Feld namens Artikel. Um auf dieses Feld zuzugreifen, verwenden wir die Funktion UNNEST().

So finden Sie die 10 meistgekauften Produkte:

SELECT
  item.item_name,
  COUNT(*) AS purchases
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`,
  UNNEST(items) AS item
WHERE event_name = 'purchase'
GROUP BY item.item_name
ORDER BY purchases DESC
LIMIT 10;

Und hier ist das Ergebnis:

item_namepurchases
Google Pride Sticker4
Google Sherpa Zip Hoodie Navy4
Google Light Pen Red3
Google Black Cloud Zip Hoodie3
Google Crewneck Sweatshirt Green3
Google Metallic Notebook Set2
Unisex Google Pocket Tee Grey2
Google Large Standard Journal Grey2
Google Sherpa Zip Hoodie Charcoal2
Google Soft Modal Scarf2

Sie können auch die Produktpreise analysieren und den Gesamt- oder Durchschnittsumsatz berechnen.

Diese Abfrage liefert zum Beispiel den Gesamtumsatz pro Produkt:

SELECT
  item.item_name,
  ROUND(SUM(item.price * item.quantity), 2) AS total_revenue
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`,
  UNNEST(items) AS item
WHERE event_name = 'purchase'
GROUP BY item.item_name
ORDER BY total_revenue DESC
LIMIT 10;

Auf diese Weise können Sie die Bestseller Ihres Shops ermitteln.

item_namepurchases
Google Pride Sticker4
Google Sherpa Zip Hoodie Navy4
Google Light Pen Red3
Google Black Cloud Zip Hoodie3
Google Crewneck Sweatshirt Green3
Google Metallic Notebook Set2
Unisex Google Pocket Tee Grey2
Google Large Standard Journal Grey2
Google Sherpa Zip Hoodie Charcoal2
Google Soft Modal Scarf2

Benutzer nach Land segmentieren

GA4-Daten enthalten auch Informationen über den Standort und das Gerät eines jeden Nutzers. Sie können den Traffic nach geo.country segmentieren.

Hier ist eine Abfrage, die zeigt, woher die Nutzer ihre Einkäufe beziehen:

SELECT
  geo.country,
  COUNT(DISTINCT user_pseudo_id) AS unique_buyers
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
WHERE event_name = 'purchase'
GROUP BY geo.country
ORDER BY unique_buyers DESC;
countryunique_buyers
United States19
Canada4
Italy2
United Kingdom1
Germany1
Japan1
Singapore1
Netherlands1
Taiwan1
Malaysia1
Poland1
Hong Kong1

Üben Sie mehr für sich selbst

Nachdem Sie nun die geführten Beispiele durchgearbeitet haben, ist es an der Zeit, selbst zu üben. Der beste Weg, Ihre SQL-Kenntnisse auszubauen - und wie ein Datenanalyst zu denken - ist, die Daten mit Ihren eigenen Fragen im Kopf zu untersuchen.

  • Aufschlüsselung der Käufe nach Verkehrsquelle (traffic_source.source)
  • Vergleichen Sie die durchschnittliche Größe des Warenkorbs zwischen mobilen und Desktop-Benutzern
  • Analysieren Sie Produktansichten, die nicht zu einem Kauf geführt haben
  • Erstellen Sie einen Pfad auf Sitzungsebene für einen einzelnen Benutzer

Hier sind einige praktische Herausforderungen, die Sie als Nächstes angehen sollten:

  • Aufschlüsselung der Käufe nach Traffic-Quelle. Stellen Sie fest, welche Quellen (wie Google, direkt oder über Empfehlungen) die meisten Käufe auslösen, indem Sie traffic_source.source verwenden.
  • Vergleichen Sie die durchschnittliche Größe des Warenkorbs zwischen mobilen und Desktop-Nutzern. Verwenden Sie Gerätedaten, um herauszufinden, ob sich das Nutzerverhalten je nach Plattform ändert.
  • Analysieren Sie Produktansichten, die nicht zu einem Kauf geführt haben. Identifizieren Sie Absprungpunkte im Trichter, indem Sie die Ereignisse view_item und purchase vergleichen.
  • Erstellen Sie einen Pfad auf Sitzungsebene für einen einzelnen Benutzer. Wählen Sie einen user_pseudo_id und rekonstruieren Sie seine Reise Schritt für Schritt mit event_timestamp.

Je mehr Sie mit Abfragen wie diesen experimentieren, desto besser werden Sie die Daten verstehen - und desto sicherer werden Sie bei der Anwendung von SQL auf reale Geschäftsprobleme.

Abschließende Überlegungen

Das Erlernen von SQL ist viel interessanter - und praktischer - wenn Sie mit echten Daten arbeiten. Vor allem, wenn diese Daten das reale Nutzerverhalten in einem echten Online-Shop, wie dem Google Merchandise Store, widerspiegeln. Das ist nicht nur Theorie, sondern die tägliche Arbeit von Datenanalysten, Marketingfachleuten und Produktteams.

In diesem Artikel erfahren Sie, wie Sie:

  • Abfragen mit echten GA4-E-Commerce-Daten schreiben
  • Mit verschachtelten Feldern arbeiten UNNEST()
  • Ereignisse, Produkte, Benutzersegmente und Trichter zu untersuchen

Durch die direkte Arbeit mit GA4-Daten in BigQuery haben Sie einen großen Schritt in Richtung einer Denkweise wie ein Datenanalyst gemacht - Sie stellen Fragen, schreiben aussagekräftige Abfragen und finden wichtige Erkenntnisse.

Möchtest du noch weiter gehen? Schauen Sie sich unseren Kurs SQL von A bis Z an, um eine solide Grundlage zu schaffen, oder tauchen Sie mit unseren interaktiven SQL-Kursen in fortgeschrittenere Themen ein.

Üben Sie weiter, bleiben Sie neugierig - und viel Spaß beim Abfragen!