21st Aug 2025 6 Leseminuten SQL lernen mit echten GA4-Daten: Ein praktischer Leitfaden für Einsteiger Agnieszka Kozubek-Krycuń SQL-Übungen Datenanalyse Inhaltsverzeichnis Lernen Sie das Dataset kennen Welche Ereignisse sind am häufigsten? Verfolgen Sie den Einkaufstrichter Analysieren Sie, was die Kunden gekauft haben Benutzer nach Land segmentieren Üben Sie mehr für sich selbst Abschließende Überlegungen Sind Sie neugierig, wie echte E-Commerce-Daten in SQL aussehen? In diesem Artikel werden Sie Google Analytics 4 (GA4)-Ereignisse aus dem Google Merchandise Store mit BigQuery analysieren und dabei praktische SQL-Kenntnisse erwerben. Möchten Sie Ihre SQL-Kenntnisse mit echten E-Commerce-Daten verbessern? In diesem Artikel werden Sie Google Analytics 4(GA4)-Daten mithilfe von SQL in BigQuery - dem cloudbasierten Data Warehouse von Google - untersuchen. GA4 ist die Webanalyseplattform von Google, die von Millionen von Websites und Anwendungen verwendet wird, um zu verfolgen, wie Nutzer mit ihren Inhalten interagieren. Sie ist in der digitalen Analytik weit verbreitet, was GA4-Kenntnisse auf dem Arbeitsmarkt und in vielen Unternehmen sehr wertvoll macht. Wenn Sie Ihre GA4-Eigenschaft mit BigQuery verbinden, können Sie diese rohen Ereignisdaten speichern und sie mit SQL abfragen. So können Sie über die integrierten GA4-Berichte hinausgehen und das Nutzerverhalten viel detaillierter analysieren. Google bietet einen kostenlosen GA4-Datensatz in BigQuery an: ga4_obfuscated_sample_ecommerce.events_20210113. Er enthält echte Ereignisdaten aus dem Google Merchandise Store - Googles offiziellem Online-Shop für Markenprodukte wie T-Shirts, Tassen und Accessoires - die am 13. Januar 2021 erfasst wurden. Sie finden dort Produktansichten, Warenkorbergänzungen, Käufe und Nutzerinformationen wie Standort oder Gerätetyp. Es handelt sich um einen leichten, realen Datensatz, der sich perfekt zum Erlernen von SQL eignet. Brauchen Sie eine schnelle Auffrischung von SQL? Probieren Sie unseren interaktiven Kurs SQL für Datenanalyse aus. Das ist der schnellste Weg, die Grundlagen zu erlernen, die Sie in diesem Handbuch verwenden werden. Lernen Sie das Dataset kennen In diesem Leitfaden verwenden wir ein kostenloses öffentliches Dataset in BigQuery: bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113 . GA4 verwendet ein ereignisbasiertes Modell, bei dem jede Benutzerinteraktion - wie das Betrachten eines Produkts, das Hinzufügen zum Warenkorb oder der Abschluss eines Kaufs - als separates Ereignis verfolgt wird. Jede Zeile im Datensatz repräsentiert eine dieser Interaktionen und enthält sowohl Standardfelder (wie Ereignisname und Zeitstempel) als auch verschachtelte Strukturen (wie Produktdetails oder Ereignisparameter). Hier sind einige Schlüsselspalten, mit denen Sie arbeiten werden: event_namedie Art der Benutzeraktion, z. B. page_view, view_item, add_to_cart, begin_checkout, oder purchase user_pseudo_idAnonymisierter Benutzeridentifikator event_timestampDatum, an dem das Ereignis eingetreten ist event_paramsDetails im Zusammenhang mit dem Ereignis (gespeichert als Schlüssel-Wert-Paare) itemsverschachtelte Produktdaten für Ereignisse wie view_item oder Kauf Welche Ereignisse sind am häufigsten? Sehen wir uns zunächst an, was die Nutzer auf der Website tun. Diese Abfrage zeigt die häufigsten Ereignistypen und wie viele Nutzer sie ausgelöst haben: SELECT event_name, COUNT(DISTINCT user_pseudo_id) AS unique_users, COUNT(*) AS total_events FROM `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113` GROUP BY event_name ORDER BY total_events DESC; Diese Abfrage zeigt die häufigsten Benutzeraktionen. Wie erwartet führt page_view mit über 15.000 Ereignissen. Nur 34 Nutzer schlossen einen Kauf ab, während viele andere die Produkte ansahen oder in den Warenkorb legten - ein deutlicher Abfall, der typisch für E-Commerce-Trichter ist. event_nameunique_userstotal_events page_view403415653 user_engagement32669698 scroll19445091 session_start40434478 first_visit34393440 view_item7312990 view_promotion14632127 add_to_cart168665 begin_checkout79398 … purchase3436 Verfolgen Sie den Einkaufstrichter Als Nächstes wollen wir einen einfachen Trichter erstellen, um zu verstehen, wie viele Benutzer vom Stöbern zum Kauf übergehen. Wir zählen, wie viele einzelne Nutzer jedes der wichtigsten E-Commerce-Ereignisse ausgelöst haben: SELECT event_name, COUNT(DISTINCT user_pseudo_id) AS users FROM `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113` WHERE event_name IN ('view_item', 'add_to_cart', 'begin_checkout', 'purchase') GROUP BY event_name ORDER BY users DESC; Dies zeigt Ihnen, wie die Nutzer in jeder Phase der Shopping-Reise absteigen. Wahrscheinlich werden Sie feststellen, dass sich mehr Nutzer Artikel ansehen als tatsächlich einen Kauf abschließen - wie in den meisten Online-Shops. event_nameusers view_item731 add_to_cart168 begin_checkout79 purchase34 Analysieren Sie, was die Kunden gekauft haben Möchten Sie wissen, welche Produkte die Nutzer am häufigsten kaufen? Viele E-Commerce-Ereignisse enthalten Produktdetails in einem verschachtelten Feld namens Artikel. Um auf dieses Feld zuzugreifen, verwenden wir die Funktion UNNEST(). So finden Sie die 10 meistgekauften Produkte: SELECT item.item_name, COUNT(*) AS purchases FROM `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`, UNNEST(items) AS item WHERE event_name = 'purchase' GROUP BY item.item_name ORDER BY purchases DESC LIMIT 10; Und hier ist das Ergebnis: item_namepurchases Google Pride Sticker4 Google Sherpa Zip Hoodie Navy4 Google Light Pen Red3 Google Black Cloud Zip Hoodie3 Google Crewneck Sweatshirt Green3 Google Metallic Notebook Set2 Unisex Google Pocket Tee Grey2 Google Large Standard Journal Grey2 Google Sherpa Zip Hoodie Charcoal2 Google Soft Modal Scarf2 Sie können auch die Produktpreise analysieren und den Gesamt- oder Durchschnittsumsatz berechnen. Diese Abfrage liefert zum Beispiel den Gesamtumsatz pro Produkt: SELECT item.item_name, ROUND(SUM(item.price * item.quantity), 2) AS total_revenue FROM `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`, UNNEST(items) AS item WHERE event_name = 'purchase' GROUP BY item.item_name ORDER BY total_revenue DESC LIMIT 10; Auf diese Weise können Sie die Bestseller Ihres Shops ermitteln. item_namepurchases Google Pride Sticker4 Google Sherpa Zip Hoodie Navy4 Google Light Pen Red3 Google Black Cloud Zip Hoodie3 Google Crewneck Sweatshirt Green3 Google Metallic Notebook Set2 Unisex Google Pocket Tee Grey2 Google Large Standard Journal Grey2 Google Sherpa Zip Hoodie Charcoal2 Google Soft Modal Scarf2 Benutzer nach Land segmentieren GA4-Daten enthalten auch Informationen über den Standort und das Gerät eines jeden Nutzers. Sie können den Traffic nach geo.country segmentieren. Hier ist eine Abfrage, die zeigt, woher die Nutzer ihre Einkäufe beziehen: SELECT geo.country, COUNT(DISTINCT user_pseudo_id) AS unique_buyers FROM `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113` WHERE event_name = 'purchase' GROUP BY geo.country ORDER BY unique_buyers DESC; countryunique_buyers United States19 Canada4 Italy2 United Kingdom1 Germany1 Japan1 Singapore1 Netherlands1 Taiwan1 Malaysia1 Poland1 Hong Kong1 Üben Sie mehr für sich selbst Nachdem Sie nun die geführten Beispiele durchgearbeitet haben, ist es an der Zeit, selbst zu üben. Der beste Weg, Ihre SQL-Kenntnisse auszubauen - und wie ein Datenanalyst zu denken - ist, die Daten mit Ihren eigenen Fragen im Kopf zu untersuchen. Aufschlüsselung der Käufe nach Verkehrsquelle (traffic_source.source) Vergleichen Sie die durchschnittliche Größe des Warenkorbs zwischen mobilen und Desktop-Benutzern Analysieren Sie Produktansichten, die nicht zu einem Kauf geführt haben Erstellen Sie einen Pfad auf Sitzungsebene für einen einzelnen Benutzer Hier sind einige praktische Herausforderungen, die Sie als Nächstes angehen sollten: Aufschlüsselung der Käufe nach Traffic-Quelle. Stellen Sie fest, welche Quellen (wie Google, direkt oder über Empfehlungen) die meisten Käufe auslösen, indem Sie traffic_source.source verwenden. Vergleichen Sie die durchschnittliche Größe des Warenkorbs zwischen mobilen und Desktop-Nutzern. Verwenden Sie Gerätedaten, um herauszufinden, ob sich das Nutzerverhalten je nach Plattform ändert. Analysieren Sie Produktansichten, die nicht zu einem Kauf geführt haben. Identifizieren Sie Absprungpunkte im Trichter, indem Sie die Ereignisse view_item und purchase vergleichen. Erstellen Sie einen Pfad auf Sitzungsebene für einen einzelnen Benutzer. Wählen Sie einen user_pseudo_id und rekonstruieren Sie seine Reise Schritt für Schritt mit event_timestamp. Je mehr Sie mit Abfragen wie diesen experimentieren, desto besser werden Sie die Daten verstehen - und desto sicherer werden Sie bei der Anwendung von SQL auf reale Geschäftsprobleme. Abschließende Überlegungen Das Erlernen von SQL ist viel interessanter - und praktischer - wenn Sie mit echten Daten arbeiten. Vor allem, wenn diese Daten das reale Nutzerverhalten in einem echten Online-Shop, wie dem Google Merchandise Store, widerspiegeln. Das ist nicht nur Theorie, sondern die tägliche Arbeit von Datenanalysten, Marketingfachleuten und Produktteams. In diesem Artikel erfahren Sie, wie Sie: Abfragen mit echten GA4-E-Commerce-Daten schreiben Mit verschachtelten Feldern arbeiten UNNEST() Ereignisse, Produkte, Benutzersegmente und Trichter zu untersuchen Durch die direkte Arbeit mit GA4-Daten in BigQuery haben Sie einen großen Schritt in Richtung einer Denkweise wie ein Datenanalyst gemacht - Sie stellen Fragen, schreiben aussagekräftige Abfragen und finden wichtige Erkenntnisse. Möchtest du noch weiter gehen? Schauen Sie sich unseren Kurs SQL von A bis Z an, um eine solide Grundlage zu schaffen, oder tauchen Sie mit unseren interaktiven SQL-Kursen in fortgeschrittenere Themen ein. Üben Sie weiter, bleiben Sie neugierig - und viel Spaß beim Abfragen! Tags: SQL-Übungen Datenanalyse