27th Nov 2023 14 Leseminuten

BigQuery-Fensterfunktionen erklärt

Inhaltsverzeichnis

Was ist BigQuery?
Was sind SQL Fensterfunktionen?
- Warum werden sie Fensterfunktionen genannt?
Syntax von BigQuery Fensterfunktionen
SQL Fensterfunktionen verfügbar in BigQuery
Praktische Verwendungen von BigQuery Fensterfunktionen
Nächste Schritte mit BigQuery Fensterfunktionen

Wenn Sie mit den Trends in der Datenanalyse Schritt halten, ist Ihr Unternehmen - und Ihr Lebenslauf - auf dem neuesten Stand. In diesem Artikel werden wir uns die BigQuery-Fensterfunktionen ansehen und wie Sie sie nutzen können, um tiefere Einblicke in Ihre Daten zu gewinnen.

BigQuery von Google wurde 2010 auf den Markt gebracht und erfreut sich zunehmender Beliebtheit bei Unternehmen, die große Mengen an Informationen schnell analysieren und ihre eigenen Daten mit öffentlich zugänglichen statistischen Daten vergleichen müssen.

Seitdem Google die Datenabfragesprache von BigQuery an den SQL-Standard angepasst und erweiterte Funktionen wie SQL-Fensterfunktionen hinzugefügt hat, ist die Popularität des Programms gestiegen. In vielen Unternehmen sind BigQuery-Kenntnisse inzwischen ein Muss, und das bedeutet, dass SQL-Kenntnisse gefragter sind denn je. Dieser Artikel erklärt, warum SQL-Kenntnisse für die Arbeit mit BigQuery unerlässlich sind

SQL ist nach wie vor die wichtigste Kompetenz für alle, die mit Daten arbeiten müssen. Wenn Sie noch kein SQL-Guru sind, könnten Sie sich für unseren SQL von A bis Z Lernpfad interessieren. Er umfasst 7 Kurse, die Sie vom absoluten Anfänger zum SQL-Experten machen. Der Kurs enthält Hunderte von Programmieraufgaben aus der Praxis und dauert etwa 84 Stunden. Da Sie über Ihren Browser auf die Beispieldatenbanken zugreifen können, müssen Sie keine Software installieren, um loszulegen.

Was ist BigQuery?

Google BigQuery ist ein Hochgeschwindigkeits-Datenlager in der Cloud. Es wurde speziell für die Speicherung von Analysedaten entwickelt und kann Petabytes an Daten in wenigen Minuten verarbeiten. Falls Sie sich mit Petabytes noch nicht auskennen: Ein Petabyte ist eine Billiarde Bytes (oder eine Million Gigabytes).

Sie zahlen für das, was Sie in BigQuery verwenden, so dass die Kosten für die Speicherung und Analyse großer Datenmengen in der Regel viel niedriger sind als die Investition in viele Festplatten. Und da alle Arten von nützlichen statistischen Daten von Regierungen und Weltorganisationen öffentlich in BigQuery gespeichert sind, können Sie darauf zugreifen, um Erkenntnisse darüber zu gewinnen, wie die Leistung Ihres Unternehmens verbessert werden könnte.

Was sind SQL Fensterfunktionen?

Fensterfunktionen sind auch als analytische Funktionen oder OVER-Funktionen bekannt. Sie wurden 2003 in den SQL-Standard aufgenommen, und die meisten großen Datenbankanbieter haben sie ab 2010 implementiert. Sie sind also eine relativ neue Ergänzung zu SQL.

Bevor Fensterfunktionen in SQL aufgenommen wurden, konnten Sie entweder einzelne Zeilen auflisten oder Aggregate wie Summen und Durchschnittswerte berechnen. Beides war in ein und derselben Abfrage nicht möglich, es sei denn, man schrieb komplexe - und wahrscheinlich langsame und ineffiziente - Unterabfragen.

Das bedeutet, dass Sie entweder eine Liste wie diese haben können ...

Student ID	Subject	Score
1	Math	63
1	Science	50
2	Math	59

... oder Sie könnten Aggregate wie dieses anzeigen:

Subject	Class Average
Math	52
Science	61
English	55
Overall Average	56

Wenn Sie in diesem Beispiel wissen wollen, wie die Punktzahl eines einzelnen Schülers im Vergleich zum Klassendurchschnitt ausfällt, müssen Sie sich die beiden Berichte nebeneinander ansehen. Es wäre viel schöner, wenn Sie den Klassendurchschnitt in derselben Zeile wie die Punktzahl eines Schülers sehen könnten, so wie hier:

Student ID	Subject	Score	Class Average
1	Math	63	62
1	Science	50	61
2	Math	59	52

Wie ich bereits erwähnt habe, könnten Sie dies mit Unterabfragen erreichen. Aber Unterabfragen sind notorisch langsam in der Ausführung und können Ihre Abfrage sehr kompliziert machen.

Mit den Fensterfunktionen können Sie genau das einfach und effizient tun: Aggregate neben Details in derselben Zeile einfügen.

Warum werden sie Fensterfunktionen genannt?

Sie werden Fensterfunktionen genannt, weil Sie, während Sie eine einzelne Zeile betrachten, auch "durch das Fenster" schauen und Informationen aus dem gesamten Datensatz oder aus Zeilen, die mit der aktuellen Zeile in Beziehung stehen, extrahieren können.

Betrachten wir als Beispiel eine Tabelle mit den Noten der Schüler:

Student ID	Teacher ID	Subject	Grade
1	1	Math	63
2	1	Math	80
3	2	Math	60
4	2	Math	45
5	1	Math	52
6	1	Math	70
7	2	Math	65
1	2	Science	70
2	2	Science	62
3	2	Science	90
4	2	Science	30
5	2	Science	53
1	5	English	59
3	5	English	70
5	5	English	45
6	5	English	62
1	12	History	55
3	12	History	67
4	12	History	58

Wie im vorigen Beispiel möchten wir den Klassendurchschnitt neben jedem Schüler anzeigen, so dass eine einzelne Zeile wie folgt aussieht:

Student ID	Subject	Grade	Class Average
4	Math	45	62

Dazu müssen wir beim Extrahieren dieser Zeile den Durchschnitt aller anderen Schüler berücksichtigen und das Ergebnis neben den anderen Daten anzeigen.

In SQL verwenden Fensterfunktionen ein gleitendes Fenster von Zeilen, um zusätzliche Informationen entweder aus dem gesamten Datensatz oder aus einer Teilmenge in Bezug auf die aktuelle Zeile zu extrahieren.

Im obigen Diagramm ist die aktuelle Zeile ein mathematisches Ergebnis, und das Fenster enthält alle mathematischen Noten.

Wenn wir diese Zeile extrahieren ...

Student ID	Subject	Grade	Class Average
1	Science	70	62

... müssen wir das Fenster "verschieben", damit wir alle naturwissenschaftlichen Ergebnisse sehen, um den Durchschnitt für Naturwissenschaften zu berechnen.

Fensterfunktionen haben viele der gleichen Fähigkeiten wie die GROUP BY-Klausel, aber der Unterschied besteht darin, dass sie uns erlauben, Aggregate und Details nebeneinander anzuzeigen.

Syntax von BigQuery Fensterfunktionen

Die OVER()-Klausel

Die OVER() Klausel zeigt an, dass Sie eine Fensterfunktion verwenden. Sie schreiben Ihre Abfrage wie gewohnt und fügen die gewünschten Aggregate neben den anderen Spaltennamen ein. Jedes Aggregat wird mit der Klausel OVER() gekennzeichnet. Wenn Sie diese Klausel allein verwenden, ist das "Fenster" der gesamte Datensatz. Auf gleitende Fenster gehe ich später in diesem Artikel noch näher ein.

Wenn Sie zum Beispiel alle Matheergebnisse extrahieren und den Klassendurchschnitt sowie die höchste und niedrigste Note für jeden Schüler anzeigen möchten, würde Ihre Abfrage wie folgt aussehen:

SELECT 
  student_id,
  grade,
  AVG(grade) OVER() AS average,
  MIN(grade) OVER() AS lowest,
  MAX(grade) OVER() AS highest
FROM exam_results
WHERE subject = 'Math';

Ihre Ergebnisse würden dann wie folgt aussehen:

student_id	grade	average	lowest	highest
1	63	62	45	80
2	80	62	45	80
3	60	62	45	80
4	45	62	45	80
5	52	62	45	80
6	70	62	45	80
7	65	62	45	80

Die PARTITION BY-Klausel

Diese Klausel verwendet ein gleitendes Fenster. Anstelle eines Fensters, das den gesamten Datensatz enthält, wird nur eine Partition (oder ein Teil) des Satzes einbezogen.

Im vorherigen Beispiel habe ich nur die mathematischen Ergebnisse einbezogen, indem ich alle anderen mit der Klausel WHERE ausgeschlossen habe. Wenn Sie einen Bericht wünschen, der die Ergebnisse für alle Fächer anzeigt, aber den Durchschnitt nur aus den Zeilen berechnet, in denen das Fach mit der aktuellen Zeile übereinstimmt, würden Sie die Klausel PARTITION BY verwenden:

SELECT 
  student_id,
  subject,
  grade,
  AVG(grade) OVER(PARTITION BY subject) AS average
FROM exam_results;

Schauen Sie sich diese farbcodierte Kopie der Tabelle mit den Noten der Schüler an, um zu sehen, wie die Unterteilungen funktionieren werden:

Student ID	Teacher ID	Subject	Grade
1	1	Math	63
2	1	Math	80
3	2	Math	60
4	2	Math	45
5	1	Math	52
6	1	Math	70
7	2	Math	65
1	2	Science	70
2	2	Science	62
3	2	Science	90
4	2	Science	30
5	2	Science	53
1	5	English	59
3	5	English	70
5	5	English	45
6	5	English	62
1	12	History	55
3	12	History	67
4	12	History	58

Bei der Verarbeitung jeder Zeile ändern sich die im Fenster enthaltenen Zeilen auf der Grundlage des Wertes in der Spalte subject. Das bedeutet, dass der Durchschnitt nur für die Partition des Datensatzes berechnet wird, in der das Thema mit der aktuellen Zeile übereinstimmt. Sie können sich das wie folgt vorstellen:

Die Ergebnisse würden wie folgt aussehen:

Student ID	Subject	Grade	Class Average
1	Math	63	62
2	Math	80	62
3	Math	60	62
4	Math	45	62
5	Math	52	62
6	Math	70	62
7	Math	65	62
1	Science	70	61
2	Science	62	61
3	Science	90	61
4	Science	30	61
5	Science	53	61
1	English	59	59
3	English	70	59
5	English	45	59
6	English	62	59
1	History	55	60
3	History	67	60
4	History	58	60

Die ORDER BY-Klausel

Die ORDER BY -Klausel innerhalb der Funktion OVER() verwendet eine andere Art von gleitendem Fenster. Wenn Sie OVER(ORDER BY column_name) verwenden, schließt das Fenster nur die Zeilen ein, in denen der Wert der angegebenen Spalte kleiner oder gleich dem Wert dieser Spalte in der aktuellen Zeile ist.

Die Klausel ORDER BY ist nützlich für die Berechnung von laufenden Summen und gleitenden Durchschnitten. Als Beispiel verwende ich eine Tabelle namens monthly_transactions die Bankkontotransaktionen enthält:

account_id	tran_date	transaction	value
1	2023-09-01	Opening Balance	500.00
1	2023-09-03	Deposit	137.45
1	2023-09-12	Withdrawal	-200.00
1	2023-09-18	Withdrawal	-250.00
2	2023-09-01	Opening Balance	1200.00
2	2023-09-14	Deposit	900.00
2	2023-09-20	Purchase	-318.90

Die folgende Abfrage listet die Transaktionen für die Konto-ID 1 auf und zeigt einen laufenden Saldo an.

SELECT 
  account_id,
  tran_date,
  transaction,
  value,
  SUM(value) OVER(ORDER BY tran_date) AS balance
FROM monthly_transactions
WHERE account_id = 1;

Die Einbeziehung der Klausel ORDER BY in die Klausel OVER steuert ein gleitendes Fenster.

Wenn Sie möchten, können Sie auch die übliche ORDER BY Klausel am Ende der Abfrage verwenden, um die endgültige Reihenfolge der Zeilen im Bericht zu steuern. Sie müssen nicht unbedingt in der ursprünglichen Reihenfolge angezeigt werden.

Standardmäßig bewirkt die Verwendung von ORDER BY innerhalb der OVER -Klausel, dass das Fenster so verschoben wird, dass nur Zeilen angezeigt werden, deren Datum kleiner oder gleich dem Datum der aktuellen Zeile ist. Es gibt noch weitere Schlüsselwörter, die diese Vorgabe ändern können, aber das würde den Rahmen dieses Artikels sprengen.

Sie können sich das folgendermaßen vorstellen:

Die Ergebnisse würden wie folgt aussehen:

account_id	tran_date	transaction	value	balance
1	2023-09-01	Opening Balance	500.00	500.00
1	2023-09-03	Deposit	137.45	637.45
1	2023-09-12	Withdrawal	-200.00	437.45
1	2023-09-18	Withdrawal	-250.00	187.45
2	2023-09-01	Opening Balance	1200.00	1200.00
2	2023-09-14	Deposit	900.00	2100.00
2	2023-09-20	Purchase	-318.90	1781.10

Verwendung von ORDER BY mit der PARTITION BY-Klausel

Wenn Sie alle Konten mit ihren laufenden Salden anzeigen möchten, können Sie PARTITION BY und ORDER BY zusammen verwenden:

SELECT 
  account_id,
  tran_date,
  transaction,
  value,
  SUM(value) OVER(PARTITION BY account_id ORDER BY tran_date) AS balance
FROM monthly_transactions
ORDER BY account_id, tran_date

Die Klausel PARTITION BY bewirkt, dass das gleitende Fenster nur Zeilen enthält, in denen account_id mit der aktuellen Zeile übereinstimmt. Die Klausel ORDER BY bewirkt, dass nur Zeilen innerhalb dieser Partition angezeigt werden, deren Datum kleiner oder gleich dem Datum der aktuellen Zeile ist.

Das Ergebnis wäre wie folgt:

account_id	tran_date	transaction	value	balance
1	2023-09-01	Opening Balance	500.00	500.00
1	2023-09-03	Deposit	137.45	637.45
1	2023-09-12	Withdrawal	-200.00	437.45
1	2023-09-18	Withdrawal	-250.00	187.45
2	2023-09-01	Opening Balance	1200.00	1200.00
2	2023-09-14	Deposit	900.00	2100.00
2	2023-09-20	Purchase	-318.90	1781.10

Jedes Konto hat einen eigenen laufenden Saldo.

SQL Fensterfunktionen verfügbar in BigQuery

Sie haben gesehen, wie gängige SQL-Aggregatfunktionen wie SUM(), AVG(), MIN() und MAX() in Verbindung mit der OVER-Klausel verwendet werden können, um Aggregate aus einem Datenfenster zu extrahieren.

Google BigQuery verfügt, wie viele andere SQL-Dialekte auch, über zusätzliche Funktionen, die tiefere Einblicke in die Daten geben können. Hier sind einige Beispiele.

RANK()

Diese Funktion ordnet den Datensatz vom höchsten zum niedrigsten Wert in einer bestimmten Spalte. Sie kann Fragen beantworten wie:

Welchen Platz hat jeder Schüler in der Klasse aufgrund der Prüfungsergebnisse eingenommen?
Welche Produkte waren am profitabelsten?
Welche Kunden gaben das meiste Geld aus?
Welches Lager erhielt die meisten Beschwerden?

Anhand der Beispieltabelle, die wir uns vorhin angesehen haben, können wir mit dieser Abfrage die Studenten nach ihren Prüfungsergebnissen einordnen:

SELECT 
  student_id,
  subject,
  grade,
  RANK() OVER(PARTITION BY subject ORDER BY grade desc) AS place
FROM exam_results
ORDER BY subject, grade DESC;

Das Ergebnis würde lauten:

student_id	subject	grade	place
3	English	70	1
6	English	62	2
1	English	59	3
5	English	45	4
3	History	67	1
4	History	58	2
1	History	55	3
2	Math	80	1
6	Math	70	2
7	Math	65	3
1	Math	63	4
3	Math	60	5
5	Math	52	6
4	Math	45	7
3	Science	90	1
1	Science	70	2
2	Science	62	3
5	Science	53	4
4	Science	30	5

Bei der Berechnung dieser Ergebnisse veranlasst die PARTITION BY subject-Klausel SQL, nur die Ergebnisse für das gleiche Fach wie die aktuelle Zeile zu betrachten. Die ORDER BY grade DESC Klausel sortiert sie in absteigender Reihenfolge der Note. Die Funktion RANK() ordnet die Schüler dann in dieser Reihenfolge an.

Da Schüler 3 die beste Note in Englisch hat, ist sein Rang 1; Schüler 6, der nächstbeste, ist in diesem Fach auf Rang 2. Schüler 2 hat die beste Note in Mathe und wird auf Platz 1 eingestuft.

DENSE_RANK()

DENSE_RANK() wird für denselben Zweck verwendet wie RANK. Der Unterschied zwischen den beiden lässt sich am besten anhand dieser Abfrageergebnisse erklären, die Ergebnisse in einem Schießwettbewerb darstellen.

Mit RANK würde die Abfrage lauten:

SELECT 
  competitor_no,
  score,
  RANK() OVER(ORDER BY score desc) AS rank
FROM match_results
ORDER BY score DESC;

Die Ergebnisse sind:

Competitor No	Score	Rank
4	85	1
5	83	2
10	83	2
9	81	4
2	76	5
6	76	5
7	72	7
3	70	8
8	68	9
1	62	10

Die Mitbewerber 5 und 10 liegen gleichauf auf dem zweiten Platz und erhalten beide die Note 2. Der Mitbewerber 9 ist der nächstplatzierte und erhält die Note 4. Der dritte Platz wird nicht berücksichtigt.

Mit DENSE_RANK lautet die Abfrage:

SELECT 
  competitor_no,
  score,
  DENSE RANK() OVER(ORDER BY score desc) AS rank
FROM match_results
ORDER BY score DESC;

Die Ergebnisse sind:

Competitor No	Score	Rank
4	85	1
5	83	2
10	83	2
9	81	3
2	76	4
6	76	4
7	72	5
3	70	6
8	68	7
1	62	8

Die Mitbewerber 5 und 10 haben immer noch beide den Rang 2, aber der dritte Platz wird nicht ausgelassen: Mitbewerber 9 hat jetzt den Rang 3.

Beide Funktionen haben die gleiche Syntax. Wenn wir die Abfrage nach den Noten der vorherigen Schüler mit der Funktion DENSE_RANK() umcodieren wollten, würde sie so aussehen:

SELECT 
  student_id,
  subject,
  grade,
  DENSE_RANK() OVER(PARTITION BY subject ORDER BY grade desc) AS class_place
FROM exam_results
ORDER BY subject, grade DESC

Da es aber keine Gleichheitswerte gibt, wäre das Ergebnis dasselbe.

ROW_NUMBER()

Die Funktion ROW_NUMBER() funktioniert ähnlich wie die beiden vorherigen Funktionen, aber die Zeilen werden einfach der Reihe nach nummeriert. Wenn Zeilen denselben Wert haben, werden sie fortlaufend nummeriert, je nachdem, welche Zeile zuerst gefunden wurde. Hier sind die Ergebnisse der Abfrage des Schießwettbewerbs unter Verwendung von ROW_NUMBER() anstelle von RANK() oder DENSE_RANK():

Competitor No	Score	Rank
4	85	1
5	83	2
10	83	3
9	81	4
2	76	5
6	76	6
7	72	7
3	70	8
8	68	9
1	62	10

LAG()

Mit dieser Funktion können Sie Daten aus der vorherigen Zeile der Ergebnismenge mit den Daten der aktuellen Zeile vergleichen. Sie ist ideal für Jahresvergleiche und ermöglicht es Ihnen, Trends zu entdecken und Probleme mit der Unternehmensleistung zu erkennen.

LAG() und die zugehörige Funktion LEAD() können nur in Verbindung mit der Klausel OVER(ORDER BY) verwendet werden.

Nehmen Sie als Beispiel die folgende Tabelle, die Umsatzdaten für ein kleines Unternehmen enthält:

year	sales_value	sales_quantity	profit
2019	54000	900	8000
2020	75000	1200	11000
2021	30000	450	1000
2022	60000	10000	7000

Die Beispielabfrage zum Vergleich der Jahreszahlen lautet:

SELECT 
  year,
  sales_value,
  sales_quantity,
  profit,
  LAG(sales_value) OVER(ORDER BY year) as ly_value,
  LAG(sales_quantity) OVER(ORDER BY year) as ly_qty,
  LAG(profit) OVER(ORDER BY year) as ly_profit,
  profit - LAG(profit) OVER(ORDER BY year) as inc_dec
FROM annual_sales
ORDER BY year;

Die Ergebnisse dieser Abfrage sind:

year	sales_value	sales_quantity	profit	ly_value	ly_qty	ly_profit	inc_dec
2019	54000	900	8000	NULL	NULL	NULL	NULL
2020	75000	1200	11000	54000	900	8000	3000
2021	30000	450	1000	75000	1200	11000	-10000
2022	60000	10000	7000	30000	450	1000	6000

Schauen wir uns diese Zeile der Abfrage an und sehen wir, was sie tatsächlich bewirkt hat:

LAG(sales_value) OVER(ORDER BY year) as ly_value

In dieser Zeile des Ergebnisses ...

year	sales_value	sales_quantity	profit	ly_value	ly_qty	ly_profit	inc_dec
2020	75000	1200	11000	54000	900	8000	3000

... ist unsere aktuelle Zeile für das Jahr 2020. Die Funktion LAG() in Verbindung mit ORDER BY year veranlasst SQL, die Zeile für das vorherige Jahr (2019) zu betrachten und den Umsatzwert daraus unter der Überschrift ly_value zu extrahieren.

Sie werden feststellen, dass in der ersten Zeile die von der Funktion LAG() berechneten Spalten einen Nullwert enthalten, da es keinen vorherigen Datensatz gibt.

LEAD()

Die Funktion LEAD() ist die Umkehrung der Funktion LAG(): Sie bezieht die Daten aus der Zeile nach der aktuellen Zeile und nicht aus der Zeile davor.

Um den Gewinn zwischen dem aktuellen Jahr, dem Vorjahr und dem Folgejahr unter Verwendung derselben Beispieltabelle zu vergleichen, würde die Abfrage lauten:

SELECT 
  year,
  profit,
  LAG(profit) OVER(ORDER BY year) as ly_profit,
  profit - LAG(profit) OVER(ORDER BY year) as ly_inc_dec,
  LEAD(profit) OVER(ORDER BY year) as ny_profit,
  LEAD(profit) OVER(ORDER BY year) - profit as ny_inc_dec
FROM annual_sales
ORDER BY year;

Die Ergebnisse dieser Abfrage wären:

year	profit	ly_profit	ly_inc_dec	ny_profit	ny_inc_dec
2019	8000	NULL	NULL	11000	3000
2020	11000	8000	3000	1000	-10000
2021	1000	11000	-10000	7000	6000
2022	7000	1000	6000	NULL	NULL

Die Spalten ny_profit und ny_inc_dec verwenden die Funktion LEAD(), die SQL veranlasst, die nächste Zeile in der Reihenfolge zu betrachten, um diese Felder zu extrahieren. Wenn die aktuelle Zeile für 2019 ist, werden diese beiden Felder aus der Zeile für 2020 genommen.

Dies sollte Ihnen einen Eindruck von einigen der nützlichen SQL-Fensterfunktionen in BigQuery vermittelt haben. Eine vollständige Liste der Funktionen finden Sie in der BigQuery-SQL-Dokumentation.

Weitere Beispiele für Fensterfunktionen finden Sie in dem Artikel SQL Window Function Examples. Eine Kurzanleitung für die Syntax der SQL-Fensterfunktionen finden Sie auch in unserem Fensterfunktionen Cheat Sheet.

Praktische Verwendungen von BigQuery Fensterfunktionen

In der realen Welt gibt es viele Möglichkeiten, wie BigQuery-Fensterfunktionen Ihnen Einblicke geben können, um die Leistung Ihres Unternehmens zu verbessern. Sie sind sehr leistungsfähig und ermöglichen es Ihnen, sehr schnell komplexe Berichte zu erstellen.

Hier sind einige Ideen, wie die BigQuery-Fensterfunktionen verwendet werden können:

Einstufung Ihrer Mitarbeiter nach Leistung, um motivierende Belohnungen zu vergeben. In diesem Artikel findenSie weitere Informationen zum Ranking von Zeilen.
Herausfinden, wie jede Produktlinie im Vergleich zu anderen ähnlichen Artikeln abgeschnitten hat.
Lernen, wie einzelne Produkte den gleitenden Durchschnittsgewinn beeinflussen. Mehr über die Berechnung von gleitenden Durchschnitten in SQL erfahren Sie hier.
Vergleich von Daten im Jahresvergleich, um Trends zu erkennen. In diesem Artikel erfahren Sie mehr über die Erstellung von Jahresvergleichen in SQL.
Verwendung von laufenden Summen, um genau zu sehen, wie viele Verkäufe zu einem bestimmten Zeitpunkt getätigt wurden. Erfahren Sie hier mehr über die Berechnung von laufenden Summen in SQL.

Nächste Schritte mit BigQuery Fensterfunktionen

Nachdem Sie nun gesehen haben, was SQL-Fensterfunktionen in BigQuery und anderen Datenbankmanagementsystemen leisten können, ist es an der Zeit, Ihre Kenntnisse in diesem wichtigen Bereich zu erweitern.

Ein guter Startpunkt ist der SQL-Kurs LearnSQL.de Fensterfunktionen . Dort lernen Sie Schritt für Schritt, wie Sie die in diesem Artikel vorgestellten Techniken anwenden können, und erhalten eine ausführliche Erklärung zu jedem Thema. Mit über 200 interaktiven Übungen erhalten Sie außerdem reichlich Übung, um sicherzustellen, dass Sie wissen, wie Sie komplexe Informationen in realen Situationen extrahieren können. Wenn Sie nicht weiterkommen, steht Ihnen Hilfe zur Verfügung, und Sie können über Ihren Browser auf Beispieldatenbanken zugreifen. Der Kurs dauert etwa 20 Stunden.

Wenn Sie wirklich ein Experte werden wollen, können Sie das Lösen komplexer Probleme noch weiter üben, indem Sie sich durch unser Fensterfunktionen Practice Set arbeiten. Sie werden 100 Beispiele für komplexe Berichte mit drei verschiedenen Datenbanken bearbeiten.

Lesen Sie auch diesen Artikel über das Üben von Fensterfunktionen, und erfahren Sie hier mehr über die BigQuery-Syntax.

Wenn Sie auf der Suche nach einer hochrangigen Stelle im Bereich Datenanalyse oder Data Science sind, werden Sie im Vorstellungsgespräch höchstwahrscheinlich aufgefordert, Ihre Kenntnisse der SQL-Fensterfunktionen unter Beweis zu stellen. Um eine Vorstellung davon zu bekommen, welche Art von Fragen Ihnen gestellt werden könnten (und wie Sie sie beantworten können), finden Sie hier einen Artikel, der die wichtigsten Fragen zu SQL-Fensterfunktionen im Vorstellungsgespräch behandelt.

Machen Sie noch heute den ersten Schritt, um Ihre Datenanalysefähigkeiten auf die nächste Stufe zu heben!

Tags:

student_id	grade	average	lowest	highest
1	63	62	45	80
2	80	62	45	80
3	60	62	45	80
4	45	62	45	80
5	52	62	45	80
6	70	62	45	80
7	65	62	45	80

student_id	grade	average	lowest	highest
1	63	62	45	80
2	80	62	45	80
3	60	62	45	80
4	45	62	45	80
5	52	62	45	80
6	70	62	45	80
7	65	62	45	80