27th Jul 2023 10 Leseminuten

Wie man COUNT() mit GROUP BY verwendet: 5 praktische Beispiele

Inhaltsverzeichnis

Wie man COUNT() und GROUP BY verwendet
- Wann wird GROUP BY verwendet?
- Wann wird die Funktion COUNT() verwendet?
5 Beispiele für die Verwendung von COUNT() mit GROUP BY
Möchten Sie mehr über COUNT() und GROUP BY wissen?

Die Verwendung der Funktion COUNT() mit GROUP BY ist eines der häufigsten SQL-Konstrukte in Aggregatabfragen. Lesen Sie diesen Artikel, um anhand von 5 Beispielen zu erfahren, wie Sie COUNT() mit GROUP BY richtig verwenden.

In diesem Artikel wird erklärt, wie wichtig die Verwendung von COUNT mit GROUP BY ist. Wir werden darüber sprechen, warum sie in SQL unverzichtbar ist und wie sie die Analyse und Zusammenfassung von Daten nach bestimmten Kriterien ermöglicht. Mit dieser Kombination können Benutzer aussagekräftige Erkenntnisse gewinnen, Zählungen berechnen und statistische Zusammenfassungen aus großen Datensätzen erstellen.

Wenn Sie eine gründliche Übersicht über die grundlegenden SQL-Konzepte wie COUNT() und GROUP BY suchen, empfehle ich Ihnen unseren interaktiven SQL für Anfänger Kurs. Er enthält 129 Übungen, mit denen Sie alle wichtigen SQL-Konzepte wiederholen können.

Wie man COUNT() und GROUP BY verwendet

Wenn Sie nur wegen der schnellen Antwort hier sind, hier ist die Kurzfassung:

Die korrekte Verwendung von COUNT() mit GROUP BY wird in der folgenden Abfrage gezeigt:

SELECT 
  Store,
  COUNT(*) as NumberOfSales, 
FROM Sales
GROUP BY Store;

Lassen Sie uns das Ergebnis aufschlüsseln, um zu verstehen, wie diese Abfrage funktioniert. Die Zeilen mit demselben Wert in der Spalte Store werden gruppiert. Stellen Sie sich eine Zwischentabelle vor, in der diese Zeilen gruppiert und mit verschiedenen Farben markiert sind, wie in der Abbildung unten. Dies wäre unsere Zwischentabelle, die nur die Spalte Store enthält, da dies die Spalte ist, die Teil unserer Anweisung SELECT ist.

Store	ProductID	CustomerID
Store A	165	7
Store A	111	16
Store A	145	25
Store B	136	9
Store B	111	38
Store C	136	16
Store C	111	8

Die Datenbank zählt dann logischerweise die Anzahl der Zeilen in jeder Gruppe mit Hilfe der Funktion COUNT(*). Diese Zählung stellt die Anzahl der Bestellungen für jede Filiale dar.

Sobald die Zeilen gezählt sind, ist es nicht mehr nötig, doppelte Zeilen mit demselben Store-Wert zu haben. GROUP BY reduziert also die Anzahl der Zeilen auf eindeutige Werte. Mit anderen Worten, die einzelnen Zeilen werden entfernt und wir erhalten eine Zusammenfassung für jede Gruppe. Am Ende erhalten wir das folgende Ergebnis:

Store	NumberOfSales
Store A	3
Store B	2
Store C	2

Wann wird GROUP BY verwendet?

GROUP BY ist eine SQL-Klausel, die Zeilen auf der Grundlage von einem oder mehreren Spaltenwerten gruppiert. Sie wird oft in Kombination mit Aggregatfunktionen wie COUNT(), SUM(), AVG(), MAX() und MIN() verwendet, um Berechnungen mit gruppierten Daten durchzuführen.

Die GROUP BY Klausel ist nützlich, wenn Sie:

Berechnungen und Aggregationen auf Teilmengen von Daten durchführen.
Zusammenfassende Statistiken und Metriken für verschiedene Gruppen oder Kategorien zu erstellen.
Muster und Trends innerhalb bestimmter Gruppen zu erkennen.
Berichte erstellen und Daten auf der Grundlage verschiedener Dimensionen oder Attribute analysieren möchten.
Anwendung von Filtern und Bedingungen auf gruppierte Daten unter Verwendung der HAVING

Zusammenfassend lässt sich sagen, dass GROUP BY verwendet wird, um Daten auf der Grundlage bestimmter Spalten, Funktionen oder Ausdrücke zu organisieren und zusammenzufassen, wodurch Sie Einblicke gewinnen und Berechnungen für bestimmte Gruppen innerhalb eines Datensatzes durchführen können.

Wann wird die Funktion COUNT() verwendet?

COUNT() ist eine der gebräuchlichsten Aggregatfunktionen von SQL. Sie gibt die Anzahl der Zeilen zurück, die einer bestimmten Bedingung entsprechen oder in einer Ergebnismenge enthalten sind. Sie wird häufig verwendet, um die Gesamtzahl der Datensätze in einer Tabelle abzurufen oder um die Anzahl der Vorkommen eines bestimmten Wertes in einer Spalte zu berechnen.

5 Beispiele für die Verwendung von COUNT() mit GROUP BY

Nachdem wir nun die grundlegenden Szenarien durchgespielt haben, in denen COUNT() und GROUP BY verwendet werden, wollen wir nun einige der komplizierteren Beispiele durchgehen. Wir beginnen mit einfacheren Beispielen und arbeiten uns dann zu komplexeren Szenarien vor.

Beispiel 1: GROUP BY einer einzelnen Spalte

Das einfachste Szenario ist, dass Sie nach einer einzelnen Spalte gruppieren müssen. Im folgenden Beispiel müssen wir herausfinden, wie sich die Anzahl der Mitarbeiter unseres Unternehmens auf die verschiedenen Berufsbezeichnungen verteilt.

Bevor wir uns die SQL-Lösung für dieses Szenario ansehen, gehen wir die Beispieldaten durch. Dies ist die employees Tabelle:

EmployeeID	FirstName	LastName	JobTitle
1	John	Doe	Manager
2	Jane	Smith	Supervisor
3	Mark	Johnson	Developer
4	Emily	Williams	Analyst
5	Michael	Brown	Designer
6	Sarah	Davis	Developer
7	Robert	Wilson	Designer
8	Jessica	Taylor	Developer

Durch die Verwendung der Funktion COUNT mit GROUP BY in der Spalte JobTitle können wir eine Aufschlüsselung der Anzahl der Mitarbeiter in jeder spezifischen Rolle erhalten. Sie können die Abfrage und die Ausgabe (basierend auf den Beispieldaten) unten sehen:

SELECT 
  JobTitle, 
  COUNT(*) AS NumberOfEmployees
FROM employees
GROUP BY JobTitle;

JobTitle	NumberOfEmployees
Analyst	1
Designer	2
Developer	3
Manager	1
Supervisor	1

Dieses Beispiel funktioniert auf die gleiche Weise wie unsere ursprüngliche Abfrage. GROUP BY fasst die Zeilen für Mitarbeiter mit der gleichen Berufsbezeichnung in einer Gruppe zusammen. Dann zählt die Funktion COUNT() die Zeilen in jeder Gruppe. GROUP BY fasst dann die Zeilen in jeder Gruppe zusammen und behält nur den Wert der Spalte JobTitle und die Anzahl.

Beispiel #2: GROUP BY Mehrere Spalten

Natürlich können Sie Zeilen nach mehr als einer Spalte gruppieren.

In diesem Beispiel sehen wir uns eine Beispiel orders Tabelle, die grundlegende Bestellinformationen enthält:

OrderID	CustomerID	ProductID	ProductCategory	OrderDate	Status	Amount
1	101	1001	Electronics	2023-05-01	Completed	150.00
2	102	1002	Clothing	2023-05-02	Completed	80.00
3	101	1001	Home Goods	2023-06-03	In progress	60.00
4	103	NULL	Accessories	2023-06-03	Canceled	200.00
5	101	1002	Electronics	2023-07-04	NULL	120.00
6	102	1001	NULL	2023-07-05	NULL	NULL
7	103	1002	Clothing	2023-07-06	In progress	90.00
8	102	1002	Accessories	2023-08-07	NULL	75.00
9	103	NULL	NULL	2023-08-08	NULL	100.00
10	101	1001	Home Goods	2023-09-09	NULL	NULL
11	102	1001	Home Goods	2023-06-05	In progress	80.00
12	103	1004	Accessories	2023-06-06	Completed	75.00
13	102	1005	Electronics	2023-08-06	Completed	88.00

Wir müssen eine Abfrage schreiben, die die Anzahl der von jedem Kunden aufgegebenen Bestellungen und die ProductCategory der jeweiligen Bestellung anzeigt. Das bedeutet, dass wir die CustomerID und die Kategorie, in die die Bestellung fällt, zurückgeben müssen.

Die Abfrage sieht wie folgt aus:

SELECT
  CustomerID,
  ProductCategory,
  COUNT(*) AS NumberOfOrders
FROM orders
GROUP BY CustomerID, ProductCategory;

Das Ergebnis der Abfrage ist unten zu sehen:

CustomerID	ProductCategory	NumberOfOrders
101	Electronics	2
101	Home Goods	2
102	Electronics	2
102	Accessories	2
102	Clothing	1
103	Accessories	2
103	Clothing	1
103	NULL	1

Unsere Abfrage gruppiert Zeilen nach zwei Spalten: CustomerID und ProductCategory. Das bedeutet, dass GROUP BY Zeilen mit den gleichen Werten von CustomerID und ProductCategory in einer Gruppe zusammenfasst. (Zeilen für CustomerID 101 und die Kategorie Electronics sind in einer Gruppe, aber Zeilen für CustomerID 101 und die Kategorie Home Goods sind in einer anderen Gruppe.) Dann werden die Zeilen in jeder Gruppe durch COUNT() gezählt.

Beispiel Nr. 3: Verwendung von WHERE mit COUNT() und GROUP BY

In unserem vorherigen Beispiel haben wir ein Szenario analysiert, in dem wir ein Aggregat aus allen Informationen in unserer orders Tabelle. Manchmal möchten wir jedoch diese Informationen aufschlüsseln und nur die Bestellungen für ausgewählte Kategorien anzeigen.

Unter Verwendung derselben Beispieldaten, die wir zuvor hatten, werden wir nun eine Abfrage schreiben, die dieselben Informationen für Bestellungen anzeigt, die in die Kategorien "Accessoires" oder "Kleidung" fallen ProductCategory.

Dazu können wir die Abfrage aus Beispiel 2 verwenden und lediglich eine WHERE Klausel hinzufügen. Diese Klausel filtert nach Datensätzen, bei denen ProductCategory gleich "Accessoires" oder "Bekleidung" ist.

SELECT
  CustomerID,
  ProductCategory,
  COUNT(*) AS NumberOfOrders
FROM orders
WHERE ProductCategory IN (‘Accessories’, ‘Clothing’)
GROUP BY CustomerID, ProductCategory;

CustomerID	ProductCategory	NumberOfOrders
102	Accessories	2
103	Accessories	1
102	Clothing	1
103	Clothing	1

Falls es nicht ganz intuitiv ist, wie die Datenbank die Ergebnisse mit der obigen Abfrage erzeugt hat, hier eine schrittweise Erklärung, was hinter den Kulissen passiert ist:

Zunächst durchsucht die Datenbank die orders Tabelle und liest alle Zeilen.
Dann wendet sie die Filterbedingung in WHERE ProductCategory IN (‘Accessories’, ‘Clothing’ ) an, um die Zeilen zu filtern. Nach diesem Schritt werden nur die Zeilen, deren Produktkategorie "Accessoires" oder "Kleidung" ist, für die weitere Verarbeitung berücksichtigt.
Die gefilterten Zeilen werden dann auf der Grundlage der Werte in den Spalten CustomerID und ProductCategory gruppiert, die in der Klausel GROUP BY angegeben sind.
Für jede der eindeutigen Kombinationen von CustomerID und ProductCategory wird die Funktion COUNT(*) angewendet. Dadurch wird die Anzahl der Zeilen innerhalb jeder Gruppe gezählt.
Die endgültige Ergebnismenge enthält die CustomerID, ProductCategory und die Anzahl der Bestellungen (in der Spalte NumberOfOrders ) für jede Gruppe.

Zusammenfassend lässt sich sagen, dass die Datenbank die Zeilen filtert, die die angegebene Filterbedingung erfüllen. Anschließend werden sie nach den in der Klausel GROUP BY angegebenen Spalten gruppiert und die Anzahl der Bestellungen in jeder dieser Gruppen berechnet. Die endgültige Ausgabe enthält CustomerID, ProductCategory und die entsprechende Anzahl der Bestellungen für jede eindeutige Kombination von CustomerID und ProductCategory.

Beispiel Nr. 4: Verwendung von ORDER BY mit COUNT() und GROUP BY

Wenn man sich das Ergebnis von Beispiel 4 ansieht, kann man erkennen, dass einige der Zeilen in der Ausgabe gemischt sind. Das liegt daran, dass die Spalten in der Liste GROUP BY im Allgemeinen eine Sortierung der Ausgabe auf der Grundlage der Liste der Spalten im Abschnitt GROUP BY erfordern, aber nicht garantieren.

Wenn wir aber beispielsweise die Ergebnisse nach verschiedenen Bedingungen ordnen müssen (z. B. nach einer Zeitleiste oder nach Datum), müssen wir eine ORDER BY-Klausel verwenden :

SELECT
  CustomerID,
  ProductCategory,
  COUNT(*) AS NumberOfOrders
FROM orders
WHERE ProductCategory IN (‘Accessories’, ‘Electronics’)
GROUP BY CustomerID, ProductCategory
ORDER BY ProductCategory, CustomerID;

CustomerID	ProductCategory	NumberOfOrdes
101	Accessories	2
102	Accessories	2
102	Electronics	1
103	Electronics	2

Wir haben die ORDER BY Klausel mit der Liste der Spalten, nach denen wir die Daten sortieren wollen, hinzugefügt. Wie Sie sehen können, werden die Ausgabedaten auf der Grundlage der Reihenfolge der aufgeführten Spalten sortiert.

Beispiel Nr. 5: COUNT(Ausdruck)

Bisher haben wir uns einfache Beispiele für die Arbeit mit COUNT() angeschaut; der Zweck war, alle Zeilen im Quelldatensatz oder in der Tabelle zu zählen.

Es gibt jedoch auch komplexere Möglichkeiten, die Kombination COUNT–GROUP BY zu verwenden. Um dies zu erklären, werden wir einen neuen Beispieldatensatz erstellen.

Wir haben eine Tabelle namens SurveyResponses die Antworten auf eine Umfrage speichert. Einige der Fragen sind optional, weshalb es einige Befragte mit Antwortwerten von NULL gibt; sie haben die optionalen Fragen übersprungen. Sie können die Beispieldaten unten sehen:

ResponseID	RespondentID	RespondentName	QuestionID	Answer
1	101	John	1	Agree
2	101	John	2	No
3	101	John	3	Yes
4	102	Sarah	1	Yes
5	102	Sarah	2	Not Sure
6	102	Sarah	3	NULL
7	103	Mark	1	No
8	103	Mark	2	Maybe
9	103	Mark	3	No
10	104	Emily	1	Yes
11	104	Emily	2	Not Sure
12	104	Emily	3	Disagree

COUNT(*) - Zählen von Zeilen

Die häufigste Verwendung der Funktion COUNT (und ihre Standardfunktionalität, auch wenn sie mit GROUP BY verwendet wird) besteht darin, die Anzahl der Zeilen zu zählen. Wenn wir beispielsweise die Antworttypen von Umfragefragen zählen wollen, können wir die folgende Abfrage verwenden:

SELECT COUNT(*) AS NumberOfYesAnswers, Answer
FROM SurveyResponses
GROUP BY Answer;

Die Ausgabe sieht dann so aus:

NumberOfAnswers	Answer
3	Yes
3	No
2	Not Sure
1	Agree
1	Disagree
1	Maybe
1	NULL

Das Ergebnis dieser Abfrage ist eine Zählung aller Zeilen, die einer bestimmten Antwort entsprechen. Sie gibt die Gesamtzahl der Umfrageantworten und den Typ der Antwort zurück.

Zählen von NON-NULL-Werten in einer Spalte

Schauen wir uns ein anderes Beispiel an, das auf den ersten Blick die gleichen Ergebnisse liefern könnte. In diesem Beispiel gibt es jedoch eine wichtige Besonderheit: Anstatt * als Parameter in unserer Funktion COUNT() zu verwenden, verwenden wir COUNT() mit einem Spaltennamen.

Wir werden die Abfrage im vorherigen Beispiel ändern. Anstelle des Parameters * für die Funktion COUNT() werden wir ihn durch die Spalte Answer ersetzen. Unsere neue Abfrage sieht wie folgt aus:

SELECT 
  COUNT(Answer) AS NumberOfAnswers, 
  AnswerFROM SurveyResponses
GROUP BY Answer;

Wenn wir diese neue Abfrage ausführen, werden wir feststellen, dass die zurückgegebenen Ergebnisse fast genau dieselben sind:

NumberOfAnswers	Answer
3	Yes
3	No
2	Not Sure
1	Agree
1	Disagree
1	Maybe
0	NULL

Wir können sehen, dass sich die Ausgabe für den NULL Antwortwert von 1 auf 0 geändert hat. Das liegt daran, dass die Funktion COUNT() bei der Aggregation nur die Werte berücksichtigt, die nichtNULL sind.

Vorher haben wir COUNT(*) verwendet, was implizit bedeutet, dass die Zeilen gezählt werden; COUNT(Answer) wird die Werte in der Spalte Answer zählen. Und da wir mit NULL einen Wert hatten, werden diese Werte bei der Berechnung übersprungen - in diesem zweiten Szenario wird 0 zurückgegeben.

Zählen von eindeutigen NON-NULL-Werten in einer Spalte

In dieser dritten Variante der Verwendung der Funktion COUNT verwenden wir dieselbe Abfrage wie in unserem vorherigen Beispiel. Dieses Mal fügen wir jedoch das Schlüsselwort DISTINCT vor dem Spaltennamen hinzu.

SELECT 
  Answer, 
  COUNT(DISTINCT Answer) AS DistinctCount
FROM SurveyResponses
GROUP BY Answer;

Status	DistinctCount
Yes	1
No	1
Not Sure	1
Agree	1
Disagree	1
Maybe	1
NULL	0

In der obigen Ausgabe können wir sehen, dass das Ergebnis dieser Abfrage alle positiven Werte in der Spalte DistinctCount auf 1 gesetzt hat. Das Hinzufügen des Schlüsselworts DISTINCT bedeutet, dass die Funktion COUNT jedes Mal, wenn sie einen neuen Wert findet, den sie noch nicht gesehen hat, diesen Status zu ihrer Liste hinzufügt und eine 1 zu ihrer Anzahl hinzufügt. Findet sie jedoch denselben Statuswert ein zweites Mal oder öfter, überspringt sie das Zählen.

Möchten Sie mehr über COUNT() und GROUP BY wissen?

Die Verwendung von COUNT() mit GROUP BY ist nur eine der vielen leistungsstarken Funktionen, die SQL bietet. Wenn Sie SQL weiter erforschen und seine Möglichkeiten wirklich beherrschen möchten, empfehle ich Ihnen unseren umfassenden Kurs SQL für Anfänger . Wenn Sie auf der Suche nach SQL-Übungen sind, empfehle ich Ihnen unseren SQL-Praxis Track, der über 600 SQL-Übungen enthält.

Nachdem Sie unsere Kurse besucht haben, haben Sie vielleicht das Gefühl, dass Sie einen Job im Bereich SQL finden möchten. Um Ihnen bei der Vorbereitung auf Ihr Vorstellungsgespräch zu helfen, haben wir eine Liste von SQL-Vorstellungsfragen zusammengestellt, die Ihnen einige Beispiele für Fragen und Probleme in SQL aus der Praxis zeigt.

Tags: