24th Nov 2022 11 Leseminuten

Was ist der Unterschied zwischen WHERE- und HAVING-Klauseln in SQL?

GROUP BY

Inhaltsverzeichnis

Logischer Ablauf von Abfragen mit WHERE und HAVING
Zunächst zu den Essentials: Bedingungen in WHERE und HAVING spezifizieren
Beispiele
Unterschied zwischen WHERE- und HAVING-Klauseln in SQL

Da die Datenmenge in der Welt von Tag zu Tag wächst, steigt der Bedarf an einer effizienten Verwaltung und Abfrage von Daten. SQL bietet Möglichkeiten zur Manipulation und Abfrage von Daten in jeder Größenordnung. Ein wichtiger Teil davon sind die WHERE- und HAVING-Klauseln, mit denen Sie Daten nach Bedarf filtern können, aber sie sind nicht dasselbe. Wir werden die Unterschiede zwischen ihnen im Detail erklären.

Eine der häufigsten Aufgaben bei der Bearbeitung und Abfrage von Daten ist das Filtern mithilfe der Klauseln WHERE und HAVING. Obwohl beide Klauseln Daten auf der Grundlage von benutzerdefinierten Bedingungen und/oder Funktionen filtern, gibt es wichtige Unterschiede in der Art und Weise, wie jede Klausel ausgeführt wird.

In diesem Artikel wird ausführlich erläutert, wann WHERE oder HAVING verwendet werden sollte. Wir werden kurz den logischen Ablauf einer SQL-Abfrage erläutern, die die Klauseln WHERE und/oder HAVING enthält, und anschließend einige praktische Szenarien und Beispiele vorstellen, die wir gemeinsam lösen können.

Logischer Ablauf von Abfragen mit WHERE und HAVING

Die Reihenfolge, in der Sie eine SQL-Abfrage schreiben, unterscheidet sich von der Reihenfolge der Ausführung. Betrachten wir das Folgende als Beispiel:

SELECT country_id, city, MIN(salary), MAX(salary) 
FROM hr.emp_details_view
WHERE country_id IN ('US', 'UK')
GROUP BY country_id, city
HAVING MIN(salary) < 15000
ORDER BY country_id;

Der logische Ablauf einer SQL-Abfrage ist in der folgenden Abbildung dargestellt.

Reihenfolge der Ausführung in SQL-Abfragen

Abbildung 1: Reihenfolge der Ausführung von SQL-Abfragen.

Die logische Verarbeitung einer SQL-Abfrage beginnt mit einer FROM -Anweisung, die Daten aus den in der Abfrage aufgeführten Tabellen sammelt. Sie kann auch eine JOIN Klausel enthalten, die zwei oder mehr Tabellen mit dem ON Operator kombiniert.

Beachten Sie, dass die in der WHERE Klausel verwendeten Bedingungen auch im ON Operator der JOIN Klausel verwendet werden können. Ebenso können die Tabellen, die mit den Bedingungen des ON -Operators der JOIN -Klausel kombiniert wurden, in der WHERE -Klausel verwendet werden. Sie sollten jedoch eine WHERE nur für Bedingungen verwenden, die einzelne Zeilen filtern. Dies verbessert die Lesbarkeit der Abfrage und ermöglicht es dem ON Operator, nur die Kombination der Tabellen zu verarbeiten, was sein Zweck ist.
Der nächste Schritt im logischen Ablauf ist die WHERE Klausel, die die Datensätze auf diejenigen filtert, die die benutzerdefinierte(n) Bedingung(en) und/oder Funktion(en) erfüllen, und diese weitergibt.
Auf die WHERE -Klausel folgt die GROUP BY -Klausel, die die von der WHERE -Bedingung erhaltenen Datensätze gruppiert. Die in der GROUP BY -Klausel aufgelistete(n) Spalte(n) können beispielsweise die Mannschaften sein, und andere Spalten werden durch die Aggregatfunktion(en) aggregiert und den entsprechenden Gruppen/Teams zugeordnet.
Als nächstes folgt die Klausel HAVING, die nicht einzelne Datensätze, sondern die in GROUP BY erstellten Gruppen filtert.
An diesem Punkt geht die logische Verarbeitung an den Befehl SELECT. Er wertet aus, welche Spalten an die Ausgabe gesendet werden sollen. Er wertet auch alle Schlüsselwörter wie UNIQUE, DISTINCT und TOP aus, falls sie enthalten sind.
Die Klausel ORDER BY wird am Ende des logischen Ablaufs ausgeführt. Sie sortiert die Daten nach der/den in ihr angegebenen Spalte(n) und standardmäßig in aufsteigender Reihenfolge.

Zunächst zu den Essentials: Bedingungen in WHERE und HAVING spezifizieren

Es gibt eine ganze Reihe von Operatoren, mit denen wir Bedingungen in WHERE und HAVING Klauseln erstellen und kombinieren können:

Vergleichszeichen: <, >, <=, >=, =, <>
Nullwertprüfung: IS NULL, IS NOT NULL
Wildcards: LIKE, '%=_'
Bereichsprüfung: BETWEEN
Prüfung des Vorhandenseins in einer Menge: IN
Existenzprüfung: EXISTS
Quantifizierte Vergleichszeichen: ALL, ANY, SOME
logische Kombination der Bedingungen: AND, OR, NOT

Die Operanden in einer WHERE -Klausel können die in SELECT aufgeführten Spalten umfassen, mit Ausnahme der in Aggregatfunktionen verwendeten Spalten. Im Gegensatz dazu filtert HAVING nach den Ergebniswerten der Aggregatfunktion, wie z. B. SUM(), COUNT(), und AVG(), unter anderem.

Beispiele

Die Tabellen employee und emp_details_viewwerden in den folgenden Beispielen teilweise verwendet.

SELECT * 
FROM hr.employees;

EMPLOYEE_ID	LAST_NAME	MANAGER_ID	HIRE_DATE	SALARY	JOB_ID
101	Kochhar	100	21-SEP-05	17000	AD_VP
102	De Haan	100	13-JAN-01	17000	AD_VP
108	Greenberg	101	17-AUG-02	12008	FI_MGR
103	Hunold	102	03-JAN-06	9000	IT_PROG
105	Austin	103	25-JUN-05	4800	IT_PROG
116	Baida	114	24-DEC-05	2900	PU_CLERK
117	Tobias	114	24-JUL-05	2800	PU_CLERK
145	Russell	100	01-OCT-04	14000	SA_MAN
148	Cambrault	100	15-OCT-07	11000	SA_MAN

SELECT * 
FROM hr.emp_details_view;

EMPLOYEE_ID	LAST_NAME	FIRST_NAME	SALARY	DEPARTMENT_ID	COUNTRY_ID	CITY	LOCATION_ID
103	Hunold	Alexander	9000	60	US	Southlake	1400
105	Austin	David	4800	60	US	Southlake	1400
101	Kochhar	Neena	17000	90	US	Seattle	1700
102	De Haan	Lex	17000	90	US	Seattle	1700
108	Greenberg	Nancy	12008	100	US	Seattle	1700
116	Baida	Shelli	2900	30	US	Seattle	1700
117	Tobias	Sigal	2800	30	US	Seattle	1700
145	Russell	John	14000	80	UK	Oxford	2500
148	Cambrault	Gerald	11000	80	UK	Oxford	2500

Szenario I: Die WHERE-Klausel

Die Klausel WHERE wird verwendet, um einzelne Zeilen von Daten zu filtern, die mit SELECT aus der Datenbank geholt wurden. Die Datensätze, die die WHERE Bedingung(en) nicht erfüllen, werden nicht in die Ausgabe aufgenommen.

Schauen wir uns ein Beispiel an:

where age > 25 AND city='New York'

Es werden nur die Datensätze übergeben, deren Alter größer als 25 ist und deren city New York ist.

In der Abfragesyntax wird die WHERE -Klausel direkt nach SELECT und FROM verwendet. Sie filtert einzelne Zeilen - rohe, nicht gruppierte Datensätze -, die von der Abfrage abgerufen werden, um zu bestimmen, welche Datensätze an die GROUP BY -Klausel weitergegeben werden sollen.

Untersuchen wir die Ausgabe der folgenden Abfrage, die die WHERE -Klausel verwendet.

SELECT last_name, hire_date, manager_id 
FROM hr.employees
WHERE last_name LIKE '%a%' 
AND (hire_date BETWEEN '01-JAN-05' AND '01-JAN-07') 
AND manager_id IS NOT NULL;

LAST_NAME	HIRE_DATE	MANAGER_ID
Baida	24-DEC-05	114
Kochhar	21-SEP-05	100
Tobias	24-JUL-05	114

Das obige Beispiel gibt die Spalten last_name, hire_date, und manager_id aus der Tabelle hr.employee. Die WHERE Klausel filtert die Ausgabe wie folgt:

last_name muss einen Buchstaben "a" enthalten;
hire_date muss größer als oder gleich 01-JAN-05 und kleiner als oder gleich 01-JAN-07 sein; und
manager_id muss einen Wert haben und darf nicht null sein.

Nur die Datensätze, die die Bedingungen von WHERE erfüllen, werden in der Ausgabe angezeigt.

Sehen wir uns ein weiteres Beispiel aus demselben Szenario an:

SELECT employee_id, salary, job_id 
FROM hr.employees
WHERE (salary < 3000 OR salary = 9000) 
AND job_id IN ('IT_PROG', 'FI_MGR', 'PU_CLERK');

EMPLOYEE_ID	SALARY	JOB_ID
103	9000	IT_PROG
116	2900	PU_CLERK
117	2800	PU_CLERK

Dieses Beispiel gibt die Spalten employee_id, salary, und job_id aus der Tabelle hr.employee. Die WHERE Klausel filtert die Ausgabe wie folgt:

salary muss kleiner als 3000 sein, oder gleich 9000 sein; und
job_id muss gleich einem beliebigen Wert sein, der im Operator IN aufgeführt ist.

Wie bei der vorherigen Abfrage enthält die Ausgabe nur die Datensätze, die die Bedingung WHERE erfüllen.

Beachten Sie, dass WHERE keine Bedingungen enthalten kann, die Aggregatfunktionen beinhalten. Das ist die Aufgabe von HAVING.

Szenario II: Die HAVING-Klausel

HAVING wird verwendet, um Gruppen von Datensätzen zu filtern, die durch die GROUP BY Klausel erstellt wurden. Aus diesem Grund muss die HAVING -Klausel auf die GROUP BY -Klausel folgen. Sie ähnelt der WHERE -Klausel, die die SELECT -Ausgabe filtert, nur dass WHERE einzelne Datensätze filtert, während HAVING Gruppen filtert.

Aggregatfunktionen wie SUM(), MAX(), MIN(), AVG() und COUNT() stehen im Mittelpunkt der HAVING -Klausel.

Sehen wir uns das in den Beispielen an.

SELECT SUM(salary), department_id 
FROM hr.emp_details_view
GROUP BY department_id
HAVING SUM(salary) > 10000;

SUM(SALARY)	DEPARTMENT_ID
34000	90
13800	60
12008	100
25000	80

Im obigen Beispiel werden die Abteilungen zusammen mit der Summe aller Gehälter in jeder Abteilung aufgelistet. In der Ausgabe werden nur die department_idaufgeführt, deren Gehaltssumme größer als 10000 ist. Diejenigen, die die durch die Klausel HAVING festgelegte Bedingung nicht erfüllen, werden herausgefiltert.

Schauen wir uns ein anderes Beispiel an:

SELECT COUNT(employee_id), job_id, salary
FROM hr.employees
WHERE salary > 12000
GROUP BY job_id, salary
HAVING COUNT(employee_id) < 10;

COUNT(EMPLOYEE_ID)	JOB_ID	SALARY
1	SA_MAN	14000
2	AD_VP	17000
1	FI_MGR	12008

Diese Abfrage listet die Anzahl der Mitarbeiter für jede Kombination von job_id und Gehalt auf. Die WHERE Klausel filtert die Datensätze auf diejenigen mit einem Gehalt von mehr als 12000. Die GROUP BY -Klausel, die auf eine WHERE folgt, gibt die Gruppierung nach den nicht aggregierten Spalten job_id und salary an. Schließlich legt die HAVING Klausel fest, dass der aggregierte Wert COUNT(employee_id) kleiner als 10 sein muss.

Szenario III: Die GROUP BY-Klausel

WHERE mit einer GROUP BY-Klausel

Die Klausel WHERE muss immer vor GROUP BY stehen. Der Grund dafür ist, dass WHERE einzelne Datenzeilen filtert, nicht Gruppen von Zeilen. Die GROUP BY -Klausel nimmt die einzelnen Zeilen aus dem Ergebnis des Filters auf Zeilenebene WHERE, um Gruppen von Zeilen zu erstellen.

Hier ist ein Beispiel:

SELECT job_id, SUM(salary) 
FROM hr.employees
WHERE manager_id IN (100, 101, 102, 103)
GROUP BY job_id;

JOB_ID	SUM(SALARY)
AD_VP	34000
FI_MGR	12008
IT_PROG	13800
SA_MAN	25000

Die obige Abfrage wird wie folgt ausgewertet:

Die WHERE -Klausel filtert zunächst die Datensätze mit manager_id heraus, die nicht in der Liste nach dem IN -Operator enthalten sind.
Die GROUP BY Klausel gruppiert dann die Datensätze nach job_id, die die WHERE Bedingung erfüllen.

Die Abfrage berechnet die Gesamtgehälter der Mitarbeiter, die von jedem der angegebenen Manager (manager_ids 100, 101, 102, 103) verwaltet werden. Die Gehälter der Mitarbeiter, die anderen Managern unterstellt sind, werden bei der Berechnung dieser Summe nicht berücksichtigt.

HAVING mit einer GROUP BY-Klausel

Die GROUP BY Klausel wird häufig mit Aggregatfunktionen verwendet. Sie erzeugt Summenwerte für die in GROUP BY aufgeführten Spalten.

Im Gegensatz dazu folgt HAVING immer auf eine GROUP BY Klausel, da HAVING mit den durch GROUP BY erstellten Gruppen arbeitet.

Betrachten wir einen Fall, in dem HAVING verwendet wird und die GROUP BY nicht weggelassen werden kann. Dies ist der Fall, wenn in SELECT Spalten aufgeführt sind, die von den Aggregatfunktionen nicht verwendet werden, wie z. B. department_id im folgenden Beispiel. Diese nicht aggregierten Spalten müssen in GROUP BY aufgeführt werden, um Daten zu gruppieren.

SELECT avg(salary), department_id 
FROM hr.emp_details_view
GROUP BY department_id
HAVING avg(salary) < 15000;

AVG(SALARY)	DEPARTMENT_ID
2850	30
6900	60
12008	100
12500	80

HAVING kann jedoch ohne eine begleitende GROUP BY verwendet werden. Beachten Sie, dass in diesem Fall HAVING auf die gesamte Ausgabe von SELECT angewendet wird und diese als eine einzige Gruppe behandelt wird. Nachstehend finden Sie ein Beispiel:

SELECT round(avg(salary))
FROM hr.emp_details_view
HAVING avg(salary) < 11000;

ROUND(AVG(SALARY))
10056

Die Abfrage gibt einen einzigen Wert zurück, der den Durchschnitt aller Gehälter enthält. Beachten Sie, dass die HAVING Klausel eine Grenze für diesen aggregierten Wert setzt. Wäre der berechnete Durchschnitt größer als 11000 gewesen, hätte die Abfrage keine Datensätze zurückgegeben.

Das nächste Beispiel ist ein Pseudo-Aggregat, bei dem Aggregatfunktionen anstelle einer GROUP BY verwendet werden:

SELECT MIN(first_name), MIN(department_id), MAX(salary)
FROM hr.emp_details_view
HAVING MIN(salary) > 1000;

MIN(FIRST_NAME)	MIN(DEPARTMENT_ID)	MAX(SALARY)
Alexander	30	17000

Die Funktion MIN() wird hier für die Spalten first_name und department_id verwendet. Sie wird nicht in einer typischen Verwendung von Aggregatfunktionen aufgerufen, sondern um eine GROUP BY zu vermeiden. In diesem Fall ist die Ausgabe nur ein einziger Datensatz, der aus dem Minimalwert für first_name, dem Minimalwert für department_id und dem Maximalwert für Gehalt besteht, jeweils aus der gesamten Tabelle. Beachten Sie, dass diese 3 Werte aus 3 verschiedenen Datensätzen stammen können, wie es in diesem Beispiel der Fall ist. Außerdem würde die Abfrage in diesem Fall keinen Datensatz zurückgeben, wenn das Mindestgehalt in der gesamten Tabelle 1000 oder weniger betragen würde.

Dieses Beispiel ist ein wenig künstlich, damit wir Ihnen etwas Einfacheres zeigen können. Pseudo-Aggregation ist zwar weniger verbreitet als GROUP BY, kann aber in Abfragen verwendet werden, die alle eingeschlossenen Zeilen als eine Gruppe behandeln.

Die Verwendung von HAVING mit oder ohne GROUP BY kann je nach Datenbank variieren. Wenn Sie mehr über die GROUP BY Klausel erfahren möchten, lesen Sie bitte den Artikel GROUP BY Klausel.

Szenario IV: Gemeinsame Verwendung der WHERE- und HAVING-Klauseln

Die Syntax für die Verwendung von WHERE und HAVING in einer Abfrage folgt der unten dargestellten spezifischen Reihenfolge:

SELECT: wählt die Spalten aus der Datenbank aus, die im Ergebnis ausgegeben werden sollen.
FROMListe der Tabellen, die in der Abfrage verwendet werden sollen.
WHEREFiltert einzelne Datensätze.
GROUP BY: gruppiert die Datensätze auf der Grundlage der angegebenen Spalte(n).
HAVING: filtert die durch GROUP BY definierten Gruppen.
ORDER BY: sortiert die Ausgabedatensätze nach der/den angegebenen Spalte(n).

Schauen wir uns ein Beispiel an, das alle oben genannten Punkte verwendet.

SELECT country_id, city, MIN(salary), MAX(salary) 
FROM hr.emp_details_view
WHERE country_id IN ('US', 'UK')
GROUP BY country_id, city
HAVING MIN(salary) < 15000
ORDER BY country_id;

COUNTRY_ID	CITY	MIN(SALARY)	MAX(SALARY)
UK	Oxford	11000	14000
US	Seattle	2800	17000
US	Southlake	4800	9000

Die Abfrage ruft das Minimum salary und das Maximum salary für jede Kombination von city und country_id ab, wobei letzteres durch die Bedingung WHERE nur auf die USA und das Vereinigte Königreich beschränkt ist.

Angenommen, Sie haben 10 Datensätze mit den USA als country_id, und darin sind 5 Datensätze mit New York als Stadt und weitere 5 mit Los Angeles als Stadt. Wenn Sie die obige Abfrage ausführen, werden aus diesen 10 Datensätzen 2 Datensätze:

ein Datensatz für die USA und New York, mit den Mindest- und Höchstgehältern,
ein weiterer Datensatz für die USA und Los Angeles, ebenfalls mit den Mindest- und Höchstgehältern.

Weitere Informationen zu den Unterschieden zwischen WHERE und HAVING finden Sie im Artikel über SQL HAVING vs. WHERE.

Szenario V: WHERE und HAVING mit JOINs

Das folgende Beispiel geht noch einen Schritt weiter und verwendet ein JOIN mit WHERE und HAVING. Es verbindet die Daten aus zwei Tabellen auf der Grundlage einer gemeinsamen Spalte, employee_id. Die Klauseln WHERE und HAVING folgen der soeben besprochenen Reihenfolge der Ausführung.

SELECT e.job_id, edv.location_id, SUM(e.salary)
FROM hr.employees e
JOIN hr.emp_details_view edv
ON e.employee_id=edv.employee_id
WHERE e.job_id IN ('IT_PROG', 'SA_MAN')
GROUP BY e.job_id, edv.location_id
HAVING SUM(e.salary) > 5000
ORDER BY e.job_id;

JOB_ID	LOCATION_ID	SUM(E.SALARY)
IT_PROG	1400	13800
SA_MAN	2500	25000

In diesem Beispiel wird die Spalte job_id aus der Tabelle hr.employee, die Spalte location_id aus der Tabelle hr.emp_details_viewund die Gesamtgehälter für jede Kombination von job_id und location_id. Die Bedingung für die Verknüpfung der Tabellen ist im Operator ON aufgeführt. Diese Bedingung basiert auf der gemeinsamen Spalte employee_id.

Als nächstes filtert die WHERE -Klausel die Datensätze auf job_ids, die entweder IT_PROG oder SA_MAN sind. Die GROUP BY -Klausel gruppiert die Datensätze nach der Kombination der Spalten job_id und location_id. Schließlich filtert die HAVING -Klausel den aggregierten Wert SUM(e.salary) auf diejenigen, die größer als 5000 sind.

Die Klausel ORDER BY sortiert die Ausgabedatensätze (standardmäßig in aufsteigender Reihenfolge) nach der Spalte job_id. Weitere Informationen zu den Klauseln GROUP BY und ORDER BY finden Sie in dem Artikel GROUP BY vs. ORDER BY.

Unterschied zwischen WHERE- und HAVING-Klauseln in SQL

Hier ist eine Zusammenfassung der Unterschiede zwischen WHERE und HAVING Klauseln in SQL:

	`WHERE` clause	`HAVING` clause
Filtering	Filters individual rows fetched by `SELECT`, i.e., the output of the `SELECT` command	Filters groups of rows created by `GROUP BY`, i.e., the output of the `GROUP BY` clause
Conditions	Cannot have conditions containing aggregate functions	Focuses on conditions containing aggregate functions
Syntax	`WHERE` comes before `GROUP BY` in the syntax	`HAVING` comes after `GROUP BY` in the syntax
Order of evaluation	`WHERE` clause is evaluated before `GROUP BY` in the process flow, before aggregation is performed	`HAVING` clause is evaluated after `GROUP BY` in the process flow, after aggregation is performed
With/without GROUP BY	Can be used with or without `GROUP BY`, since `WHERE` and `GROUP BY` are not related	Should be used with `GROUP BY`; otherwise, the output of `SELECT` is treated as one group

WHERE und HAVING sind ein wichtiger Bestandteil beim Erlernen von SQL. Schauen Sie sich den SQL für Anfänger Kurs, um Ihre SQL-Kenntnisse zu verbessern.

Tags:

GROUP BY