Zurück zur Artikelliste Artikel
10 Leseminuten

SQL und Chill: 5 lustige Datensätze zum Üben an einem Freitagabend

Haben Sie genug von langweiligen Übungsdatensätzen, bei denen sich SQL wie Arbeit anfühlt? Lehnen Sie sich zurück und verbessern Sie Ihre Fähigkeiten mit fünf lustigen, skurrilen Datensätzen, mit denen das Lernen von SQL mehr wie ein Spiel aussieht.

Es ist Freitagabend. Sie sind nicht in der Stimmung auszugehen, es gibt nichts Gutes mehr zu streamen, und Ihr Gehirn sehnt sich nach etwas Befriedigenderem als dem Scrollen auf Ihrem Handy. Also schalten Sie Ihren Laptop ein, öffnen Ihren SQL-Editor und lassen sich auf eine andere Art der Entspannung ein.

SQL - die strukturierte Abfragesprache - ist die Sprache, die Daten verarbeitet. Sie hilft Ihnen, Erkenntnisse aus riesigen Tabellen zu ziehen, Muster zu erkennen und Fragen zu beantworten wie "Welches ist unser meistverkauftes Produkt in diesem Monat?" oder "Welcher Pizzabelag ist der wahre Publikumsliebling?" SQL ist überall - in der Wirtschaft, in der Technik, im Marketing - und in Ihrer Zukunft, wenn Sie auch nur ein bisschen neugierig auf Daten sind.

Aber die Sache ist die: Beim Erlernen von SQL geht es nicht darum, Befehle auswendig zu lernen. Es geht um Praxis. Es geht darum, Abfragen zu schreiben, sie auszuführen, sie zu korrigieren, wenn sie nicht funktionieren, und diese kleinen Aha-Momente zu genießen, wenn die Ergebnisse endlich einen Sinn ergeben. Das bedeutet, dass sich Übung nicht wie Hausaufgaben anfühlen muss!

Um das zu beweisen, haben wir fünf lustige, verrückte und einfach nur interessante Datensätze zusammengestellt, die Ihnen helfen, Ihre SQL-Kenntnisse zu verbessern und dabei auch noch Spaß zu haben. Denken Sie dabei weniger an die Personaldatenbank eines Unternehmens, sondern eher an UFO-Sichtungen und Filmbewertungen.

Und wenn Sie den Schwung beibehalten wollen, besuchen Sie den SQL-Praxis Track auf LearnSQL.com. Es ist ein interaktiver Lernpfad für alle, die aufhören wollen, über SQL zu lesen, und anfangen wollen, es zu tun.

Lasst uns SQL und entspannen.

IMDb-Filme-Datensatz

Was ist in dem Datensatz enthalten? Die nicht-kommerziellen Datensätze von IMDb bieten Ihnen Zugang zu einer Vielzahl von filmbezogenen Informationen, die sich perfekt für die Erforschung mit SQL eignen. Der Datensatz enthält mehrere verknüpfte Tabellen (im TSV-Format), die Folgendes umfassen:

  • Grundlegende Filminformationen: Titel, Erscheinungsjahr, Genre, Laufzeit und ob es sich um einen Film, einen Kurzfilm oder eine TV-Episode handelt.
  • Bewertungsdaten: Durchschnittliche Nutzerbewertungen und Anzahl der Stimmen pro Titel.
  • Angaben zum Team: Regisseure und Autoren, die mit den einzelnen Filmen in Verbindung stehen.
  • Informationen zur Besetzung: Die wichtigsten Schauspieler und Schauspielerinnen und ihre Rollen.
  • Personenprofile: Namen, Geburtsjahre, Berufe und bemerkenswerte Werke.

Wo man es bekommt: https://developer.imdb.com/non-commercial-datasets/

Welche SQL-Konzepte können Sie üben? IMDb bietet einen relationalen Datensatz mit realitätsnaher Komplexität. Er ist ideal zum Üben von Verknüpfungen, Filtern, Gruppierungen und mehr, während Sie in die Welt des Films eintauchen.

  • SELECT WHERE und Filtern nach Text oder Zahl
  • ORDER BY Filme nach Bewertung oder Beliebtheit zu ordnen
  • GROUP BY und Aggregatfunktionen (wie AVG(), COUNT())
  • LIMIT um die besten Ergebnisse zu finden
  • Filtern mit IN, BETWEEN, und LIKE

Lustige Abfrage-Ideen:

  • Welches sind die 10 am besten bewerteten Komödien, die nach 2010 veröffentlicht wurden?
  • Wer ist der beständigste Regisseur, der einen Hit nach dem anderen ohne viele Flops abliefert?
  • Welche Fortsetzungen von Komödien werden besser bewertet als das Original?
  • Welche Schauspieler haben in den am besten bewerteten Filmen mitgespielt (z. B. IMDb-Bewertung > 8)?
  • Welches sind die längsten Filme, die je gedreht wurden (und waren sie es wert)?

Empfohlenes Sprachniveau: Anfänger bis Fortgeschrittene. Hervorragend geeignet, um grundlegende SQL-Kenntnisse mit realen Daten zu üben.

Die Simpsons-Folgen-Datensatz

Was ist in dem Datensatz enthalten? Die Simpsons sind die am längsten laufende Zeichentrickserie in der Fernsehgeschichte und bekannt für ihre schrulligen Charaktere, ihren scharfen Humor und ihre überraschend tiefgründigen sozialen Kommentare. Dieses Dataset fängt das Wesen der Serie in mehr als 600 Episoden ein und bietet Ihnen eine strukturierte Möglichkeit, Springfield anhand von Daten zu erkunden.

Der Datensatz enthält mehrere verknüpfte Tabellen:

  • Episoden - Titel, Ausstrahlungstermine, Staffeln, Episodennummern und Kurzbeschreibungen.
  • Charaktere - Alle Charaktere, von der Simpson-Familie bis hin zu obskuren Stadtbewohnern, haben eine eindeutige ID.
  • Orte - Orte, die in der Serie vorkommen, wie Moe's Tavern, Springfield Elementary und der Kwik-E-Mart.
  • Drehbuchzeilen - Über 150.000 Dialogzeilen mit Informationen darüber, wer was gesagt hat, in welcher Folge und wo es passiert ist.

Wo man es bekommt: https://www.kaggle.com/datasets/prashant111/the-simpsons-dataset

Welche SQL-Konzepte können Sie üben?

  • Verknüpfen mehrerer Tabellen (Charaktere, Episoden, Orte, Drehbuchzeilen)
  • Filtern von Text mit LIKE und LOWER()
  • Zählen und Gruppieren mit GROUP BY und COUNT()
  • Finden von eindeutigen Werten mit DISTINCT
  • Analysieren des Auftretens von Charakteren mit ORDER BY und LIMIT

Lustige Abfrage-Ideen:

  • Welche Simpsons-Staffel hat die meisten Episoden?
  • Wer redet mehr: Bart oder Lisa?
  • Gibt es Figuren, die nur in einer Folge auftreten?
  • Welches sind die 5 am häufigsten verwendeten Orte in der Serie?
  • Welches sind die 10 Wörter, die Homer am häufigsten benutzt?

Empfohlenes Sprachniveau: Fortgeschritten. Dieser Datensatz ist ideal, wenn Sie sich mit Joins auskennen und bereit sind, in einer unterhaltsamen Umgebung mit Textdaten und Mehrtabellenabfragen zu experimentieren.

LEGO Datenbank

Was ist in dem Datensatz enthalten? Dieser Datensatz ist für Steinliebhaber und Datenforscher gleichermaßen gedacht. Er deckt Jahrzehnte offizieller LEGO Sets ab und erfasst alles, von winzigen Teilen bis hin zu umfangreichen thematischen Sammlungen. Die Daten sind in relationalen Tabellen organisiert, so dass Sie untersuchen können, wie LEGO Sets gebaut und katalogisiert werden. Die Tabellen enthalten:

  • Sets - Jedes LEGO Set mit seinem Namen, dem Erscheinungsjahr, dem Thema und der Anzahl der Teile.
  • Teile - Jedes einzelne Teil, mit Teilenummern, Namen und Kategorien.
  • Farben - Eine vollständige Liste der verfügbaren LEGO Steinfarben, einschließlich der RGB-Werte.
  • Bestände - Welche Teile sind in welchen Sets enthalten und in welcher Menge.
  • Inventarteile - Verbindet Sets, Teile und Farben - perfekt, um zu erforschen, wie Sets aufgebaut sind.
  • Themen - Das Thema, zu dem jedes Set gehört (z. B. Star Wars, Technic, City).

Es handelt sich um einen spielerischen, aber reichhaltigen Datensatz, der ideal ist, um Beziehungen in der realen Welt abzufragen und aus der Datenbankperspektive in die bunte Welt von LEGO einzutauchen.

Wo man ihn bekommt:

Welche SQL-Konzepte können Sie üben?

  • Multi-Tabelle JOINs (z. B. Verbindung von Sets, Teilen, Vorräten und Farben)
  • Filtern mit WHERE, IN, und BETWEEN
  • Aggregieren mit GROUP BY, COUNT(), und SUM()
  • Sortieren mit ORDER BY und Einschränken der Ergebnisse mit LIMIT
  • Hierarchien erforschen (z. B. Themen innerhalb von Themen)

Lustige Abfrage-Ideen:

  • Welches LEGO Set hat die meisten Teile?
  • Welches sind die 5 häufigsten LEGO Steinfarben? Welche sind die 5 am wenigsten verbreiteten?
  • In welchem Jahr wurden die meisten neuen LEGO Sets herausgebracht?
  • Gibt es Teile, die nur in einem Set vorkommen?
  • Welche Themen haben die höchste durchschnittliche Anzahl an Teilen pro Set?
  • Welche LEGO Themen sind am farbenfrohesten (gemessen an der Anzahl der verwendeten Steinfarben)?

Empfohlenes Fähigkeitsniveau: Fortgeschrittene. Ideal, wenn Sie die Grundlagen beherrschen und sich mit mehreren zusammenhängenden Tabellen vertraut machen wollen.

UFO-Sichtungen

Was ist in dem Datensatz? Dieser skurrile, einzigartige Datensatz enthält Tausende von UFO-Sichtungsberichten aus dem 20. Jahrhundert, die vom National UFO Reporting Center (NUFORC) gesammelt wurden. Jeder Eintrag enthält das Datum und die Uhrzeit der Sichtung, die Stadt, das Bundesland und das Land, in dem die Sichtung stattfand, die gemeldete Form des UFOs, die Dauer der Sichtung und sogar die Beschreibung des Ereignisses durch den Zeugen. Mit über 80.000 Einträgen - komplett mit Koordinaten - ist es die perfekte Spielwiese für alle, die neugierig auf mysteriöse Lichter am Himmel sind und wissen wollen, was die Daten über sie aussagen.

Wo man es bekommt: https://www.kaggle.com/datasets/NUFORC/ufo-sightings

Welche SQL-Konzepte können Sie üben?

  • Filtern nach Datum, Uhrzeit und Text mit WHERE, LIKE, und BETWEEN
  • Aggregationen mit COUNT(), AVG(), und GROUP BY
  • Sortieren mit ORDER BY
  • Arbeiten mit geografischen Daten (Städte, Staaten, Länder)
  • Grundlegende Ideen zur Datenbereinigung (z. B. Herausfiltern von unvollständigen oder ausreißerischen Einträgen)

Lustige Abfrage-Ideen:

  • Welcher US-Bundesstaat hatte in den 1990er Jahren die meisten UFO-Sichtungen?
  • Welches sind die häufigsten UFO-Formen, die im Laufe der Zeit gemeldet wurden?
  • Gibt es bestimmte Monate mit mehr Sichtungen als andere?
  • Wie lange dauert eine Sichtung je nach Form durchschnittlich?
  • Welche Städte sind UFO-"Hotspots", gemessen an der Zahl der Meldungen?

Empfohlenes Fähigkeitsniveau: Anfänger bis Fortgeschrittene. Dies ist eine gute Wahl, wenn Sie mit Filtern und Gruppierungen vertraut sind und zeit- und ortsbezogene Daten auf unterhaltsame Weise untersuchen möchten.

Ihr eigenes Netflix eingewickelt

Was ist in dem Datensatz enthalten? Dieser Datensatz ist ein bisschen anders, denn er gehört Ihnen. Im Gegensatz zu den meisten öffentlichen Datensätzen stammt dieser direkt von Ihrem eigenen Netflix-Konto. In Netflix Wrapped With SQL zeigen wir Ihnen genau, wie Sie Ihren persönlichen Fernsehverlauf herunterladen und in etwas verwandeln, das Sie mit SQL untersuchen können.

Viele Streaming-Plattformen wie Netflix und Spotify ermöglichen Ihnen den Zugriff auf Ihre eigenen Daten. Das ist eine gute Möglichkeit, SQL mit etwas zu lernen, mit dem Sie bereits verbunden sind.

Die Netflix-Viewing-History-Datei enthält zwei Hauptspalten:

  • Titel - Der Name des Films oder der Episode, die Sie gesehen haben.
  • Datum - Das genaue Datum, an dem Sie den Film gesehen haben.

Einfach, aber aussagekräftig. Mit diesen Informationen können Sie Ihre Sehgewohnheiten analysieren, Muster im Laufe der Zeit erkennen und sogar Fragen beantworten, von denen Sie nicht wussten, dass Sie sie über Ihre eigene Bildschirmzeit haben.

Wo Sie es bekommen: Befolgen Sie die Anweisungen in unserem früheren Artikel Netflix Wrapped With SQL.

Welche SQL-Konzepte können Sie üben?

  • Filtern nach Datum und Titel mit WHERE, LIKE, und BETWEEN
  • Aggregieren mit COUNT(), MAX(), AVG() und GROUP BY, um die Sehgewohnheiten zu analysieren
  • Sortieren der Ergebnisse mit ORDER BY, um die meistgesehenen Sendungen oder die meistgenutzten Tage zu finden
  • Arbeiten mit Datums-/Zeitfunktionen zum Extrahieren von Monaten oder Wochentagen oder zum Berechnen von Zeitabständen
  • Grundlegende Textbereinigung und -formatierung mit String-Funktionen wie SUBSTRING() oder TRIM() für Seriennamen und Episoden

Lustige Abfrage-Ideen:

  • Von welcher Fernsehserie haben Sie die meisten Episoden gesehen?
  • In welchem Monat haben Sie die meisten Inhalte auf Netflix geschaut?
  • An welchem Wochentag drücken Sie normalerweise auf "Play"?
  • Welche Genres sehen Sie sich am häufigsten an (falls Daten zu den Genres verfügbar sind)?
  • Wie oft schauen Sie im Durchschnitt etwas an - jeden Tag, alle paar Tage oder nur am Wochenende?

Empfohlenes Fähigkeitsniveau: Anfänger bis Fortgeschrittene. Dies ist ideal für alle, die mit grundlegenden SQL-Operationen vertraut sind und ihre Kenntnisse auf reale, personalisierte Daten anwenden möchten.

Bonus: Unser SQL-Praxis Datensätze Kurs

Möchten Sie die Freiheit haben, SQL auf eigene Faust zu erforschen, aber mit sofort einsetzbaren, gut organisierten Datenbanken? Der SQL-Praxis Datensätze Kurs auf LearnSQL.de bietet Ihnen Zugang zu einer Vielzahl von realistischen Datenbanken von Online-Shops, Universitäten, Museen und Musikplattformen. Im Gegensatz zu typischen Kursen mit Schritt-für-Schritt-Aufgaben können Sie sich in diesem Kurs frei bewegen. Sie erforschen Datenbankstrukturen auf eigene Faust, stellen eigene Fragen und schreiben Abfragen, um sie zu beantworten.

Die Datenbanken des Kurses umfassen:

  • Ein Universitätssystem (Studenten, Kurse, Noten)
  • Ein E-Commerce-Shop (Bestellungen, Produkte, Kunden)
  • Blog-Analysen (Seitenaufrufe, Benutzerverhalten)
  • Ein digitaler Musikladen (Künstler, Alben, Titelkäufe)
  • Das Museum für Moderne Kunst (Kunstwerke und Künstler)

Der Kurs eignet sich perfekt zum Üben des Zusammenfügens, Gruppierens, Filterns und des Schreibens von SQL in der Praxis - ohne dass Sie etwas einrichten müssen.

Sehen Sie sich den Kurs an unter: SQL-Praxis Datensätze auf LearnSQL.com

Bereit für SQL und Chillen?

SQL zu üben muss sich nicht wie Arbeit anfühlen - und es muss definitiv nicht mit langweiligen Mitarbeiterdatenbanken zu tun haben. Ganz gleich, ob Sie sich für Filme, UFO-Sichtungen, LEGO-Sets oder Ihre eigene Netflix-Historie interessieren, es gibt ein Dataset, mit dem das Lernen wie ein Spiel aussieht.

Wenn Sie also das nächste Mal einen ruhigen Abend haben, versuchen Sie es doch mal mit ein paar ausgefallenen Abfragen, anstatt nur zu scrollen. Wer weiß - vielleicht entdecken Sie ja eine neue Lieblingsbeschäftigung für sich.

Und wenn Sie noch mehr üben wollen, schauen Sie sich unseren SQL-Praxis Track an. Ihre zukünftigen SQL-Kenntnisse (und Ihr Lebenslauf) werden es Ihnen danken.