SQL ist nicht ganz einfach zu verstehen, speziell wenn es darum geht mehrere Tabellen mit joins zusammenzufassen bzw zu verknüpfen. Im Folgenden wird dem SQL Einsteiger sehr einfach mit Venn Diagrammen sowie einfachen SQL queries erklärt  wie die verschiedenen SQL joins funktionieren. Dazu werden zwei Beispieltabellen mit Daten benutzt und Joins beschrieben sowie deren Eingabedaten und Ergebnisse. Dateien zum Erstellen der Beispieldaten sowie die SQL queries können downloaded werden. Die Beispiele sind für mySQL und DB2.
 
sql_innerjoin.jpg sql_leftouterjoin.jpg sql_fullouterjoin.jpg sql_leftouterjoinminusintersection.jpg sql_fullouterjoinminusintersection.jpg

 

 
Zur Einführung werden Venn Diagramme benutzt. Im streng mathematischen Sinne benutzt man Venn Diagramme nur für Mengen und deren Operationen wie Vereinigung, Schnitt, Differenz usw, aber sie sind auch sehr hilfreich um sql joins zu erklären und zu verstehen.
 
Genaugenommen gibt es vier verschiedene sql joins die man verstehen muss:
 
1) inner join
2) left/right outer join
3) full outer join
4) karthesisches Produkt
 
Wenn man Venn Diagramme benutzt um die Joins zu erklären gibt es noch zwei weitere Joins, die Entsprechungen in den Venn Diagrammen haben und das Verständnis von Joins fördern.
 
5) Left outer join where null
6) Full outer joinwhere null
 
In den folgenden Venn Diagrammen findet man immer zwei Tabellen TabelleA und TabelleB, die jeweils Zeilen enthalten, in denen Namen und weitere Informationen stehen. Der Join wird immer über die Namen gemacht, d.h. es werden Zeilen in beiden Tabellen gesucht, die gleiche Namen haben und deren Joinergebnisse betrachtet.
 
Bei den folgenden Beispielen enthalten die Tabellen A und B folgende Spalten und Inhalt:
Jede Tabelle hat einen Schlüssel id, eine Spalte name sowie eine Spalte nation mit der Nationalität der Person sowie eine Spalte table, die entweder A oder B enthält um zu kennzeichnen, in welcher Tabelle die Zeilenstehen, also Tabelle A oder Tabelle B. 
 
Die sql Befehle um die Tabelle anzulegen und zu füllen können hier für mySQL und hier für DB2 runtergeladen werden.  Die Queries um die Joins über die Tabelle auszuführen befinden sich hier für mySQL und hier für DB2 zum download.
 
Tabelle A:
 
mysql> select * from TableA;
+----+-----------+---------+-------+
| id | name      | nation  | table |
+----+-----------+---------+-------+
|  1 | Albert    | Germany | A     | 
|  2 | Elizabeth | England | A     |
|  3 | Paul      | Spain   | A     |
|  4 | Julia     | Denmark | A     |
+----+-----------+---------+-------+                                                                                                                                
 
Tabelle B:
mysql> select * from TableB;
+----+--------+--------+-------+
| id | name   | nation | table |
+----+--------+--------+-------+
|  1 | Marc   | China  | B     |
|  2 | Albert | France | B     |
|  3 | Peter  | Japan  | B     |
|  4 | Paul   | Poland | B     |
+----+--------+--------+-------+
 

1) Inner join
 
Bei einem Inner join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind.
 
Beispiel:
 
mysql> select * from TableA inner join TableB on TableA.name = TableB.name;
+----+--------+---------+-------+----+--------+--------+-------+
| id | name   | nation  | table | id | name   | nation | table |
+----+--------+---------+-------+----+--------+--------+-------+
|  1 | Albert | Germany | A     |  2 | Albert | France | B     |
|  3 | Paul   | Spain   | A     |  4 | Paul   | Poland | B     |
+----+--------+---------+-------+----+--------+--------+-------+
 
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul.
 
sql_innerjoin.jpg
 

2) Left outer join
 
Bei einem left outer join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind sowie alle Elemente aus der linken Tabelle, die in diesem Falle Tabelle A ist.
 
Beispiel:
 
mysql> select * from TableA left outer join TableB on TableA.name = TableB.name;
+----+-----------+---------+-------+------+--------+--------+-------+
| id | name      | nation  | table | id   | name   | nation | table |
+----+-----------+---------+-------+------+--------+--------+-------+
|  1 | Albert    | Germany | A     |    2 | Albert | France | B     |
|  2 | Elizabeth | England | A     | NULL | NULL   | NULL   | NULL  |
|  3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
|  4 | Julia     | Denmark | A     | NULL | NULL   | NULL   | NULL  |
+----+-----------+---------+-------+------+--------+--------+-------+
 
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul aber auch die Elemente aus der Tabelle A, wo es keinen gleichen Namen in Tabelle B gibt (Elizabeth und Julia). Diese Elemente sind daran zu erkennen, dass der Teil der Ergebnisspalten, wo die Teile aus der Tabelle B stehen mit NULL gefüllt sind.
 
sql_leftouterjoin.jpg
 

   
3) Full outer join
 
Bei einem full outer join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind sowie alle Elemente aus den beiden Tabellen, diekeine gleichen Elemente haben.
 
Beispiel mysql: (Da mysql kein full outer join anbietet wird der full outer join über eine Vereinigung von dem left und right outer join vorgenommen, der dasselbe Ergebnis liefert)
 
mysql> select * from TableA left join TableB on TableA.name = TableB.name
    -> UNION
    -> select * from TableA right join TableB on TableA.name = TableB.name;
 
Beispiel DB2: (Richtiger full join)
 
select * from TableA full join TableB on TableA.name = TableB.name;
 
+------+-----------+---------+-------+------+--------+--------+-------+
| id   | name      | nation  | table | id   | name   | nation | table |
+------+-----------+---------+-------+------+--------+--------+-------+
|    1 | Albert    | Germany | A     |    2 | Albert | France | B     |
|    2 | Elizabeth | England | A     | NULL | NULL   | NULL   | NULL  |
|    3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
|    4 | Julia     | Denmark | A     | NULL | NULL   | NULL   | NULL  |
| NULL | NULL      | NULL    | NULL  |    1 | Marc   | China  | B     |
| NULL | NULL      | NULL    | NULL  |    3 | Peter  | Japan  | B     |
+------+-----------+---------+-------+------+--------+--------+-------+
 
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul aber auch die Elemente aus der Tabelle A, wo es keinen gleichen Namen in Tabelle B gibt (Elizabeth und Julia) sowie die Elemente aus Tabelle B, wo es kein gleichen Namen in Tabelle A gibt (Marc und Peter). Diese Elemente sind daran zu erkennen, dass der Teil der Ergebnisspalten, wo die Teile aus der anderen Tabelle nicht existieren mit NULL gefüllt sind.Bei dem Zusammenfügen (UNION) der beiden Tabellen ist zu berücksichtigen, dass dabei eigentlich die Zeilen, die gleiche Namen in beiden Tabellen haben, in der Ergebniszeile doppelt auftreten, da sie sowohl im left als auch right join enthalten sind. Allerdings entfernt die UNION diese doppelten Elemente. Im folgenden Beispiel wird durch UNION ALL diese Entfernung verhindert. Die Zeilen mit Albert und Paul tauchen zweimal auf.
 
mysql> select * from TableA left join TableB on TableA.name = TableB.name  UNION ALL  select * from TableA right join TableB on TableA.name = TableB.name;
+------+-----------+---------+-------+------+--------+--------+-------+
| id   | name      | nation  | table | id   | name   | nation | table |
+------+-----------+---------+-------+------+--------+--------+-------+
|    1 | Albert    | Germany | A     |    2 | Albert | France | B     |
|    2 | Elizabeth | England | A     | NULL | NULL   | NULL   | NULL  |
|    3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
|    4 | Julia     | Denmark | A     | NULL | NULL   | NULL   | NULL  |
| NULL | NULL      | NULL    | NULL  |    1 | Marc   | China  | B     |
|    1 | Albert    | Germany | A     |    2 | Albert | France | B     |
| NULL | NULL      | NULL    | NULL  |    3 | Peter  | Japan  | B     |
|    3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
+------+-----------+---------+-------+------+--------+--------+-------+
 
sql_fullouterjoin.jpg
 

  
4) Cross join - Karthesisches Produkt
 
In diesem Falle gibt es keine Join Bedingung. Deshalb werden  bei diesem join jeweils alle Zeilen der linken Tabelle mit den jeweiligen Zeilen der rechten Tabelle  zusammengeführt. D.h. die Ergebnistabelle enthält immer (Anzahl Zeilen TabelleA) * (Anzahl Zeilen TabelleB) Ergebniszeilen. Diese kann bei großen Ausgangstabellen sehr schnell riesige Ergebnistabellen ergeben deren Berechnung sehr zeit- und speicher aufwendig ist und sollte deshalb vermieden werden.
 
Beispiel: 
 
mysql> select * from TableA join TableB;
+----+-----------+---------+-------+----+--------+--------+-------+
| id | name      | nation  | table | id | name   | nation | table |
+----+-----------+---------+-------+----+--------+--------+-------+
|  1 | Albert    | Germany | A     |  1 | Marc   | China  | B     |
|  2 | Elizabeth | England | A     |  1 | Marc   | China  | B     |
|  3 | Paul      | Spain   | A     |  1 | Marc   | China  | B     |
|  4 | Julia     | Denmark | A     |  1 | Marc   | China  | B     |
|  1 | Albert    | Germany | A     |  2 | Albert | France | B     |
|  2 | Elizabeth | England | A     |  2 | Albert | France | B     |
|  3 | Paul      | Spain   | A     |  2 | Albert | France | B     |
|  4 | Julia     | Denmark | A     |  2 | Albert | France | B     |
|  1 | Albert    | Germany | A     |  3 | Peter  | Japan  | B     |
|  2 | Elizabeth | England | A     |  3 | Peter  | Japan  | B     |
|  3 | Paul      | Spain   | A     |  3 | Peter  | Japan  | B     |
|  4 | Julia     | Denmark | A     |  3 | Peter  | Japan  | B     |
|  1 | Albert    | Germany | A     |  4 | Paul   | Poland | B     |
|  2 | Elizabeth | England | A     |  4 | Paul   | Poland | B     |
|  3 | Paul      | Spain   | A     |  4 | Paul   | Poland | B     |
|  4 | Julia     | Denmark | A     |  4 | Paul   | Poland | B     |
+----+-----------+---------+-------+----+--------+--------+-------+ 

Man sieht also, dass das Ergebnis alle Zeilen aus der Tabelle A jeweils mit allen Elementen der Tabelle B zusammengefügt hat. Dabei tauchen keine Spalten mit NULL auf.
 
Eine Darstellung als Venn Diagramm gibt es dafür nicht.     
 

 
5) Left outer join where null
 
Bei diesem join werden alle Zeilen aus der Tabelle A mit der Tabelle B zusammengeführt, wo es keine gleichen Elemente gibt. Es entspricht also auch dem left outer join wo der inner join entfernt wurde.
 
Beispiel: 
 
mysql> select * from TableA left outer join TableB on TableA.name = TableB.name
    -> WHERE TableB.id is null;
+----+-----------+---------+-------+------+------+--------+-------+
| id | name      | nation  | table | id   | name | nation | table |
+----+-----------+---------+-------+------+------+--------+-------+
|  2 | Elizabeth | England | A     | NULL | NULL | NULL   | NULL  |
|  4 | Julia     | Denmark | A     | NULL | NULL | NULL   | NULL  |
+----+-----------+---------+-------+------+------+--------+-------+

Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils für Namen aus der linken Tabelle A keine Namen in der Tabelle B existieren. Da ein Join vorgenommen wird tauchen Spalten der Tabelle B im Ergebnis auf, die aber alle mit NULL gefüllt sind.
 
sql_leftouterjoinminusintersection.jpg
 

 
6) Full outer join where null
 
Bei diesem join werden alle Zeilen der beiden Tabellen  zusammengeführt, wo es keine gleichen Elemente in der anderen Tabelle gibt. Er entspricht also dem full outer join wo der inner join entfernt wurde.
 
Beispiel: 
 
mysql> select * from TableA left join TableB on TableA.name = TableB.name where TableB.id is null
    -> UNION
    -> select * from TableA right join TableB on TableA.name = TableB.name where TableA.id is null;
+------+-----------+---------+-------+------+-------+--------+-------+
| id   | name      | nation  | table | id   | name  | nation | table |
+------+-----------+---------+-------+------+-------+--------+-------+
|    2 | Elizabeth | England | A     | NULL | NULL  | NULL   | NULL  |
|    4 | Julia     | Denmark | A     | NULL | NULL  | NULL   | NULL  |
| NULL | NULL      | NULL    | NULL  |    1 | Marc  | China  | B     |
| NULL | NULL      | NULL    | NULL  |    3 | Peter | Japan  | B     |
+------+-----------+---------+-------+------+-------+--------+-------+

Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils für Namen aus der linken Tabelle A keine Namen in der Tabelle B existieren und für Namen aus der rechten Tabelle B keine Namen in der linken Tabelle A existieren. Da ein Join vorgenommen wird tauchen Spalten der Tabelle A und B im Ergebnis auf, die aber alle mit NULL gefüllt sind.
 
sql_fullouterjoinminusintersection.jpg
 

 
References: 
 

Kommentar schreiben

Spam Kommentare sind sinnlos !
Vor der Publizierung wird jeder Beitrag auf Spam geprüft. Leider dauert es deswegen bis ein Kommentar sichtbar wird. Dafür erhält aber kein Subscriber Spam eMails.
Die eMail ist optional und nicht öffentlich sichtbar. Sie ist notwendig um eMail Benachrichtigungen zu Antworten auf Kommentare zu erhalten und wird u.U. genutzt um offline zu kommunizieren.

Spam comments are useless !
Any comment will be reviewed first and checked for spam. Unfortunately this delays the publishing of comments but will protect subscribers from spam.
eMail is optional and hidden and is required get update notifications for any comments and may be used to contact you offline


Kommentare   

0 #7 framp 2016-08-26 14:23
Moin Erik,

auf dieser Seite habe ich versucht mit Venn Diagrammen den Einstieg in die Welt der SQL Joins Einsteigern zu erleichtern.

Fuer mehrere Tabellen sind Venn Diagramme nicht mehr geeignet. Wer mit >2 Tabellen arbeitet ist kein Einsteiger mehr und gehoert nicht mehr zur Zielgruppe dieser Seite :-) Es gibt aber diverse andere Seiten im Netz die bei der Beantwortung Deiner Frage helfen.

Cu framp
Zitieren
0 #6 Erik Lorenz 2016-08-26 08:36
Moin,

die Erklärungen sind sehr gut und echt hilfreich. Aber wie verhält es sich, wenn ich nicht 2 sondern 5 Tabellen mit einander verbinden möchte und die Abfrage sich über mehrere Referenzen erstreckt? Wie baut man einen solchen Join auf?
Zitieren
+3 #5 Tobias 2016-03-11 15:21
Danke, hat mir bei einen Problem weiter geholfen!
Zitieren
+1 #4 Swagboy 2015-04-24 10:13
Super mega geil :lol: :lol: :lol:
Zitieren
+4 #3 i 2014-10-17 10:28
Sehr gute Erklärung die auch ohne viel Vorwissen verstanden werden kann. Vielen Dank!!!
Zitieren
+1 #2 framp 2014-02-05 19:57
Im streng mathematischen Sinn ist die Anwendung von Venndiagrammen nich korrekt. Aber ich persoenlich finde diese Darstellung hilfreich um die Joins zu verstehen. Und es freut mich dass es Dir auch so geht.
Zitieren
+2 #1 Walter 2014-02-05 09:52
Sehr nice gemacht. Beschaeftige mich eher selten mit SQL im Rahmen meiner Hobby-Programmi erkunst, und erkenne bloss so nach langer Zeit ganz langsam die Sphaeren datenbankteschn ischer Funktionalitaet.

Ich sehe diese Diagramme zum ersten mal, komme mir im Moment ein wenig an den Film Tron erinnert vor, wo das Programm den Schlitten von einem Leitstrahl auf den anderen lenkt. :-*

Greets
Zitieren