SQL ist nicht ganz einfach zu verstehen, speziell wenn es darum geht mehrere Tabellen mit joins zusammenzufassen bzw zu verknüpfen. Im Folgenden wird dem SQL Einsteiger sehr einfach mit Venn Diagrammen sowie einfachen SQL queries erklärt  wie die verschiedenen SQL joins funktionieren. Dazu werden zwei Beispieltabellen mit Daten benutzt und Joins beschrieben sowie deren Eingabedaten und Ergebnisse. Dateien zum Erstellen der Beispieldaten sowie die SQL queries können downloaded werden. Die Beispiele sind für mySQL und DB2.
 
sql_innerjoin.jpg sql_leftouterjoin.jpg sql_fullouterjoin.jpg sql_leftouterjoinminusintersection.jpg sql_fullouterjoinminusintersection.jpg

 

 
Zur Einführung werden Venn Diagramme benutzt. Im streng mathematischen Sinne benutzt man Venn Diagramme nur für Mengen und deren Operationen wie Vereinigung, Schnitt, Differenz usw, aber sie sind auch sehr hilfreich um sql joins zu erklären und zu verstehen.
 
Genaugenommen gibt es vier verschiedene sql joins die man verstehen muss:
 
1) inner join
2) left/right outer join
3) full outer join
4) karthesisches Produkt
 
Wenn man Venn Diagramme benutzt um die Joins zu erklären gibt es noch zwei weitere Joins, die Entsprechungen in den Venn Diagrammen haben und das Verständnis von Joins fördern.
 
5) Left outer join where null
6) Full outer joinwhere null
 
In den folgenden Venn Diagrammen findet man immer zwei Tabellen TabelleA und TabelleB, die jeweils Zeilen enthalten, in denen Namen und weitere Informationen stehen. Der Join wird immer über die Namen gemacht, d.h. es werden Zeilen in beiden Tabellen gesucht, die gleiche Namen haben und deren Joinergebnisse betrachtet.
 
Bei den folgenden Beispielen enthalten die Tabellen A und B folgende Spalten und Inhalt:
Jede Tabelle hat einen Schlüssel id, eine Spalte name sowie eine Spalte nation mit der Nationalität der Person sowie eine Spalte table, die entweder A oder B enthält um zu kennzeichnen, in welcher Tabelle die Zeilenstehen, also Tabelle A oder Tabelle B. 
 
Die sql Befehle um die Tabelle anzulegen und zu füllen können hier für mySQL und hier für DB2 runtergeladen werden.  Die Queries um die Joins über die Tabelle auszuführen befinden sich hier für mySQL und hier für DB2 zum download.
 
Tabelle A:
 
mysql> select * from TableA;
+----+-----------+---------+-------+
| id | name      | nation  | table |
+----+-----------+---------+-------+
|  1 | Albert    | Germany | A     |
|  2 | Elizabeth | England | A     |
|  3 | Paul      | Spain   | A     |
|  4 | Julia     | Denmark | A     |
+----+-----------+---------+-------+
                                                                                                                                
 
Tabelle B:
mysql> select * from TableB;
+----+--------+--------+-------+
| id | name   | nation | table |
+----+--------+--------+-------+
|  1 | Marc   | China  | B     |
|  2 | Albert | France | B     |
|  3 | Peter  | Japan  | B     |
|  4 | Paul   | Poland | B     |
+----+--------+--------+-------+
 

1) Inner join
 
Bei einem Inner join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind.
 
mysql> select * from TableA inner join TableB on TableA.name = TableB.name;
+----+--------+---------+-------+----+--------+--------+-------+
| id | name   | nation  | table | id | name   | nation | table |
+----+--------+---------+-------+----+--------+--------+-------+
|  1 | Albert | Germany | A     |  2 | Albert | France | B     |
|  3 | Paul   | Spain   | A     |  4 | Paul   | Poland | B     |
+----+--------+---------+-------+----+--------+--------+-------+
 
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul.
 
sql_innerjoin.jpg
 

2) Left outer join
 
Bei einem left outer join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind sowie alle Elemente aus der linken Tabelle, die in diesem Falle Tabelle A ist.
 
mysql> select * from TableA left outer join TableB on TableA.name = TableB.name;
+----+-----------+---------+-------+------+--------+--------+-------+
| id | name      | nation  | table | id   | name   | nation | table |
+----+-----------+---------+-------+------+--------+--------+-------+
|  1 | Albert    | Germany | A     |    2 | Albert | France | B     |
|  2 | Elizabeth | England | A     | NULL | NULL   | NULL   | NULL  |
|  3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
|  4 | Julia     | Denmark | A     | NULL | NULL   | NULL   | NULL  |
+----+-----------+---------+-------+------+--------+--------+-------+
 
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul aber auch die Elemente aus der Tabelle A, wo es keinen gleichen Namen in Tabelle B gibt (Elizabeth und Julia). Diese Elemente sind daran zu erkennen, dass der Teil der Ergebnisspalten, wo die Teile aus der Tabelle B stehen mit NULL gefüllt sind.
 
sql_leftouterjoin.jpg
 

   
3) Full outer join
 
Bei einem full outer join werden alle Zeilen aus der Tabelle A und der Tabelle B zusammengeführt, wo die Join Spaltenelemente gleich sind sowie alle Elemente aus den beiden Tabellen, diekeine gleichen Elemente haben.
 
mysql: (Da mysql kein full outer join anbietet wird der full outer join über eine Vereinigung von dem left und right outer join vorgenommen, der dasselbe Ergebnis liefert)
 
mysql> select * from TableA left join TableB on TableA.name = TableB.name
    -> UNION
    -> select * from TableA right join TableB on TableA.name = TableB.name;
 
DB2: (Richtiger full join)
 
select * from TableA full join TableB on TableA.name = TableB.name; 
+------+-----------+---------+-------+------+--------+--------+-------+
| id   | name      | nation  | table | id   | name   | nation | table |
+------+-----------+---------+-------+------+--------+--------+-------+
|    1 | Albert    | Germany | A     |    2 | Albert | France | B     |
|    2 | Elizabeth | England | A     | NULL | NULL   | NULL   | NULL  |
|    3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
|    4 | Julia     | Denmark | A     | NULL | NULL   | NULL   | NULL  |
| NULL | NULL      | NULL    | NULL  |    1 | Marc   | China  | B     |
| NULL | NULL      | NULL    | NULL  |    3 | Peter  | Japan  | B     |
+------+-----------+---------+-------+------+--------+--------+-------+
 
Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils der Name gleich ist, d.h. Albert und Paul aber auch die Elemente aus der Tabelle A, wo es keinen gleichen Namen in Tabelle B gibt (Elizabeth und Julia) sowie die Elemente aus Tabelle B, wo es kein gleichen Namen in Tabelle A gibt (Marc und Peter). Diese Elemente sind daran zu erkennen, dass der Teil der Ergebnisspalten, wo die Teile aus der anderen Tabelle nicht existieren mit NULL gefüllt sind.Bei dem Zusammenfügen (UNION) der beiden Tabellen ist zu berücksichtigen, dass dabei eigentlich die Zeilen, die gleiche Namen in beiden Tabellen haben, in der Ergebniszeile doppelt auftreten, da sie sowohl im left als auch right join enthalten sind. Allerdings entfernt die UNION diese doppelten Elemente. Im folgenden Beispiel wird durch UNION ALL diese Entfernung verhindert. Die Zeilen mit Albert und Paul tauchen zweimal auf.
 
mysql> select * from TableA left join TableB on TableA.name = TableB.name  UNION ALL  select * from TableA right join TableB on TableA.name = TableB.name;
+------+-----------+---------+-------+------+--------+--------+-------+
| id   | name      | nation  | table | id   | name   | nation | table |
+------+-----------+---------+-------+------+--------+--------+-------+
|    1 | Albert    | Germany | A     |    2 | Albert | France | B     |
|    2 | Elizabeth | England | A     | NULL | NULL   | NULL   | NULL  |
|    3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
|    4 | Julia     | Denmark | A     | NULL | NULL   | NULL   | NULL  |
| NULL | NULL      | NULL    | NULL  |    1 | Marc   | China  | B     |
|    1 | Albert    | Germany | A     |    2 | Albert | France | B     |
| NULL | NULL      | NULL    | NULL  |    3 | Peter  | Japan  | B     |
|    3 | Paul      | Spain   | A     |    4 | Paul   | Poland | B     |
+------+-----------+---------+-------+------+--------+--------+-------+
 
sql_fullouterjoin.jpg
 

  
4) Cross join - Karthesisches Produkt
 
In diesem Falle gibt es keine Join Bedingung. Deshalb werden  bei diesem join jeweils alle Zeilen der linken Tabelle mit den jeweiligen Zeilen der rechten Tabelle  zusammengeführt. D.h. die Ergebnistabelle enthält immer (Anzahl Zeilen TabelleA) * (Anzahl Zeilen TabelleB) Ergebniszeilen. Diese kann bei großen Ausgangstabellen sehr schnell riesige Ergebnistabellen ergeben deren Berechnung sehr zeit- und speicher aufwendig ist und sollte deshalb vermieden werden.
 
mysql> select * from TableA join TableB;
+----+-----------+---------+-------+----+--------+--------+-------+
| id | name      | nation  | table | id | name   | nation | table |
+----+-----------+---------+-------+----+--------+--------+-------+
|  1 | Albert    | Germany | A     |  1 | Marc   | China  | B     |
|  2 | Elizabeth | England | A     |  1 | Marc   | China  | B     |
|  3 | Paul      | Spain   | A     |  1 | Marc   | China  | B     |
|  4 | Julia     | Denmark | A     |  1 | Marc   | China  | B     |
|  1 | Albert    | Germany | A     |  2 | Albert | France | B     |
|  2 | Elizabeth | England | A     |  2 | Albert | France | B     |
|  3 | Paul      | Spain   | A     |  2 | Albert | France | B     |
|  4 | Julia     | Denmark | A     |  2 | Albert | France | B     |
|  1 | Albert    | Germany | A     |  3 | Peter  | Japan  | B     |
|  2 | Elizabeth | England | A     |  3 | Peter  | Japan  | B     |
|  3 | Paul      | Spain   | A     |  3 | Peter  | Japan  | B     |
|  4 | Julia     | Denmark | A     |  3 | Peter  | Japan  | B     |
|  1 | Albert    | Germany | A     |  4 | Paul   | Poland | B     |
|  2 | Elizabeth | England | A     |  4 | Paul   | Poland | B     |
|  3 | Paul      | Spain   | A     |  4 | Paul   | Poland | B     |
|  4 | Julia     | Denmark | A     |  4 | Paul   | Poland | B     |
+----+-----------+---------+-------+----+--------+--------+-------+ 

Man sieht also, dass das Ergebnis alle Zeilen aus der Tabelle A jeweils mit allen Elementen der Tabelle B zusammengefügt hat. Dabei tauchen keine Spalten mit NULL auf.
 
Eine Darstellung als Venn Diagramm gibt es dafür nicht.     
 

 
5) Left outer join where null
 
Bei diesem join werden alle Zeilen aus der Tabelle A mit der Tabelle B zusammengeführt, wo es keine gleichen Elemente gibt. Es entspricht also auch dem left outer join wo der inner join entfernt wurde.
 
mysql> select * from TableA left outer join TableB on TableA.name = TableB.name
    -> WHERE TableB.id is null;
+----+-----------+---------+-------+------+------+--------+-------+
| id | name      | nation  | table | id   | name | nation | table |
+----+-----------+---------+-------+------+------+--------+-------+
|  2 | Elizabeth | England | A     | NULL | NULL | NULL   | NULL  |
|  4 | Julia     | Denmark | A     | NULL | NULL | NULL   | NULL  |
+----+-----------+---------+-------+------+------+--------+-------+

Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils für Namen aus der linken Tabelle A keine Namen in der Tabelle B existieren. Da ein Join vorgenommen wird tauchen Spalten der Tabelle B im Ergebnis auf, die aber alle mit NULL gefüllt sind.
 
sql_leftouterjoinminusintersection.jpg
 

 
6) Full outer join where null
 
Bei diesem join werden alle Zeilen der beiden Tabellen  zusammengeführt, wo es keine gleichen Elemente in der anderen Tabelle gibt. Er entspricht also dem full outer join wo der inner join entfernt wurde.
 
mysql> select * from TableA left join TableB on TableA.name = TableB.name where TableB.id is null
    -> UNION
    -> select * from TableA right join TableB on TableA.name = TableB.name where TableA.id is null;
+------+-----------+---------+-------+------+-------+--------+-------+
| id   | name      | nation  | table | id   | name  | nation | table |
+------+-----------+---------+-------+------+-------+--------+-------+
|    2 | Elizabeth | England | A     | NULL | NULL  | NULL   | NULL  |
|    4 | Julia     | Denmark | A     | NULL | NULL  | NULL   | NULL  |
| NULL | NULL      | NULL    | NULL  |    1 | Marc  | China  | B     |
| NULL | NULL      | NULL    | NULL  |    3 | Peter | Japan  | B     |
+------+-----------+---------+-------+------+-------+--------+-------+

Man sieht also, dass das Ergebnis die beiden Zeilen aus der Tabelle A und B zusammengefügt hat, wo jeweils für Namen aus der linken Tabelle A keine Namen in der Tabelle B existieren und für Namen aus der rechten Tabelle B keine Namen in der linken Tabelle A existieren. Da ein Join vorgenommen wird tauchen Spalten der Tabelle A und B im Ergebnis auf, die aber alle mit NULL gefüllt sind.
 
sql_fullouterjoinminusintersection.jpg
 

 
References: 
 
Kommentar schreiben
Hinweis:
Die eMail ist versteckt und nicht öffentlich sichtbar. Sie wird benutzt um über neue Kommentare zu informieren.