Hauptmenü öffnen
Rot-Schwarz-Baum
Komplexität
bei Elementen
Platz
Operation im Mittel Worst Case
Suchen
Querschritt
Min, Max
Einfügen
Löschen
Platz- und Zeit-Komplexitäten

Ein Rot-Schwarz-Baum (englisch red–black tree oder englisch RB tree) ist eine Datenstruktur vom Typ binärer Suchbaum, die „sehr schnellen“ Zugriff auf die in ihr gespeicherten Werte garantiert. Rot-Schwarz-Bäume wurden zuerst 1972 von Rudolf Bayer beschrieben,[1] welcher sie symmetric binary B-trees nannte. Der heutige Name geht auf Leonidas J. Guibas und Robert Sedgewick zurück, die 1978 die rot-schwarze Farbkonvention einführten.[2] Die schnellen Zugriffszeiten auf die einzelnen im Rot-Schwarz-Baum gespeicherten Elemente werden durch drei Forderungen erreicht, die zusammen garantieren, dass ein Rot-Schwarz-Baum immer balanciert ist, wodurch die Höhe eines Rot-Schwarz-Baumes mit Schlüsseln (Elementen) nie größer als wird.[3] Somit können die wichtigsten Operationen in Suchbäumen – Suchen, Einfügen und Löschen – garantiert in (s. Landau-Symbole) ausgeführt werden.

Inhaltsverzeichnis

DefinitionBearbeiten

Zusätzlich zu den Eigenschaften des binären Suchbaums hat jeder Knoten des Rot-Schwarz-Baums ein weiteres Attribut, genannt Farbe, mit zwei Werten, genannt rot (engl. RED) und schwarz (engl. BLACK). Diese Einfärbung hat die drei folgenden Forderungen zu erfüllen:[4]

Forderung N: Alle externen Blatt-Knoten (d. s. die #NIL-Knoten) sind schwarz.
Forderung R: Ist ein Knoten rot, so sind beide Kinder schwarz.
Forderung B: Jeder Pfad von einem gegebenen Knoten zu seinen Blattknoten enthält die gleiche Anzahl schwarzer Knoten.
 
Rot-Schwarz-Baum der Höhe 4 und der Schwarztiefe 2

Die auf allen Pfaden von Wurzel zu Blatt gleiche Anzahl schwarzer Knoten wird die Schwarztiefe[5] (auch Schwarzhöhe, engl. black-height) des Baums genannt. Dabei seien in diesem Artikel die die Pfade abschließenden und immer schwarzen NIL-Knoten nicht mitgezählt, auch nicht bei der Baumhöhe.

Durch diese drei Forderungen[6] wird die wichtigste Eigenschaft von Rot-Schwarz-Bäumen sichergestellt:

Wegen der Forderung R kann es auf keinem Pfad von der Wurzel zu einem Blatt mehr rote als schwarze Knoten geben, während auf dem kürzesten Pfad im Extremfall nur schwarze Knoten vorhanden sind. Da die Forderung B jedoch festlegt, dass die Anzahl der schwarzen Knoten auf allen Pfaden gleich sein muss, kann der Pfad, auf dem sich jeweils ein roter mit einem schwarzen Knoten abwechselt, maximal doppelt so lang sein wie ein Pfad, auf dem nur schwarze Knoten liegen. Hierdurch ist ein Rot-Schwarz-Baum immer gut genug balanciert – auf jeden Fall so gut, dass das Verhältnis zwischen der Höhe   des Baums und dem Logarithmus der Knotenzahl   beschränkt bleibt. Diese logarithmische Beschränkung, die im Abschnitt #Höhenbeweis formal bewiesen wird, ist aber gleichzeitig das informationstheoretische Optimum, d. h. es gibt keinen Binärbaum mit asymptotisch kleinerer maximaler Pfadlänge (= Höhe)  .

Bei den herausgehobenen Operationen Suchen, Einfügen und Löschen ist der auf einer Ebene des Baums anfallende Aufwand konstant. Also ist die Laufzeit höchstens proportional zur Anzahl der Knoten in einem Pfad, die wieder durch die Höhe limitiert ist, welche ihrerseits durch den Logarithmus der Knotenzahl limitiert ist.

Anmerkung: Dieser Artikel nimmt die im Artikel Binärer Suchbaum in dessen Abb. 1B aufgezeigte und bei Rot-Schwarz-Bäumen außerordentlich verbreitete Sichtweise ein, bei der die internen Knoten die Schlüssel tragen („knotenorientierte Speicherung“) und die externen Blätter die (randlosen) Intervalle zwischen den Schlüsseln markieren. In dieser Sichtweise haben die Schlüssel tragenden Knoten immer genau zwei Kinder, und die schlüssellosen (externen) Blätter (die sog. „NIL-Knoten“ oder NIL-Blätter) tragen gemäß Forderung N die Farbe schwarz. (Im Vergleich dazu wäre der Knoten mit dem Schlüssel   ein rotes internes Blatt und der mit   ein schwarzes.) Diese Sichtweise präjudiziert aber die Implementierung nicht wirklich (bspw. von NIL-Knoten, die im unten stehenden C-Beispielcode als Nullzeiger implementiert sind).

OperationenBearbeiten

NavigierenBearbeiten

Die Navigationsoperationen, das sind die verschiedenen Suchoperationen, das Traversieren, Aufsuchen erstes oder letztes Element und ähnliche, lassen den Baum unverändert (nur lesender Zugriff) und funktionieren im Prinzip auf jedem binären Suchbaum. Die dortigen Algorithmen und Angaben zur Komplexität gelten genauso für Rot-Schwarz-Bäume – mit der Präzisierung, dass die Höhe des Rot-Schwarz-Baums sich immer logarithmisch zur Anzahl der Knoten verhält.

Das Suchen eines Elements anhand seines Schlüssels ist die wichtigste unter den Navigationsoperationen. Die Höhen-Balancierung des Rot-Schwarz-Baums versucht, auf diese Operation hin zu optimieren. Sie ermöglicht eine Art „direkten Zugriff“ (im Gegensatz zum sequentiellen Zugriff der Traversierung). Sie wird in der Regel als vorausgehende Operation bei den Modifikationsoperationen (Einfügen oder Löschen) eingesetzt.

Das Suchen setzt eine totale Quasiordnung auf der Menge der Schlüssel voraus, die am flexibelsten durch eine Vergleichsfunktion realisiert wird.

EinfügenBearbeiten

Die ersten Aktionen beim Einfügen eines neuen Elements   in den Rot-Schwarz-Baum sind dieselben wie bei einem binären Suchbaum: Der neue Knoten ersetzt einen NIL-Knoten, der entweder die Wurzel ist, falls der Baum vorher leer war, oder linker bzw. rechter Kindknoten bei einem Schlüssel tragenden Knoten  , der in dieser Richtung kein Kind hat. Im unten stehenden Beispielcode wird angenommen, dass diese Richtung – die das letzte Ungleichergebnis der Suchfunktion reflektiert – in einer Variablen d übergeben wird. Auf jeden Fall bringt   zwei neue NIL-Knoten mit.   wird zunächst rot gefärbt, damit die Schwarztiefe des Baumes erhalten bleibt.

Der neue Knoten werde   (wie engl. node) genannt, sein Elter   (wie engl. parent), der Großelter   (wie engl. grandparent) und der Onkel mit   (wie engl. uncle).   ist beim ersten Iterationsschritt der gerade betrachtete „Problemknoten“.

Der Kopf der Funktion RBinsert1 zum Einfügen eines Knotens nach einer separat erfolgten und nicht erfolgreichen Suchoperation könnte wie folgt aussehen:

 void RBinsert1(
   RBtree* T, // Rot-Schwarz-Baum
   struct node* P, // Nachbarknoten (wird zum Elter von N)
           // oder NULL, wenn der Baum leer war
   byte d, // (Kindes-)Richtung der Einfügung  {LEFT, RIGHT}
           // oder UNDEFINED, wenn der Baum leer war
   struct node* N) // einzufügender Knoten
  {
   struct node* G, U;

   N->color = RED;
   N->left = NULL; // NIL-Knoten
   N->right = NULL; // NIL-Knoten
   if (P != NULL) // N ist nicht die neue Wurzel
    {
     P->child[d] = N; // neuer Knoten als d-Kind von P
     N->parent = P;
     // Es folgt die do-Schleife ...

Einfügen: Schleifeninvariante:

  • Zu Beginn jedes Iterationsschritts ist der Problemknoten   rot. (Er hat im Diagramm des resp. Falles eine blaue Kontur.)
  • Die Forderung B »Die Anzahl der schwarzen Knoten von jedem beliebigen Knoten zu einem Blatt ist auf allen Pfaden gleich« gilt im ganzen Baum.
  • Die Forderung R »Kein roter Knoten hat ein rotes Kind« gilt im ganzen Baum – mit der einzigen möglichen Ausnahme beim Paar   .
  • In den Diagrammen stellen die kleinen nummerierten Dreiecke (Rot-Schwarz-)Teilbäume dar. Diese Dreiecke haben alle dieselbe Schwarztiefe, es sei denn, ein Dreieck hat eine kleine schwarze Scheibe an der Spitze, womit eine um 1 höhere Schwarztiefe symbolisiert wird. Damit kommen alle Pfade im Diagramm (beim Einfügen) auf gleich viele (kleine oder große) schwarze Kreisflächen (und die Wurzeln der so markierten Dreiecke sind alle schwarz).
Bedingung Fall
Rota-
tion
Zuwei-
sung
Ergebnis
Test
        x         x
  0  
    1    
        2  :=    ? ? ? 0
        i 3     :=          o 4
        o 4           
Einfügen: Zusammenschau der Fälle

Einfügen: Zusammenschau der Fälle

Die möglichen Konstellationen lassen sich in fünf Fälle aufteilen, zu denen es Transformationen (enthaltend Rotation und/oder Umfärbung) gibt, die entweder auf der betrachteten Ebene oder über weitere Iterationsschritte auf höheren Ebenen zu einer Reparatur des Baumes führen.

In der nebenstehenden Tabelle wird ein Fall durch eine Zeile repräsentiert, die

  1. die Bedingung, d. i. die Konstellation, die den Fall definiert,
  2. die Fallnummer,
  3. die Konstellation nach Transformation und ggf. Zuweisung in der Spaltengruppe Ergebnis

enthält. Eine Konstellation besteht aus fünf Gegebenheiten, und zwar aus den vier Farben der Knoten   und  . Manche Fälle benötigen darüber hinaus eine fünfte Angabe x zur Kindesrichtung von  , und zwar steht o (wie engl. outer) für eine Rechts-Rechts- oder Links-Links-Kindesrichtung von   zu   zu   und i (wie engl. inner) für Rechts-Links oder Links-Rechts. Eine Zelle ist leer gelassen, wenn es bei dem Fall auf die entsprechende Angabe nicht ankommt.

Die Konstellationen in der Gruppe Bedingung genügen der Schleifeninvariante, und ihre logische Summe schöpft diese genau aus.

Die Transformation, deren Fallnummer in der Spalte Fall → verlinkt ist, transformiert die Eingabe in eine Konstellation, die normalerweise im Diagramm des Falles dargestellt ist. Steht ein „–“ in der Spalte → Test, dann reflektiert die Gruppe Ergebnis den Endstand, und die Einfügeoperation ist durch die Transformation abgeschlossen. Andernfalls steht dort die Fallnummer derjenigen Bedingung, auf die die transformierte und neu zugewiesene Konstellation zu testen ist, wobei die entsprechende Zuweisung, angegeben für den Problemknoten   in der Spalte Zuweisung, auch die Knoten   sowie die Angabe x zur Kindesrichtung von   definiert. Die Gruppe Ergebnis zeigt dann die Konstellation nach der Zuweisung.

In der Spalte → Test kommt der Eintrag „0“ nur bei der Transformation_2 vor und bedeutet u. U. einen neuen Iterationsschritt. Dieser beginnt mit dem Test auf Bedingung_0 in der do while-Anweisung – zwei Ebenen höher. Da die Anzahl der Ebenen mit der Höhe   übereinstimmt, können maximal   Iterationen vorkommen. Nun ist der Aufwand für eine Iteration beschränkt (d. h. in  ) und damit der für die gesamte Einfügeoperation in  . Im Mittel ist der Aufwand gemäß Abschnitt #Durchschnittliche und amortisierte Laufzeit sogar konstant.

Bei einem Eintrag in der Spalte Rotation ist eine Rotation an der Transformation beteiligt. Man entnimmt der Tabelle sofort, dass bei einer Einfügung maximal 2 Rotationen vorkommen. Denn nach einer Rotation (Transformation_3 und Transformation_4) gibt es keine weitere Iteration – die Rotationen befinden sich endrekursiv am Ende der letzten Iteration.

Im folgenden Beispielcode entscheidet die Kindesrichtung von   sowohl über die nachfolgenden Rotationsrichtungen wie über die Kindesrichtung des Elters  . (Hat   dieselbe Kindesrichtung wie  , dann ist die Variable „x“ auf „o“ für „außen“, sonst auf „i“ für „innen“ zu setzen.) Eine andere Möglichkeit ist, das Innere der do-Schleife in zwei Versionen aufzuschreiben, in einer für die Kindesrichtung links und in einer für rechts.[7] Die Diagramme bei den Fällen zeigen allerdings nur eine Kindesrichtung, und zwar ist   immer links von  .

Jeder Fall wird unter seiner Nummer erläutert und einschließlich Test und Transformation durch ein Stück C-Code genau beschrieben.[8]

     do // Beginn der do-Schleife
      {
       // Hier ist in keiner Iteration P == NULL,
       // also auch N nicht die Wurzel des Baums T.
       if (N == P->left)
        {
         d = LEFT;     // Kindesrichtung von N
         S = P->right; // Geschwister von N
        }
       else
        {
         d = RIGHT;    // Kindesrichtung von N
         S = P->left;  // Geschwister von N
        }

Einfügen Fall 1: Der Elter   des Problemknotens   ist schwarz. (Damit gilt die Forderung R im ganzen Baum.)

Nach Voraussetzung (Schleifeninvariante) ist die Schwarztiefe auf allen Pfaden dieselbe. Alle Paare Elter→Knoten erfüllen die Forderung R. Damit ist der Baum (ohne weitere Aktion) schon in Rot-Schwarz-Form.

       // Bedingung_1
       if (P->color == BLACK)
         // Transformation_1:
         return; // Einfügung fertiggestellt

Anmerkung: In den nun folgenden Fällen ist angenommen, dass der einzufügende Knoten   einen Großelter   hat, da sein Elter   rot ist und somit nicht die Wurzel sein kann.[6][9] Da es sich aber bei einem Rot-Schwarz-Baum um einen Binärbaum mit externen Blättern handelt, hat der Großelter auf jeden Fall noch ein (schwarzes) Kind – das ggf. auch ein NIL-Knoten sein kann.

Einfügen Fall 2: Sowohl der Onkel   als auch der Elter   des Problemknotens   ist rot.

Eine Umfärbung von   und   in schwarz und von   in rot stellt die Forderung R im von   gewurzelten Teilbaum wieder her. Auf keinem Pfad ändert sich die Schwarztiefe. Durch diese Aktion wird also das Problem um zwei Ebenen nach oben verschoben mit   als dem neuen Problemknoten.

       G = P->parent; // Großelter von N
       U = G->child[LEFT+RIGHT-d]; // Onkel von N

       if (U != NULL && U->color == RED) // Bedingung_2
        {
         // Transformation_2:
         P->color = BLACK;
         U->color = BLACK;
         G->color = RED;
         N = G; // neuer Problemknoten (N kann die Wurzel sein)
         P = N->parent;
         continue; // Iteration zwei Ebenen höher
        }

Einfügen Fall 3: Der Problemknoten   hat keinen oder einen schwarzen Onkel und hat eine Kindesrichtung entgegengesetzt zu der seines roten Elters  , d. h.,   ist innerer Enkel.

Eine entsprechende Rotation um   vertauscht die Rollen von   und  , und zwar eine Linksrotation, wenn   rechtes Kind ist, sonst eine Rechtsrotation. (Im Folgenden wird eine solche Rotation als (nicht-d)-Rotation bezeichnet mit d als der Kindesrichtung von  .) Dadurch werden die Pfade des Teilbaums   (s. Diagramm) so verändert, dass sie durch einen zusätzlichen, während die des Teilbaums   durch einen Knoten weniger führen. Da jedoch in beiden Fällen rote Knoten den Unterschied ausmachen, ändert sich an der Schwarztiefe nichts, womit die Forderung B erfüllt bleibt.

Die Ergebniskonstellation entspricht der Eingangskonstellation des Falles 4 mit   als dem neuen Problemknoten.

       if (P == G->child[LEFT+RIGHT-d]) // Bedingung_3
        {
         // N ist links an P und P rechts an G (==> N ist innerer Enkel)
         //   oder
         // N ist rechts an P und P links an G (==> N ist innerer Enkel)
         // Transformation_3:
         rotate(P,LEFT+RIGHT-d); // (nicht-d)-Rotation um P
         U = N; // aufbewahren
         N = P; // neuer Problemknoten (RED) und äußerer Enkel von G
                // (nicht die Wurzel)
         P = U; // neuer Elter von N (RED)
        }

Einfügen Fall 4: Der Problemknoten   hat keinen oder einen schwarzen Onkel. Seine Kindesrichtung ist dieselbe wie die von  , also ist   äußerer Enkel.

Eine (nicht-d)-Rotation um   macht   zum Elter sowohl von   als auch von  . Da   rot war, muss wegen Forderung R   schwarz sein. Vertauscht man nun die Farben von   und  , so ist in dem dadurch entstehenden Baum die Forderung R wieder erfüllt. Die Forderung B bleibt ebenfalls erfüllt, da alle Pfade, die durch einen dieser drei Knoten laufen, vorher durch   liefen und nun alle durch   laufen, der inzwischen – wie   vor der Transformation – der einzige schwarze der drei Knoten ist.

       // Bedingung_4
       // N (RED) ist äußerer Enkel.
       // Transformation_4:
       rotate(G,LEFT+RIGHT-d); // (nicht-d)-Rotation um G
       P->color = BLACK;
       G->color = RED;
       return; // Einfügung fertiggestellt
      }
     while ((P = N->parent) != NULL); // nicht-Bedingung_0
     // Ende der (do while)-Schleife.
     // Sie wird verlassen per return; oder continue;
     // Bei letzterem kann P == NULL, also N die Wurzel sein.
    } // end_if (P != NULL)

Einfügen Fall 0: Der Problemknoten   ist die (ggf. neue) Wurzel. Wie oben angemerkt, kann eine rote Wurzel ohne Schaden sofort von rot auf schwarz umgefärbt werden[6] – mit dem Vorteil einer Abfrage weniger vor der Transformation_2.

   if (P == NULL) // Bedingung_0: N ist die Wurzel des Baums T
    {
     // Transformation_0:
     T->root = N; // neue Wurzel (beim Einfügen != NIL)
     N->color = BLACK;
     N->parent = NULL; // Erkennungszeichen der Wurzel
     return; // Einfügung fertiggestellt
    }
  } // Ende RBinsert1

LöschenBearbeiten

Das Löschen eines Knotens, sein Name sei   (wie engl. remove), aus einem Rot-Schwarz-Baum erfolgt wie bei einem binären Suchbaum. Hat   ein oder gar kein Kind, dann bleibt er der Löschknoten. Hat   aber zwei Kinder, dann nimmt man, ohne letztendlich die Sortierreihenfolge zu stören, als effektiven Löschknoten einen seiner Nachbarknoten – natürlich, nachdem man vorher die Benutzerdaten ausgetauscht hat.[10] Wir werden also die Löschung durch die Entfernung eines Knotens mit maximal einem Kind durchführen, eines Knotens, den wir weiterhin mit   benennen.

Hat   genau ein Kind, so sei dieses mit   (wie engl. node) bezeichnet. Hat   kein Kind, so stehe   für einen seiner NIL-Knoten. In beiden Fällen sei   (wie engl. parent) der Elter von   und d (wie engl. direction) seine Kindesrichtung (rechtes oder linkes Kind von  ).

Ist   rot, so kann man   durch den Knoten   ersetzen, der wegen Forderung R schwarz sein muss. Da   ebenfalls aufgrund von Forderung R schwarz gewesen sein muss, bleibt diese Forderung erfüllt. Da alle Pfade, die ursprünglich durch den gelöschten roten Knoten verliefen, nun durch einen roten Knoten weniger verlaufen, ändert sich an der Schwarztiefe nichts, womit die Forderung B erfüllt bleibt.

Ebenfalls einfach zu lösen ist der Fall, wenn   schwarz ist und   rot. Man färbt   schwarz und macht ihn an der Kindesrichtung d zum Kind von  . Damit ist   aus dem Baum entfernt, und die Forderung R bleibt erfüllt. Ferner verlaufen nun alle Pfade, die durch den gelöschten schwarzen Knoten verliefen, durch sein schwarzes Kind, wodurch Forderung B erfüllt bleibt.

Schwieriger zu lösen ist der Fall, wenn beide,   und   schwarz sind. (Nach #Beobachtung 2 ist dann   ein NIL-Knoten, also   ohne echtes Kind.) Nach der Ersetzung von   bei   durch   enthalten die durch   führenden Pfade einen schwarzen Knoten weniger als vorher, also einen weniger als die nicht durch   führenden Pfade.

Relativ zu   sei sein neues Geschwister, d. i. das (nicht-d)-Kind von   (und vormalige Geschwister von  ), mit   (wie engl. sibling) und dessen nahes Kind (der Kindesrichtung d) mit   (wie engl. close nephew) resp. dessen fernes Kind mit   (wie engl. distant nephew) bezeichnet. Da   schwarz war und kein NIL-Knoten, kann (gemäß #Beobachtung 3)   kein NIL-Knoten sein.

Beobachtungen zu Geschwisterknoten in einem Rot-Schwarz-Baum
  1. Ein echter Knoten ohne echtes Geschwister ist immer rot, es sei denn, es handelt sich um die Wurzel.
  2. Ein schwarzer Knoten ohne echtes Geschwister ist ein NIL-Knoten, es sei denn, es handelt sich um die Wurzel.
  3. Ein echter schwarzer Knoten hat immer ein echtes Geschwister.
  4. In einem nicht-leeren Rot-Schwarz-Baum hat ein NIL-Knoten immer ein Geschwister.

Der Kopf der Funktion RBdelete1 zum Löschen eines schwarzen Knotens   ohne echtes Kind mit einem Kindknoten   (der ein NIL-Knoten ist) könnte wie folgt aussehen:

 void RBdelete1(
   RBtree* T, // Rot-Schwarz-Baum
   struct node* R, // schwarzer zu löschender Knoten
   struct node* N) // Kind von R (NIL-Knoten)
  {
   struct node* P, S;
   byte d; // Richtung ∈ {LEFT, RIGHT}

   P = R->parent;   // Elter von R
   if (P != NULL)
    {
     // s.a. unten Bedingung_0
     // Ersetze R bei P durch N:
     if (R == P->left)
       P->left = N;
     else
       P->right = N;
     // Der NIL-Knoten N hat kein .parent.
     // Es folgt die do-Schleife ...

Löschen: Schleifeninvariante:

  • Zu Beginn jedes Iterationsschritts ist der gerade betrachtete Problemknoten   schwarz. (In dem zum Fall gehörigen Diagramm hat er eine blaue Kontur.)
  • Die Forderung R »Kein roter Knoten hat ein rotes Kind« ist überall erfüllt.
  • Die Anzahl der schwarzen Knoten auf den Pfaden, die nicht durch   führen, ist ungeändert, während die Pfade durch   einen schwarzen Knoten weniger enthalten, so dass die Forderung B »Die Anzahl der schwarzen Knoten von jedem beliebigen Knoten zu einem Blatt ist auf allen Pfaden gleich« verletzt ist.
  • In den Diagrammen stellen die kleinen nummerierten Dreiecke Teilbäume dar, die alle dieselbe Schwarztiefe haben, es sei denn, das Dreieck hat eine kleine schwarze Scheibe an der Spitze, womit eine um 1 höhere Schwarztiefe symbolisiert wird. Damit kommen in den linken Hälften der Diagramme eines Löschen-Falls die durch   führenden Pfade auf eine schwarze Kreisfläche (klein oder groß) weniger.
Bedingung Fall
Rota-
tion
Zuwei-
sung
Ergebnis
Test
                   
  0  
          1     :=      ?   ? 3
          2  :=    ? ? ? ? 0
          3          
          4     :=      ?     5
    c     5        c    
Löschen: Zusammenschau der Fälle

Löschen: Zusammenschau der Fälle[11][12]

Die möglichen Farbkonstellationen lassen sich in sechs Fälle gruppieren, zu denen es Transformationen (enthaltend Rotation und/oder Umfärbung) gibt, die entweder auf der betrachteten Ebene oder über weitere Iterationsschritte auf höheren Ebenen zu einer Reparatur des Baumes führen.

In der nebenstehenden Tabelle wird ein Fall durch eine Zeile repräsentiert, die

  1. die Bedingung, d. i. die Konstellation, die den Fall definiert,
  2. die Fallnummer,
  3. die Konstellation nach Transformation und ggf. Zuweisung in der Spaltengruppe Ergebnis

enthält. Eine Konstellation (5 Spalten) besteht aus den 5 Farben der 5 Knoten  . Das Zeichen   zeigt die schwarze Farbe bei einem Knoten an und gleichzeitig, dass die Zahl der schwarzen Knoten auf den Pfaden durch ihn um 1 vermindert ist. In ein und derselben Zeile bedeuten die 2 Zeichen   dieselbe Farbe, ebenso die 2 Buchstaben c. Eine Zelle ist leer gelassen, wenn es bei dem beschriebenen Fall auf die entsprechende Angabe nicht ankommt.

Die Konstellationen in der Gruppe Bedingung genügen der Schleifeninvariante, und ihre logische Summe schöpft diese genau aus.

Die Transformation, deren Fallnummer in der Spalte Fall → verlinkt ist, transformiert die Eingabe in eine Konstellation, die im Diagramm des Falles dargestellt ist. Steht ein „–“ in der Spalte → Test, dann reflektiert die Gruppe Ergebnis den Endstand, und die Löschoperation ist durch die Transformation abgeschlossen. Andernfalls steht dort die Fallnummer derjenigen Bedingung, auf die die transformierte und neu zugewiesene Konstellation zu testen ist, wobei die entsprechende Zuweisung, angegeben für den Problemknoten   in der Spalte Zuweisung, auch die Knoten   eindeutig bestimmt. Die Gruppe Ergebnis zeigt dann die Konstellation nach der Zuweisung.

Der Eintrag „0“ kommt nur bei der Transformation_2 vor und bedeutet u. U. einen neuen Iterationsschritt auf der um 1 höheren Ebene im Baum, beginnend mit dem Test auf die Bedingung_0. Die Anzahl der Ebenen stimmt mit der Höhe   überein, so dass höchstens   Iterationen vorkommen können. Nun ist der Aufwand für eine Iteration beschränkt (d. h. in  ) und damit der für die gesamte Löschoperation in  . Gemäß Abschnitt #Durchschnittliche und amortisierte Laufzeit ist der Aufwand im Mittel sogar konstant.

Bei einem Eintrag in der Spalte Rotation ist eine Rotation an der Transformation beteiligt. Und die Tabelle zeigt, dass bei einer Löschung maximal 3 Rotationen erforderlich sind. Denn nach einer Rotation (Transformation_1, Transformation_4 und Transformation_5) kommt kein neuer Iterationsschritt – die Rotationen befinden sich am Ende der letzten Iteration.

Im folgenden Beispielcode entscheidet die Kindesrichtung (im Beispielcode die Variable d) von   sowohl über die nachfolgenden Rotationsrichtungen wie über die Kindesrichtung der Neffen von  . (Der Neffe   (wie engl. close) mit derselben Kindesrichtung ist der „nahe“, der andere,   (wie engl. distant), der „ferne“ Neffe.) Eine andere Möglichkeit ist, das Innere der do-Schleife in zwei Versionen aufzuschreiben, in einer für die Kindesrichtung links und einer für rechts. Die Diagramme bei den Fällen zeigen allerdings nur eine Kindesrichtung, und zwar ist   immer links von  .

Jeder Fall wird unter seiner Nummer erläutert und einschließlich Test und Transformation durch ein Stück C-Code genau beschrieben.[8]

     do // Beginn der do-Schleife
      {
       // Hier ist in keiner Iteration P == NULL,
       // also auch N nicht die Wurzel des Baums T.
       if (N == P->left)
        {
         d = LEFT;     // Kindesrichtung von N
         S = P->right; // Geschwister von N
        }
       else
        {
         d = RIGHT;    // Kindesrichtung von N
         S = P->left;  // Geschwister von N
        }

Löschen Fall 1: Das Geschwister   des Problemknotens   ist rot.

Eine Rotation um   macht   zum Großelter von  , und zwar eine Linksrotation, wenn   linkes Kind ist, sonst eine Rechtsrotation. (Im Folgenden wird eine solche Rotation als d-Rotation bezeichnet mit d als der Kindesrichtung von  .) Danach invertiert man die Farben von   und  . Alle Pfade haben weiterhin dieselbe Anzahl an schwarzen Knoten, aber   hat nun ein schwarzes Geschwister ( ) und einen roten Elter ( ), weswegen man nun zu Fall 3, 4 oder 5 weitergehen kann – mit   als altem und neuem Problemknoten.

       if (S->color == RED)
        { // Bedingung_1: RED: S, also: BLACK: C && D
         // Transformation_1:
         S->color = BLACK;
         P->color = RED;
         rotate(P,d); // d-Rotation um Knoten P
         S = S->child[d]; // neues Geschwister von N (BLACK) (vorher C)
         if (S->child[d]->color == BLACK &&          // Farbe der Wurzel von /3\
             S->child[LEFT+RIGHT-d]->color == BLACK) // Farbe der Wurzel von /4\
             goto case_3;
         goto case_4;
        } // end_if (S->color == RED)

Löschen Fall 2: Der Elter   des Problemknotens  , sein Geschwister   und die Kinder   und   von   sind alle schwarz.

Eine Umfärbung von   von schwarz in rot vermindert in allen Pfaden, die durch   führen, die Zahl der schwarzen Knoten um 1. Das sind genau die Pfade im Teilbaum von  , die nicht durch   führen. Damit ist in diesem Teilbaum die Ungleichheit ausgeglichen. Aber alle Pfade, die durch   laufen, haben nun einen schwarzen Knoten weniger als die Pfade, die nicht durch   laufen, weshalb die Forderung B weiterhin überprüft werden muss. Durch diese Aktion wird das Problem also um eine Ebene nach oben verschoben mit   als neuem Problemknoten.

       else
        { // S->color == BLACK
         if (S->child[d]->color == BLACK
             && S->child[LEFT+RIGHT-d]->color == BLACK)
          {
           if (P->color == BLACK)
            { // Bedingung_2: BLACK: P && C && S && D
             // Transformation_2
             S->color = RED;
             N = P; // neuer Problemknoten (N kann die Wurzel sein)
             continue; // Iteration eine Ebene höher
            }

Löschen Fall 3: Sowohl das Geschwister   des Problemknotens   als auch die Kinder   und   von   sind schwarz, aber der Elter   von   ist rot.

Eine Vertauschung der Farben von   und   lässt die Anzahl der schwarzen Knoten auf den Pfaden, die durch   laufen, unverändert, fügt aber auf allen Pfaden durch   einen schwarzen Knoten hinzu und gleicht damit den fehlenden schwarzen Knoten auf diesen Pfaden aus.

 case_3:
           // Bedingung_3: RED: P, BLACK: C && S && D
           // Transformation_3:
           S->color = RED;
           P->color = BLACK;
           return; // Löschung fertiggestellt
          } // end_if (C->color == BLACK && D->color == BLACK)
        } // end_if (S->color)

Löschen Fall 4: Das Geschwister   von   und der ferne Neffe   von   ist schwarz, wogegen der nahe Neffe   rot ist.

Eine (nicht-d)-Rotation um   macht   zum Elter von   und zugleich zum Geschwister von  . Danach vertauscht man die Farben von   und  . Nun haben alle Pfade immer noch die gleiche Anzahl an schwarzen Knoten, aber   hat ein schwarzes Geschwister ( ), dessen fernes Kind ( ) rot ist, womit man zum Fall 5 weitergehen kann. Weder   noch   noch die Schwarztiefe werden durch diese Transformation beeinflusst.

 case_4:
       // Ab hier: BLACK: S && wenigstens eines RED: C || D
       // Bedingung_4:
       if (S->child[LEFT+RIGHT-d]->color == BLACK) // ==> RED: S->child[d]
        {
         // Transformation_4:
         S->color = RED;
         S->child[d]->color = BLACK; // in der Graphik: S->child[d] = C
         rotate(S,LEFT+RIGHT-d); // (nicht-d)-Rotation
           // S wird zum fernen Neffen S->child[LEFT+RIGHT-d] von N
         S = S->child[d]; // naher Neffe wird neues Geschwister von N (BLACK)
        }

Löschen Fall 5: Das Geschwister   von   ist schwarz, und der ferne Neffe   von   ist rot. Die im Diagramm weiß dargestellten Knoten   und   haben dieselbe Farbe, rot oder schwarz.

Eine d-Rotation um   macht   zum Großelter von  . Nun reicht es, die Farben von   und   zu vertauschen und   schwarz zu färben.   hat immer noch dieselbe Farbe, wodurch die Forderung R erfüllt bleibt. Aber   hat nun einen zusätzlichen schwarzen Vorfahren: Falls   vor der Transformation noch nicht schwarz war, so ist er nach der Transformation schwarz, und falls   schon schwarz war, so hat   nun   als schwarzen Großelter, weswegen die Pfade, die durch   führen, nun einen zusätzlichen schwarzen Knoten passieren.

Bei den Pfaden, die sich ändern und die nicht durch   gehen, gibt es zwei Möglichkeiten:

  1. Der Pfad verläuft durch den beliebig eingefärbten Wurzelknoten des Teilbaums   (s. Diagramm), der zum neuen Geschwister von   wird. Dann muss der Pfad sowohl vor als auch nach der Transformation durch   und   laufen. Da die beiden Knoten aber nur ihre Farben vertauscht haben, ändert sich an der Schwarztiefe auf dem Pfad nichts.
  2. Der Pfad verläuft durch den neuen Onkel   von  , welcher das rechte Kind des Geschwisters   ist. In diesem Fall ging der Pfad vorher durch   und  . Nach der Transformation geht er aber nur noch durch  , der von Rot auf Schwarz (die vorige Farbe von  ) umgefärbt wurde, und den Knoten  , welcher die Farbe von   angenommen hat. Somit ändert sich die Schwarztiefe eines solchen Pfades nicht.

Da die Anzahl der schwarzen Knoten in den Pfaden, die durch   führen, sich um 1 erhöht, und in denen, die nicht durch   gehen, sich nicht ändert, ist die Forderung B wiederhergestellt.

       // Bedingung_5: RED: ferner Neffe D von N
       // Transformation_5:
       S->color = P->color;
       P->color = BLACK;
       rotate(P,d);
       S->child[LEFT+RIGHT-d]->color = BLACK; // in der Graphik: D
       return; // Löschung fertiggestellt
      }
     while ((P = N->parent) != NULL); // nicht-Bedingung_0
     // Ende der (do while)-Schleife.
     // Sie wird verlassen per return; oder continue;
     // Bei letzterem kann P == NULL, also N die Wurzel sein.
    } // end_if (P != NULL)

Löschen Fall 0: Der Problemknoten   ist die (ggf. neue) Wurzel.

In diesem Fall ist man fertig, da alle vergleichbaren Pfade durch   gehen (und einen schwarzen Knoten weniger enthalten als vorher).

   // Bedingung_0: N ist die Wurzel des Baums T
   if (P == NULL)
    {
     // N ist die neue Wurzel.
     // (NIL, wenn der Baum jetzt leer ist.)
     T->root = N;
     if (N != NULL)
       N->parent = NULL; // Erkennungszeichen der echten Wurzel
       // (Ein NIL-Knoten hat kein .parent.)
    }
   return; // Löschung fertiggestellt
  } // Ende RBdelete1

HöhenbeweisBearbeiten

Wie schon in der Einleitung ausgeführt, ist die besondere Eigenschaft von Rot-Schwarz-Bäumen, dass sie in logarithmischer Zeit – genauer in   mit   als der Anzahl der Schlüssel – ein Element im Baum suchen, löschen oder einfügen können. Diese Operationen sind auf allen binären Suchbäumen von der Höhe   des Baumes abhängig. Je niedriger die Höhe des Baumes ist, desto schneller laufen die Operationen. Kann man nun beweisen, dass ein binärer Suchbaum mit   Elementen nie eine gewisse Höhe (im Falle des Rot-Schwarz-Baumes  ) überschreitet, so hat man bewiesen, dass die oben genannten Operationen im schlechtesten Fall logarithmische Kosten haben, nämlich die genannten Kosten von   für einen Baum, in dem   Elemente gespeichert sind. Somit muss gezeigt werden, dass folgende Aussage gilt:

Für die Höhe   eines Rot-Schwarz-Baumes, der   Elemente speichert, gilt:  .

Rot-Schwarz-Bäume mit kleinster Knotenzahl zu gegebener Höhe
 
Rot-Schwarz-Bäume RBh der Höhen h=1,2,3,4,5,
jeweils mit minimaler Knotenzahl 1,2,4,6 resp. 10.

Zu   gibt es einen Rot-Schwarz-Baum der Höhe   mit

 

internen Knoten, und keinen mit weniger (  steht für die Gauß-Klammer).[13]

Beweis

Damit ein Rot-Schwarz-Baum einer bestimmten Höhe   eine minimale Knotenzahl besitzt, muss er genau einen längsten Pfad enthalten, und dieser eine größtmögliche Anzahl roter Knoten, um eine möglichst große Baumhöhe mit möglichst kleiner Schwarztiefe zu erreichen. Seine Einfärbung hat also unten beim internen Blatt mit Rot zu beginnen, und sich in der Folge nach oben bis zur Wurzel mit Schwarz und Rot streng abwechselnd fortzusetzen. Außerhalb dieses die Baumhöhe definierenden Pfades hat er nur schwarze Knoten.[14][15] Denn angenommen, es gäbe dort einen roten Knoten, dann beeinträchtigt das Entfernen desselben die Rot-Schwarz-Eigenschaften nicht, sofern einer von seinen zwei (schwarzen) Kindknoten an seine Stelle nachrückt und der andere gleichzeitig einschließlich seines Teilbaums entfernt wird. Alle Teilbäume außerhalb des längsten Pfades sind somit vollständige Binärbäume mit ausschließlich schwarzen Knoten.

Es gibt genau einen Rot-Schwarz-Baum der Höhe   mit einem roten internen Blatt, welches gleichzeitig die Wurzel ist. Also ist   in Übereinstimmung mit  .

Bei einem Minimalbaum (RBh in der Abbildung) der Höhe   sind die zwei Kindbäume der Wurzel von unterschiedlicher Höhe: der höhere enthält den die Höhe definierenden längsten Pfad und ist ein Minimalbaum der Höhe   mit   Knoten und der Schwarztiefe  ; der niedrigere ist ein vollständiger Binärbaum mit Höhe = Schwarztiefe  , hat also   interne Knoten. Damit ist rekursiv

             
(großer Kindbaum) (Wurzel) (kleiner Kindbaum)
woraus man
     
   

ausrechnet.  ■

Der Graph der Funktion   ist konvex nach unten und stückweise linear mit den Ecken an den Punkten   mit  . Ferner ist   A027383(h–1) für   mit der Folge A027383 in OEIS.

Zur Höhe   gibt es   Formen von Minimalbäumen, da die Position des längsten Pfades der Position eines externen Blattes des vollständigen Binärbaums der Höhe   entspricht und dadurch auch die Lage der Knoten außerhalb dieses Pfades bestimmt ist. (Die Abbildung zeigt die äußerste linke Position.)

Umformung

Wegen   (eine Folge von  ) haben wir für ungerades   die Ungleichung

 

so dass sich für alle (geraden wie ungeraden)  

 

ergibt.

Da   die kleinste Knotenzahl   für alle Rot-Schwarz-Bäume der Höhe   ist, gilt:

 

Bringt man nun noch den Summanden –2 auf die andere Seite und logarithmiert, so folgt:

 

Somit folgt die Behauptung, dass ein Rot-Schwarz-Baum eine maximale Höhe   von   hat und damit die Operationen suchen, einfügen und löschen in logarithmischer Zeit erledigen kann. Drückt man dieses Ergebnis in der O-Notation aus, so ergibt sich für die Kosten der oben genannten Operationen, dass sie alle in   liegen mit   als der Zahl der Schlüssel. [16]

Durchschnittliche und amortisierte LaufzeitBearbeiten

Der Rot-Schwarz-Baum bietet amortisiert konstante Modifikationskosten[17] und damit auch im Mittel konstante. Anwendungen von (binären) Suchbäumen, die nur Sequenzen von Einfügungen und Löschungen – ganz ohne jede Suchoperation – enthalten, gehen allerdings am Zweck des Suchbaums vorbei. Sieht man also von dieser Art Anwendungen ab, ist das Gesamtverhalten einer Mischung von Suchen und Modifikation amortisiert, im Mittel und im Worst Case logarithmisch in der Anzahl der Knoten.

Anzahlen von Rot-Schwarz-BäumenBearbeiten

 
Die 3 RB-Bäume mit 3 Schlüsseln

Die Folge A001131  in OEIS gibt in Abhängigkeit von der Knotenzahl   die Gesamtzahl der Rot-Schwarz-Bäume, Folge A001137 in OEIS derer mit schwarzer Wurzel und Folge A001138 in OEIS derer mit roter Wurzel.

In einem reinen Einfügeszenario wird bspw. von den 3 möglichen Bäumen mit 3 internen Knoten (Schlüsseln) nur der eine Baum mit schwarzer Wurzel und 2 roten Kindern (der linke in der Abbildung) gebildet.
Beim Suchen und Traversieren ist wegen der identischen Form (Gestalt) der 3 Bäume alles Verhalten einschließlich Laufzeit gleich. Unterschiede gibt es aber bei den Einfügungen: Bei den rechten 2 Bäumen sind alle Einfügungen vom Typ Transformation_2 und beim linken Baum alle vom Typ Transformation_3 gefolgt von Transformation_1.

Verwandtschaft mit 2-3-4-BäumenBearbeiten

 
2 Kinder
 
3 Kinder
 
3 Kinder
 
4 Kinder

Die 4 kleinen Grafiken links und rechts zeigen, wie kleine Bausteine eines Rot-Schwarz-Baums (linke Hälften der Grafiken) mit einem (dicken) Knoten eines 2-3-4-Baums (rechte Hälften der Grafiken) zur Entsprechung gebracht werden können. Man erzeugt aus einem Rot-Schwarz-Baum einen 2-3-4-Baum, indem man rote Kinder entsprechend ihrer Kindesrichtung links oder rechts als Datenelemente in den schwarzen Elterknoten hereinholt.[18][19]

 
Der Rot-Schwarz-Baum des Beispiels dargestellt als 2-3-4-Baum

Umgekehrt kann man einen 2-3-4-Baum ganz einfach in einen Rot-Schwarz-Baum überführen: Aus einem Knoten mit 2 Datenelementen und 3 Kindzeigern (wie der Knoten [NIL,1,6] in der Abbildung) wird ein schwarzer Knoten (Datenelement) mit 1 Kindzeiger und einem roten Kindknoten (Datenelement), der noch 2 Kindzeiger enthält; aus einem Knoten mit 3 Datenelementen und 4 Kindzeigern (wie die Knoten [8,13,17] und [22,25,27] in der Abbildung) wird ein schwarzer Knoten (Datenelement) mit 2 roten Kindknoten (jeweils 1 Datenelement und 2 Kindzeiger).

Darüber hinaus gibt es Entsprechungen bei den Modifikationsoperationen (Einfügen, Löschen) zwischen Farbwechsel und Rotationen auf Seite der Rot-Schwarz-Bäume und den Aktionen Spalten (split) und Verschmelzen (fuse) bei den 2-3-4-Bäumen.

Im Gegensatz zu 2-3-4-Bäumen muss man bei Rot-Schwarz-Bäumen nicht den „Füllzustand“ (Speicherausnutzung, engl. fill factor) der Knoten beobachten und verwalten, weshalb letztere als sehr effiziente Art der Implementierung der 2-3-4-Bäume gelten.[20]

Vergleich mit AVL-BaumBearbeiten

Die Menge der AVL-Bäume ist eine echte Teilmenge in der Menge der Rot-Schwarz-Bäume. Denn jeder Binärbaum, der das AVL-Kriterium erfüllt, lässt sich in einer das Rot-Schwarz-Kriterium erfüllenden Weise einfärben.[21][22]

 
Rot-Schwarz-, aber nicht AVL-Baum

Es gibt aber Rot-Schwarz-Bäume, die das AVL-Kriterium nicht erfüllen. Die nebenstehende Abbildung zeigt zum Beispiel einen Rot-Schwarz-Baum mit 6 (internen) Knoten und der externen Pfadlängensumme 21, während 20 die größte externe Pfadlängensumme bei AVL-Bäumen (und zugleich die kleinstmögliche für alle Binärbäume) dieser Größe ist. Konsequenterweise ist auch die Worst-Case-Höhe des AVL-Baums kleiner als die des Rot-Schwarz-Baums, und zwar um den Faktor (2 log2 Φ)−1 ≈ 0,720. Allgemein werden AVL-Bäume als besser balanciert und ihr Suchverhalten als günstiger angesehen.

Die Laufzeiten für alle angeführten Operationen unterscheiden sich im Mittel und im Worst Case asymptotisch nur um einen konstanten Faktor, gehören also derselben Komplexitätsklasse an. Der Rot-Schwarz-Baum bietet allerdings amortisiert konstante Einfüge- und Löschkosten (jeweils ohne Navigation). Beim AVL-Baum sind nur die Einfügekosten amortisiert, die Löschkosten immerhin im Mittel konstant.

Realistische Anwendungssituationen mit Performancedaten und -vergleichen – auch mit weiteren Suchalgorithmen und Spielarten der Datenstrukturen – finden sich bei Ben Pfaff.[23] Seine Ergebnisse zeigen in 79 Messungen unter anderem die sehr große Ähnlichkeit von AVL-Bäumen (AVL) und Rot-Schwarz-Bäumen (RB) mit Laufzeitverhältnissen AVLRB zwischen 0,677 und 1,077 bei einem Median von ≈0,947 und einem geometrischen Mittelwert von ≈0,910.

Der Speicherplatzbedarf ist praktisch identisch: 1 Bit für die Rot-Schwarz-Farbe gegenüber 2 Bits[24] für den AVL-Balance-Faktor. Während die Balance-Faktoren eines AVL-Baums direkt von dessen Gestalt abhängen, sind bei Rot-Schwarz-Bäumen derselben Gestalt – außer bei den Minimalbäumen gerader Höhe – unterschiedliche Einfärbungen möglich (s. Abschnitt #Anzahlen von Rot-Schwarz-Bäumen). Dabei wirken sich die Unterschiede der Einfärbungen nur auf die Modifikations- und nicht auf die Navigationsoperationen aus. Des Weiteren kann jede mögliche Gestalt eines AVL-Baums durch gezielte Einfügungen auch hergestellt werden. Bezogen auf die Baumform gilt dies auch für Rot-Schwarz-Bäume; es gibt aber Baumformen, bei denen durchaus regeltreue Einfärbungen in einem reinen Einfügeszenario nicht bewirkt werden können.

Eine Folge dieser etwas größeren Freiheitsgrade ist, dass im Rot-Schwarz-Baum die für die Einfügung oder Löschung erforderlichen Farbänderungen und Rotationen schon während des Suchvorgangs – also beim Abstieg – vorgenommen werden können.[25] Diese „Top-Down-Strategie“[26] ist bspw. für persistente und nebenläufige Programmierung interessant.[27][28]

So bleibt beim Einfügen der frisch eingefügte Knoten rot (das sind die Fälle 1 bis 4). Das bedeutet, dass eine zugehörige Suchfunktion im Abstieg den Baum an der betreffenden Stelle (in logarithmischer Zeit) so vorbereiten kann, dass das endgültige Einfügen unmittelbar bei einem schwarzen Elter in Form eines roten Knotens geschehen oder eben auch unterbleiben kann. Genauso kann beim Löschen eine (andere) Suchfunktion den Baum im Abstieg so vorbereiten, dass der zu löschende Knoten rot ist und 2 NIL-Kinder hat. In beiden Fällen bleibt der Baum sowohl beim Durchführen wie beim Unterlassen der Modifikation ein gültiger Rot-Schwarz-Baum, einer Modifikation, die beim Einfügen nur aus dem Setzen eines einzigen Zeigers besteht und beim Löschen nur geringfügig komplizierter ist. Demgegenüber gibt es beim AVL-Baum Baumformen, bei denen die Entscheidung betreffend den Vollzug der Modifikation nicht mit derart geringer Implikation offen gehalten werden kann.

Verwendung von Rot-Schwarz-BäumenBearbeiten

Im Java Development Kit sind die Klassen TreeSet[29] und TreeMap[30] als Rot-Schwarz-Bäume implementiert. Sie stellen geordnete Mengen bzw. geordnete Dictionarys zur Verfügung.

Weitere BäumeBearbeiten

LiteraturBearbeiten

Einzelnachweise und AnmerkungenBearbeiten

  1. Rudolf Bayer: Symmetric Binary B-Trees. Data Structure and Maintenance Algorithms. In: Acta Informatica. 1, 1972, S. 290-306. doi:10.1007/BF00289509.
  2. Leo J. Guibas, Robert Sedgewick: A Dichromatic Framework for Balanced Trees. In: IEEE Computer Society (Hrsg.): Proceedings of the 19th Annual Symposium on Foundations of Computer Science. 1978, S. 8–21.
  3. Diese Abschätzung ist scharf (siehe #Höhenbeweis) und für   wegen
     
    marginal genauer als
     .
  4. Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein: Introduction to Algorithms. 2. Auflage. MIT Press, Cambridge (Massachusetts) 2001, ISBN 0-262-03293-7, S. 273.
  5. Mehlhorn 2008 S. 154.
  6. a b c Einige Autoren fordern noch, dass die Wurzel des Baums schwarz zu färben sei. Nicht jedoch z. B. Mehlhorn 2008 und Sedgewick. Tatsächlich stört diese Forderung die Rekursivität und erübrigt sich. Denn ist die Wurzel rot, so müssen ihre Kinder nach Forderung R schwarz sein, und bei ihrer Umfärbung auf schwarz wird keine der anderen Forderungen verletzt. In den Algorithmen kann jedoch die Zahl der Fallunterscheidungen marginal geringer gehalten werden, wenn man bei einem roten Knoten immer einen Elter voraussetzen kann.
  7. Um der Kürze der Aufschreibung willen wird im Beispielcode zweimal goto verwendet. Es ist leicht, dies durch Verdoppelung des Codes zu vermeiden.
    Noch bessere Effizienz wird erreicht, wenn nach Feststellung der Fall-Bedingung auch der Code für die ggf. mehreren Rotationen aufgebrochen und Anweisung für Anweisung auf Einsparungen überprüft wird.
  8. a b Für die Vorteile der iterativen Programmierung hinsichtlich Platz und Zeit gegenüber einer rekursiven Programmierung s. a. Binärer Suchbaum#Iterative Programmierung. Darüber hinaus erzwingt erstere eine genauere Beachtung der Knoteneigenschaften.
  9. Wären jedoch rote Wurzeln zugelassen und wäre   eine solche, dann könnte man in (nicht-d)-Richtung um   rotieren und die neue Wurzel   schwarz färben, und der Baum wäre fertiggestellt. Es wäre aber bspw. in der Transformation_2 eine zusätzliche Fallunterscheidung erforderlich.
  10. Diese Vorgehensweise wurde zum ersten Mal von T. Hibbard in 1962 vorgeschlagen, zitiert nach Robert Sedgewick, Kevin Wayne: Algorithms Fourth Edition. Pearson Education, 2011, ISBN 978-0-321-57351-3, p. 410 (englisch, abgerufen am 25. März 2018)
  11. entspricht Roger Whitney.
  12. Auf eine andere Aufteilung (der Bedingungen) der Fälle, aber im Ergebnis ebenfalls auf die Gesamtzahl 6, kommt University of Science and Technology of China (zitiert nach stackoverflow.com).
  13. Diese Minimalbäume spielen bei den Rot-Schwarz-Bäumen eine ähnliche Rolle wie die Fibonacci-Bäume bei den AVL-Bäumen.
  14. Sedgewick 2011 S. 444 Proof sketch
  15. s. a. die Überlegungen bei der Folge A027383 in OEIS
  16. Als eine Datenstruktur, die im homogenen Arbeitsspeicher (Hauptspeicher) untergebracht ist, ist der Rot-Schwarz-Baum durch dessen Größe beschränkt, also auch die Höhe des Baums und die Längen der Pfade von Blatt zu Wurzel. Gängig sind Hauptspeicher mit 32 Bit und 64 Bit breiten 8-Bit-Byte-Adressen. (Allerdings wird von den Betriebssystemen oft nur der halbe Adressbereich von 0 bis 231–1 bzw. 263–1 dem Benutzer zur Verfügung gestellt.) Der Entwickler wird Anwendern gegenüber typischerweise die Knotenzahl (also die Anzahl von Elementen) beschränken, da die Baumhöhe nur indirekt wahrnehmbar ist. Die folgende Tabelle stellt die maximale Höhe von Rot-Schwarz-Bäumen maximalen Elementanzahlen gegenüber.
    Umfang von Rot-Schwarz-Bäumen
    Anzahl Knoten   Höhe  
    100663293 50
    134217725 51
    201326589 52
    268435453 53
    402653181 54
    108086391056891901 110
    144115188075855869 111
    216172782113783805 112
    288230376151711741 113
    432345564227567613 114
    576460752303423485 115
    864691128455135229 116
    1152921504606846973 117

    Mit den Bezeichnungen im Text ist

     

    eine Maßgabe, die so knapp wie möglich unterhalb der Knotenzahl des nächstgrößeren Minimalbaums bleibt.

  17. Mehlhorn und Sanders widmen dem Thema in Mehlhorn 2008 das Kapitel „7.4 Amortized Analysis of Update Operations“. In die Sprache der Rot-Schwarz-Bäume übersetzt lautet das Hauptergebnis (Theorem 7.3, S. 158):
    Für eine beliebige Folge von   Einfüge- und Löschoperationen in einen anfänglich leeren Rot-Schwarz-Baum ist die Anzahl der Farbwechsel und Rotationen in  .
    Im Beweis, der für (2,4)-Bäume geführt wird und bei dem die Account-Methode zum Zug kommt, werden nur die split- und fuse-Operationen abgerechnet – ein Aufsuchen der betroffenen Stelle im Baum wird überhaupt nicht erwähnt. Die Aussage bezieht sich also auf die reinen Update-Kosten.
    Das Kapitel „III.5.3.2. Amortisierung von Rebalancierungskosten und Sortieren vorsortierter Files“ in Mehlhorn 1998 berücksichtigt dagegen das Aufsuchen mit dem Ergebnis (Satz 10, S. 209):
    Eine Folge von   Elementen mit   Inversionen kann in Zeitkomplexität   sortiert werden.
    Das Maß der Sortiertheit wird durch   angegeben, und es ist   mit   an der Obergrenze für völlig unsortierte Files. Für das Wirksamwerden dieser Formel für kleinere   ist allerdings eine spezielle Suchfunktion (bspw. Mehlhorn 1998 S. 208) erforderlich, die Nachbarschaften erkennt und ausnützt.
  18. Mehlhorn 1988 S. 193
  19. Wenn man die zwei Wahlmöglichkeiten bei 3 Kindern auf eine (bspw. auf die erste, die obere) einschränkt, kommt man zu den LLRB (Abkürzung für engl. left-leaning red–black) Bäumen, die im Wesentlichen dieselben informationstheoretischen Eigenschaften haben, bei deren Implementierung aber laut Sedgewick weniger Fälle zu unterscheiden sind (s. Robert Sedgewick. Left-leaning Red–Black Trees und PDF).
  20. Mehlhorn 1988 S. 187
  21. Paul E. Black: Red-black tree. In: Dictionary of Algorithms and Data Structures. National Institute of Standards and Technology, 13. April 2015, abgerufen am 2. Juli 2016 (englisch).
  22. s. „One should be able to color any AVL tree, without restructuring or rotation, to transform it into a Red-Black tree.“ Junghyun Chae in AVL Trees vs. Red-Black Trees? abgerufen am 14. Oktober 2015 und Beweis in AVL-Baum#VergleichRB.
  23. Ben Pfaff: Performance Analysis of BSTs in System Software. Stanford University 2004.
  24. oder auch nur 1 Bit (s. Implementierung)
  25. Red Black Trees. Abgerufen am 14. Oktober 2015.
  26. Mehlhorn 1988 S. 197–198.
  27. Die Sperren, die bei einem der Veränderung unterworfenen Baum der Erhaltung seiner Konsistenz dienen, können bei der Top-Down-Strategie von der Wurzel beginnend zu den Blättern fortschreitend gesetzt werden. Halten sich alle den Baum bearbeitenden Prozesse an solche (und ggf. weitere) Protokolle, kann ein Deadlock vermieden werden.
  28. s. a. Comparison of Binary Search Trees abgerufen am 14. Oktober 2015; oder Paul Callahan in AVL Trees vs. Red-Black Trees? abgerufen am 14. Oktober 2015
  29. docs.oracle.com
  30. docs.oracle.com

WeblinksBearbeiten