Cantorsche Paarungsfunktion

(Weitergeleitet von Cantorsche Tupelfunktion)

Die Cantorsche Paarungsfunktion, manchmal auch Nummerierungsfunktion genannt, ist eine unter anderem in der theoretischen Informatik verwendete Abbildung, die auf dem Diagonalargument von Cantor basiert.

Mit ihr kann man ein beliebiges Paar natürlicher Zahlen durch eine einzige natürliche Zahl darstellen. Man nummeriert damit alle Zahlenpaare. Diese Nummerierung ist sogar eindeutig umkehrbar. Das heißt, man kann aus der Zahl das ursprüngliche Zahlenpaar wieder ermitteln. Mathematisch gesprochen heißt das: Die Cantorsche Paarungsfunktion ist eine bijektive totale Funktion .

Die Idee der diagonalen Abzählung der Menge aller Paare natürlicher Zahlen geht auf Georg Cantor zurück. Die Verallgemeinerung der Cantorschen Paarungsfunktion von Paaren auf Tupel wird als Cantorsche Tupelfunktion bezeichnet.

Motivation Bearbeiten

In der theoretischen Informatik wird die Cantorsche Paarungsfunktion bzw. Tupelfunktion benutzt, um Funktionen, die mehr als einen Parameter haben, auf Funktionen zurückzuführen, die nur genau einen Parameter haben, was viele Beweise deutlich erleichtert.

Die Zurückführung eines Problems auf ein (eventuell einfacheres) bereits bekanntes Problem ist eine bewährte Beweistechnik, die man als Reduktion bezeichnet.

Mit der Cantorschen Paarungsfunktion bzw. Tupelfunktion lässt sich die Berechenbarkeit von  -stelligen Zahlenfunktionen auf die Berechenbarkeit von einstelligen Zahlenfunktionen reduzieren. Das heißt, man kann sich bei der Untersuchung der Berechenbarkeit von Zahlenfunktionen auf die Untersuchung von Einstelligen beschränken und weiß, dass die gewonnenen Ergebnisse für alle (also auch für die mehrstelligen) Zahlenfunktionen gelten.

Grundsätzliches Bearbeiten

Es ist vielleicht nicht unmittelbar einsichtig, dass es möglich ist, alle beliebigen Kombinationen von zwei Zahlen durch eine Zahl zu kodieren: Die Menge aller Zahlenpaare   scheint viel größer zu sein als die Menge aller Zahlen  . Die Cantorsche Paarungsfunktion zeigt jedoch, dass beide Mengen gleich groß sind, denn sie stellt eine 1:1-Beziehung her. Sie ist eine Bijektion.

Eine Menge, die man bijektiv auf die natürlichen Zahlen abbilden kann, nennt man abzählbar unendlich; insbesondere haben die natürlichen Zahlen selbst diese Eigenschaft. Die Cantorsche Paarungsfunktion zeigt dann, dass auch die Menge der Paare natürlicher Zahlen abzählbar unendlich ist.

Definition Bearbeiten

Die Cantorsche Paarungsfunktion definiert man als

 
 ,

wobei man die natürlichen Zahlen bei 0 beginnen lässt. (Siehe z. B. DIN-Norm 5473)

Kurzschreibweise:

 

  kodiert das Paar  

Hier ist eine Skizze der Diagonal-Abzählung:

 

Auf den Achsen sind die beiden Werte aufgetragen, wie in einer Entfernungstabelle schlägt man den Wert der Cantorschen Paarungsfunktion im Schnittpunkt nach, zum Beispiel  .

Die Nummerierung ist denkbar einfach: Man zählt diagonal mit Null beginnend die Paare ab: (0,0), (1,0), (0,1), (2,0), (1,1), (0,2) usw.

Man kann das obige Bildungsgesetz direkt ablesen, wenn man sich die Summation jeweils über eine Spalte verdeutlicht.

Erweiterung auf k-Tupel Bearbeiten

Durch mehrfache Anwendung lassen sich auch  -Tupel eindeutig nummerieren. Man definiert induktiv für   die Funktionen

 

mit Hilfe der Paarungsfunktion   durch:

 

und

 

Die Funktionen   bezeichnet man als Cantorsche Tupelfunktionen.

Kurzschreibweise:

 

Umkehrfunktion Bearbeiten

Die Cantorsche Paarungsfunktion besitzt als Umkehrfunktion die Dreieckswurzel. Die Umkehrung ist eindeutig und berechenbar. Letzteres ist für die Anwendung in der theoretischen Informatik wichtig, da die Berechenbarkeit der Funktion und der Umkehrfunktion Bedingung ist, um ohne Probleme alle berechenbaren Funktionen durch einstellige Funktionen darzustellen.

Umkehrbar heißt, man kann aus einer Zahl   auf die beiden Zahlen   und   schließen, für die   gilt. Die Umkehrfunktion setzt sich aus zwei Hilfsfunktionen   und   zusammen:

Formale Definition Bearbeiten

Man schreibt ihre Inverse   komponentenweise als  , wobei gilt:

 

vermöge der Projektion

 ,

welche die  -te Komponente aus einem Tupel der Länge   auswählt.

Bei Paaren (der Fall  ) schreibt man kurz   und  , sodass man die Inverse der Paarungsfunktion als   schreiben kann.

Mit den Hilfsfunktionen (Dreieckszahl)

 

und

 

oder (abgerundete Dreieckswurzel)

 

kann man   und   wie folgt für   berechnen:

 
 

Beispiel Bearbeiten

Welches Zahlenpaar repräsentiert die Zahl 17?

Dazu bestimmt man zunächst die größte natürliche Zahl  , für die   gilt. Das lässt sich entweder durch Ausprobieren ermitteln (dabei hilft die Wertetabelle von  ):

j 00 0    1    2    3    4    5    6
f(j) 0    1    3    6   10   15   21

oder über die abgerundete Formel der Dreieckswurzel:

 

Nun kann man einsetzen:

 
 

Also gilt   Das lässt sich einfach anhand der Skizze oben verifizieren.

Computerimplementierungen Bearbeiten

Implementierung der Berechnungen in Java Bearbeiten

Bei großen Werten von   steigt der Zeitbedarf durch die WHILE-Schleife enorm, daher wurde darauf verzichtet, Schleifen zu verwenden, und stattdessen die Variante mit der Dreieckswurzel implementiert:

  public class Cantor {
    public static long compute(long x, long y) {
      return (x+y)*(x+y+1)/2 + y;
    }
    public static long computeX(long z) {
      long j = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
      return j - (z - j*(j+1)/2);
    }
    public static long computeY(long z) {
      long j = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
      return z - j*(j+1)/2;
    }
  }

Die Methode compute berechnet die dem übergebenen Zahlenpaar (x y) zugeordnete Zahl, computeX und computeY sind die Umkehrfunktionen von compute.

Implementierung der Berechnungen in Python Bearbeiten

from math import isqrt

def cantor(x, y):
    return (x + y) * (x + y + 1) // 2 +  y

def invCantor(z):
    j = (isqrt(8 * z + 1) - 1) // 2
    x = j - (z - j * (j + 1) // 2)
    y = z - j * (j + 1) // 2
    return (x, y)

Die Funktion cantor berechnet die dem übergebenen Zahlenpaar (x y) zugeordnete Zahl (z).

Die Funktion invCantor berechnet das der Zahl (z) entsprechende Zahlenpaar (x, y).

Pascal-Programm zur Berechnung der Umkehrung Bearbeiten

Das folgende Pascal-Programm berechnet die Umkehrfunktion  :

 procedure CantorPair(I : Integer; Var X,Y : Integer);
 { Gibt das i-te Paar (X,Y) in Diagonalabzaehlung zurueck }
 var
    J : Integer;

    function F(Z : Integer) : Integer;
    begin
       F := (Z * (Z + 1)) div 2
    end;

    function Q(Z : Integer) : Integer;
    var
       V : Integer;
    begin
       V := 0;
       while F(V) <= Z do
          V := V + 1;
       Q := V - 1
    end;

 begin
    J := Q(I);
    Y := I - F(J);
    X := J - Y;
 end;

Hinweis: Wird das Pascal-Programm auf realen Rechnern übersetzt, muss es mit den Einschränkungen realer Rechner leben. Das heißt, dass bei großen Werten von   Integer-Überläufe das Ergebnis verfälschen. Für die Anschauung ist ein Pascal-Programm jedoch verständlicher als eine Registermaschine.

Berechenbarkeit Bearbeiten

Die Cantorsche Paarungsfunktion ist eine totale, bijektive, berechenbare (sogar primitiv-rekursive) Funktion, daher ist auch ihre Umkehrung berechenbar.

Beweis der Berechenbarkeit der Cantorschen Paarungsfunktion Bearbeiten

Eine Methode zu beweisen, dass eine Funktion berechenbar ist, ist, eine Registermaschine anzugeben, welche die Funktion berechnet.

Dieser Maschine muss man im Register   den Funktionsparameter   und im Register     übergeben. Man erhält dann im Ausgaberegister   den Wert von   an der Stelle  .

Die folgende zweistellige Maschine berechnet die Cantorsche Paarungsfunktion  :

R4 = R1 + R2
R5 = R4 + 1
R4 = R4 * R5
R4 = R4 / 2
R0 = R4 + R2

Auf einen formalen Beweis, dass die Registermaschine tatsächlich die Funktion berechnet, wird verzichtet: Das ist offensichtlich erkennbar, wenn man die Funktionsvorschrift zur Berechnung der Cantorschen Paarungsfunktion mit der Maschine vergleicht.

Diese Registermaschine nutzt jedoch Befehle, die die einfache Registermaschine nicht kennt. Die einfache Registermaschine kennt nur die Operationen  ,   und den einfachen Test.

Durch Verfeinerung lässt sich diese Registermaschine aber auf eine einfache Registermaschine zurückführen.

Damit gibt es eine Registermaschine, die die Cantorsche Paarungsfunktion berechnet. Somit ist die Cantorsche Paarungsfunktion berechenbar.

Beweis der Berechenbarkeit der Umkehrfunktion Bearbeiten

Für den Beweis der Umkehrfunktion bietet es sich an, eine andere Definition der Berechenbarkeit zu nutzen:

Eine Funktion ist genau dann berechenbar, wenn ein WHILE-Programm existiert, das diese Funktion berechnet.

Das oben angegebene Pascal-Programm lässt sich zu einem WHILE-Programm verfeinern. Also gibt es ein WHILE-Programm, das die Umkehrfunktion berechnet. Somit ist auch die Umkehrung berechenbar.

Anwendung der Berechenbarkeit Bearbeiten

Aus der Berechenbarkeit der Cantorsche Paarungsfunktion und ihrer Umkehrung folgt, dass es für die Theorie der Berechenbarkeit ausreichend ist, sich mit einstelligen Funktionen von   zu befassen. Für Funktionen von   folgt die Berechenbarkeit dann durch die Anwendung der Cantorschen Paarungsfunktion und ihrer Umkehrfunktion:

  ist berechenbar

genau dann, wenn es eine berechenbare Funktion   gibt mit

 

Man kann zum Beispiel zeigen, dass sich alle rationalen Zahlen durch ein geordnetes Tripel   natürlicher Zahlen darstellen lassen. Damit kann man die Berechenbarkeit leicht von den natürlichen Zahlen auf die Menge der rationalen Zahlen erweitern.

Herkunft Bearbeiten

Die Idee stammt aus der Mengenlehre von Georg Cantor. Er hatte die Idee, die Größe einer Menge (Mächtigkeit, Kardinalität) mit der Größe einer anderen Menge zu vergleichen, indem man versucht, eine 1:1-Abbildung (Bijektion) dieser Menge mit der anderen Menge zu finden. Jedem Element der ersten Menge soll genau ein Element der zweiten Menge zugeordnet werden und umgekehrt. Das erscheint kompliziert, findet aber seine Berechtigung, wenn es um Mengen mit unendlich vielen Elementen geht. Siehe auch Galileis Paradoxon.

Mit einer Diagonal-Abzählung (wie oben angedeutet) zeigt man leicht, dass bei einer abzählbaren Menge   das kartesische Produkt   gleichmächtig ist zu  , was vielleicht gegen die Intuition spricht, da hier Tupel verschiedener Dimension auftreten.

Alternativen Bearbeiten

Für zwei benachbarte Punkte   und   auf der Trajektorie der Umkehrfunktion kann   beliebig groß werden, was bei der Anwendung der Abzählung unerwünscht sein kann. Daher betrachtet man auch eine Variante der Cantorschen Abzählung, bei der stets   gilt und die in diesem Sinn stetig ist. Diese Form wird die boustrophedonische Cantor-Abzählung genannt, da hier der Pfad nicht von der  -Achse zur  -Achse springt (wie in der Skizze oben dargestellt), sondern an den Achsen wendet. Sie ist auf OEIS als A319571 beschrieben.

Es gibt viele andere Möglichkeiten, Paare natürlicher Zahlen bijektiv durch eine natürliche Zahl zu kodieren, z. B. kann man mit der Formel   spiralförmig abzählen:[1]

r\c 0 1 2 3 4
0 0 1 8 9 .
1 3 2 7 10 .
2 4 5 6 11 .
3 15 14 13 12 .
4 . . . . .

Auch die einfache Formel   liefert eine Bijektion zwischen   und  :

   | 0   1   2   3   4    y
 --+----------------------->
 0 | 1   3   5   7   .
 1 | 2   6  10  14   .
 2 | 4  12  20  28   .          
 3 | 8  24  40  56   .
 4 | .   .   .   .   .
   |
 x v

Beweis der Umkehrbarkeit:   ist die größte natürliche Zahl so, dass   ein Teiler von   ist, also die Anzahl der Faktoren   in der Primfaktorzerlegung von  . Sei  . Dann ist  .

Die Primfaktorzerlegung gibt eine Möglichkeit an, beliebige endliche Tupel natürlicher Zahlen durch natürliche Zahlen zu kodieren:

 

Beispiel:

 

Literatur Bearbeiten

  • Klaus Weihrauch: Computability. Springer, Berlin u. a. 1987, ISBN 3-540-13721-1 (EATCS monographs on theoretical computer science 9).
  • Eric W. Weisstein: Pairing Function. In: MathWorld (englisch).
  • Katrin Erk, Lutz Priese: Theoretische Informatik. Eine umfassende Einführung. 2. erweiterte Auflage. Springer, Berlin u. a. 2002, ISBN 3-540-42624-8, S. 263 f. (Springer-Lehrbuch).
  • Uwe Schöning: Theoretische Informatik – kurzgefasst. 4. Auflage. Korrigierter Nachdruck. Spektrum, Heidelberg u. a. 2003, ISBN 3-8274-1099-1, S. 111 f. (Hochschultaschenbuch).

Einzelnachweise Bearbeiten

  1. Christoph Michel: Enumerating a Grid in Spiral Order. In: cmichel.io Blog. 7. September 2016, abgerufen am 7. September 2016 (englisch).