Formale Begriffsanalyse (FBA) ist ein Teil der mathematischen Ordnungstheorie. Ihre ursprüngliche Motivation ist die konkrete Darstellung vollständiger Verbände und deren Eigenschaften mittels (einwertiger) formaler Kontexte. Diese Datentabellen repräsentieren binäre Relationen zwischen Gegenständen und Merkmalen. Prinzipiell können auch beliebige Tabellen einer relationalen Datenbank als mehrwertige Kontexte aufgefasst und mittels sogenannter Skalierung in einwertige Kontexte übersetzt werden.

Die Theorie in ihrer heutigen Form geht zurück auf die Darmstädter Forschungsgruppe um Rudolf Wille, Bernhard Ganter und Peter Burmeister, in welcher Anfang der 1980er Jahre die Formale Begriffsanalyse entstand. Die mathematischen Grundlagen wurden jedoch bereits von Garrett Birkhoff in den 1930er Jahren im Rahmen der allgemeinen Verbandstheorie geschaffen. Vor den Arbeiten der Darmstädter Gruppe gab es bereits Ansätze in verschiedenen französischen Gruppen. Philosophische Fundierungen der Formalen Begriffsanalyse berufen sich insbesondere auf Charles S. Peirce und Hartmut von Hentig.

Formale Begriffsanalyse findet in vielfältigen Bereichen praktische Anwendung, wie Data- und Textmining, Wissensmanagement, Semantic Web, Softwareentwicklung, Wirtschaft oder Biologie.

Motivation and Philosophischer Hintergrund

Bearbeiten

Mathematische Grundlagen

Bearbeiten

Das Hauptziel der Formalen Begriffsanalyse ist die Darstellung von vollständigen Verbänden mittels formaler Kontexte einerseits, aber auch die Untersuchung von Daten in Form formaler Kontexte mit Mitteln der Ordnungstheorie andererseits. Die dafür grundlegenden Definitionen sollen in diesem Abschnitt diskutiert werden.

Formale Kontexte und Formale Begriffe

Bearbeiten

Gegeben seien zwei Mengen   und eine Relation  . Das Tripel   wird dann als formaler Kontext[1] bezeichet,   als seine Gegenstandsmenge und   als seine Merkmalsmenge; für einen Gegenstand   und ein Merkmal   bedeutet   „der Gegenstand   hat das Merkmal  “. Oft wird auch   statt   geschrieben. Die Menge   wird als Inzidenzrelation des formalen Kontextes bezeichnet.

Sind die Mengen   und   endlich, so lassen sich formale Kontexte gut in Form von „Kreuztabellen“ darstellen. Man beachte dabei, dass die Gegenstände und Merkmale in dieser Darstellung willkürlich geordnet werden können. Diese Ordnung ist dann aber nicht Teil des formalen Kontextes, sondern nur seiner Darstellung.

 
Ein formaler Kontext zu Eigenschaften der Zahlen 1-10.

Ist   Menge von Gegenständen eines formalen Kontextes  , so bezeichnet man mit

 

die Menge der gemeinsamen Merkmale der Gegenstände in  . Entsprechend definitiert wird für eine Menge   von Merkmalen von   die Menge

 

aller Gegenstände, die die Merkmale aus   besitzen. Die Menge   und   werden als die Ableitungen der entsprechenden Mengen   und   bezeichnet und die Funktionen, welche beide mit   benannt sind, Ableitungsoperatoren von   genannt.

Die Ableitungsoperatoren erfüllen eine Reihe von sehr grundlegenden Eigenschaften. Sind   Mengen von Gegenständen und   Mengen von Merkmalen, so gilt

  •   und dual  ,
  •   und dual  ,
  •   und  ,
  •  .

Tatsächlich definieren damit die Ableitungsoperatoren eine antitone Galoisverbindung zwischen den Potenzmengenverbänden der Gegenstandsmenge und der Merkmalmenge. Umgekehrt lässt sich jede solche Galoisverbindung zwischen Potenzmengenverbänden als Paar von Ableitungsoperatoren eines formalen Kontextes darstellen.

Zu einem formalen Kontext   heißt nun ein Paar   ein formaler Begriff[1] von  , falls

  •   eine Menge von Gegenständen von   ist,
  •   eine Menge von Merkmalen von   ist,
  •   und
  •   gilt.

Die Menge   wird dann Umfang und die Menge   Inhalt des Begriffes   genannt. Die Menge aller Begriffe wird mit   bezeichnet. Stellt man formale Kontexte als Kreuztabellen dar und wählt dabei eine geeignete Ordnung auf den Gegenständen und Merkmalen, so lassen sich formale Begriffe als maximale Rechtecke in dieser Kreuztabelle verstehen.

Sind nun  , so lässt sich mit

 

eine Ordung auf   definieren. Diese Ordnung macht dann die Struktur   zu einem vollständigen Verband. Tatsächlich ist umgekehrt nach dem Hauptsatz der Formalen Begriffsanalyse jeder vollständige Verband ordnungsisomorph zu einem Begriffsverband.

 
Begriffsverband zum obigen Zahlenkontext.

Begriffsverbände können als Ordnungsdiagramme dargestellt werden. Die Beschriftung von Begriffsverbänden erlaubt dabei eine vereinfachte Beschriftung. Betrachtet man für einen Gegenstand   die Menge aller Begriffe, die   in ihrem Umfang haben, so hat diese Menge einen Hauptfilter im Begriffsverband. Daher wird nur unterhalb des kleinsten Begriffs, der   im Umfang enthält, der Gegenstand   notiert. Dual dazu wird oberhalb des größten Begriffs, der ein gegebenes Merkmal   im Inhalt besitzt, das Merkmal   notiert. Ein Begriff im Ordnungsdiagramm hat also genau dann einen Gegenstand in seinem Umfang, wenn er oberhalb des Begriffes liegt, der mit dem Gegenstand beschriftet ist. Entsprechend hat ein Begriff im Ordnungsdiagramm ein Merkmal in seinem Inhalt, wenn er unterhalb des Begriffes liegt, der mit dem Merkmal beschriftet ist.

Hauptsatz der Formalen Begriffsanalyse

Bearbeiten

Es sei   ein formaler Kontext und   sein Begriffsverband. Man kann für Gegenstände   und Merkmale   dann die Begriffe

 
 

betrachten. Es wird   der Gegenstandsbegriff von   und   der Merkmalsbegriff von   genannt. Weiterhin gilt

 

Ist nun   ein vollständiger Verband, so ist   genau dann isomorph zu  , wenn es Abbildungen   gibt derart, dass

 

gilt. Insbesondere ist   isomorph zu  .

Beispiele

Bearbeiten

(aus dem Buch, zitieren!)

  • Partitionenverband
  • Tamari-Verband

Eigenschaften Vollständiger Verbände als Eigenschaften zugehöriger Kontexte

Bearbeiten

(alles nur kurz erwähnen, eventuell auf andere Seiten verweisen (auch wenn es die noch nicht gibt)).

  • Vollständige Kongruenzen
  • Pfeilrelationen
  • Verbandsoperationen als Kontextoperationen (Tensorprodukte, subdirekte Produkte, ...)
  • Verbandssymmetrien als Kontextsymmetrien

Implikationentheorie Formaler Kontexte

Bearbeiten

Implikationen und die Kanonische Basis

Bearbeiten
Definition Implikation
Definition Pseudoinhalt
Definition Kanonische Basis
Auch noch erwähnen
* Association Rules
* Regeln
* Partielle Implikationen
* funktionale und ordinale Abhängigkeiten in mehrwertigen Kontexten

Merkmalexploration

Bearbeiten

Verbindung zu anderen Formalismen

Bearbeiten
  • Beschreibungslogiken (Rudolph, Sertkaya, Distel), oder auch allgemein Theorien zur Wissenrepräsentation
  • Theorie relationaler Datenbanken
  • Philosophie?
  • Systembiologie

Varianten

Bearbeiten
  • Relational Concept Analysis
  • Fuzzy stuff

Software

Bearbeiten
  • ConExp
  • Lattice Miner
  • Galicia
  • conexp-clj (shameless plug ;)

Literatur

Bearbeiten
Bearbeiten

Einzelnachweise

Bearbeiten
  1. a b Bernhard Ganter, Rudolf Wille: Formale Begriffsanalyse; Springer, Heidelberg, 1996, Kap. 1 „Begriffsverbände von Kontexten“. ISBN 3-540-60868-0.