In der Statistik und dort insbesondere in der parametrischen Regressionsanalyse ist ein linearer Prädiktor eine Linearkombination einer Reihe von Koeffizienten (Regressionskoeffizienten) und erklärenden Variablen (unabhängige Variablen), deren Wert zur Vorhersage (Prädiktion) einer Antwortvariablen verwendet wird. Diese additiv-lineare systematische Komponente ist ein Hauptbestandteil von linearen Regressionsmodellen.

Definition

Bearbeiten

In der parametrischen Regressionsanalyse wird mittels mehrerer Regressionsparameter ein Suchraum aus potenziellen Regressionsfunktionen gebildet. Im Anschluss soll diejenige Parameterkonfiguration bestimmt werden, die die höchste Anpassungsgüte für die beobachteten Werte der Antwortvariablen und erklärenden Variablen liefert. Die wichtigsten Modellklassen der parametrischen Regressionsanalyse sind zum einen die Klasse der linearen Modelle und zum anderen die Klasse der verallgemeinerten linearen Modelle. Das Beiwort „linear“ resultiert daraus, dass die beiden Modellklassen auf dem linearen Prädiktor aufbauen, der wie folgt definiert ist

 .

Dieser linearen Prädiktor wird aus den erklärenden Variablen   und den festen, aber unbekannten Regressionsparametern   gebildet, wobei   für gewöhnlich gleich eins gesetzt wird ( ). Der Parameter   ist somit der Achsenabschnitt der Regressionsgerade bzw. genauer „Regressionshyperebene“. Er bestimmt das Niveau des linearen Prädiktors und wird folglich auch Niveauparameter genannt. In der Regressionsanalyse geht es darum den Achsenabschnitt  , die Steigungsparameter   und die Varianz der Störgrößen zu schätzen.[1]

Lineare Modelle vs. verallgemeinerte lineare Modelle

Bearbeiten

Lineare Modelle gehen vom folgenden Zusammenhang zwischen der Regressionsfunktion und dem linearen Prädiktor aus

 .

Verallgemeinerte lineare Modelle dagegen gehen von aus, dass der Erwartungswert der Antwortvariablen   erst durch eine geeignete invertierbare Kopplungsfunktion   die Form eines linearen Prädiktors annimmt[2]

 .

Mit der Umkehrfunktion der Kopplungsfunktion, der Antwortfunktion   ergibt sich für die Regressionsfunktion in diesem Fall

 .

Vektor-Matrix-Schreibweise

Bearbeiten

Mittels Vektor-Matrix-Schreibweise lässt sich der lineare Prädiktor wie folgt schreiben:

 , wobei   und  .

Hierbei ist   ein  -Spaltenvektor und   ist ein transponierter  -Spaltenvektor, sodass das Produkt   eine  -Matrix bzw. ein Skalar ergibt.

Verwendung in der linearen Regression

Bearbeiten

Ein Beispiel für die Verwendung eines linearen Prädiktors ist die lineare Regression, bei der jeder die Beziehung zwischen erklärenden Variablen und Antwortvariablen durch eine additive Störgröße überlagert wird. In der multiple lineare Regression lässt sich der Zusammenhang wie folgt schreiben:

 .

Einzelnachweise

Bearbeiten
  1. Torsten Becker, et al.: Stochastische Risikomodellierung und statistische Methoden. Springer Spektrum, 2016. S. 288.
  2. Torsten Becker, et al.: Stochastische Risikomodellierung und statistische Methoden. Springer Spektrum, 2016. S. 288.