Quantilsregression

Als Quantilsregression wird eine Methode zum Schätzen der Parameter eines linearen Regressionsmodells bezeichnet. Im Gegensatz zur Kleinste-Quadrate-Schätzung, die den Erwartungswert der Zielgröße schätzt, ist die Quantilsregression dazu geeignet, ihre bedingten Quantile zu schätzen. Die Quantilsregression ist somit eine Möglichkeit durch die Betrachtung anderer Eigenschaften der Zielgrößenverteilung, den dem klassischen linearen Modell unterliegenden Fokus auf den Erwartungswert der Zielgröße aufzugeben.^[1] Die Median-Regression stellt einen Spezialfall der Quantilsregression dar.

Optimierungsproblem Bearbeiten

Pinball-Verlustfunktion mit

\tau =0{,}9

. Für

\varepsilon <0

beträgt der Fehler

-0{,}1\varepsilon

, für

\varepsilon \geq 0

beträgt er

0{,}9\varepsilon

.

Sei $Y$ eine reelle Zufallsvariable mit Verteilungsfunktion $F_{Y}(y)=P(Y\leq y)$ , dann entspricht das (bedingte) $\tau$ -Quantil von $Y$ :

Q_{Y}(\tau )=F_{Y}^{-1}(\tau )=\inf \left\{y\colon F_{Y}(y)\geq \tau \right\}

mit $\tau \in (0,1).$

Seien $(\mathbf {x} _{i},y_{i})$ mit $i\in \{1,\dots ,n\}$ beobachtete Paare von unabhängigen Variablen $\mathbf {x} _{i}$ und zugehörigen abhängigen Variablen $y_{i}$ . Das Regressionsmodell wird als $y_{i}=\mathbf {x} _{i}^{\top }{\boldsymbol {\beta }}+\varepsilon _{i}$ beschrieben, wobei prinzipiell auch nichtlineare Zusammenhänge angenommen werden können. Die optimalen Regressionsparameter können durch die folgende empirische Risikominimierung bestimmt werden:^[2]^[3]

{\hat {\boldsymbol {\beta }}}_{\tau }=\arg \min _{\beta _{\tau }}\sum _{i=1}^{n}w_{\tau }(y_{i},\eta _{i,\tau })|y_{i}-\mathbf {x} _{i}^{\top }{\boldsymbol {\beta }}_{\tau }|

.

Hierbei entspricht $\eta _{i,\tau }=\mathbf {x} _{i}^{\top }{\boldsymbol {\beta }}_{\tau }$ dem linearen Prädiktor. Die Verlustfunktion entspricht der geneigten absoluten Abweichung:

w_{\tau }(y_{i},\eta _{i,\tau })={\begin{cases}1-\tau &{\textrm {falls}}\quad y_{i}<\mathbf {x} _{i}^{\top }{\boldsymbol {\beta }}_{\tau }\\\tau &{\textrm {falls}}\quad y_{i}\geq \mathbf {x} _{i}^{\top }{\boldsymbol {\beta }}_{\tau }\end{cases}}.

Aufgrund ihres Aussehens wird die Verlustfunktion auch pinball loss genannt.^[4]

Das Optimierungsproblem kann mit typischen Optimierungsalgorithmen gelöst werden.

Beachte, dass die Unsicherheit extremer Quantile tendenziell größer ist, da die Wahrscheinlichkeitsdichte $f$ der zugrundeliegenden Verteilung dort sehr kleine Werte annimmt, siehe Empirisches Quantil#Eigenschaften:

{\text{Empirisches p-Quantil}}\sim {\mathcal {N}}\left(\mu =p,\sigma ^{2}={\frac {p(1-p)}{Nf(x_{p})^{2}}}\right),

wobei $p$ das Quantil ist, $N$ die Stichprobengröße und $x_{p}=F^{-1}(p)$ der Wert der Zufallsvariable beim p-Quantil.

Erweiterungen Bearbeiten

Zensierte Daten Bearbeiten

Für unzensierte Daten kann die normale Quantilsregression (mit Zielvariable Ereigniszeit) ebenso wie die nichtparametrische Ereigniszeitanalyse benutzt werden um die bedingten empirischen Quantile zu schätzen: bei der Ereigniszeitanalyse wird die (bedingte) Überlebensfunktion $S$ geschätzt und aus dieser kann der bedingte Quantilsschätzer direkt abgelesen werden.

Darstellung zweier Kaplan-Meier Schätzer für die Überlebenswahrscheinlichkeiten

S(t)=1-F(t)

zweier Patientengruppen als Funktion der Zeit

t

, wobei

F(t)

die Verteilungsfunktion der Tode ist. Das

\tau

-Quantil der Tode ist bei

t_{\tau }=F^{-1}(\tau )

, wobei

F^{-1}

die verallgemeinerte inverse Verteilungsfunktion der Tode ist.

Für zensierte Daten muss die Quantilsregression zur zensierten Quantilsregression erweitert werden^[5] und liefert dann eine Verallgemeinerung des Kaplan-Meier-Schätzers^[6].

Schätzung mehrerer Quantile Bearbeiten

Die simultane Schätzung mehrerer Quantile mithilfe der empirischen Likelihood kann zu effizienteren Schätzer führen als wenn nur ein Quantil geschätzt wird^[7].

Literatur Bearbeiten

Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Brian D. Marx: Regression – Models, Methods and Applications. Springer, Berlin / Heidelberg 2013, ISBN 978-3-642-34332-2, Kapitel 10: Quantile Regression, doi:10.1007/978-3-642-34333-9 (E-Book-ISBN 978-3-642-34333-9).
David J. Petersen et al.: Perspektiven einer pluralen Ökonomik. Springer Vieweg. Springer Fachmedien, Wiesbaden 2019, ISBN 978-3-658-16144-6, S. 238–240.

Einzelnachweise Bearbeiten

↑ David J. Petersen et al.: Perspektiven einer pluralen Ökonomik. Springer Vieweg. Springer Fachmedien, Wiesbaden 2019, ISBN 978-3-658-16144-6, S. 238.
↑ Roger Koenker, Gilbert Basset Jr.: Regression Quantiles. In: Econometrica: journal of the Econometric Society. 1978, S. 33–50.
↑ Roger Koenker, Kevin F. Hallock: Quantile regression. In: Journal of economic perspectives. Band 15, Nr. 4, 2001, S. 143–156.
↑ Ingo Steinwart, Andreas Christmann: Estimating conditional quantiles with the help of the pinball loss. In: Bernoulli. Band 17, Nr. 1, Februar 2011, ISSN 1350-7265, S. 211–225, doi:10.3150/10-BEJ267, arxiv:1102.2101 (projecteuclid.org [abgerufen am 11. Juli 2020]).
↑ Portnoy, Stephen. "Censored quantile regression." Journal of American Statistical Association 98.1 (2003): 00.
↑ Handbook of Quantile Regression. (2017). Vereinigtes Königreich: CRC Press. Seiten 80 ff. Google Books
↑ Cho, Hyunkeun & Kim, Seonjin & Kim, Mi-Ok, 2017. "Multiple quantile regression analysis of longitudinal data: Heteroscedasticity and efficient estimation," Journal of Multivariate Analysis, Elsevier, vol. 155(C), pages 334-343.

[1] David J. Petersen et al.: Perspektiven einer pluralen Ökonomik. Springer Vieweg. Springer Fachmedien, Wiesbaden 2019, ISBN 978-3-658-16144-6, S. 238.

[2] Roger Koenker, Gilbert Basset Jr.: Regression Quantiles. In: Econometrica: journal of the Econometric Society. 1978, S. 33–50.

[3] Roger Koenker, Kevin F. Hallock: Quantile regression. In: Journal of economic perspectives. Band 15, Nr. 4, 2001, S. 143–156.

[4] Ingo Steinwart, Andreas Christmann: Estimating conditional quantiles with the help of the pinball loss. In: Bernoulli. Band 17, Nr. 1, Februar 2011, ISSN 1350-7265, S. 211–225, doi:10.3150/10-BEJ267, arxiv:1102.2101 (projecteuclid.org [abgerufen am 11. Juli 2020]).

[5] Portnoy, Stephen. "Censored quantile regression." Journal of American Statistical Association 98.1 (2003): 00.

[6] Handbook of Quantile Regression. (2017). Vereinigtes Königreich: CRC Press. Seiten 80 ff. Google Books

[7] Cho, Hyunkeun & Kim, Seonjin & Kim, Mi-Ok, 2017. "Multiple quantile regression analysis of longitudinal data: Heteroscedasticity and efficient estimation," Journal of Multivariate Analysis, Elsevier, vol. 155(C), pages 334-343.

[1]

[2]

[3]

[4]

[5]

[6]

[7]