Detailansicht

Die Full- und die Split-Methode
zwei auf On-line Setting basierende Herangehensweisen zur Konstruktion konformaler Konfidenzbereiche im Rahmen von Regressionsanalysen
Mario Giuseppe Caputo
Art der Arbeit
Magisterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Wirtschaftswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Magisterstudium Statistik
Betreuer*in
Hannes Leeb
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.47390
URN
urn:nbn:at:at-ubw:1-26130.02626.887961-2
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Methoden zur Konstruktion konformaler Konfidenzbereiche, welche im Rahmen des sogenannten On-Line Settings angewendet werden, haben vor allem durch die Arbeit von Gammerman et al. (2005) sowie von Shafer und Vovk (2008) Bekanntheit erlangt. Die hier vorliegende Arbeit beschäftigt sich mit zwei besonderen Herangehensweisen: die Full- und die Split-Methode, welche beide in G‘Sell et al. (2016) vorgestellt werden. Dabei wird der Schwerpunkt auf zwei Aspekte gelegt. Zum einen wird gezeigt, dass beide Methoden unter der Bedingung der Vertauschbarkeit der datengenerierenden Folge von Zufallsvariablen bei fester Stichprobengröße gültige Konfidenzbereiche hervorbringen, d.h. Konfidenzbereiche, deren Übderdeckungswahrscheinlichkeit das vorgegebene Konfidenzniveau nicht unterschreitet und mit wachsender Stichprobe sich diesem sogar annähert. Zum anderen wird unter der stärkeren Annahme, dass die datengenerierende Folge aus unabhängigen und identisch verteilten Zufallsvariablen besteht, für beide Methoden die auf wachsende Stichproben Bezug nehmende Asymptotik untersucht, wobei das Konvergenzverhalten der empirischen Überdeckungsrate sowie der Breite der Konfidenzbereiche von Relevanz ist. Diese Untersuchung wird außerdem noch durch eine einfache Simulation eines On-Line Settings exemplarisch ergänzt. Im Verlauf dieser Arbeit zeigt sich, dass bezüglich rechentechnischer Umsetzung und Robustheit die Split-Methode gegenüber der Full-Methode einige Vorzüge aufzuweisen hat.
Abstract
(Englisch)
Methods to construct conformal confidence regions, which are applied within the framework of the so called on-line setting, have been popularised through Gammerman et al. (2005) as well as through Shafer and Vovk (2008). The work in hand deals with two particular approaches: the full- and the split-method, which are both introduced by G’Sell et al. (2016). The focus is laid on two issues. On the one hand, it is shown that under exchangeability of the data generating sequence of random variables and fixed sample size both methods generate valid confidence regions, i.e. confidence regions whose coverage probability does not fall short of the given confidence level and even converges towards it with increasing sample size. On the other hand, the asymptotics of both methods, which refers to increasing sample size, are examined with respect to the convergence behaviour of both the empirical coverage rate and the width of the relevant confidence regions under the stronger assumption that the data generating sequence consists of independent and identically distributed random variables. In addition, these examinations are supplemented by a simple simulation of an on-line setting framework. Throughout this work, it becomes apparent that the split method exhibits some advantages over the full method regarding computational realization and robustness.

Schlagwörter

Schlagwörter
(Englisch)
full method split method conformal inference on-line setting regression prediction
Schlagwörter
(Deutsch)
Full-Methode Split-Methode konformale Inferenz On-Line Setting Regression Prognosen
Autor*innen
Mario Giuseppe Caputo
Haupttitel (Deutsch)
Die Full- und die Split-Methode
Hauptuntertitel (Deutsch)
zwei auf On-line Setting basierende Herangehensweisen zur Konstruktion konformaler Konfidenzbereiche im Rahmen von Regressionsanalysen
Paralleltitel (Englisch)
The full and split method: two approaches based on on-line setting to construct conformal confidence regions within the framework of regression analysis
Publikationsjahr
2017
Umfangsangabe
135 Seiten : Diagramme
Sprache
Deutsch
Beurteiler*in
Hannes Leeb
Klassifikationen
31 Mathematik > 31.73 Mathematische Statistik ,
31 Mathematik > 31.80 Angewandte Mathematik ,
54 Informatik > 54.89 Angewandte Informatik: Sonstiges
AC Nummer
AC13741765
Utheses ID
41938
Studienkennzahl
UA | 066 | 951 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1