Detailansicht
Variable selection via fixed-X and model-X Knockoff procedures
detailed proofs
Mathias Wörndl
Art der Arbeit
Magisterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Wirtschaftswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Magisterstudium Statistik
Betreuer*in
Hannes Leeb
DOI
10.25365/thesis.64231
URN
urn:nbn:at:at-ubw:1-27766.25028.317769-9
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Oftmals wird eine abhängige Variable zusammen mit einer Vielzahl an Kovariaten beobachtet und Wissenschaftler sind an denjenigen Kovariaten interessiert, die einen echten Zusammenhang mit der abhängigen Variable aufweisen. Diese wichtigen Kovariaten werden mittels Variablenselektionsverfahren ausgewählt. Eine Gruppe solcher Verfahren hält dabei die FDR unter Kontrolle. Das heißt, es werden möglichst viele der wichtigen Kovariaten ausgewählt, während gleichzeitig die Anzahl an fälschlicherweise gewählten Kovariaten nicht zu groß wird. Barber und Candes (2015) haben eine solche FDR-einhaltende Variablenselektionsmethode vorgestellt, die sogenannte Knockoffs nutzt um wichtige von unwichtigen Kovariaten zu unterscheiden. Diese Ideen haben Candes et al. (2018) verwendet, um eine FDR-einhaltende Variablenselektionsmethode für eine Situation zu schaffen, in der die Verteilung der Kovariaten bekannt ist und in der die Anzahl der Kovariaten beliebig groß sein kann. Diese Arbeit stellt beide Prozeduren mit ausführlichen Beweisen im Stil eines Vorlesungsskriptes vor.
Abstract
(Englisch)
In many fields of science, a response variable together with a large number of potential explanatory variables are observed and researchers would like to know which variables are truly associated with the response. Variable selection procedures are used to detect such important explanatory variables. FDR-controlling variable selection procedures accomplish this task and make sure that most of the important variables are selected while at the same time, the number of falsely selected variables is not too high. Barber and Candes (2015) introduced such a FDR-controlling variable selection method using so-called Knockoffs to tease apart important and unimportant variables. Using the same ideas, Candes et al. (2018) created a FDR-controlling variable selection method for a setting, where the distribution of the explanatory variables is known and where the number of explanatory variables can be much higher than the number of observations. This thesis presents both techniques in a lecture-note style with detailed proofs.
Schlagwörter
Schlagwörter
(Englisch)
variable selection knockoff model-X false discovery rate (FDR)
Schlagwörter
(Deutsch)
Variablenselektion Knockoff model-X false discovery rate (FDR)
Autor*innen
Mathias Wörndl
Haupttitel (Englisch)
Variable selection via fixed-X and model-X Knockoff procedures
Hauptuntertitel (Englisch)
detailed proofs
Publikationsjahr
2020
Umfangsangabe
132 Seiten
Sprache
Englisch
Beurteiler*in
Hannes Leeb
Klassifikation
31 Mathematik > 31.80 Angewandte Mathematik
AC Nummer
AC16075733
Utheses ID
56988
Studienkennzahl
UA | 066 | 951 | |