Detailansicht

Anomalieerkennung von Energieverbrauchsdaten mittels funktionaler Datenanalyse
Johanna Fritz
Art der Arbeit
Magisterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Wirtschaftswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Magisterstudium Statistik
Betreuer*in
Lukas Steinberger
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.78410
URN
urn:nbn:at:at-ubw:1-22028.92153.331813-0
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
In dieser Arbeit wird eine mehrstufige Methodik zur Anomalieerkennung von Smart-Meter-Daten des Wiener Start-ups nista vorgestellt. Diese wird in Python implementiert, deren Performance mittels einer Simulationsstudie analysiert und deren Eignung für den Anwendungsfall evaluiert. Die Methodik setzt sich aus einem k-Means-Clustering-Schritt und einem clusterweisen Prozess aus dem Bereich der funktionalen Datenanalyse, welcher auf den statistischen Tiefemaßen Total Variation Depth und Modified Shape Similarity basiert, zusammen. Der vorgestellte Prozess konnte in der Simulationsstudie eine sehr gute Performance hinsichtlich einer hohen True- und einer niedrigen False-Positive-Rate aufweisen. Im Vergleich mit einem simpleren Ansatz der Firma nista performte die vorgestellte Methode besser. Im Anwendungsfall wurden zwei verschiedene Clustering-Ansätze an den Daten erprobt - ein simpleres multivariates k-Means-Clustering, sowie ein verfeinerter Ansatz mit einer vorhergehenden Dimensionsreduktion. Die Relevanz der gewonnenen Erkenntnisse wurde von der Firma nista erhoben. Beide Ansätze konnten für die Firma relevante Anomalien detektieren. Der verfeinerte Ansatz stellte sich durch eine höhere Anzahl relevanter und eine niedrigere Anzahl irrelevanter Anomalien als für den Anwendungsfall als besser geeignet heraus. Abschließend wird noch auf zukünftige Anwendungsbereiche und Forschungsmöglichkeiten sowie eine Reihe von eröffneten Fragestellungen eingegangen.
Abstract
(Englisch)
This thesis presents a multi-stage methodology for anomaly detection of smart meter data from the Viennese start-up nista. This is implemented in Python, its performance is analysed by means of a simulation study and its suitability for the use case is evaluated subsequently. The methodology consists of a k-means clustering step and a cluster-by-cluster process from the field of functional data analysis, which is based on the statistical depth measures Total Variation Depth and Modified Shape Similarity. In the simulation study, the process presented was able to demonstrate very good performance in terms of a high true and low false positive rate. In comparison with a simpler approach from the company nista, the method presented performed better. In the use case, two different clustering approaches were tested on the data - a simpler multivariate k-means clustering, as well as a more refined approach including a previous dimension reduction. The relevance of the insights gained was assessed by the company nista. Both approaches were able to detect relevant anomalies for the company. The refined approach turned out to be more suitable for the application due to a higher number of relevant and a lower number of irrelevant anomalies. Finally, future areas of application and research possibilities as well as a number of open questions are discussed.

Schlagwörter

Schlagwörter
(Deutsch)
Anomalieerkennung funktionale Datenanalyse Energieverbrauchsdaten Smart-Meter-Daten funktionale Daten Clustering k-Means funktionale PCA
Autor*innen
Johanna Fritz
Haupttitel (Deutsch)
Anomalieerkennung von Energieverbrauchsdaten mittels funktionaler Datenanalyse
Paralleltitel (Englisch)
Anomaly detection in energy consumption data using functional data analysis
Publikationsjahr
2025
Umfangsangabe
68 Seiten : Illustrationen
Sprache
Deutsch
Beurteiler*in
Lukas Steinberger
Klassifikationen
31 Mathematik > 31.73 Mathematische Statistik ,
31 Mathematik > 31.99 Mathematik. Sonstiges ,
54 Informatik > 54.89 Angewandte Informatik. Sonstiges
AC Nummer
AC17533492
Utheses ID
75667
Studienkennzahl
UA | 066 | 951 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1