Detailansicht

Data analytics for smart product configuration
statistical analysis of operational log data in a smart city platform
Tomislav Maruscak
Art der Arbeit
Magisterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Wirtschaftswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Magisterstudium Statistik
Betreuer*in
Erhard Reschenhofer
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.52104
URN
urn:nbn:at:at-ubw:1-29850.70930.384878-9
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Die Analyse von Log-Daten bekommt im letzten Jahrzehnt zunehmende Aufmerksamkeit in der Wissenschaft. Während die Verwendung von Log-Daten für Debugging schon üblich ist, ist deren Analyse zur Optimierung und zu sonstige Zwecken ein offenes Problem in der Literatur. Das volle Potential der Analyse von Log-Daten wird eingeschränkt durch unterschiedliche Hindernisse, wie z.B. keine (fehlende) Standards oder heterogene Variablen (sie können, unter anderem, nominal, aber auch alltägliche Sprache sein). Diese Magisterarbeit schlägt eine statistische Vorgehensweise für die Analyse von Log-Daten vor. Insbesondere stellen wir eine Menge von Verfahren dar, sowohl zur Ableitung von wichtigen Maßen aus semi-strukturierten Log-Daten, als auch Strukturbruchtests zur Feststellung von plötzlichen Änderungen in diesen Maßen. Zusätzlich dazu führen wir Wege zur Erkennung von Abweichungen vom erwarteten Verhalten des Systems ein, und zur dynamischen Anpassung der Grenzen zur Erkennung eines atypischen Zustands des Systems. Die vorgeschlagene Methodik wird an Daten einer Implementierung aus der realen Welt erfolgreich getestet . Die Arbeit, die in dieser Magisterarbeit präsentiert worden ist, ist ein Teil des H2020 EU-geförderten Projektes „SUPERSEDE“. Teile davon werden im kommenden Deliverable D2.5DataAnalysis_v2 enthalten sein.
Abstract
(Englisch)
The analysis of log files has attracted an unprecedented attention of scientific community in the last decade. While usage of log files for debugging purposes is common, the analysis for optimization and further purposes is an open hot topic in literature. Unleashing the full potential of log file analysis is prevented by a number of obstacles, e.g. lack of standards, heterogeneity of features (mostly nominal, but also natural text), etc. This thesis proposes a statistical approach for automatizing the analysis of log files. In particular, we present a set of methods for the extraction of relevant metrics from semi-structured log files and structural break tests to detect abrupt changes in these metrics. In addition we introduce means to identify deviations from expected system behaviour and to dynamically tune thresholds for the detection of anomalous system conditions. Proposed methodology was successfully tested by using actual log file from a real-world implementation. The work performed in this thesis is a part of the H2020 EU-funded project “SUPERSEDE”. Parts of this thesis will be included in the upcoming project deliverable D2.5DataAnalysis_v2.

Schlagwörter

Schlagwörter
(Englisch)
data analysis smart city platform rule evaluation KPI extraction structural break tests kernel density estimation operational log data nominal variables
Schlagwörter
(Deutsch)
Datenanalyse Smart-City-Platform Rule-Evaluation KPI Extrachierung nominale Variablen Strukturbruchtests Kerndichteschätzer operative Log Daten
Autor*innen
Tomislav Maruscak
Haupttitel (Englisch)
Data analytics for smart product configuration
Hauptuntertitel (Englisch)
statistical analysis of operational log data in a smart city platform
Paralleltitel (Deutsch)
Datenanalyse für Smart Product Configuration : statistische Analyse von operativen Log-Daten einer Smart City Platform
Publikationsjahr
2018
Umfangsangabe
79 Seiten : Illustrationen, Diagramme
Sprache
Englisch
Beurteiler*in
Erhard Reschenhofer
Klassifikationen
31 Mathematik > 31.73 Mathematische Statistik ,
31 Mathematik > 31.99 Mathematik: Sonstiges
AC Nummer
AC15081362
Utheses ID
46020
Studienkennzahl
UA | 066 | 951 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1