Detailansicht

Datenqualität für Process Mining
Alexander Brandl
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Betreuer*in
Stefanie Rinderle-Ma
Alle Rechte vorbehalten / All rights reserved
URN
urn:nbn:at:at-ubw:1-29994.86340.696966-7
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Einhergehend mit der steigenden Verbreitung und Durchdringung von Informationssystemen in Unternehmen kam es in den letzten Jahren zu einem Anstieg an von diesen Systemen aufgezeichneten Ereignisprotokolldaten. Im Rahmen des Process Mining werden auf Grundlage dieser Daten Analysen der Geschäftsprozesse durchgeführt. Mangelhafte Qualität der diesen Analysen zu Grunde liegenden Daten beeinflusst dabei die Ergebnisse und kann für Unternehmen weitreichende Folgen besitzen. Im Rahmen dieser Arbeit werden grundlegende Methoden vorgestellt, wie auf Basis syntaktischer, semantischer und lexikalischer Konzepte die Qualität von Ereignisprotokolldaten auf Basis der Betrachtung der Label einzelner Workflowelemente erhöht werden kann. Dafür werden in dieser Arbeit zunächst die allgemeinen Grundlagen aus den Bereichen Process Mining und Datenqualität aufbereitet, um danach eine definitionsmäßige Brücke zwischen beiden Fachgebieten zu schlagen. In Kapitel 3 werden zunächst aus der relevanten Literatur bekannte Ansätze und Metriken vorgestellt, um anschließend zwei im Rahmen dieser Arbeit entwickelte Methoden zur Messung der Ähnlichkeit zwischen Workflowelemente vorzustellen, die auf semantisch-lexikalischen Ansätzen beruhen. Kapitel 4 beschreibt die Anforderungen an den im Rahmen dieser Arbeit entwickelten und implementierten Prototypen zur Erstellung und Simulation von künstlich verfälschten Logdateien, auf dessen Basis die vorgestellten und entwickelten Metriken und Ansätze evaluiert werden. Ebenfalls wird ein neues Vorgehensmodell zur Verbesserung der Qualität von Ereignisprotokolldaten vorgestellt und in den Ablauf eines Process Mining Projektes integriert. Auf Basis des implementierten Prototyps erfolgt eine Evaluierung der betrachteten und entwickelten Metriken und Ansätze sowie des neu vorgestellten Vorgehensmodell in Form von vier Fallstudien, von denen drei aus dem Bereich Verwaltung und eine aus dem Bereich medizinisch-klinischer Behandlungen stammen. Die Ergebnisse dieser Evaluierungen zeigen, dass durch die Berücksichtigung semantischer, syntaktischer und lexikalischer Aspekte die Qualität von Logdaten und damit ihre Eignung für die Zwecke des Process Mining deutlich erhöht werden kann. Der Druckversion dieser Arbeit liegt eine Multimediabeilage bei.
Abstract
(Englisch)
Along with the increasing number of enterprise information systems used by companies and organisations, the number of event log data recorded by these systems have increased significantly in recent years. According to this data, process mining methods enable analysis and evaluation of business processes performed by an organisation. At the same time one has to point out the strong influence of the quality of event log data on the analysis results. Based on syntactic, semantic and lexical concepts, the present work describes methods to improve quality and cleaning of event data by considering workflow element labels. Therefore, the fundamentals of process mining and data quality will be discussed to bridge the gap between these two research fields and to find a definition for event data quality. The present work introduces common known methods and metrics and subsequently shows two new approaches of similarity measuring based on semantic-lexical aspects developed for this thesis. In addition, the work describes the requirements of the developed prototype to simulate process models and generate falsified event data, used to evaluate the developed and introduced methods and metrics. Furthermore, a completely new procedure model for quality improvement of event data is presented that ranks among the procedure of standard process mining projects. Based on the implemented prototype, four case studies out of two different domains are presented for evaluation purpose. The results indicate that considering syntactic, semantic and lexical aspects to clean event data helps to improve the quality of process mining analysis results significantly.

Schlagwörter

Schlagwörter
(Englisch)
process mining data quality event log procedure model data quality improvements cleaning event data
Schlagwörter
(Deutsch)
Process Mining Datenqualität Ereignisprotokolldaten Vorgehensmodell Verbesserung
Autor*innen
Alexander Brandl
Haupttitel (Deutsch)
Datenqualität für Process Mining
Publikationsjahr
2014
Umfangsangabe
221 S. : graph. Darst.
Sprache
Deutsch
Beurteiler*in
Stefanie Rinderle-Ma
Klassifikationen
54 Informatik > 54.00 Informatik: Allgemeines ,
54 Informatik > 54.80 Angewandte Informatik
AC Nummer
AC12232316
Utheses ID
30877
Studienkennzahl
UA | 066 | 926 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1