Detailansicht

TIDATE - time and data aware process mining at runtime
Florian Stertz
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Dr.-Studium der technischen Wissenschaften (DissG: Informatik)
Betreuer*in
Stefanie Rinderle-Ma
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.71827
URN
urn:nbn:at:at-ubw:1-24287.32955.379031-9
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
In einer relativen kurzen Zeit hat sich Process Mining erfolgreich als Technologie etabliert, welche Unternehmen unterstuetzt Business Processes zu finden. Process Mining Algorithmen kontrollieren auch die Ausführung von Prozessinstanzen im Vergleich mit einen Prozessmodell und das Verbessern der Prozesse durch das Entdecken von Engpässen bei der Nutzung von geteilten Ressourcen. Die Grundlage für diese Verfahren bilden Process Execution Logs Dateien. Diese beinhalten Informationen von bereits ausgeführten Aktivitäten alter Prozessinstanzen, wie Namen und Ausführungsdatum einer Aktivität. Üblicherweise werden Prozessminingalgorithmen nach der Exekution von Prozessinstanzen durchgeführt, offline. Außerdem werden Datenelemente, wie Sensordaten, welche nicht direkt in der Logik von Prozessen verarbeitet und gespeichert werden, nicht in die Algorithmen miteinbezogen, obwohl diese den Ablauf von Prozessinstanzen beeinflussen können. So werden z.B. der Blutdruck oder andere Vitalitätszeichen in bestimmen Abständen im Krankenhaus gemessen werden , die Messwerte werden jedoch nicht einer bestimmten Aktivität zugeordnet in einem Prozess. Online Prozessminingalgorithmen hingegen werden direkt während der Ausführung von Prozessinstanzen angewendet. Externe Datenelemente werden aber weiterhin nicht beachtet. Diese Limitierungen von offline Prozessminingalgorithmen, sowie die Vernachlässigung von externen Daten bilden eine Forschungslücke, z.B. wie kann man Abweichungen nicht nur feststellen sondern auch den Grund erklären? Sollte zum Beispiel eine neue medizinische Richtlinie den Therapieplan von Patienten in einem Krankenhaus ändern, so können online Prozessminingalgorithmen, welche Datenelemente miteinbeziehen, eine Veränderung in dem Prozessmodel feststellen. Durch das Entdecken aller Prozessmodelle für einen Prozess in seiner Lebenszeit, können die Arten von Concept Drifts (Änderungen im Modell) genau bestimmt werden and Domainexperten können diese Modelle nutzen um zukünftige Prozessinstanzen anzupassen. Durch in Betracht ziehen von externen Datenelementen kann der Grund für eine Abweichung festgestellt werden. Wird z.B. ein anderes Medikament verabreicht weil ein Medikament zuvor nicht gewirkt hat, kann dies über das Einbeziehen von externen Datenelementen, wie der Temperatur eines Patienten, ermittelt werden. Die Temperatur wird ständig gemessen, jedoch nicht als Datenelement in einer Aktivität gespeichert, aber sie würde den Grund für die Abweichung in der Prozessinstanz erklären im Therapieplan. Diese Abschlussarbeit präsentiert das TIDATE framework, welches neue Konzepte und Algorithmen für online Prozessmining beinhaltet. Es beinhaltet Techniken um einen Event Stream zu erzeugen, eine Datenstruktur welche direkt während der Ausführung einer Prozessinstanz generiert wird. Zusätzlich, da die Logik von Prozessen sich laufend ändert, bietet TIDATE auch ein innovatives Konzept, Process History, welches die Evolution von einem Prozess abbildet und Prozessmodelle beinhaltet, welche nicht nur die Arbeitsabläufe darstellen, sondern auch die Datenelemente berücksichtigen. Die online Conformance Checking-Algorithmen in TIDATE basieren auf den Datenelementen, welche intern gespeichert in einer Prozessengine sind und jene welche außerhalb der Prozesse gespeichert werden, wie z.B. Sensordaten. Das ist wichtig, um den Grund für Abweichungen in Prozessinstanzen zu ermitteln, aber auch um die Abweichungen zu gewichten. Diese Konzepte sind evaluiert durch Prototypen, welche künstlich erzeugte Datensätze und auch echte Datensätze verwenden. Abschließend ist festzuhalten, dass TIDATE es Unternehmen ermöglicht, einen Datensatz zu generieren auf welchen online Prozessminingalgorithmen angewendet werden können. Auf diesen können Abweichungen und Änderungen in der Prozesslogik ehestmöglich erkannt, bestimmt und gewichtet werden
Abstract
(Englisch)
In a short period of time, process mining emerged successfully as a technology to support companies in identifying business processes, check the conformance of business processes, and even enhance business processes by detecting bottlenecks with shared resources across different processes. This is usually achieved by using process execution logs, i.e., data files containing information of the executed tasks like the name of a task, or the timestamp of the execution. In its traditional application, process mining is applied offline, i.e., after the execution. It is also important to note, that specific data elements, e.g., time series sensor data, that are often captured outside of the process execution log, can potentially impact the execution of a process as well, but are not properly taken into account in traditional process mining, e.g., the blood pressure and other vital signs are periodically measured for patients in a hospital, but the data points are not related to a specific task in a process. Online process mining tackles the first problem of traditional process mining and applies techniques directly during the execution, but data elements are often not taken into account as well as exterior data, like sensor data elements. These limitations of offline process mining and negligence of exterior data, create a research gap, i.e., how can deviations in the execution of process instances be explained? E.g., a new medical guideline changes the therapy plan for patients in a hospital. Online process mining using data elements can detect a new process model in store it in a history of older process models for a process. This allows domain experts to determine the type of concept drift and suggest adjustments for the process model for future instances. When process mining techniques take exterior data into account, an explanation for a deviation can be provided for domain experts, i.e., a specific drug is not working according to the body temperature of a patient, hence a different drug is used. The body temperature is usually monitored constantly and not logged in a process execution log directly, but offers an explanation for the change in the therapy plan. This thesis provides the TIDATE framework, containing novel concepts and algorithms for online process mining. It comprises techniques to generate an event stream, i.e, a data structure created during the execution of business processes containing all generated events of process instances. In addition, since business processes change constantly, TIDATE also provides an innovative concept, that reflects the evolution of a business process, containing all different process models, discovered after drifts in the workflow perspective and/or data perspective for a process, a process history. The online conformance checking approach of this framework is based on data elements, interior data captured by the process execution as well as exterior data like sensor data streams, to identify the source of a potential drift in the business process and weigh deviations in a process instance to better quantify the degree of conformance of an instance. These concepts are evaluated through prototypical implementations using artificial and real world data sets. To conclude TIDATE enables companies to generate event streams and apply online process mining techniques. It is used to identify drifts in the process logic as early as possible, find the reason and explanation of the drift and to detect and quantify non conformance in the behavior of executed process instances

Schlagwörter

Schlagwörter
(Deutsch)
process mining workflow systems conformance checking process discovery concept drifts XES Zeitserien
Schlagwörter
(Englisch)
process mining workflow systems conformance checking process discovery concept drifts XES time series
Autor*innen
Florian Stertz
Haupttitel (Englisch)
TIDATE - time and data aware process mining at runtime
Publikationsjahr
2022
Umfangsangabe
xxi, 176 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*innen
Andrea Burattin ,
Erich Schikuta
Klassifikationen
54 Informatik > 54.00 Informatik: Allgemeines ,
54 Informatik > 54.99 Informatik: Sonstiges
AC Nummer
AC16591157
Utheses ID
62643
Studienkennzahl
UA | 786 | 880 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1