Detailansicht
Anomaly detection in financial services
a comparison study of different methods used for anomaly detection
Enis Pinari
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Wirtschaftswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Business Analytics
Betreuer*in
Yllka Velaj
DOI
10.25365/thesis.77495
URN
urn:nbn:at:at-ubw:1-22420.88625.146830-6
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Anomalieerkennung, auch als Ausreißererkennung bekannt, ist der Prozess der Identifizierung von Datenpunkten, die keinem festgelegten Muster folgen. Sie wird seit langem angewendet, vor allem in der Statistik, doch im Laufe der Zeit hat sich ihre Anwendung auf verschiedene Bereiche ausgeweitet. Ein Anomalieereignis könnte auf einen möglichen Betrug, Netzwerkprobleme, Krankheiten oder fehlerhafte Geräte hinweisen. Eine der größten Herausforderungen beim Umgang mit Anomalien besteht darin, zu definieren, was ein normaler Punkt ist und welche Eigenschaften er besitzt. Forscher haben zahlreiche Studien durchgeführt, in denen eine große Anzahl von Anomalieerkennungsmodellen in verschiedenen Bereichen bewertet wurden. Diese Studien haben die Notwendigkeit der Anomalieerkennung insbesondere im Finanzsektor hervorgehoben. Die Entwicklungen in der Finanzbranche haben sie eng mit Technologie und Daten verknüpft, um den Entscheidungsprozess zu verbessern und die Effizienz zu steigern. Obwohl der technologische Fortschritt das Datenvolumen erhöht hat, mit dem das Unternehmen zu tun hat, ist ein wachsender Bedarf an Anomalieerkennung entstanden. Im Finanzwesen besteht die Aufgabe der Anomalieerkennung darin, ungewöhnliche Muster zu identifizieren, die zu Betrug, Identitätsdiebstahl, Geldwäsche usw. führen könnten. Ziel dieses Dokuments ist es, die Leistung von unbeaufsichtigten und überwachten Modellen des maschinellen Lernens bei der Anomalieerkennung anhand von Finanzdaten zu vergleichen. Es erweitert die bestehende Benchmarkforschung, indem sowohl klassische als auch fortgeschrittene Modelle bewertet werden. Darüber hinaus betont es die Bedeutung der Anomalieerkennung in der Finanzbranche, bietet Einblicke in die Modellwirksamkeit und bietet Finanzfachleuten Anleitung bei der Auswahl geeigneter Modelle basierend auf den Eigenschaften ihrer Datensätze oder anstehenden Aufgaben. Um unser Ziel zu erreichen, führen wir zwei Hauptexperimente durch. Experiment 1 verwendet vier reale Finanzdatensätze, um die Leistung der Algorithmen des maschinellen Lernens zu vergleichen, wobei ROC AUC, F1-Score und Laufzeit als Leistungsmetriken verwendet werden. Für Experiment 2 verwenden wir synthetische Datensätze, um die Skalierbarkeit des ausgewählten Modells zu testen. Den Ergebnissen der Experimente zufolge sind XGBoost, CatBoost und Random Forest Classifiers das beste Modell, was gute Genauigkeitswerte und eine angemessene Rechenlaufzeit betrifft. Andere Modelle mit guter Leistung sind KNN, Isolation Forest und DBSCAN.
Abstract
(Englisch)
Anomaly Detection, also known as outlier detection, is the process of identifying data points that do not follow establish patterns. It has a long history of application, primarily in statistics, nonetheless with passing time its application has expanded across various domains. An anomaly event could indicate a potential fraud, network issues, diseases or faulty equipment. One of the biggest challenges, when dealing with anomalies, is defining what is a normal point and what characteristics it possess. Researchers have conducted numerous studies evaluating a vast number of anomaly detection models across various domains. These studies have highlighted the need for anomaly detection, especially, in the financial sector. The developments in the financial industry have closely connected it to technology and data with the purpose of improving decision-making process and increasing efficiency. Though, the technological advancement have increased the volume of data the business is dealing with, it has created a growing need for anomaly detection. In finance, the role of anomaly detection is to identify unusual patters that could lead to fraud, identity theft, money laundering, etc. The aim of this paper, is to compare the performance of unsupervised and supervised machine learning models in anomaly detection using financial data. It extends existing benchmark research by evaluating both classical and advanced models. Furthermore, it emphasizes the importance of anomaly detection in the financial industry, providing insights into model effectiveness and offering guidance for finance professionals in selecting appropriate models based the characteristics of their datasets or tasks at hand. To achieve our goal, we conduct two main experiments. Experiment 1, uses four real world financial datasets to compare the performance of the machine learning algorithms, using ROC AUC, F1 Score and Runtime as the main performance metrics. For experiment 2, we use synthetic datasets to test the scalability of the chosen models. According to the findings of experiments, XGBoost, CatBoost and Random Forest Classifiers are the best model, in terms of providing good accuracy scores and reasonable computational runtime. Other good performing models are KNN, Isolation Forest and DBSCAN.
Schlagwörter
Schlagwörter
(Deutsch)
Anomalieerkennung Maschinelles Lernen Modelle Finanzen Leistung Metriken
Schlagwörter
(Englisch)
anomaly detection machine learning models finance metrics performance
Autor*innen
Enis Pinari
Haupttitel (Englisch)
Anomaly detection in financial services
Hauptuntertitel (Englisch)
a comparison study of different methods used for anomaly detection
Publikationsjahr
2024
Umfangsangabe
xi, 73 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Yllka Velaj
Klassifikationen
54 Informatik > 54.99 Informatik. Sonstiges ,
85 Betriebswirtschaft > 85.00 Betriebswirtschaft. Allgemeines
AC Nummer
AC17406780
Utheses ID
73904
Studienkennzahl
UA | 066 | 977 | |