Detailansicht

Transforming keywords into conversation
implementation of a chatbot-driven system for speech impaired individuals
Lucas Munz
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Wirtschaftsinformatik
Betreuer*in
Moritz Grosse-Wentrup
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.73843
URN
urn:nbn:at:at-ubw:1-14605.41352.804950-5
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
In der künstlichen Intelligenz sind die neuesten Sprachmodelle den menschlichen Sprach- kenntnissen fast ebenbürtig. Warum also nicht diese Technologien nutzen, um die Sprache von Menschen mit Sprachbehinderungen wieder auf das menschliche Niveau zu bringen? Nach aktuellem Kenntnisstand der Forschung gibt es derzeit keine Systeme, die anhand weniger Schlüsselwörter, die Menschen mit diversen Sprachbehinderungen äußern können, in umfassende Sätze umwandeln. Im Rahmen dieser Arbeit werden verschiedene Ansätze diskutiert und bewertet, um der Forschungsfrage nachzugehen: Welches ist die beste Strategie, um ein System zu entwickeln, das aus Schlüsselwörtern ganze Sätze bildet und so sprachbehinderten Menschen eine Stimme gibt? Zunächst werden die theoretischen Grundlagen der Anwendungsfälle sowie die neuesten Entwicklungen auf dem Gebiet Natural Language Processing diskutiert. Anschließend werden verwandte Verfahren und ähnliche Projekte im Bereich der Chatbots betrachtet und es wird untersucht, ob es bereits erste Ansätze gibt, auf denen aufgebaut werden kann. Ferner werden verschiedene technologische Ansätze zur Systemimplementierung verglichen, mit dem Ziel, die optimale Lösung in die Praxis umzusetzen. Dazu werden Datensätze mit unterschiedlichen Charakteristiken generiert und einzelne Sprachmodelle damit trainiert. Um die Implementierung der verschiedenen Modelle zu evaluieren, wird ein ausführliches Experiment konzipiert und durchgeführt. Der Schwerpunkt liegt dabei, neben einigen automatischen Bewertungsmetriken, auf menschlichen Bewertungen. Diese bewerten die Leistungsfähigkeit der Modelle in simulierten Szenarien. Die erhaltenen Evaluationsdaten des Experiments werden einer detaillierten und fundierten Auswertung unterzogen. Diese Auswertung beantwortet letztlich die Forschungsfrage und liefert den Nährboden für zukünftige Projekte mit neuen Erkenntnissen. Nicht nur die Ergebnisse der Evaluation, sondern auch die neu generierten Daten des Experiments bieten Raum für weitere Arbeiten. Im Laufe der Arbeit kristallisieren sich immer wieder Erweiterungen und Folgethemen heraus. Zusammenfassend lässt sich die folgende Arbeit in drei Teile gliedern: Eine Literatur- recherche, die Implementierung und das Experiment zur Evaluierung der implementierten Lösung. Letztlich zielen die Beiträge und Kapitel darauf ab, sprachbehinderte Menschen zu befähigen, das menschliche Bedürfnis nach Kommunikation, Zuneigung und sozialer Zugehörigkeit zu befriedigen. Auf Basis der implementierten Modelle und Ergebnisse des Experiments wird die Forschungsfrage final beantwortet. Die beste Methode zur Umsetzung eines solchen Systems ist das fine-tuning eines großen Sprachmodells mit einem qualitativ hochwertigen Datensatz.
Abstract
(Englisch)
In artificial intelligence, the latest language models are almost on a par with human language skills. Utilizing these technologies could enhance the language skills of individuals with speech impairments closer to human levels. Within the scope of the thesis, different approaches are discussed and evaluated to solve such a problem. In the course of this work, it is demonstrated that there are gaps, especially in the area of keyword-driven chatbots. According to current knowledge on the state of research, there are no systems at present that convert the few keywords that people with speech impairments can still utter into comprehensive sentences in conversations. This work aims to enable these mentioned patients to fully participate in a conversation through a chatbot and ultimately giving them a voice. For this purpose, several strategies of implementing such a system are compared and based on that, various datasets are created to fine-tune one of the largest available language models. The resulting system, called DialoKEY, can create sentences derived from keywords in conversations. In a subsequent experiment, the performance of the different versions of DialoKEY is evaluated. Based on the implemented models and results of the experiment, the best way to implement such a system is to fine-tune a large language model with a high-quality data set. The detailed evaluation of the experimental outcomes confirms that the proposed system provides results that are nearly on par with human language. DialoKEY therefore takes one step further in enabling patients with speech impairments to fully participate in a conversation again.

Schlagwörter

Schlagwörter
(Deutsch)
KI Chatbots NLP Fine-Tuning Sprachmodelle GPT Transformer Sprachbeeinträchtigungen Aphasie Datensatzerstellung
Schlagwörter
(Englisch)
AI chatbots NLP Fine-Tuning Large-Language-Model GPT Transformer Speech-Impairments Aphasia Dataset-generation
Autor*innen
Lucas Munz
Haupttitel (Englisch)
Transforming keywords into conversation
Hauptuntertitel (Englisch)
implementation of a chatbot-driven system for speech impaired individuals
Paralleltitel (Deutsch)
Transformation von Stichwörtern in eine Konversation
Paralleluntertitel (Deutsch)
Implementierung eines Chatbot-gesteuerten Systems für sprachbeeinträchtigte Personen
Publikationsjahr
2023
Umfangsangabe
xiii, 136 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Moritz Grosse-Wentrup
Klassifikationen
05 Kommunikationswissenschaft > 05.00 Kommunikationswissenschaft. Allgemeines ,
17 Sprach- und Literaturwissenschaft > 17.31 Spracherwerb ,
17 Sprach- und Literaturwissenschaft > 17.35 Neurolinguistik ,
54 Informatik > 54.08 Informatik in Beziehung zu Mensch und Gesellschaft ,
54 Informatik > 54.72 Künstliche Intelligenz ,
54 Informatik > 54.75 Sprachverarbeitung
AC Nummer
AC16877713
Utheses ID
67331
Studienkennzahl
UA | 066 | 926 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1