Provide an automatized training customized by adjustments for different convolutional neural networks to classify characters in a real environment based on generated data

Laux Jonas; undefined; undefined; undefined

doi:undefined

Detailansicht

Provide an automatized training customized by adjustments for different convolutional neural networks to classify characters in a real environment based on generated data

Jonas Laux

Art der Arbeit

Masterarbeit

Universität

Universität Wien

Fakultät

Fakultät für Informatik

Studiumsbezeichnung bzw. Universitätlehrgang (ULG)

Masterstudium Medieninformatik

Betreuer*in

Wolfgang Klas

Mitbetreuer*in

Elaheh Momeni-Ortner

Volltext in Browser öffnen

URN

urn:nbn:at:at-ubw:1-13772.91137.315066-8

Link zu u:search

(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract

(Deutsch)

Dank modernster Technologien hat Machine Learning (ML) in den letzten Jahren die Leistungen von Computervision übertroffen. ML Prozesse erfordern ein Training. Um ein gutes Trainingsprogramm zu erstellen, das benötigt wird um ein Netzwerk funktionstüch- tig zu machen, muss der für das Training verwendete Datenpool zufriedenstellend sein. Der Erwerb vorbereiteter und annotierter Daten kann jedoch kosten- und zeitintensiv sein, was durch die Generierung der Daten umgangen werden kann. Um bei solchen Aufgaben zur Vorbereitung des Trainingsaufbaus und des Trainings selbst gute Leistungen zu erbringen, bedarf es einer Kenntnis des Basiswissens. Um diese Probleme anzugehen, stelle ich ein System vor, dass alle erforderlichen Schritte in einem einfachen Ablauf vereint. Betrachtet man das folgende Beispiel. Ein User hat einen Anwendungsfall im Bereich Optical Character Recognition (OCR) und möchte ein Modell erhalten, dass auf einer spezifischen Schriftart, welches den Kern des Datansatzes repräsentiert, trainiert ist. Durch die Modifikation dieses Kerns, der aus den extrahierten Zeichen der bereitgestell- ten Font-Datei besteht, wird ein Datenset erstellt, dass bei einem Training des neuronalen Netzwerks verwendet wird. Die Parameter für den optimalen Ablauf des Trainings, sowie die Parameter der Gene- rierung der Trainings-Datensätze werden in dieser Arbeit untersucht. Darüber hinaus wird die Architektur, Struktur und Leistung des Netzwerks angepasst, so dass es in der Industrie verwendet werden kann - zum Beispiel in Mobiltelefonen. Um einen Vergleich der verschiedenen Ansätze zu gewährlisten, evaluiere ich meine Methoden, indem ich ein Validierungs-Datenset erstelle und jedes erstellte Modell mit diesem Set teste. Die daraus resultierende Genauigkeit wird zur Bewertung verwendet.

Abstract

(Englisch)

Thanks to state-of-the-art implementations ML has out-performed computer vision tasks in recent years. ML processes require training. To create a good training program to enable a network to perform, the pool of data used for the training must be satisfying. However, the acquisition of prepared and annotated data can be a costly and time- consuming task. This can be circumvented by generating the data. To perform well in such tasks for the preparation of the training setup and the training itself, one requires a knowledge of the underlying processes. To address these issues, we present a system which combines all the required steps in one simple workflow. Consider the following example. A user has a use case in the OCR scope and wants to receive a model trained on a specific font, which s/he uploads to present the ground truth. By modifying the ground truth of the extracted characters from the font file provided, a data set is created which is used in the training of the neural network model. The training’s hyperparameters and the parameters of the augmentation are studied so that the training performs optimally. In addition, the architecture, structure, and performance of the network is adjusted so it can be used in production in the industry—for example, by mobile phones. We evaluate our methods by creating a validation set and testing every model against this to determine the accuracy the model is scoring on the set.

Autor*innen

Jonas Laux

Haupttitel (Englisch)

Provide an automatized training customized by adjustments for different convolutional neural networks to classify characters in a real environment based on generated data

Publikationsjahr

2018

Umfangsangabe

xv, 96 Seiten : Diagramme

Sprache

Englisch

Beurteiler*in

Wolfgang Klas

Klassifikationen

54 Informatik > 54.72 Künstliche Intelligenz ,

54 Informatik > 54.74 Maschinelles Sehen

AC Nummer

AC15181637

Utheses ID

48070

Studienkennzahl

UA | 066 | 935 | |

Detailansicht

Abstracts

Schlagwörter