Detailansicht

The WIBARAB database (October 2021-October 2023)
data modelling and linguistic analysis
Veronika Engler
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Philologisch-Kulturwissenschaftliche Fakultät
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Arabische Welt: Sprache u. Gesellschaft
Betreuer*in
Ana Iriarte Díez
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.74831
URN
urn:nbn:at:at-ubw:1-15680.38844.654374-7
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Ein wichtiger Teil des ERC-finanzierten Forschungsprojekts WIBARAB (What Is Bedouin-type Arabic?) ist die TEI-basierte Datenbank, die zur linguistischen Analyse einer großen Anzahl an arabischen Varietäten entwickelt wird. Die WIBARAB-Datenbank wird ungefähr 125 Features, hauptsächlich aus Phonologie, Morphologie und Syntax; aber auch eine Auswahl von lexikalischen und phraseologischen Phänomenen enthalten. Die Datenbank inkludiert im Endausbau linguistische Daten aus ungefähr 300 Publikationen, Feldforschung und persönlichen Kommunikationen mit Expert*innen zu rund 320 arabischen Varietäten. Aufgrund des Forschungsschwerpunkts des Projektes, der auf der Dichotomie zwischen Beduinen- und Sesshaftendialekten liegt, werden viele der inkludierten Varietäten in (ehemals) nomadischen Gemeinschaften gesprochen. Die WIBARAB-Datenbank wird nicht nur die erste Datenbank ihrer Größe, die ausschließlich arabische Varietäten beinhaltet, sondern auch die erste, die sich auf beduinische Varietäten spezialisiert. Die vorliegende Masterarbeit dient sowohl der Dokumentation der Datenbank und der ersten zwei Jahre ihrer Entwicklung als auch als Probelauf ihrer vorläufigen Analysefunktionen. Die Arbeit beinhaltet eingehende Beschreibungen der verschiedenen Quellen- und Datentypen, der methodologischen Überlegungen und Herausforderungen, die sich während der Entwicklung des Datenmodells ergaben, und des Datenmodells selbst. Sie beschreibt auch den Prozess der Datenkodierung und die analytischen Funktionen, die die Datenbank schlussendlich besitzen wird. Einige dieser Funktionen werden in einer Analyse des linguistischen Features „Realisierung von qāf“ aufgezeigt. Die Analyse ist auf die geographische Verteilung der Realisierungen von qāf, den Vergleich urbaner und beduinischer Varietäten und einen Vergleich zwischen drei Ländern fokussiert. Die wichtigsten Ziele dieser Masterarbeit sind die Dokumentation der Datenbank und ihrer Entwicklung, die Illustration der Eigenschaften einer TEI-basierten Datenbank und die Demonstration der analytischen Funktionen der Datenbank.
Abstract
(Englisch)
A vital part of the ERC funded WIBARAB (What Is Bedouin-type Arabic?) project is its TEI-based database which is being constructed to facilitate linguistic analysis of a great number of Arabic varieties. The WIBARAB database will include approximately 125 features, mainly from phonology, morphology, and syntax, but also a selected set of lexical and phraseological items. The finished database will contain linguistic data from approximately 300 publications, fieldwork campaigns and personal communications with experts on around 320 Arabic varieties. Many of these varieties are spoken by (formerly) nomadic communities due to the project’s research focus on the Bedouin-sedentary split of Arabic. The WIBARAB database will not only be the first all-Arabic database of this size, but it will also be the first one to focus on the varieties spoken by Bedouins. This thesis serves both as a documentation of the database and the first two years of its development, and as a trial run of the database’s preliminary analytic functions. It contains a thorough documentation of the database’s different types of sources and data, the methodological considerations and challenges that arose during the development of the data model, and a detailed description of the data model itself. It also describes the data encoding process and the analytic functions the database will ultimately have. Some of these functions are also demonstrated in an analysis of the linguistic feature ‘reflexes of qāf’ which focuses on the geographical distribution of the different reflexes of qāf, a comparison of urban and Bedouin varieties, and a comparison of three countries. The main objectives of the thesis are the documentation of the database and its construction, the illustration of the specificities of a TEI-based database, and the demonstrations of the database’s analytic functions.

Schlagwörter

Schlagwörter
(Deutsch)
Datenbank TEI Arabisch Beduinen Linuistische Analyse Digitale Geisteswissenschaften Dialektologie
Schlagwörter
(Englisch)
Database TEI Arabic Bedouin Linguistic Analysis Digital Humanities Dialectology
Autor*innen
Veronika Engler
Haupttitel (Englisch)
The WIBARAB database (October 2021-October 2023)
Hauptuntertitel (Englisch)
data modelling and linguistic analysis
Paralleltitel (Deutsch)
Die WIBARAB-Datenbank (Oktober 2021-Oktober 2023)
Paralleluntertitel (Deutsch)
Datenmodellierung und linguistische Analyse
Publikationsjahr
2023
Umfangsangabe
133 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Ana Iriarte Díez
Klassifikationen
10 Geisteswissenschaften allgemein > 10.03 Methoden und Techniken der geisteswissenschaftlichen Forschung ,
18 Einzelne Sprachen und Literaturen > 18.74 Arabische Sprache und Literatur
AC Nummer
AC17010647
Utheses ID
69302
Studienkennzahl
UA | 066 | 676 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1