Detailansicht
Gender bias in neural machine translation and human simultaneous interpreting
a comparative analysis in the English into German language direction
Iris Writze
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Zentrum für Translationswissenschaft
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Translation Deutsch Französisch
Betreuer*in
Dragos Ioan Ciobanu
DOI
10.25365/thesis.73697
URN
urn:nbn:at:at-ubw:1-12867.10034.211937-1
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Kommerzielle maschinelle Übersetzungstools werden immer leistungsfähiger und zugänglicher, jedoch wird ihnen sowohl von der Wissenschaft als auch von den Medien bias vorgeworfen. Dieser gender bias wird als Ergebnis voreingenommener Daten angesehen, da maschinelle Übersetzungssysteme mit Hilfe von großen Datenmengen in Form von Textkorpora trainiert werden. Obwohl es bereits umfangreich Forschung zu den Ursachen, Symptomen und der Abschwächung von gender bias in NMT-Systemen gibt, ist dieses Thema in der Dolmetschwissenschaft erst kürzlich stärker in den Vordergrund gerückt. Die (voreingenommene) Ausgabe der Übersetzungstools könnten möglicherweise einen Einblick darin geben, wie unsere Gesellschaft spricht, und somit auch darin, wie unsere Simultandolmetscher:innen sprechen. Diese Masterarbeit befasst sich mit gender bias in der Neuronalen Maschinellen Übersetzung und dem menschlichen Simultandolmetschen in der Sprachrichtung Englisch-Deutsch. Die Tatsache, dass Englisch eine geschlechtsneutrale und Deutsch eine geschlechtsspezifische Sprache ist, kann zu Situationen führen, in denen Substantive im Englischen kein bestimmtes Genus implizieren, im Deutschen aber flektiert werden müssen. Da es im Deutschen keine offiziellen Regeln für geschlechtsneutrale Sprache gibt, dienen die Leitlinien für geschlechterneutralen Sprachgebrauch im Europäischen Parlament als Grundlage für mögliche Lösungen. Für die vergleichende Analyse werden 100 Reden aus Debatten im Europäischen Parlament transkribiert, um einen Korpus zu erstellen, der die Äußerungen der Dolmetscher:innen und die von drei neuronalen maschinellen Übersetzungssystemen enthält: DeepL, Google Translate und eTranslation. In diesem Korpus sind 932 Personenbezeichnungen annotiert, die auf Strategien wie das generische Maskulinum, das generische Femininum, binäre Optionen und gender-neutrale Sprache analysiert werden. Die quantitativen Ergebnisse beschreiben die Häufigkeit der jeweiligen Strategien und die Unterschiede zwischen den drei NMT-Systemen sowie die Ergebnisse der Dolmetscher:innen. Die qualitative Analyse der Arbeit gibt Beispiele für häufig vorkommende Begriffe in den Debatten und vergleicht die Leistungen der Dolmetscher:innen und der NMT-Systeme in diesem Zusammenhang. Diese Beobachtungen führen zu Vorschlägen für die Übersetzung bestimmter, in Konferenzsituationen verwendeter Begriffe, die für die Ausbildung von Dolmetscher:innenn und für künftige Leitlinien für gender-neutrale Sprache in Dolmetschsituationen hilfreich sein könnten.
Abstract
(Englisch)
While commercial machine translation systems have become increasingly powerful and accessible, they have also been accused of showing bias by both professionals, as well as the media. This gender bias is seen as a common result of biased training data, as machine translation systems are trained on large amounts of real-world data in the form of text corpora. Although there is substantial research on the origins, symptoms, and mitigation of gender bias in NMT systems, this has only recently become a more relevant topic for research in interpreting. An NTM system’s (biased) output could possibly provide a window into the way our society talks and therefore also into how our simultaneous interpreters speak. This master’s thesis focuses on gender bias in Neural Machine Translation and Human Simultaneous Interpreting in the German-English language direction. Using English as a natural gender language for the source speech and German as a grammatical gender language for the target speech, the language’s different grammatical typologies can lead to situations where nouns do not implicate a specific gender in English but have to be inflected in German. As there is a lack of official rules for gender-neutral language in German, the Guidelines for Gender-Neutral Language in the European Parliament serve as the foundation for possible solutions. For the comparative analysis, 100 speeches held at debates in the European Parliament are transcribed to build a corpus including the interpreter’s output and the output of three neural machine translation systems: DeepL, Google Translate and eTranslation. In this corpus, 932 personal appellations are annotated, and all output is analyzed on strategies such as the generic masculine, the generic feminine, binary options and gender-inclusive methods. Quantitative results describe the frequency of the respective strategies and the differences between the three NMT systems as well as the interpreters’ output. The qualitative analysis of the thesis gives examples of frequently occurring terms in the debates and compares the interpreters and NMT systems output in this context. These observations lead to suggestions for the translation of specific terms used in conference settings, which could be helpful for the training of interpreters and for future guidelines for gender-neutral language in interpreting settings.
Schlagwörter
Schlagwörter
(Deutsch)
Neuronale maschinelle Übersetzung Simultandolmetschen Translation gender bias
Schlagwörter
(Englisch)
Neural Machine Translation simultaneous interpreting translation gender bias
Autor*innen
Iris Writze
Haupttitel (Englisch)
Gender bias in neural machine translation and human simultaneous interpreting
Hauptuntertitel (Englisch)
a comparative analysis in the English into German language direction
Paralleltitel (Deutsch)
Gender bias in der neuronalen maschinellen Übersetzung und beim menschlichen Simultandolmetschen
Paralleluntertitel (Deutsch)
eine vergleichende Analyse in der Sprachrichtung Englisch-Deutsch
Publikationsjahr
2023
Umfangsangabe
502 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Dragos Ioan Ciobanu
AC Nummer
AC16871447
Utheses ID
66744
Studienkennzahl
UA | 070 | 331 | 345 |