Detailansicht

The feasibility of light post-editing of NMT output in the medical domain for the language pair English-Croatian
Tina Cakara
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Zentrum für Translationswissenschaft
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Translation Deutsch Bosnisch/Kroatisch/Serbisch
Betreuer*in
Dragoş Ioan Ciobanu
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.73077
URN
urn:nbn:at:at-ubw:1-20190.42943.616387-5
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Der medizinische Fachbereich ist durch intensive internationale Zusammenarbeit gekenn-zeichnet, bei der wissenschaftliche Publikationen häufig in englischer Sprache verfasst werden. Knappe Deadlines und ein begrenztes Budget machen eine professionelle Über-setzung wissenschaftlicher Arbeiten oder Abstracts oft unmöglich. In diesen Fällen kann maschinelles Übersetzen zusammen mit Post-Editing eine mögliche Lösung sein, um For-schungsergebnisse einem breiteren Publikum schneller zugänglich zu machen. In dieser Masterarbeit wird untersucht, inwieweit die bisher veröffentlichten Richtlinien für light Post-Editing (die zur Zeit der statistischen maschinellen Übersetzung erstellt wurden) richtiges Verständnis neuronaler maschineller Übersetzungen (NMT) von Texten aus dem medizinischen Bereich für das Sprachenpaar Englisch-Kroatisch sicherstellen. 68 Seg-mente aus medizinischen Abstracts (verfasst auf Englisch) wurden mit drei allgemeinen NMT-Modellen (Tilde, eTranslation und mBART) sowie einer domänenspezifischen, auf medizinische Texten trainierten Version von mBART maschinell übersetzt. Die Fehler in den maschinell übersetzten Texten wurden mit dem Qualitivity-Plug-in von Trados Studio 2021 annotiert und mit den Richtlinien für light und full Post-Editing (PE) des language data networks TAUS (Massaro et al., 2016), kombiniert mit Kriterien aus anderen Richtli-nien (Hu & Cadwell, 2016), verglichen. Die Ergebnisse dieser Masterarbeit zeigen, dass die zuvor veröffentlichten Richtlinien für light Post-Editing in aktualisierter Form auf neuronale maschinelle Übersetzungen von medizinischen Abstracts für das Sprachpaar Englisch-Kroatisch anwendbar sind. Um den Verständlichkeitsanforderungen der Ziel-gruppe der medizinischen Abstracts gerecht zu werden, wurden die bestehenden PE-Richtlinien aktualisiert, um auch Terminologiefehler mit dem Fehlerschweregrad Major in light Post-Editing zu inkludieren. Infolgedessen kann der folgende Anteil an Fehlern in den neuronal maschinell erstellten Übersetzungen dieses Projektes durch light Post-Editing korrigiert werden: Tilde ~49,5%, eTranslation ~62,0%, mBART general ~38,5% und mBART fine-tuned ~48,9% aller Fehler.
Abstract
(Englisch)
The medical domain is characterised by intense international cooperation, leading to sci-entific publications being authored mostly in English. With short deadlines and a tight budget, a professional translation of scientific papers or abstracts is often not an option. In this case, machine translation combined with post-editing can be a very useful tool to make research findings available quicker to a broader audience. This master’s thesis anal-yses how applicable the previously published guidance for MT light post-editing (pro-duced at the time of statistical MT) is to ensure the accurate understanding of NMT output of texts from the medical domain for the language pair English-Croatian. 68 segments taken from English medical abstracts are machine-translated by three general NMT mod-els (Tilde, eTranslation and mBART) alongside a domain-specific fine-tuned version of mBART. The errors in the MT outputs are annotated using the Qualitivity plug-in from Trados Studio 2021 and compared to guidelines for light and full post-editing (PE) by the language data network TAUS (Massaro et al., 2016), combined with criteria from other guidelines (Hu & Cadwell, 2016). The results of this research project show that the previ-ously published guidance for MT light post-editing is still applicable to NMT outputs of medical abstracts for the language pair English-Croatian in an updated format. In order to meet the comprehensibility needs of the intended target audience of these abstracts, the existing PE guidelines were updated to include terminology errors with the error severity Major in light post-editing, as well. As a result, the following proportion of errors in the NMT outputs used in this research project can be corrected with light post-editing: Tilde ~49.5%, eTranslation ~62.0%, mBART general ~38.5% of and mBART fine-tuned ~48.9% of all errors.

Schlagwörter

Schlagwörter
(Deutsch)
neuronale maschinelle Übersetzung Post-Editing Fehlerannotierung Accuracy Fluency
Schlagwörter
(Englisch)
neural machine translation post-editing error annotation accuracy fluency
Autor*innen
Tina Cakara
Haupttitel (Englisch)
The feasibility of light post-editing of NMT output in the medical domain for the language pair English-Croatian
Paralleltitel (Deutsch)
Die Anwendbarkeit von light Post-Editing auf neuronal maschinell erstellte Übersetzungen im medizinischen Bereich für das Sprachpaar Englisch-Kroatisch
Publikationsjahr
2023
Umfangsangabe
98 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Dragoş Ioan Ciobanu
Klassifikation
17 Sprach- und Literaturwissenschaft > 17.45 Übersetzungswissenschaft
AC Nummer
AC16770007
Utheses ID
65835
Studienkennzahl
UA | 070 | 331 | 363 |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1