Detailansicht
Verortung geschichtswissenschaftlicher Quellen mittels Geoparsing
André Novak
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Geowissenschaften, Geographie und Astronomie
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Kartographie und Geoinformation
Betreuer*in
Andreas Riedl
DOI
10.25365/thesis.70690
URN
urn:nbn:at:at-ubw:1-11244.96736.839391-0
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
„Historical GIS“, also die Anwendung von Methoden der Geoinformation in der Geschichts-wissenschaft, entstand im Zuge des spatial turns. Verbunden mit der Verbreitung der „Digital Humanities“ entwickeln sich so neue Arbeitsweisen und die Möglichkeit, auch ganz neue Fragen zu stellen. Da in der Geschichtswissenschaft vor allem mit textlichen Quellen gearbeitet wird, sollte es daher das Ziel sein, eine Arbeit mit diesen auch im Bereich des Historical GIS zu ermöglichen. Daher wurden „Qualitative GIS“-Ansätze gewählt, um dies zu verwirklichen. „Text Mining“ kann dabei helfen, räumliche Informationen aus Texten zu extra-hieren. Daher wurde ein „Geoparsing“-Workflow (Toponym Recognition + Resolution) entwickelt, welcher die Verortung geschichtswissenschaftlicher Quellen einfacher und automatisierbar macht. Dabei wurde das Online-Gazetteer „GeoNames“ für das Geocoding gewählt. Die Programmierung wurde mittels „Python“ und dem Natural-Language-Package „spaCy“ umgesetzt. Der Workflow wurde mit drei verschiedenen Quellentypen (Brief, Zeitung, Reisebericht) getestet. Auch wenn eine automatische Transkription einer Quelle mittels „OCR“ die Verortung beeinflusst, können solche Texte trotzdem zur Verortung herangezogen werden. Eine Evaluation der Ergebnisse zeigte, dass auch wenn der Workflow nur einen Teil der Ortsnamen richtig verorten konnte, trotzdem aussagekräftige Aussagen über den jeweiligen Text getroffen werden konnte, ohne diesen jemals genau gelesen haben zu müssen. Eine manuelle Nachbearbeitung kann dabei das Ergebnis deutlich verbessern. Trotzdem gibt es noch einige Optimierungsmöglichkeiten für zukünftige Arbeiten.
Abstract
(Englisch)
“Historical GIS”, that is the application of geographic information methods in historical studies, developed at the time of the spatial turn. In connection with “Digital Humanities”, new work methods and the possibility to answer completely new questions developed. Since in historical studies people mainly work with textual sources, the aim should be to work with them in the area of Historical GIS. For that reason, “Qualitative GIS”-approaches were chosen to realise this. “Text mining” can help to extract spatial information from texts. Therefore, a “geoparsing”-workflow (toponym recognition + resolution) was developed, which makes the localisation of historical sources easier and automatable. The online gazetteer “GeoNames” was chosen for geocoding. The programming was done in “Python” and the natural-language-processing package used was “spaCy”. The workflow was tested with three different types of sources (letter, newspaper, travel report). Even if an automatic transcription of a source using “OCR” influences the localisation, such texts can still be used for the “geoparsing”-process. An evaluation of the results showed that, although the workflow could only correctly locate parts of the place names, meaningful conclusions could still be drawn about the respective text without reading it closely. Manual post-processing can significantly improve the result. Nevertheless, there are still some optimisation options for future work.
Schlagwörter
Schlagwörter
(Englisch)
geography geographical-information-systems GIS historical-GIS qualitative-GIS history geoparsing location location-extraction
Schlagwörter
(Deutsch)
Geographie Geographische-Informationssysteme GIS Historical-GIS Qualitative-GIS Geschichte Geoparsing Verortung Location-Extraction
Autor*innen
André Novak
Haupttitel (Deutsch)
Verortung geschichtswissenschaftlicher Quellen mittels Geoparsing
Paralleltitel (Englisch)
Locating historical sources using geoparsing
Publikationsjahr
2021
Umfangsangabe
x, 128 Seiten : Illustrationen
Sprache
Deutsch
Beurteiler*in
Andreas Riedl
AC Nummer
AC16502852
Utheses ID
61018
Studienkennzahl
UA | 066 | 856 | |