Detailansicht

DNA Data Storage
eine mögliche Zukunft der digitalen Archivierung
Hanna Mitter
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Historisch-Kulturwissenschaftliche Fakultät
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Historische Hilfswissenschaften und Archivwissenschaft
Betreuer*in
Elisabeth Schöggl-Ernst
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.77588
URN
urn:nbn:at:at-ubw:1-24958.00097.573515-6
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
In der vorliegenden Masterarbeit soll eine mögliche, zukünftige Methode der digitalen Datenspeicherung in Archiven analysiert werden. Es handelt sich hierbei um die Speicherung von digitalen Daten auf synthetisch hergestellter DNA. Die vorliegende Arbeit widmet sich der genaueren Arbeitsweise der DNA-Datenspeicherung und deren bisherige Entwicklung innerhalb der Forschung. Allerdings soll auch hinterfragt werden, inwieweit DNA-Datenspeicherung eine Zukunft in österreichischen Archiven, beziehungsweise in Archiven generell haben könnte und wie so eine praktische Umsetzung, im Rahmen des heutigen Forschungsstandes, gestaltet werden würde. Die Masterarbeit befasst sich auch mit einem naturwissenschaftlichen und informatischen Thema, welches ein inhaltliches Vorwissen für das Verständnis erfordert. Einzelne Begriffe und Abläufe werden daher im Laufe der Arbeit so gut wie möglich erklärt und aufbereitet. Für genauere Ausführungen und Vertiefungen sind an den jeweiligen Stellen weiterführende Literaturvorschläge angegeben. Mit der laufenden Zunahme von digitalen Daten, sei es jetzt über das Internet, den regelmäßigen E-Mail-Verkehr, die Verwendung des Elektronischen Aktes in der österreichischen Verwaltung oder die Sozialen Medien, müssen sich auch Archive darüber Gedanken machen, wie sie in Zukunft diese neue Menge an digitalen Daten in ihrem System speichern können. Die Verwendung von herkömmlichen technischen Speichern weist einige Nachteile auf, unter anderem die laufenden Kosten der Datenmigration, welche regelmäßig durchgeführt werden muss, um einen Verlust von Daten zu vermeiden, aber auch die Zunahme von Speicherplatz oder die Kosten für den Strom für die Speicherung der Daten. Diese und andere Aspekte sprechen dafür, sich nach einer umweltfreundlicheren und kostengünstigeren Methode der digitalen Speicherung umzuschauen. Hier kommen die sogenannten Optical Storages oder auch Write Once, Read Forever (WORF)-Speichermethoden ins Spiel. Auch DNA-Datenspeicherung fällt unter diese Begriffe. Diese Ansätze bringen unterschiedliche Vorteile im Vergleich zu jetzigen digitalen Speichermethoden mit sich. Ein großer Pluspunkt dieser Methoden ist die Tatsache, dass es keiner Datenmigration bedarf, um die digitalen Daten zu erhalten. Zusätzlich können mit diesen Methoden große Mengen an Daten auf vergleichsweise kleinem Platz gespeichert werden. Hier sticht besonders die DNA Datenspeicherung hervor. Die Forschungsarbeiten und Paper, welche sich mit diesem Thema beschäftigen, geben dazu unterschiedliche Angaben, wie viel Daten tatsächlich auf DNA gespeichert werden können, aber ein ungefährer Richtwert sind 109 Gigabyte auf einem Kubikmillimeter DNA . DNA hat den weiteren Vorteil, dass sie eine hohe Stabilität aufweist. Und diese verliert sie auch unter schwierigeren, klimatischen Bedingungen nicht. Aufgrund dieser Gegebenheiten können Optical Storages und im Besonderen die DNA Datenspeicherung als kostengünstige und effiziente Speichermethode gesehen werden. Dennoch gibt es bei der DNA Datenspeicherung auch Nachteile. Die Herstellung der synthetischen DNA ist unter heutigen Voraussetzungen immer noch sehr teuer im Vergleich zu herkömmlichen digitalen Speicherträgern. Die finanziellen Vorteile ergeben sich daher erst über einen längeren Zeitraum und nicht direkt bei der Anschaffung dieses neuen Speichers. Besonders bei der Herstellung von DNA kommt es zu unterschiedlichen Schwierigkeiten. Einerseits ist die Synthetisierung von DNA fehleranfällig, wodurch immer ein Mehr an DNA hergestellt wird, um etwaigen Datenverlust zu verhindern. Andererseits ist es noch nicht möglich, längere Stränge von DNA ohne Probleme herzustellen, wodurch gerade große digitale Daten nicht in einem Stück auf DNA gespeichert werden können . Und auch im Bereich der Lagerung und dem Auslesen ergeben sich noch Probleme, weil es teilweise noch nicht möglich ist, direkt auf nur ein Dokument in einem Pool aus DNA zuzugreifen, wodurch bei der Sequenzierung und der Decodierung Mehrkosten und Mehraufwand entstehen. Neben den theoretischen Ausführungen, wie DNA Datenspeicherung funktioniert und aufgebaut ist, soll auch ein Überblick gegeben werden, welche Forschungsprojekte sich mit DNA Datenspeicherung beschäftigen. Darunter fallen theoretische Ansätze, welche deren Theorie nur mit einer kleinen Datenmenge testen und an der Verbesserung und Weiterentwicklung der Arbeitsweise von DNA Datenspeicherung arbeiten. Der zweite Teil des Kapitels beschäftigt sich mit praktischen Ansätzen und Projekten, welche entweder schon abgeschlossen sind oder an denen noch aktiv geforscht wird. Bei diesen Projekten handelt es sich hauptsächlich um Kooperationen zwischen Universitäten und Firmen, welche gemeinsam Ansätze der DNA Datenspeicherung testen. Der Fokus der Arbeit liegt auf dem Aspekt der Umsetzung dieses Ansatzes im Archivalltag, daher wird abschließend ein Arbeitskonzept ausgearbeitet, welches darlegen soll, wie die Implementierung eines DNA Datenspeichers in einem Archiv ablaufen könnte. Es soll die nötige Vorarbeit für ein solches Projekt beinhalten, die zu setzenden Schritte aufzeigen und einen Überblick darüber geben, welche Anschaffungen ein Archiv tätigen muss oder welche zusätzlichen Anforderungen an Archivarinnen und Archivare gestellt werden müssen, damit ein digitales Archiv in DNA gespeichert werden kann. Es handelt sich hierbei um ein theoretisches Konzept, welches sich auf einen größeren Datensatz konzentriert, da bei großen Datenmengen die Vorteile der DNA Datenspeicherung besonders sichtbar sind. Bei den Daten handelt es sich um Geoinformationssystemdaten des Landes Steiermark, welche unter anderem Orthophotos und Laserdaten beinhalten. Bei einem Orthophoto handelt es sich um „eine verzerrungsfreie und maßstabsgetreue Abbildung der Erdoberfläche.“ Das Konzept konzentriert sich auf den Back-Up Speicher der Daten, wodurch der Zugriff auf die Daten auf DNA nur im Notfall notwendig wird. Insgesamt soll ein gesamtheitlicher Überblick über das Thema gegeben werden, in dem neben der Funktionsweise auch die Vorteile und die Nachteile der Methode besprochen werden sollen. Wie sich die Methode in Zukunft weiterentwickeln wird und ob es zu einer Anwendung in Archiven kommen wird, ist mit dem heutigen Stand der Forschung noch nicht vorauszusehen.
Abstract
(Englisch)
This master's thesis analyses a possible future method of digital data storage in archives, namely the storage of digital data on synthetically produced DNA. This paper is dedicated to the more precise functioning of DNA data storage and its development within research to date. However, it also questions the extent to which DNA data storage could have a future in Austrian archives, or in archives in general, and how such a practical implementation would be organised in the context of the current state of research. However, the topic of the Master's thesis also deals with a scientific and computer science topic, which requires prior knowledge of the content to understand it. Individual terms and processes are therefore explained and prepared as well as possible during the thesis. For more detailed explanations and in-depth information, further reading suggestions are provided at the relevant points. With the constant increase in digital data, be it via the Internet, regular e-mail traffic, the use of electronic files in the Austrian administration or social media, archives must also consider how they want to and can store this new volume of digital data in their system in the future. The use of conventional technical storage systems has several disadvantages, including the ongoing costs of data migration, which must be carried out regularly to avoid losing data, but also the increase in storage space or the cost of electricity for storing the data. These and other aspects speak in favour of looking for a more environmentally friendly and cost-effective method of digital storage. This is where so-called optical storage or Write Once, Read Forever (WORF) storage methods come into play. DNA data storage also falls under this term. These approaches have various advantages compared to current digital storage methods. A major point of these methods is the fact that no data migration is required to preserve the digital data. The storage medium preserves the data in its original state after the storage process. In addition, these methods can be used to store large amounts of data in a relatively small space. DNA data storage in particular stands out here. The research and papers that deal with this topic give different figures on how much data can be stored on DNA, but an approximate guideline is 109 gigabytes on one cubic millimetre of DNA. DNA has the further advantage of being very stable. And it does not lose this stability even under difficult climatic conditions. Due to these circumstances, optical storage and DNA data storage can be seen as a cost-effective and efficient storage method. However, DNA data storage also has disadvantages. Under current conditions, the production of synthetic DNA is still very expensive compared to conventional digital storage media. The financial advantages therefore only become apparent over a longer period and not immediately when purchasing this new storage device. There are various difficulties, particularly in the production of DNA. On the one hand, the synthesis of DNA is prone to errors, which means that more DNA is always produced to prevent any loss of data. On the other hand, it is not yet possible to produce longer strands of DNA without problems, which means that large digital data cannot be stored in one piece on DNA. And there are still problems in storage and reading, because it is sometimes not yet possible to directly access just one document in a pool of DNA, which results in additional costs and effort for sequencing and decoding. In addition to the theoretical explanations of how DNA data storage works and is structured, an overview will also be given of which research projects are dealing with DNA data storage. This includes theoretical approaches that test their theory with only a small amount of data and work on improving and further developing the way DNA data storage works. The second part of the chapter deals with practical approaches and projects that have either already been completed or are still actively researching. These projects are mainly collaborations between universities and companies that are jointly testing approaches to DNA data storage. The focus of the work is on the aspect of implementing this approach in everyday archive work, so a working concept will be developed at the end that will explain how the implementation of a DNA data storage facility in an archive could work. It should include the necessary preparatory work for such a project, show the steps to be taken and provide an overview of what purchases an archive must make or what additional requirements must be placed on archivists so that a digital archive can be stored in DNA. This is a theoretical concept that focuses on a larger data set, as the advantages of DNA data storage are particularly evident with large amounts of data. The data is geoinformation system data from the state of Styria, which includes orthophotos and laser data. An orthophoto is "a distortion-free and true-to-scale image of the earth's surface." The concept focuses on the back-up storage of the data, which means that access to the data on DNA is only necessary in an emergency. Overall, a comprehensive overview of the topic is to be given, in which the advantages and disadvantages of the method are to be discussed in addition to how it works. How the method will develop in the future and whether it will be used in archives cannot yet be predicted from today's perspective.

Schlagwörter

Schlagwörter
(Deutsch)
DNA Datenspeicherung Digitale Archivierung WORF
Autor*innen
Hanna Mitter
Haupttitel (Deutsch)
DNA Data Storage
Hauptuntertitel (Deutsch)
eine mögliche Zukunft der digitalen Archivierung
Paralleltitel (Englisch)
DNA data storage
Paralleluntertitel (Englisch)
a possible future for digital archiving
Publikationsjahr
2024
Umfangsangabe
106 Seiten : Illustrationen
Sprache
Deutsch
Beurteiler*in
Elisabeth Schöggl-Ernst
Klassifikation
15 Geschichte > 15.99 Geschichte. Sonstiges
AC Nummer
AC17417811
Utheses ID
74203
Studienkennzahl
UA | 066 | 804 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1