Detailansicht

A study of the evolution of low level file system features
Christina Manuela Ochsenhofer
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Betreuer*in
Wolfgang Klas
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.30126
URN
urn:nbn:at:at-ubw:1-29353.91487.838766-9
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Um Dateisysteme und ihre Dynamik verstehen und beurteilen zu können ist es wichtig zu wissen welche Daten auf den Dateisystemen gespeichert sind, und wie sich diese Daten verändern. Dennoch ist nur wenig über die Menge und Art der gespeicherten Daten, sowie über deren Dynamik und Organisation bekannt. Die Entwicklung von fortschrittlichen Speicher- und Organisationswerkzeugen, sowie viele Forschungs- und Entwicklungsaktivtäten würden von mehr Daten und Wissen über diese Themen profitieren. Die vorliegende Arbeit beschreibt Methoden die zum Überwachen von Dateisystemen verwendet werden können. Zwei Techniken für das Abrufen von Dateisysteminformationen sowie zum Erkennen von Änderungen im Dateisystem werden vorgestellt. Beide Techniken erlauben das Sammeln von Daten über Dateisysteme, welche für das Studieren von Dateisystemstatistiken verwendet werden können. Die vorliegende Studie konzentriert sich darauf herauszufinden welcher Anteil von Dateien auf einem Dateisystem Multimediadateien sind und wie diese Multimediadateien sowie andere Dateien und Verzeichnisse im Dateisystem verteilt sind. Des Weiteren werden Untersuchungen darüber durchgeführt wie sich Dateien und Verzeichnisse über die Zeit verändern und ob es Regionen im Dateisystem gibt die potenziell dynamischer sind als andere Regionen. Die erste Technik für das Sammeln von Dateisysteminformationen führt eine Echtzeitprotokollierung von Dateisystemänderungen durch, die zweite Technik erzeugt eine Momentaufnahme, auch Snapshot genannt, des gesamten Dateisystems. Auf der einen Seite liefert die Echtzeitprotokollierung des Dateisystems sehr genaue Daten über das Dateisystem und seine Dynamik. Andererseits kann diese Technik nur zur Beobachtung von kleinen Regionen des Dateisystems verwendet werden, da die Technik große Mengen an Systemressourcen benötigt und ineffizient wird sobald viele Dateisystemobjekte beobachtet werden müssen. Beim Erstellen der Snapshots werden zu jeder gefundenen Datei und zu jedem gefundenen Verzeichnis eines Dateisystems Informationen gespeichert. Die Snapshots werden zu einem bestimmten Zeitpunkt (einmal, täglich, wöchentlich, jährlich, etc.) erstellt und durch das Vergleichen von aufeinanderfolgenden Snapshots können Veränderungen im Dateisystem beobachtet werden. Ein Nachteil dieser Technik ist, dass einige Änderungen die im Dateisystem zwischen zwei Snapshots geschehen, verlorengehen können. In einem Experiment wird die Technik zum Erstellen von Snapshots verwendet, um Informationen über 16 Windows und Mac OSX Dateisysteme zu sammeln. Die Snapshots der Dateisysteme werden wöchentlich, über einen Zeitraum von zehn Wochen erstellt und durch das Vergleichen von aufeinanderfolgenden Snapshots können Veränderungen im Dateisystem beobachtet werden. Die Snapshots werden verwendet um Informationen über Dateisysteme, wie zeitliche Änderungen in der Menge der Dateien und Verzeichnisse, die Dateigrößen, das Alter von Dateien, sowie die Häufigkeit von Dateitypen, die Speicherkapazität und der Speicherverbrauch zu untersuchen. Dateisystemdesigner, sowie Entwickler von Backup oder Anti-Virus Techniken können von mehr Informationen über Dateisysteme profitieren, da sie Aufschluss darüber geben können welche Daten gespeichert sind und wie sich diese verändern. Dieses Wissen kann helfen die Geschwindigkeit und Zuverlässigkeit von Dateisystemen sowie von Backup und Anti-Virus Software zu erhöhen.
Abstract
(Englisch)
For understanding and evaluating file systems and their dynamics, it is important to know what kind of data is stored in the file systems, and how these data change. However, little is known about the amount and kind of data stored, or about their dynamics and organization. The development of advanced storage and organization tools, as well as many related research and development activities, would benefit from more data and knowledge regarding the evaluation of file systems. This thesis aims to describe methodologies used for monitoring file systems. Two techniques for retrieving file system information and for detecting changes in the file system shall be introduced. Both techniques allow for gathering data about file systems, which can be used to study file system statistics. The study at hand focuses on what fractions of files in a file system are multimedia files and how these multimedia files as well as other files and directories are distributed in the file system. Furthermore, investigations about how file systems and the data stored in them changes over time and if there are file types or regions in the file system that are potentially more dynamic than others are performed. The first technique for retrieving file system information performs real-time logging of file system changes and the second creates file system snapshots of the whole file system. On the one hand, real-time logging of the file system delivers very accurate data about the file system and its dynamics. On the other hand this technique can be used for observing small file system regions only as the technique needs a lot of system resources and gets inefficient when too many objects must be observed. When creating file system snapshots information about each file and directory found in the file system is stored. The file system snapshots are created at a certain point in time (once, daily, weekly, yearly, etc.) and by comparing consecutive file system snapshots, changes of file system related meta data can be observed. One drawback of this technique is that some changes happening between two snapshots can get lost. In an experiment, the investigated technique of creating file system snapshots is used to gather file system information of 16 different file systems using a Windows or Mac OSX operating system. The file system snapshots are created weekly over a period of ten weeks. The snapshots are used to analyse file system information such as temporal changes in file and directory counts, file size and age, file-type frequency as well as storage capacity and consumption. Temporal changes in the file system are detected by comparing consecutive file system snapshots. Designers of file systems, as well as designers of backup or anti-virus utilities can benefit from more file system information as they can draw conclusions about what kind of data is stored and how often this data changes. This knowledge can help to increase the speed and reliability of file systems, backup processes, and anti-virus scanning.

Schlagwörter

Schlagwörter
(Englisch)
Information about file systems dynamic of file systems
Schlagwörter
(Deutsch)
Informationen über Dateisysteme Danymik von Dateisystemen
Autor*innen
Christina Manuela Ochsenhofer
Haupttitel (Englisch)
A study of the evolution of low level file system features
Paralleltitel (Deutsch)
Eine Studie über die Entwicklung von Dateisystemeigenschaften
Publikationsjahr
2013
Umfangsangabe
92 S. : Ill., graph. Darst.
Sprache
Englisch
Beurteiler*in
Wolfgang Klas
Klassifikation
54 Informatik > 54.62 Datenstrukturen
AC Nummer
AC11798202
Utheses ID
26862
Studienkennzahl
UA | 066 | 935 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1