Detailansicht

Design and implementation of a dataspace model for e-Science applications
Adnan Muslimovic
Art der Arbeit
Diplomarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Betreuer*in
Peter Brezany
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.2658
URN
urn:nbn:at:at-ubw:1-29070.12322.837955-4
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Wissenschaftliche Daten stammen aus verschiedenen Wissens- und Forschungsgebieten, wobei durch die Sammlung dieser Daten große Datenbestände entstehen. Diese oft heterogenen und geographisch verteilten Datenmengen befinden sich auf verschiedenen Serversystemen und werden im Forschungsbereich der e-Science unter dem Begriff primary data zusammengefasst. Forscher aus der ganzen Welt verwenden diese rohen Daten im Zuge vieler wissenschaftlicher Applikationen für ihre Forschungsexperimente und Analysen um signifikantes Wissen aus erzielten Forschungsergebnissen zu gewinnen. Der Output dieser Datenanalysen und Experimente, auch derived data genannt, ist das Ergebnis vieler rechenintensiver Prozesse und Aktivitäten, deren Organisation, für eine kooperative Weiterforschung innerhalb der beteiligten Forschungsgruppen und das Wiederverwenden der erzielten Ergebnisse, von enormer Bedeutung ist. Das Hauptziel dieser Arbeit ist es, die Beziehungen zwischen den oben genannten primary und derived data in Form einer Ontologie zu beschreiben und somit ein intelligentes Datenmodell, welches ein typisches Forschungsscenario in der wissenschaftlichen Wissensgewinnung darstellt, definiert. Dieses Datenmodell repräsentiert einen sogenannten Dataspace, welcher aus einer Menge von forschungsrelevanten Datenelementen (Participants) und ihren Beziehung (Relationships) besteht und somit eine einheitliche Sicht auf diese Menge von heterogenen Daten ermöglicht. Die Grundlage dieser Ontologie, welche in OWL (Ontology Web Language) implementiert wurde, ist das sogenannte e-Science Life Cycle Dataspace Model, welches aus fünf verschiedenen Aktivitäten, dargestellt in Form eines e-Science Lebenszyklus, besteht. Dieser Lebenszyklus beschreibt den Datenerfassungsprozess innerhalb eines wissenschaftlichen Forschungsscenarios, ausgehend von der einfachen Zielsetzung bis hin zur Datenintegration und Ergebnispublikation.
Abstract
(Englisch)
Modern collaborations in science are very often based on large scale linking of databases that were not expected to be used together when they were originally developed. Within the distributed database community, database integration approaches traditionally focus on structural heterogeneity. However, in many scientific applications, there is additionally a strong demand to solve problems of semantic heterogeneity. The heterogeneous and distributed mix of various data sources nowadays requires intelligent management systems in order to provide an unified view over such a data. The research challenge motivating the work on this Thesis is faced by the vision of dataspaces which main idea is to abstract from the underlying data source structures by providing a system managing various and heterogeneous data as single information data source. The dataspace concepts are presented as a vision, however their implementation in e-Science application environments opens new research challenges, especially, in distributed dynamic environments, like scientific grids. The main effort of this work is to provide an integrated view over data being collected in scientific collaborations through e-Science life cycles. These life cycles represent a process of collecting data for significant analysis by introducing a hierarchical and iterative model, which includes several different activities. Each activity contains a number of tasks gathering information from multiple heterogeneous data resources that are organized as participants in scientific dataspaces. The e-Science Life Cycle Dataspace model is presented as ontology specified in the Web Ontology Language, which allows building semantically rich relationships among e-Science life cycle iterations and its participating data elements.

Schlagwörter

Schlagwörter
(Englisch)
Web Ontology Langugae e-Science dataspace Ontology heterogeneous data sources scientific applications semantic heterogeneity data abstraction
Schlagwörter
(Deutsch)
Web Ontology Langugae e-Science dataspace Ontologie heterogene Daten wissenschaftliche Applikationen Wissensgewinnung große Datenbestände Ergebnispublikation
Autor*innen
Adnan Muslimovic
Haupttitel (Englisch)
Design and implementation of a dataspace model for e-Science applications
Paralleltitel (Deutsch)
Design und Implementierung eines Dataspace-Modells für Applikationen in e-Science
Publikationsjahr
2008
Umfangsangabe
X, 149 S. : Ill., graph. Darst.
Sprache
Englisch
Beurteiler*in
Peter Brezany
Klassifikationen
06 Information und Dokumentation > 06.35 Informationsmanagement ,
06 Information und Dokumentation > 06.41 Wissenschaftliche Bibliotheken ,
54 Informatik > 54.52 Software engineering ,
54 Informatik > 54.55 Auszeichungssprachen ,
54 Informatik > 54.64 Datenbanken ,
54 Informatik > 54.81 Anwendungssoftware
AC Nummer
AC07459920
Utheses ID
2295
Studienkennzahl
UA | 175 | | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1