Informationssysteme

PROJEKT: ODYSSEUS — Ein flexibles Framework zur Erstellung von Datenstrommanagementsystemen

Die Überwachung und Analyse kontinuierlicher (Sensor-)Datenströme findet klassischerweise mittels manuell erstellter Programme statt. Datenstrommanagementsysteme erlauben es diese Aufgaben stattdessen mit Hilfe von deklarativen Anfragen/Regeln - ähnlich wie Datenbankanfragen -  zu erledigen. Mit sogenannten Complex Event Processing (CEP) Systeme ist es möglich komplexe Ereignisabfolgemuster zu definieren und in Ereignisdatenströmen zu erkennen.

Vorhandene Datenstrommanagementsysteme sind zumeist als Universalwerkzeuge ausgelegt, die nur das relationale Datenmodell unterstützen und in ihren Kernkomponenten wie dem Scheduler, der die Ausführung der Anfragen regelt, schlecht anpassbar sind. Manche Anwendungen erfordern aber genau solch eine Anpassung. Daher entwickeln wir im Projekt ODYSSEUS (dem Oldenburger DynaQuest Datastream Query System) ein Framework für Datenstrommanagementsysteme, desen Architektur (siehe unten) es auf besonders einfache Art und Weise erlaubt einzelne Komponenten anzupassen und sogar das zugrundeliegende Datenmodelle auszutauschen. ODYSSEUS soll außerdem in der  Lage sein  die Mächtigkeit von SQL-ähnlichen Anfragesprachen mit der komfortablen Definition von Mustern, wie sie in CEP Systemen möglich ist, zu verbinden.

ODYSSEUS Systemarchitektur

Studentische Arbeiten im Projekt

  • Erweiterung von Stream-SPARQL um Aggregationsoperatoren (frei)
  • Erweiterung von Stream-SPARQL um komplexere Fensteroperationen bzw. Gruppierungen (frei)
  • Mustererkennung in Ereignis-Datenströmen (frei)
  • Kostenbasierte Optimierung kontinuierlicher Anfragen (frei)
  • Eclipse Plugin zur visuellen Überwachung der Operatorausführung in ODYSSEUS (laufend)
  • Integration dynamischer Regelverarbeitung in ODYSSEUS (laufend)
  • Erweiterung von SPARQL zu einer Anfragesprache für RDF-Datenströme (abgeschlossen)
  • Prioritätsbasiertes Scheduling (abgeschlossen)
  • Thread-basierte Scheduling-Strategien für ein Datenstrom verarbeitendes System (abgeschlossen)

Eine genauere Beschreibung der Arbeiten ist auf den Lehre-Seiten zu finden.

Mitarbeiter

Veröffentlichungen

2008
Implementierung einer RDF-Datenstromverarbeitung mit SPARQL
Andre Bolles, Marco Grawunder
School of Informaton Technology, International University in Germany. Print, Technischer Bericht, 5/2008
Der Volltext dieser Arbeit kann hier als PDF-Dokument heruntergeladen werden.
Streaming SPARQL - Extending SPARQL to process data streams
Andre Bolles, Marco Grawunder, Jonas Jacobi
In: S. Bechhofer, M. Hauswirth, J. Hoffmann, M. Koubarakis (Hrsg.): The Semantic Web Research and Applications 5th European Semantic Web Conference, ESWC 2008, Tenerife, Canary Islands, Spain, Lecture Notes in Computer Science, 5021, Springer Verlag, 5/2008
Erweiterung von SPARQL zu einer Anfragesprache für RDF-Datenströme
Andre Bolles
Diplomarbeit, Fakultät II - Informatik, Wirtschafts- und Rechtswissenschaften, Universität Oldenburg, 1/2008