Ontos SOA

Ontos SOA bildet den gesamten Ablauf der semantischen Analyse und Verwaltung von unstrukturierten Informationen aus dem Internet oder anderen Datenquellen ab. Dabei werden prinzipiell folgende Schritte berücksichtigt:

  1. Überwachen von Datenquellen, Finden von neuen Daten.
  2. Linguistische Analyse von Texten.
  3. Erkennen und Prozessieren von identischen Objekten (Personen, Organisationen, Politische Parteien, etc.) sowie Abspeichern der Daten in einer Datenbank.
  4. Bereitstellen von Diensten, die die erkannten Informationen nutzbar machen.

Linguistische Analyse von Texten

Das System erkennt Objekte und Relationen zwischen Objekten in einem Text. Dazu werden linguistische Regeln in einem NLP-Prozess (Natural Language Processing) angewandt. Die Objekt- und Relationstypen werden in einer Ontologie definiert.

Die erkannten und extrahierten Informationen werden in ein maschinenlesbares Format transformiert und in einer Datenbank gespeichert. Die Daten können dann mit beliebigen Datenbankprogrammen verarbeitet werden.

Ein entscheidender Schritt des Prozesses ist das Identifizieren und Verschmelzen von identischen Objekten.

Angenommen, der folgende Sachverhalt wird erkannt: "Paul Wolfowitz ist Präsident der Weltbank". Beim Abspeichern dieser Informationen stellt das System fest, das weitere Daten zu Paul Wolfowitz existieren, z. B.: "Von 2001 bis 2005 arbeitete Paul Wolfowitz als stellvertretender Verteidigungsminister". Das System fügt die neuen Informationen zu Paul Wolfowitz ein und erweitert somit das existierende Wissen.


Verteiltes Rechnen

Der beschriebene, äußerst rechenintensive Prozess kann auf verschiedene Computer verteilt werden.

Das System basiert auf der aktuellen J2EE Technologie. Es kann auf groß dimensionierten Servern aber auch auf üblichen Arbeitsplatzrechnern installiert werden.

News
White Papers