THESEUS-Basistechnologien

Diesen Text als PDF laden

Das Forschungsprogramm THESEUS leistet einen Beitrag für eine neue internetbasierte Wissensinfrastruktur, in der das Wissen im Internet künftig besser aufbereitet und genutzt werden kann. Im Fokus des Forschungsprogramms stehen semantische Technologien, die die inhaltliche Bedeutung der Informationen (Wörter, Bilder, Töne) erkennen und einordnen können. Mit diesen Technologien können Computerprogramme intelligent nachvollziehen, in welchem Kontext Daten abgespeichert wurden. Darüber hinaus können Computer durch Anwendung von Regeln und Ordnungsprinzipien aus den Inhalten logische Schlüsse ziehen und selbständig Zusammenhänge zwischen unterschiedlichen Informationen aus mehreren Quellen erkennen und herstellen.

Unter dem Dach von THESEUS entwickeln hierzu öffentliche und industrielle Forschungspartner gemeinsam innovative Basistechnologien und technische Standards. Diese Basistechnologien werden von den Industriepartnern im Konsortium in 6 Anwendungsszenarien prototypisch umgesetzt und erprobt. Dabei soll überprüft werden, wie diese neuen Technologien zeitnah in innovative Werkzeuge, marktfähige Dienste und erfolgsversprechende Geschäftsmodelle für das WorldWideWeb und andere internetbasierte Netzwerke umgesetzt werden können.

Zu den Basistechnologien, die von den Forschungspartnern entwickelt werden, gehören unter anderem Funktionen zur automatisierten Erzeugung von Metadaten für Audio-, Video-, 2D und 3D- Bilddateien und deren anwendungsspezifische Kombination, sowie Mechanismen für die semantische Verarbeitung multimedialer Dokumente und der damit verknüpften Services. Im Fokus der Forschung steht auch die Entwicklung von Werkzeugen für das Management Ontologien-unterstützter Wissensrepräsentation. Darüber hinaus entwickelt das Konsortium neue Methoden des maschinellen Lernens und der situationsbewussten Dialogverarbeitung. Gleichzeitig wird auch an innovativen Benutzeroberflächen und Interfaces gearbeitet. Neue Verfahren des Digital Rights Management (DRM) sollen die Urheber- und Vermarktungsrechte am geistigen Eigentum multimedialer Inhalte künftig besser schützen.

a) Automatisierte Erzeugung von Metadaten für Multimediadaten

Die Forschungspartner entwickeln Methoden zur Erfassung von Inhalten und zur Erzeugung von interoperablen Metadaten für audiovisuelle Daten, die der verbesserten Indexierung, Archivierung und Erschließung multimedialer Quellen dienen sollen. Der Schwerpunkt liegt dabei auf semantischen Indexierungs- und Annotationsverfahren, automatischer Metadatengenerierung und kontextbasierender Videoerkennung. Ziel ist die Integration semantischer Informationen unterschiedlicher Modalitäten (Text, Sprache, Standbilder, Audio, Video usw.) zu einer Objektgruppe mit höherer Informationsqualität. Die Kombination der Metadaten erfolgt dabei anwendungsspezifisch, d.h. je nach Anwendung wird eine eigene optimale Kombination bereitgestellt, um gezielt auf die Statistiken der zugrunde liegenden Datenbanken einzugehen. Weiterhin werden adaptive, content-basierte Verfahren zur effizienten Komprimierung von Videosignalen entwickelt, um dem Nutzer Bild- und Videoinformationen in effizienter Weise zur Verfügung stellen zu können.

b) Semantische Verarbeitung multimedialer Dokumente

Um die Recherche in hochkomplexen multimedialen Datenbanken innerhalb akzeptabler Responsezeiten zu ermöglichen, werden besonders effiziente Indexing- und Retrievalalgorithmen für Metadaten erarbeitet, die die inhaltsbasierte Bild- und Videorecherche in Datenbanken mit mehreren Hunderttausenden Objekten (Bildern, Videoshots, Videoszenen) erlauben.

c) Ontologien

Im Rahmen von THESEUS entwickeln die Forschungspartner integrierte Methoden und innovative Werkzeuge für das Management von Ontologien in Software-Applikationen mit sehr großen Ressourcenbeständen. Ziel ist dabei, sämtliche Phasen im Prozess einer Ontologie-Entwicklung zu ermöglichen, vom Design über das Mapping mit anderen interoperablen Ontologien bis hin zu automatisierten logischen Schlussfolgerungen (Reasoning).

d) Maschinelles Lernen

Die Forschungspartner werden skalierbare Technologien für die Modellierung und Strukturierung von Daten und Ontologien entwickeln. Hierzu werden sie innovative Verfahren zur Ermittlung von logisch-deterministischen und probabilistischen Beziehungen in Text-, Audio-, Image- und Videodaten verwenden, die auf den Methoden des Maschinellen Lernens basieren. So werden Methoden des statistischen Maschinellen Lernens entwickelt, die Wissensextraktion aus relationalen Daten ermöglichen, um sie anschließend zur Entwicklung bzw. Erweiterung vorhandener Ontologien zu nutzen. Die Methoden des statistischen Maschinellen Lernens werden auch eingesetzt, um ein System zur automatischen Annotierung von Textdokumenten zu entwickeln. Die semantischen Informationen werden in effizienten Rich Structures abgelegt, so dass das spätere Suchen und Clustern optimal erfolgen kann. Die Technologien der Textannotierung werden auch für die Beschreibung von Web Services angewendet, um das Discovery und die Nutzung von Web Services zu unterstützen.

e) Situationsbewusste Dialogverarbeitung

Die Forschungspartner entwickeln für die Dialogverarbeitung flexible Komponenten, die je nach Bedarf der Anwendungsszenarien speziell konfigurierbar sind. Diese Komponenten stellen im Wesentlichen Funktionsbausteine bereit, aus denen Systeme realisiert werden können, die die dialogische Interaktion zwischen Mensch und Maschine realisieren. Für sogenannte multimodale Schnittstellen, die per Sprache und Gestik bedient werden können, entwickeln die Partner text-, grafik-, sprach- und gestikspezifische Analyse und Generierungsalgorithmen. Anwender können ihre Anfragen intuitiv formulieren und sie frei sprechend im Dialog mit dem System verfeinern. Mit einer Diskurs-Ontologie, die allgemeines Dialogverhalten beschreibt wird das sprachliche Verhalten modelliert. Eine spezielle Komponente, der sogenannte Semantische Mediator, stellt die Schnittstelle zwischen den Repräsentationen der multimodalen Benutzereingaben- und den verschiedenen Metadaten-Quellen bereit, um so effizient, die korrekte semantischen Datenquelle für eine Anfrage zu bestimmen. Die Einbindung dieser Semantischen Datenquellen erfordert u.a. Methoden zur semantischen Annotierung von Web Services, um diese interaktiv ansprechen zu können.

Die multimodale Interaktion ermöglicht eine semantische Navigation in der der Benutzer durch vielfältige Vorschläge und assoziative Hinweise unterstützt wird. Damit kann er seine Anfragen effizienter gestalten. Dabei wird er von Tutorials und sonstigen Hilfefunktionen unterstützt.

f) Innovative Benutzeroberflächen und Interfaces

Im Rahmen des Theseus-Projekts sollen graphische Benutzeroberflächen entstehen, die Zusammenhänge zwischen verschiedenen Daten, Metadaten und Dokumenten auf den ersten Blick erkennbar machen und so einen intuitiven Umgang mit den Inhalten erlauben. Ergebnisse von Suchanfragen werden in Theseus als sogenannte “Wissensnetze” dargestellt, die die Zusammenhänge der Ergebnisse mit dem Suchbegriff sowie untereinander darstellen. Diese Wissensnetze erlauben eine intuitivere Suche, geben eine Übersicht über das gesamte Themengebiet und tragen dazu bei, dass der Nutzer die benötigten Informationen schneller findet.

Um den Nutzern den Umgang mit Theseus-Anwendungen weiter zu erleichtern, wird ein einheitlicher Rahmen geschaffen, der allen Theseus-Anwendungen eine einheitliche Anmutung gibt. Nutzer müssen sich daher nicht immer wieder aufs Neue einarbeiten, sondern finden bei allen Anwendungen den gleichen Aufbau und ähnliche Funktionalitäten vor. Gleichzeitig sorgt dieser Rahmen dafür, dass sich die Benutzeroberfläche an verschiedene Endgeräte anpasst. Mit Hilfe der “Triple Play” Technologie wird erreicht, dass die Theseus-Anwendungen homogen auf Mobiltelefon, PC und TV unter jeweils optimaler Ausnutzung der Geräteeigenschaften dargestellt werden können.

Die Forschungspartner haben nicht nur die Endanwender im Blick, sondern schaffen auch die Voraussetzungen dafür, dass Unternehmen die Theseus-Technologien schnell und einfach für ihre Anwendungen einsetzen können. Dazu wird ein Rahmen geschaffen, der es Unternehmen erlaubt, die Theseus-Technologien unkompliziert an ihre spezifischen Anforderungen anzupassen, anstatt Produkte neu zu entwickeln. So können Unternehmen in Zukunft Zeit und Kosten sparen sowie die Qualität der Produkte durch Wiederverwendung erhöhen.

Der Schwerpunkt der Arbeiten liegt auf der Verarbeitung von Wissen. Entsprechend werden Schemata zur Eingabe von Daten und Metadaten festgelegt, die ohne großen Aufwand an unterschiedlichste Anwendungsfälle angepasst werden können. Zum Erstellen und Editieren von Ontologie-Schemata und Instanzen bietet das Front-End visuelle Tools. Zugriffsrechte auf die Tools, beispielsweise zur Erstellung von Metadaten-Templates, können in Form von “Rollen” definiert werden. Zusätzlich werden die Interfaces so intuitiv gestaltet, dass bei der Datenpflege möglichst wenige Informationen eingegeben werden müssen.

g) Innovative Verfahren des Digital Rights Management (DRM)

Die Forschungspartner erarbeiten neue Tools des Digital Rights Management (DRM), mit denen die Urheber- und Vermarktungsrechte am geistigen Eigentum multimedialer Inhalte künftig besser geschützt werden können. Die angestrebten ganzheitlichen Lösungen ermöglichen auch die Identifikation und Verfolgung von markengeschützten digitalen Daten im Internet. Hierbei werden im Wesentlichen folgende Technologien weiterentwickelt: Digitale Wasserzeichen, Verschlüsselungssysteme zur kontrollierten Distribution, Labelling für verschiedene Datenformate, Technologien der Verifikation und Filtersysteme für Daten und gedruckte Dokumente.

h) Evaluation

Im Forschungsprogramm THESEUS werden Methoden und Werkzeuge erarbeitet bzw. Daten zusammengestellt und verwaltet, die für das Testen und Evaluieren der entwickelten neuen Technologien gebraucht werden. Ziel ist es, neue Methoden zum Testen von Bild- und Sprachanalysetechnologien bzw. zum Messen der Qualität von Ton und Bild (z.B. nach der Anwendung von Kodierungs- und Kompressionsverfahren) zu entwickeln. Ein weiterer Schwerpunkt liegt auf der Evaluierung der Gebrauchstauglichkeit (Usability) und der Informationsdarstellung, der benutzerorientierten Gestaltung und Zugänglichkeit.