|
|
| home research personal |
A slightly revised English translation has been published by Springer:
See here for an English abstract. ÜberblickDas menschliche Sprachverstehen arbeitet inkrementell. Dies bedeutet, daß Personen Teile der akustischen Eingabe bereits verarbeiten, bevor diese noch vollständig vorliegt, und sie z.B. in einem Dialog den Redebeitrag des Partners antizipieren können, ehe er ausgeredet hat. Simultandolmetscher - um ein hier relevantes Beispiel zu nennen - arbeiten inkrementell, indem sie mit geringer Verzögerung Äußerungen in die Zielsprache übersetzen.Die Einführung inkrementeller Strategien in die maschinelle Verarbeitung von Sprache ist folglich bereits aus dem Gesichtspunkt der Verarbeitungsadäquatheit sinnvoll; sobald von Maschinen ähnlich natürliche Leistungen erwartet werden wie der Mensch sie erbringen kann, müssen auch dort zwangsläufig inkrementelle Algorithmen verwendet werden. Allerdings geschieht dies bisher nur zögerlich. Das liegt vor allem daran, daß Inkrementalität zunächst eine Erhöhung des Aufwands zur Bearbeitung einer Eingabe mit sich bringt, da durch den fehlenden rechten Kontext weniger Sicherheit bezüglich des Ganges der Verarbeitung besteht. Eine damit verbundene Erhöhung der Verarbeitungszeit läßt sich erst durch die Ausnutzung der nun bestehenden Möglichkeiten zur Parallelisierung vermeiden, eine qualitative Verbesserung der einzelnen Arbeitsschritte erst durch die Konstruktion alternativer Informationspfade zur gegenseitigen Beeinflussung erzielen. In den letzten Jahren wird jedoch zunehmend versucht, die Einsetzbarkeit inkrementeller Verfahren innerhalb sprachverarbeitender Systeme zu prüfen; vornehmlich geschieht dies im Bereich der Systeme zur Verarbeitung spontan gesprochener Sprache, und hier insbesondere im Rahmen von Dolmetschsystemen. Erste richtungweisende Ergebnisse liegen bereits vor. Das in der vorliegenden Arbeit entwickelte System MILC ( Machine Interpreting with Layered Charts, Maschinelles Dolmetschen mit Mehr-Ebenen-Charts) stellt den Versuch dar, ein durchgängig inkrementelles System zur Übersetzung spontan gesprochener Sprache zu entwerfen und prototypisch zu implementieren. Jede Komponente des Systems beginnt mit der Bearbeitung seiner Eingabe, bevor letztere abgeschlossen ist. Dabei werden Teile der Eingabe strikt in der Reihenfolge der Sprechzeit angenommen. Daraus resultiert ein insgesamt inkrementelles Verhalten der Anwendung, die bereits zielsprachlichen Text generieren kann, bevor der quellsprachliche Dialogpartner seinen Redebeitrag beendet hat. Um ein solches System in integrierter und uniformer Weise konstruieren zu können, wurde eine neue Datenstruktur, die Mehr-Ebenen-Chart, entwickelt, die - analog zur herkömmlichen Betrachtungsweise einer Chart während der Strukturanalyse oder der Generierung - zur Speicherung von Zwischenergebnissen auf allen Ebenen benutzt wird. Außerdem wurde ein getypter komplexer Merkmalformalismus implementiert, der einerseits die Wartbarkeit der Wissensquellen verbessert und andererseits den Austausch linguistischer Objekte zwischen Modulen des Systems erleichtert. Beide Maßnahmen erlauben eine homogene Sicht auf den Gesamtzustand des Systems zu jedem Zeitpunkt der Verarbeitung und sichern die Möglichkeit zur Untersuchung nichttrivialer Interaktionsmuster zwischen den Komponenten. Durch die erfolgreiche Implementation wird nachgewiesen, daß ein konzeptionell stringentes, integriertes System zur inkrementellen Übersetzung spontan gesprochener Sprache für ein eingeschränktes Korpus realisierbar ist. Zusätzlich ist hierdurch die Grundlage für weitergehende Untersuchungen zur Architektur inkrementeller sprachverarbeitender Systeme gegeben, etwa durch die Neueinführung weiterer Komponenten. Exemplarisch ist dies gezeigt durch die Einbeziehung der inkrementellen Erkennung und Übersetzung von idiomatischen Ausdrücken. Diese Arbeit ist wie folgt organisiert:
|