Digitale Sprachassistenten wie Siri und Alexa gibt es seit Jahren. Doch Sprachtechnologien lassen sich auch in der Schifffahrt nutzen. Das Fraunhofer-Center für Maritime Logistik und Dienstleistungen (CML) hat einen Spracherkenner namens „Mar FM“ entwickelt, der jedoch längst nicht nur in der maritimen Wirtschaft anwendbar ist.
Es gibt allerdings ein Problem: „Über Funk können nur ‚Einmalinformationen‘ ausgetauscht werden, die im Anschluss nicht mehr verfügbar sind“, berichtet Maximilian Reimann, Teamleiter Maritime Operation Management und wissenschaftlicher Mitarbeiter beim Hamburger Fraunhofer-Center für Maritime Logistik und Dienstleistungen (CML). „Es gibt zwar Funkgeräte, mit denen der zuletzt empfangene Funkspruch noch einmal angehört werden kann, aber die grundsätzliche Schwierigkeit wird dadurch nicht gelöst.“ Oft seien die Beteiligten angesichts der vielen wichtigen Informationen sehr stark ge- und zum Teil auch überfordert.
Neuentwicklung für die maritime Wirtschaft
Vor diesem Hintergrund wurde am Fraunhofer CML die Idee verfolgt, ein Unterstützungstool für den maritimen Sprechfunk zu entwickeln, das den Inhalt von Funksprüchen automatisch verschriftlicht und dokumentiert. Die Herausforderung dabei: Konventionelle Assistenten wie Siri und Alexa sind auf Alltagssprache trainiert.
„In der maritimen Wirtschaft wird aber ein besonderes Vokabular mit zahlreichen Fachbegriffen und Eigennamen verwendet. In Kombination mit den akustischen Bedingungen an Bord kommen herkömmliche Sprachassistenzsysteme schnell an ihre Grenzen, sodass diese für einen Einsatz im maritimen Kontext nicht geeignet sind“, unterstreicht Reimann. Hinzu kommt, dass es zwar Standardredewendungen der internationalen Seeschifffahrtsorganisation IMO (International Maritime Organization) – die Standard Marine Communication Phrases (SMCP) – gibt, die als vorformulierte Beispiele dienen sollen. „Diese haben sich aber in der Praxis bisher nicht durchgesetzt.“
Daher begann man am CML mit der Entwicklung eines Spracherkenners speziell für die maritime Wirtschaft. Auch hierbei galt es, einige Hürden zu überwinden. So gehören im Funkverkehr schlechte Qualität der Signale, laute Stör- und Hintergrundgeräusche, unterschiedliche Akzente, Dialekte und Sprachniveaus im Englischen zum Alltag. Hinzu kommen erschwerend die bereits erwähnten Fachbegriffe und Abkürzungen, definierte Phrasen und Redewendungen sowie zahlreiche Eigennamen, etwa von Schiffen.
Bei der Entwicklung lag das Augenmerk vor allem auf maritimen Fachwörtern. „Deshalb ist auch die Erkennungsgüte von allgemeinem Vokabular noch nicht so hoch wie bei herkömmlichen Spracherkennern“, räumt Reimann ein. „Für uns ist es wichtig, dass beispielsweise das englische Wort für Boje korrekt als ‚buoy‘ und nicht als ‚boy‘ transkribiert wird“, erläutert Reimann.
„Für uns ist es wichtig, dass beispielsweise das englische Wort für Boje korrekt als ‚buoy‘ und nicht als ‚boy‘ transkribiert wird.“
Maximilian Reimann, Teamleiter Maritime Operation Management und wissenschaftlicher Mitarbeiter beim Hamburger Fraunhofer-Center für Maritime Logistik und Dienstleistungen (CML)
Trainingsdaten sind der Schlüssel
Die eingesetzten KI-Modelle wurden mit Millionen von Audiodaten trainiert, um eine hohe Erkennungsgenauigkeit zu gewährleisten. Diese Modelle wurden anschließend durch maritime Daten ergänzt, die das CML im Rahmen verschiedenster Forschungsarbeiten generiert hat. „Damit haben wir ein maritimes ‚Standardsprachmodell‘ entwickelt, das dann mit den Daten unserer Kunden angereichert und optimiert wird“, unterstreicht Reimann.
Am schwierigsten sei der Zugang zu den Daten gewesen und am aufwendigsten das Training der Modelle. Aber es werde einfacher: „Inzwischen reichen uns für die Anpassung eines Modells auf eine neue Domäne etwa zehn Stunden an Audiodaten.“ Auf diese Weise können Audiosignale anschließend automatisch in Text umgewandelt, also transkribiert werden, und das funktioniert sogar offline. Ein weiteres Plus ist es, dass dadurch die Möglichkeit entstanden ist, Kommunikationsinhalte nachträglich auszuwerten, etwa um nachgelagerte Prozesse zu optimieren.
Mehrere Kunden von Mar FM gibt es bereits, allerdings wurden mit vielen von ihnen Geheimhaltungsvereinbarungen geschlossen. Genannt werden darf das Vessel Traffic Service Center (VTS) Fintraffic – die Seeverkehrsleitzentrale für das gesamte finnische Seegebiet. Im Rahmen eines Forschungsauftrags wurde hier der UKW-Seefunkverkehr mithilfe von automatischer Spracherkennung weiterentwickelt, die den Sprechfunkverkehr in Echtzeit in Textform für die Schiffverkehrsleitzentrale umwandelt und bereitstellt. Hierbei wurde die Technologie für die Erkennung der Sprachen Englisch, Finnisch und Schwedisch optimiert.
„Eine vergleichbare Anwendung gibt es weltweit bisher nicht“, betont Reimann. Dementsprechend groß wird auch das Potenzial gesehen – und das über die Branche hinaus. Reimann: „Es sind auch Anwendungen für die Offshore-Windindustrie, die Öl- und Gasbranche oder die Luftfahrt denkbar. Letztlich funktioniert unsere Anwendung überall dort, wo Informationen auf der Tonspur ausgetauscht werden.“ (cb)
Fakten
Fraunhofer-Center für Maritime Logistik und Dienstleistungen CML
Gründung: 2010
Sitz: Hamburg
Mitarbeiter: 100
Tätigkeitsfeld: Entwicklung innovativer Lösungen für den maritimen Sektor und die maritime Supply Chain
Forschungsschwerpunkte: Nautik und Seeverkehr, Schiffs- und Flottenmanagement, Hafen- und Terminalentwicklung sowie Hafentechnologien