- Mehr als 70 Millionen Menschen weltweit nutzen Gebärdensprache, aber es mangelt an Dolmetschern. Silence Speaks entwickelt einen KI-gesteuerten Gebärdensprach-Avatar zur Übersetzung von Text in Gebärdensprache. Das System kann britische Gebärdensprache (BSL) und US-amerikanische Gebärdensprache (ASL) übersetzen. Transport for London plant den Einsatz der Technologie in über 250 Stationen. Die Plattform zielt darauf ab, Barrierefreiheit für Gehörlose zu verbessern und Echtzeitübersetzung zu ermöglichen.
Mehr als 70 Millionen gehörlose oder schwerhörige Menschen weltweit nutzen Gebärdensprache, aber es mangelt akut an Dolmetschern. Silence Speaks, ein britisches Startup, will diese Lücke mit einem KI-gesteuerten Gebärdensprach-Avatar schließen, der in der Lage ist, Text in Gebärdensprache zu übersetzen. Kommunikationsprobleme und Isolation stellen besonders in Umgebungen mit Hintergrundgeräuschen und Störgeräuschen eine Herausforderung dar. Für gehörlose und schwerhörige Menschen ist es oft unmöglich, Gesprächen in Bahnhöfen, Krankenhäusern, Schulklassen und geschäftigen Büros zu folgen. Selbst Menschen mit Cochlea-Implantaten erfassen oft nur wenige Wörter pro Satz und kämpfen mit dem Ton.
Technologische Innovation
Entwickelt von und für die gehörlose Gemeinschaft kann Silence Speaks Texte genau in die britische Gebärdensprache (BSL) übersetzen. In Großbritannien gibt es mehr als hunderttausend Menschen, die auf BSL angewiesen sind. Das Modell wurde mit Datensätzen trainiert, die regionale Dialekte, kontextuelle Sprache und emotionale Nuancen abdecken, um einen KI-generierten Avatar zu ermöglichen, der weit über die einfache direkte Übersetzung hinausgeht und Absichten sowie Emotionen vermittelt. Die Plattform umfasst integrierte Untertitelungsfunktionen für gehörlose Benutzer, die nicht gebärden oder die Gebärdensprache noch lernen.
Mit einem Hintergrund bei Vodafone, wo er die KI-Architektur für Chatbots vorantrieb, gründete Pavan Madduru das Unternehmen vor etwas mehr als drei Jahren. Nachdem ihm im Alltag die Herausforderungen eines gehörlosen Freundes aufgefallen waren, entschloss er sich, das fehlende Gebärdensprach-Unterstützungssystem zu verbessern. Anfangs versuchten sie, Gebärdensprache in Text zu übersetzen, um die Echtzeitübersetzung jeder Gebärdensprache in jede andere zu ermöglichen. Doch dieser Ansatz erwies sich als anspruchsvoller als erwartet.
Ein neuer Ansatz in der Übersetzung
Während in den USA die Amerikanische Gebärdensprache (ASL) weit verbreitet ist, unterscheidet sich BSL erheblich, und es gibt weltweit über 200 Gebärdensprachen. Silence Speaks begann mit BSL, erkannte jedoch schnell, dass regionaler Slang und Akzente auch die Gebärdensprache beeinflussen und die Geschwindigkeit des Gebärdens beeinflussen. Bei einem Versuch entdeckten sie, dass Gebärdende in Edinburgh 50 Prozent schneller waren als in Southampton oder Birmingham. Nach einer Neuausrichtung entwickelte Madduru ein System, das Texte sowohl in BSL als auch in ASL übersetzen kann. Die aktuelle Version operiert in der Cloud und benötigt noch Zeit, um aus Text Eingaben die Gebärden zu generieren, aber das Ziel ist eine Echtzeit-Übersetzung direkt auf dem Gerät.
Vorausschauend könnte eine zukünftige Version sowohl Sprache, Text als auch Gebärdensprache in jede Richtung übersetzen. Der gegenwärtige Fokus liegt jedoch darauf, eine starke Grundlage zu schaffen, die beweist, dass die Technologie funktioniert und bei der sofortigen Verbesserung der Barrierefreiheit für Gehörlose eine Rolle spielen kann. Transport for London plant, den KI-gesteuerten Gebärdensprach-Avatar in mehr als 250 Stationen einzusetzen, um den Zugang für gehörlose und schwerhörige Passagiere zu erweitern, indem visuelle Anzeigen für Bahnansagen bereitgestellt werden. Sogar Grußkarten nutzen diese Technologie, um spezielle Videobotschaften in Gebärdensprache zu integrieren und so ein neues Erlebnis zu schaffen.