Spoken Language Identification: An AI-assisted Museum Label
2020/2021
Medium Auto-adaptive, KI-gestützte Werktafel mit Sprachidentifikation
Software
Spoken Language Identification (Maschinelles Lernen: Tensorflow; Sprachdatenset: Mozilla Common Voice)
Hardware
Einplatinencomputer, Bildschirm (10"), Lidarsensor, Lavaliermikrofon
Das Projektteam von intelligent.museum hat den Prototyp einer KI-gestützten Werktafel für den Ausstellungsraum entwickelt. Diese soll die Nationalsprache aus der gesprochenen Sprache der Ausstellungsbesucher:innen heraushören. So werden Werktexte und Metainformationen automatisch in die entsprechende Sprache übersetzt.
Die maschinelle Erkennung gesprochener Sprache ist kein triviales Problem. Um einer Maschine beizubringen, Sätze einer Sprache perfekt zu erkennen, wird das gesamte Spektrum einer Sprache benötigt. Das wiederum erfordert absurde Datenmengen. Da sich die Sprachen akustisch überschneiden, wird die Aufgabe umso schwieriger, je mehr Sprachen es voneinander zu unterscheiden gilt. Noch schwieriger wird die Aufgabe, wenn unterschiedliche Akzente, das Alter, das Geschlecht und andere Merkmale berücksichtigt werden, die den Vokaltrakt beeinflussen. In ersten Experimenten ist der Prototyp der KI-gestützten Werktafel in der Lage, sieben Sprachen (Deutsch, Englisch, Französisch, Spanisch, Italienisch, Chinesisch, Russisch) mit einer Gesamtgenauigkeit von 83% zu unterscheiden.
Bis aus der prototypischen Entwicklung eine skalierbare Lösung für internationale Museen wird, müssen viele weitere Entwicklungsschritte gegangen und Lösungen implementiert werden. Nur so kann die notwendige Robustheit für den Ausstellungsbetrieb garantiert werden.