Wie sich mit künstlicher Intelligenz und einem Knopf im Ohr Sprachbarrieren überwinden lassen

Timekettle

99 Prozent aller Firmen, die sich mit künstlicher Intelligenz beschäftigen, fokussieren sich auf die Interaktion zwischen Personen und Maschinen. Das Startup Timekettle aus Shenzhen will dagegen die zwischenmenschliche Kommunikation verbessern. Eine Reise in die Schweiz diente als Geburtshelfer für das Produkt.

Matthias Müller, Shenzhen

NZZ – Neue Zürcher Zeitung

Leal Tian ist der Gründer des Unternehmens Timekettle, das laut Amazon das weltweit erste auf künstliche Intelligenz gestützte Übersetzungssystem herstellt.

In einem grossen, hellen Raum sitzen rund 20 Personen zusammen, einige blicken auf den Bildschirm, andere unterhalten sich. Das Büro befindet sich in dem Mini Science Park in der an Hongkong angrenzenden Millionenstadt Shenzhen, wo es vor vier Jahrzehnten nur ein paar Dörfer gab. Leal Tian schaut auf das Team und sagt: «Mit 30 Kolleginnen und Kollegen und einem Durchschnittsalter von 28 Jahren haben wir eine gute Grösse. Ich möchte nicht zu schnell wachsen, denn daran gehen viele Startups zugrunde.»

Tians Unternehmen Timekettle hat im Dezember vergangenen Jahres seinen vierten Geburtstag gefeiert. Und auf der Site des Online-Händlers Amazon wird das von Tian und seiner Mannschaft entwickelte Produkt als «weltweit erstes auf künstliche Intelligenz gestütztes Übersetzungssystem» angepriesen.

«Sie haben es nicht einmal versucht»

Die Nutzung des Hightech-Produkts ist einfach: Bei Unterhaltungen unter vier Augen benötigen die beiden Gesprächspartner jeweils einen Ohrstöpsel und ein Smartphone mit Internetzugang, auf dem die App von Timekettle installiert ist. Nun können sie in ihrer jeweiligen Muttersprache reden, und das Gegenüber hört die Übersetzung mit einer leichten Verzögerung von ein bis drei Sekunden auf seinem Ohrstöpsel. Parallel dazu ist das Gesagte auch auf dem Smartphone zu lesen.

Derzeit bietet Timekettle 43 Sprachen und mehr als 90 Dialekte an. Da das System auf künstlicher Intelligenz basiert, sind «Sie haben es nicht einmal versucht» wegen der grossen Datenmengen die Übersetzungen aus dem Chinesischen und Englischen besonders gut. Auch die Übertragungen aus dem Chinesischen ins Deutsche sind verständlich, selbst die schwierige Setzung der Kommata ist regelkonform.

Das System basiert auf drei Pfeilern. Die von Timekettle entwickelten Ohrstöpsel gewährleisten wegen der Nähe zum Mund, dass die automatische Spracherkennung die Stimme gut wahrnimmt. Zudem hat das Startup an der Geräuschunterdrückung gefeilt, um den störenden externen Lärmpegel zu unterdrücken. Das Gespräch wird anschliessend von der App als zweitem Pfeiler des Systems in die Cloud übertragen, wo – als letztem Pfeiler – drei Vorgänge stattfinden.

Bei der Spracherkennung erfolgt im ersten Schritt eine automatische Interpretation der menschlichen Sprache, wobei es dem System dank Deep-Learning-Methoden möglich ist, die Datenbank an Wörtern in eigener Regie zu erweitern. In einem nächsten Schritt erfolgt die maschinelle Übersetzung, bevor durch Sprachsynthese der Fliesstext in akustische Sprachsignale umgewandelt und damit für die Personen verständlich wird. Zudem ist – der dritte Schritt – die Übersetzung auf dem Smartphone zu lesen.

Die Gründung des Unternehmens im Dezember 2016 hat indirekt auch mit der Schweiz zu tun. Tians aus der zentralchinesischen Provinz Hunan stammende Eltern reisten vor ein paar Jahren erstmals nach Europa. Und obwohl die Tour geführt war, machte sich der Sohn Gedanken, wie sie sich dort verständigen sollten. «Ich habe ihnen fünf, sechs Sprach-Apps auf ihre Smartphones heruntergeladen», sagt der junge Unternehmer im Rückblick.

Bei einer Tour in die Schweizer Alpen litt seine Mutter unter Höhenkrankheit, und ein französischsprachiger Arzt rettete sie. Eine Kommunikation wäre mit den auf den Smartphones installierten Sprach-Apps möglich gewesen. Als die Eltern wieder zu Hause waren, fragte Tian, ob sie diese verwendet hätten. Noch heute schwingt eine Mischung aus Verständnislosigkeit und Entrüstung in seiner Stimme mit, wenn er sagt: «Sie haben es nicht einmal versucht.»

Kommunikation ohne störende Hardware

Tian trieb die Frage um, was bei den Eltern schiefgelaufen war. Der Besuch einer Messe in Shenzhen öffnete ihm schliesslich die Augen. «Damals hatte ich mich selbst mit diversen Übersetzungs-Apps ausgestattet, um vor Ort auch mit jenen Besuchern ins Gespräch zu kommen, die kein Chinesisch oder Englisch sprachen.» Er scheiterte mit seinem Vorhaben jedoch kläglich. «Ich sprach in mein Smartphone und reichte es meinem Gesprächspartner, der die Übersetzung las.»

Tian wurde klar, dass auf solch unnatürliche Weise keine längeren Gespräche zustande kommen können. Meist nach einer Minute waren die Unterhaltungen bereits wieder beendet. Das ständige Herumreichen des Smartphones war für beide Seiten zu lästig.

Der Absolvent der renommierten University of Electronic Science and Technology of China in Chengdu, der vor der Eigenständigkeit zunächst drei Jahre beim Telekomausrüster Huawei und anschliessend bei einem zu dem Konzern gehörenden Startup gearbeitet hatte, kam nach reiflichen Überlegungen zu zwei Folgerungen. Erstens kommt es bei der Übersetzung weniger auf die Grammatik als auf spezifische Wörter an. «Wenn man ein italienisches Restaurant besucht und die Sprach-App übersetzt ‹Ich Pizza bestellen›, dann versteht es die Bedienung, auch wenn der Satz nicht korrekt formuliert ist. Problematisch wird es jedoch, wenn man eine Pizza bestellt und dieses Wort dann mit ‹Lasagne› übersetzt wird», sagt Tian.

Und seine eigenen Erfahrungen auf der Messe in Shenzhen und jene der Eltern in Europa haben ihn zweitens gelehrt, dass Gespräche in einer natürlichen Atmosphäre stattfinden müssen. Hat man wie bei Timekettle nur einen Knopf im Ohr, sind während einer Unterhaltung Gesten möglich, und man kann dem Gegenüber in die Augen schauen und Emotionen wahrnehmen. «Personen sollen frei miteinander kommunizieren, ohne dass die Hardware stört», erläutert Tian seine Schlussfolgerungen. Der Name des ersten Produkts lautete denn auch WT2, wobei die beiden Buchstaben für «wearable translator», also tragbaren Übersetzer, stehen.

Die Vereinigten Staaten sind der wichtigste Markt

Rund die Hälfte des Umsatzes erwirtschaftet Timekettle in den Vereinigten Staaten; Europa und Japan folgen mit einem Anteil von jeweils 20 Prozent. China spielt für das Startup noch keine grosse Rolle. «In meinem Heimatland existieren fast keine Sprachbarrieren. In Amerika gibt es dagegen zahlreiche multikulturelle Familien», betont Tian. Kundenbefragungen in den Vereinigten Staaten haben ergeben, dass jeder fünfte Käufer von Timekettle die Ohrstöpsel nutzt, um sich mit anderen Familienmitgliedern unterhalten zu können.

Mit der Wahl der jungen Millionenstadt Shenzhen, die auch als «Silicon Valley für Hardware» bezeichnet wird, hat der Entrepreneur einen logischen Entscheid getroffen. «Wenn wir bei der Entwicklung unserer Produkte Schwierigkeiten haben, gibt es innerhalb einer Fahrstunde irgendeine eine HardwareFirma, die uns helfen kann», sagt Tian, der darüber hinaus die Stadt auch wegen des Klimas mag. Richtig kalt wird es im Süden Chinas nie. Und von Shenzhen geht mit den vielen jungen Unternehmern eine faszinierende Dynamik aus. Die Stadt bietet vielen Chinesinnen und Chinesen das ideale Umfeld, um sich den auch von Tian gelebten chinesischen Traum zu erfüllen.

 

EN https://www.timekettle.co/

DE https://de.timekettle.co/

Leave a comment

All comments are moderated before being published.

This site is protected by hCaptcha and the hCaptcha Privacy Policy and Terms of Service apply.