Swiss made ­Spracherkennung
Quelle: Recapp

Swiss made ­Spracherkennung

Von Christian Walter, Swiss Made Software

Anders als Google, Amazon und Apple bietet Recapp Spracherkennung mit Branchenfokus an. Die Lösung des Walliser Start-up versteht ausserdem Mundart.

Artikel erschienen in Swiss IT Magazine 2017/01

     

Das gesprochene Wort in ein Schriftstück und gleichzeitig Mundart in Hochdeutsch übertragen, das ist das Metier des Start-ups Recapp aus Martigny. Das Unternehmen positioniert sich damit im dynamischen Spracherkennungsumfeld neben Grössen wie Apple, Google oder Amazon. Für Gründer David Imseng sind diese schillernden Namen mit ihren Horden von Entwicklern und Milliardenbudgets aber nur bedingt Konkurrenten. "Wir konzentrieren uns klar auf bestimmte Marktsegmente. Das gibt uns ein Alleinstellungsmerkmal", meint Imseng.

Im Parlament im Einsatz

So fokussiert Recapp zurzeit auf Parlamente und ist damit schon in den Kantonen Wallis und Schaffhausen im Einsatz. Das Walliser Beispiel zeigt die Qualitäten des Start-ups: "Siri hat heute noch Probleme bei der Kontaktsuche, wenn Vor- und Nachname aus zwei verschiedenen Sprachregionen kommen. Und das ist noch einfach, verglichen mit dem Umschalten zwischen Deutsch und Französisch von Redner zu Redner, wie das im Walliser Parlament normal ist", so Imseng. Für Recapp ist das kein Problem. Die Software transkribiert die kompletten Sitzungen. Dabei liegt die Qualität der Spracherkennung bei 90 bis 95 Prozent. Das heisst: Jedes zehnte bis zwanzigste Wort muss anschliessend von einer der Parlamentssekretärinnen korrigiert werden. "Die Damen waren begeistert, denn es ist eine enorme Arbeitserleichterung", so Imseng. Aber das wäre nur ein bedingter Erfolg, wenn die Software nicht auch in der Lage wäre, das Transkript mit Satzzeichen zu versehen. Erst so wird der Text für den Menschen angenehm lesbar. Anschliessend erstellt die Software einen auf Schlüsselwörtern basierenden Index, der die Parlamentssessionen online für jeden durchsuchbar macht, und zwar nach Redner, Schlüsselwörtern oder chronologisch sortiert.


Gegenüber Google & Co. punktet Recapp also mit zwei Stärken: dem Fokus auf den branchenüblichen Jargon sowie die deutsche Sprache in Mundart und Hochdeutsch. «Englisch kann heute jeder. Zudem versuchen die Grossen jeder Situation und Branche gerecht zu werden. So liegen ihre Trefferquoten klar tiefer als bei einem Spezialisten», findet Imseng. Ausserdem ist das Transkribieren im englischen Sprachraum nicht unbedingt ein Feld nur für die IT. Hier lohnt sich nach wie vor das Auslagern in Billiglohnländer wie Indien. Bedingt gilt das auch für Französisch mit Angeboten aus Madagaskar.

Swisscom TV auf Mundart steuern

Recapp kann aber noch mehr, zum Beispiel als Element des neuen Swisscom TV. Kunden können hier mittlerweile per Stimme nach den gewünschten Programmen suchen. Die Software versteht dabei auch Mundart. Auf die Frage nach "Drii Hasilniss ver zAschenbrödel" liefert sie prompt "Drei Haselnüsse für Aschenbrödel".

Kombiniert man beide Projekte, kann Recapp auch multimediale Archive bequem durchsuchbar machen. So können Reden oder Fernsehsendungen nach Themen durchsucht oder auch Zitate in Filmen gefunden werden.


Die Technologie für Recapp entstand im Rahmen vom Imsengs Forschungsarbeiten an der Univerity of California in Berkeley sowie dem Forschungsinstitut Idiap in Martigny. Seit 2014 ist das Unternehmen am Markt. In Zukunft will Imseng noch viele weitere Bereiche mit dieser Technologie erschliessen, zum Beispiel die Medizin. Dabei kann der Standort Schweiz durchaus von Vorteil sein. "Nicht jeder will oder darf seine Daten ins Ausland geben", so Imseng. Recapp kann deshalb schon heute in drei Varianten installiert werden. In der Cloud bei Anbietern wie Amazon, bei Hostern exklusiv in der Schweiz sowie in der eigenen Cloud-Infrastruktur, wie das Swisscom macht.


Weitere Artikel zum Thema

Google setzt auf Sprachdienst

19. Mai 2016 - Mit Google Assistant hat der Suchmaschinenriese eine Spracherkennungstechnologie vorgestellt, die Privatpersonen bei alltäglichen Fragen zur Seite stehen soll. Zudem wurde mit Google Home das passende Gadget für zuhause gleich auch präsentiert.

Microsoft spendiert Cortana ein Tastaturkürzel

1. Juni 2015 - Die Spracherkennung von Cortana lässt sich in Windows 10 ab sofort mit einem Tastaturkürzel aktivieren. Dies ist eine von ein paar weiteren, kleineren Verbesserungen die der neue Build 10130 beinhaltet.

Facebook kauft Spracherkennungs-Spezialisten

6. Januar 2015 - Facebook hat das Unternehmen Wit.ai gekauft, das sich auf das Thema Spracherkennung spezialisiert hat und dessen Lösung ähnlich wie Apples Siri funktionieren soll.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Aus welcher Stadt stammten die Bremer Stadtmusikanten?
GOLD SPONSOREN
SPONSOREN & PARTNER