Mozilla gibt 500 Stunden Sprachdaten frei

Mozilla gibt 500 Stunden Sprachdaten frei

Mozilla gibt 500 Stunden Sprachdaten frei

(Quelle: Mozilla)
30. November 2017 -  Mozilla hat hunderttausende Sprachaufnahmen gesammelt und diese jetzt zum kostenlosen Download freigegeben. Mit der offenen Datenbank können Forscher und Entwickler ihre Spracherkennungsprojekte weiter vorantreiben – denn Sprach-Interfaces werden im Umgang mit Geräten eine immer wichtigere Rolle spielen.
Mozilla verfolgt den Open-Source-Gedanken weiter und möchte Sprachtechnologie-Projekte unterstützen. So hat das Machine-Learning-Team des Unternehmens jetzt eine umfangreiche Sprachdatenbank im Rahmen des Projekts Common Voice öffentlich zugänglich gemacht. Die 500 Stunden Material umfassende Sammlung enthält 400'000 Aufnahmen von 200'000 Personen – und sie wird konstant durch Menschen aus aller Welt überprüft und weiter gefüttert.

Mit dieser Datensammlung möchte Mozilla Entwicklern, Forschern und Start-ups, die mit sprachbasierten Technologien arbeiten, einen offenen Zugang zu Forschungsmaterial bieten. Vergleichbare, qualitativ ähnlich hochwertige Sprachdaten können zehntausende Euro kosten und reichen oftmals im Umfang doch nicht aus, um eine Statistikgrundlage für eine Spracherkennung zu schaffen, die Nutzererwartungen trifft.

Die Machine-Learning Experten von Mozilla arbeiten ausserdem an einer Open-Source-Speech-To-Text-Engine, mittels derer Diktier-Software weiter ausgefeilt werden kann. Das Team ist sehr erfolgreich: Bei Mozilla Librispeech liegt die Erkennungsfehlerrate mittlerweile bei 6,5 Prozent. Bisher liegen alle Daten in englischer Sprache vor, aber bald sollen weitere Idiome dazukommen.

Die Daten stehen bei Mozilla Common Voice zum kostenlosen Download bereit. (rpg)
Weitere Artikel zum Thema
 • Microsofts Spracherkennung ist so gut wie die menschliche
 • Statistik Stadt Zürich stellt Open-Source-Software zur Verfügung
 • Spracherkennung versteht Schweizerdeutsch

Vorherige News
 
Nächste News

Neuen Kommentar erfassen

Kommentare werden vor der Freischaltung durch die Redaktion geprüft.
Anti-Spam-Frage Vor wem mussten die sieben Geisslein aufpassen?
Antwort
Name
E-Mail
NEWSLETTER ABONNIEREN
Abonnieren Sie unseren täglichen Newsletter mit den wichtigsten ICT-Meldungen
SWISS IT MAGAZINE - AUSGABE 2017/12
Schwerpunkt: IT-Trends 2018
• Digitale Transformation der Unternehmen
• Mensch und Maschine im Einklang
• Digitale Bilder verschmelzen mit der Realität
• Cybersecurity: Vom Hype in die Integration
• Cloud und Co. fordern das Datenmanagement heraus
Zum Inhaltsverzeichnis
SPONSOREN & PARTNER