01/2007 - 07/2007
Referenzprojekt »Wyve«
Webbasierter Spracherkennungsdienst

Spracherkennung als Webdienst
Entwicklung eines standortunabhängigen, webbasierten Spracherkennungsdienstes (freies Diktieren) mit darauf basierenden Client-Anwendungen. Der Webdienst war SOAP-basiert und konnte Sprachdaten im WAV-Format von jedem SOAP-Client entgegennehmen.
Sofort einsatzbereiter Client
Als Prototyp einer typischen Client-Anwendung wurde ein C#-basierender Client implementiert. Der Client hatte eine minimale Grösse (ca. 300KB) und war ohne Installation nutzbar (z.B. von einem USB-Stick).
Er übernahm die Sprachentgegennahme und -vorbereitung (Schwellwert-Analyse und Pausenerkennung), verschickte die Sprachpakete über Webservices (SOAP over HTTP) an die Serveranwendung und fügte die erkannten Sprachpassagen in die konfigurierten Zielapplikationen ein.
Server mit Unterstützung beliebiger Sprachengines
Für den Tomcat-basierten Server wurde ein Framework entwickelt, das beliebige 3rdparty-Speech-Recognition-Engines integrieren und zur Laufzeit umschalten konnte.
Mittels des Prototyps wurden die Speech-Engines Sphinx 4.1 (Java) und Loquendo ASR (C/C++) evaluiert (Spracherkennungsqualität, Parallelisierbarkeit, Stabilität, Lastverhalten). Für die Anbindung von Loquendo wurde zudem ein JNA-basierter Mapper (Java zu C/C++) entwickelt.
Aufgabe im Gesamtprojekt
Technische Gesamt-Verantwortung, Design- und Architektur-Verantwortung, Analyse, Design und Implementierung des Prototyps, technische Evaluierung der Speech-Engines.
Technik
Projektgröße
Durch das Auswählen von Eigenschaften dieses Projektes, können weitere Projekte mit ähnlichen Eigenschaften gesucht werden.