Spracherkennung-News: Infos & Nachrichten

Spracherkennung

"Hey Siri, wie wird das Wetter heute?" - So oder so ähnlich klingt es heutzutage, wenn man Apples Spracherkennungssoftware nach der Wetterlage fragt. Auch wenn postwendend und in Sekundenschnelle eine Antwort zurückgegeben wird, so ist die Technologie hinter der Spracherkennung deutlich komplexer.

Grob lässt sich der Vorgang in drei Abschnitte unterteilen: die Texterfassung, die Sinnerfassung und die Ausführung der Antwort. Diese drei Teilschritte sind so verzwickt, dass sie eine genauere Beschreibung benötigen, um vollständig verstanden zu werden.

Spracherkennung - Texterfassung

Im ersten Schritt, der Texterfassung werden für die Spracherkennung die gesprochenen Wörter in einer Datei aufgenommen und durch eine Software zu einem computerlesbaren Text konvertiert.

Diese Software bildet die aufgenommenen Frequenzen in einem Schallbild ab, worauf dieses auf bestimmte Konsonanten und Vokale analysiert wird. Diese Analyse wird mit jedem einzelnen Wort vorgenommen, wodurch im Endeffekt die analoge, menschliche Sprache für den Computer verständlich wird.

Spracherkennung - Sinnerfassung

Was bringt jedoch ein vorliegender Text, wenn der Computer den Sinn und Zweck dieser Wörter nicht versteht? Um dieser komplexen Frage aus dem Weg zu gehen, werden im zweiten Schritt der Sinnerfassung die nun erkannten Wörter mit einem sogenannten Natural Language Processing (NLP) - System untersucht.

Diese äußerst komplexe Software zerlegt die Eingabe in grammatikalische und semantische Bestandteile, wodurch der Computer die Bedeutung und den Sinn des Satzes „verstehen“ kann.

Da dieser zweite Schritt der aufwendigste der drei Teilschritte ist, läuft dieser häufig auf einem externen Server des Herstellers ab, der per Internet stets mit dem Gerät verbunden ist.

Spracherkennung - Ausführung und Antwort

Im dritten und letzten Schritt folgt die Ausführung der Antwort auf die vom Nutzer gestellte Frage oder Aufforderung. Da der Text des Nutzers nun vollständig vom Computer erkannt und interpretiert wurde, muss nur noch eine Reaktion folgen.

Dafür wird auf das vorprogrammierte Repertoire zurückgegriffen, welches Befehle für verstandene Aufforderungen enthält. So kann ein Sprachassistent nur auf Fragen antworten, auf die der Entwickler im Vorhinein eine Antwort hinterlegt hat.

Diese wird von einer weiteren Software erkannt und aufgeführt, wodurch der Nutzer schlussendlich seine Antwort auf die gestellte Frage erhält.

News

Duolingo – Eine beliebte Sprachlern-App

Duolingo Image

Viele Menschen träumen davon, neben ihrer Muttersprache auch eine weitere Sprache zu beherrschen. Oftmals fällt der erste Blick dann auf diverse Sprachlern-Apps, die beim Lernen der neuen Fremdsprache unterstützen sollen. Eine der populärsten Optionen stellt dabei die Online-Lernplattform und App Duolingo dar.

Unsere Nachrichten auf Ihrer Website

Sie haben die Möglichkeit, mit unserem Webmaster-Nachrichten-Tool die Nachrichten von IT-Times.de kostenlos auf Ihrer Internetseite einzubauen.

Zugeschnitten auf Ihre Branche bzw. Ihr Interesse.

Folgen Sie IT-Times auf ...