Startseite>Raspberry Pi per Sprache steuern
Aus Raspberry Pi Geek 01/2016

Raspberry Pi per Sprache steuern (Seite 3)

Was sich hingegen leicht anpassen lässt, ist das unglücklich gewählte, weil nur mit Mühe korrekt aussprechbare Befehlsschlüsselwort “Jasper”. Dazu tauschen Sie das Wort sowohl in der Datei jasper/static/keyword_phrases als auch in jasper/jasper.py aus. Die neue Keyword-Datei laden Sie dann auf die Webseite eines Online-Tools [7] hoch und generieren sich dort ein neues Dictionary und Language-Model (Dateinamen Name.dic und Name.lm). Im Verzeichnis jasper/static überschreiben Sie anschließend die Dateien dictionary_persona.dic und languagemodel_persona.lm mit den frisch erzeugten Versionen.

Da die Erkennung immer auf Wörterbucheinträgen basiert, sollten Sie idealerweise als Schlüsselwort einen einfachen, verbreiteten Namen wählen, dessen Aussprache sich im Deutschen und Englischen nur wenig unterscheidet. Aus diesem Grund fällt zum Beispiel das naheliegende “RasPi” flach.

Am Einfachsten lässt sich die Stimme für die Sprachausgabe ändern: Hier müssen Sie nur ein paar Zeilen in der Profildatei anpassen. Statt der E-Speak-TTS-Engine (Listing 4, Zeilen 15 bis 19) verwenden Sie etwa die F-Lite-Engine (Listing 6), für die es eine Reihe verschiedener Stimmen gibt. Die Stimme slt klingt deutlich natürlicher als die roboterähnliche E-Speak-Ausgabe und ist dennoch gut zu verstehen.

Listing 6

 

tts_engine: flite-tts
  flite-tts:
  voice: 'slt'

Fazit

Der Einstieg in Jasper gestaltet sich aufgrund der langwierigen Vorarbeiten aufwendig, und auch im Gebrauch macht Jasper wegen der mehr schlechten als rechten Spracherkennung nicht sonderlich viel Spaß. Bei gut eingestelltem Mikro und intelligent gewählten Schlüsselwörtern funktioniert Jasper dennoch überraschend zuverlässig. Die eigentliche Leistung des Jasper-Projekts liegt auch darin, alle Komponenten mit einfachem und kompaktem Python-Code zu verbinden. Selbst wer Jasper nicht direkt nutzen möchte, profitiert davon, denn weite Teile lassen sich einfach per Cut & Paste in eigene Projekte integrieren.

Da Jasper quasi ständig lauscht, verbietet sich ein Ausweichen auf die guten Online-Sprach-Engines von Google und Co., da sonst jedes gesprochene Wort dort landet. In eigenen Projekten ließe sich dieses Problem jedoch leicht lösen: Statt über ein gesprochenes Schlüsselwort (“Jasper”) leitet etwa ein Knopfdruck (oder Klick auf ein Icon) die Sprachaufnahme ein. So funktionierte vor der Einführung von OK Google auch die Spracherkennung von Android. Google bekäme dann nur gezielt gesprochene Befehle für die STT-Engine zu hören – damit ließe sich dann in vielen Bereichen gut leben. 

Der Autor

Bernhard Bablok ([email protected]) arbeitet bei der Allianz Managed&Operations Services SE als SAP-HR-Entwickler. Wenn er nicht Musik hört, mit dem Rad oder zu Fuß unterwegs ist, beschäftigt er sich mit Themen rund um Linux, Programmierung und neuerdings Kleincomputer.

DIESEN ARTIKEL ALS PDF KAUFEN
EXPRESS-KAUF ALS PDFUmfang: 6 HeftseitenPreis €0,99
(inkl. 19% MwSt.)
€0,99 – Kaufen
RASPBERRY PI GEEK KAUFEN
EINZELNE AUSGABE Print-Ausgaben Digitale Ausgaben
ABONNEMENTS Print-Abos Digitales Abo
TABLET & SMARTPHONE APPS
Deutschland