Raspberry Pi per Sprache steuern

© Jozef Polc, 123RF

Aufs Wort

Siri, Alexa, Cortana und OK Google – digitale Assistenten mit Sprachfähigkeiten infiltrieren auf allen Plattformen das Privatleben des Benutzers. Anwender eines Raspberry Pi nutzen dagegen freie Software, ohne dass internationale Konzerne mithören.

Computer per Sprache statt per Tastatur zu steuern ist ein alter Traum, zuerst in zahlreichen Science-Fiction-Serien der späten Sechzigerjahre verwirklicht. Inzwischen sind sowohl die Rechner als auch die Sprachforscher so weit, dass die Idee tatsächlich im Alltag funktioniert. Technisch kommen hier zwei Komponenten zum Einsatz: Eine sogenannte STT-Engine (englisch für "speech-to-text", Sprache-zu-Text) wandelt die gesprochene Sprache in Text um. Die andere Richtung übernimmt eine TTS-Engine ("text-to-speech", Text-zu-Sprache). Dazwischen sitzt ein Programm, das den eingegebenen Text interpretiert und den Ausgabetext erzeugt.

Sowohl für STT als auch für TTS gibt es On- und Offline-Lösungen. Insbesondere die Sprachanalyse benötigt viel Know-how, ein gutes Sprachmodell und ein Lexikon, damit die Spracheingabe nicht zum sinnlosen Silbenbrei verkommt. Diverse Anbieter wie Google erlauben – nicht ganz uneigennützig – die Integration ihrer Online-Engines in selbst geschriebene Programme. Wer jedoch nicht möchte, dass der Anbieter mithört, benötigt eine Offline-Engine.

Zum Glück gibt es mit Pocketsphinx [1] und Julius [2] zwei quelloffene Engines, die autark arbeiten. Die Latte für die Hardware-Anforderungen liegt dabei erfreulich niedrig: Für beide reicht die Rechenleistung eines Raspberry Pi aus. Darüber hinaus gibt es mit dem Jasper-Projekt [3] eine Python-Lösung, die diese (und andere) TTS- und STT-Engines über einen simplen Mechanismus verbindet und so die Sprachsteuerung eines RasPi recht einfach macht. In den folgenden Abschnitten geht es um die Hardware, die Installation der Software sowie um ein kleines Beispiel für die Sprachverarbeitung.

Hardware-Voraussetzungen

Für den normalen Betrieb genügt die Rechenleistung eines Raspberry Pi der ersten Generation. Möchten Sie die Software selbst kompilieren (mehr dazu im nächsten Abschnitt), benötigen Sie aber sehr viel mehr Geduld als beim RasPi 2. Im Betrieb verhielt sich der Ur-Pi ein wenig besser, da bei ihm anders als bei seinem Nachfolger keine Brummgeräusche auftraten. Hier fehlt dem RasPi 2 offensichtlich eine ordentliche Abschirmung der Audiobuchse.

Da der Raspberry Pi im Gegensatz zu anderen SBCs wie etwa dem Banana Pi nicht über ein eingebautes Mikrofon verfügt, stehen entweder eine kleine USB-Soundkarte plus Mikrofon (Abbildung 1) oder gleich ein USB-Mikrofon auf der Einkaufsliste. Die Kombi in Abbildung 1 mit der USB-Soundkarte Creative Soundblaster Play und dem Notebook-Mini-Mikrofon von Hama kostet 17 Euro plus 6 Euro für das Mikro. Das USB-Mikro Akiro von Kinobo in Abbildung 2 gibt es für etwa 18 Euro im Handel.

Abbildung 1: USB-Soundkarte mit Mini-Mikrofon direkt in der Mikrofonbuchse.
Abbildung 2: USB-Mikrofon zum Aufstellen auf dem Schreibtisch und Mini-Lautsprecher.

Die Sprachausgabe erfolgt über den HDMI-Ausgang oder per 3,5-mm-Klinke. Besondere Ansprüche an die Lautsprecher gibt es nicht, hier tun es selbst einfache "Brüllwürfel": Die synthetischen Stimmen der meisten Sprachausgabe-Engines hauen audiophile Nutzer sowieso nicht vom Hocker. Freilich spricht nichts gegen bessere Lautsprecher, etwa falls das System später sprachgesteuert Musik abspielen soll.

Der richtige Ton

Um später nicht irgendwelche Fehler in der Software zu suchen, sollten Sie Aufnahme (Mikrofon) und Wiedergabe richtig konfigurieren. Das folgende Setup geht von der Ausgabe über die interne Soundkarte mithilfe der 3,5-mm-Klinkenbuchse aus. Die Konfiguration klappt am bequemsten über Raspi-config und dessen Menüpunkt zum Steuern der Ausgabe. Letztlich besteht die Konfiguration nur aus dem Ändern eines Werts in /etc/modprobe.d/alsa-base.conf: Raspi-config stellt dort die Option snd-usb-audio von -2 auf 0.

Schließen Sie das Mikrofon über eine unterstützte USB-Soundkarte an, können Sie sich eine weitere Konfiguration sparen. Dasselbe gilt für USB-Mikrofone, die quasi ein auf das Eingabeteil reduziertes Sound-Device enthalten. Für einen ersten Test und zum Einstellen der Aufnahme- und Wiedergabelautstärke greifen Sie zum Programm alsamixer. Mit [F6] wählen Sie das Sound-Device aus, mit [Tab] gelangen Sie zu den einzelnen Geräten für Ein- und Ausgabe. Über die Pfeiltasten ändern Sie die Einstellungen (Abbildung 3). Taucht statt des Mixerprogramms nur eine Fehlermeldung auf, gehört typischerweise der angemeldete Nutzer nicht zur Gruppe audio – wer mit dem Standardnutzer pi arbeitet, hat dieses Problem nicht.

Abbildung 3: Mit dem Alsamixer stellen Sie den Schallpegel des Mikrofons ein.

Hilfreich für die Einrichtung ist das Programm mic-test aus dem zu diesem Artikel entstandenen Github-Projekt des Autors [4]. Das Programm nimmt für fünf Sekunden auf und spielt die Aufnahme anschließend gleich wieder ab – damit lässt sich dann sowohl die Aussteuerung des Mikros als auch die Ausgabelautstärke per Alsamixer den eigenen Bedürfnissen anpassen. Anschließend speichert der Befehl sudo alsactl store die Einstellungen. Beim nächsten Bootvorgang lädt das System diese automatisch wieder.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 6 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Raspberry Pi Geek kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Editorial 01/2016

    Der Raspberry Pi ist mehr, als nur einer von vielen Bastelrechnern: In einer Zeit, in der immer mehr Firmen, Staaten und Behörden dem Bürger an die Daten wollen, glänzt er als ebenso preiswerter wie effizienter Baustein für ein persönliches Privacy- und Security-Konzept.

  • Raspberry-Pi-Roboter Rapiro im Test

    Vor einiger Zeit erregte die Kickstarter-Kampagne um Rapiro, den humanoiden Roboter mit einem Raspberry Pi als Gehirn, viel Aufsehen. Wir haben das inzwischen lieferbare Endprodukt ausprobiert.

  • Aktivitätsüberwachung für allein lebende Senioren

    Ein RasPi, ein Arduino, ein Flusssensor, eine Webcam mit Mikro und etwas Python-Code sowie eine Spracherkennung bilden eine preiswerte, auf dem Wasserverbrauch basierende Aktivitätsüberwachung für alleinstehende Senioren.

  • Der Raspberry Pi 3 Model B im Detail

    Viele Raspberry-Fans wünschten sich für die nächste Generation des Mini-Computers USB 3.0, SATA-Schnittstelle und Gigabit-Ethernet. Dies alles bietet der Raspberry Pi 3 nicht, dafür aber WLAN, Bluetooth und eine schnelle 64-Bit-CPU.

  • RasPi-Alternative Banana Pi im Test

    Zum Basteln genügt die Leistung des Raspberry Pi locker, doch als Mini-Server oder Multimedia-Center dürfte er ruhig ein wenig mehr Saft haben. Der Banana Pi verspricht Kompatibilität zum Raspberry Pi – bei einem Plus an Rechenleistung.

Aktuelle Ausgabe

06/2018
Raspberry 3 Modell B+

Diese Ausgabe als PDF kaufen

Preis € 7,99
(inkl. 19% MwSt.)

Stellenmarkt

Neuigkeiten

  • Neues auf der Heft-DVD

    Nur mit dem optimalen System und der richtigen Software nutzen Sie das volle Potenzial eines Mini-PC. Mit der Heft-DVD erhalten Sie nicht nur die neusten Distributionen für den RasPi und Co., sondern gleichzeitig auch die passenden Programme zu den Artikeln.

  • Auf vielen Kanälen

    Die IoT-Welt spricht MQTT. Das robuste Protokoll eignet sich aber nicht nur für die Industrie, sondern auch für den Einsatz in den eigenen vier Wänden.

  • Stabübergabe

    Ist das Prototyping erst einmal abgeschlossen, dann darf ein günstiger Mikrocontroller wie der MSP430 das Ruder übernehmen.

  • Einfach eingesteckt

    Mit dem Mediastick von Western Digital erweitern Sie einen Fernseher auf einfache Weise um ein Compute-Modul. In der Praxis lauern aber einige Fußangeln.

  • Laubenpieper

    Mit Teamviewer IoT passt der Remote-Desktop-Spezialist seine Software an die Anforderungen im Internet der Dinge an. Dabei bleibt der Raspberry Pi ein wichtiges Element.

  • Im Labor

    Es gibt Situationen, die eine genauere Analyse erfordern, als der Strommesser aus dem Baumarkt sie liefert. Ein Selbstbaumodul samt Pi Zero zeichnet Messdaten für die spätere Auswertung auf.

  • HTTPS für alle

    Mit Caddy gelingt es auch unerfahrenen Anwendern, einen Webserver vernünftig und sicher aufzusetzen. Dabei reduziert er das üblicherweise komplexe Setup von HTTPS auf ein Minimum.

  • Informativ

    Kiosksysteme als interaktives Informationsangebot verursachen in Anschaffung, Betrieb und Wartung meist erhebliche Kosten. Raspberry Digital Signage dagegen bietet eine Lösung für das kleine Budget.

  • Logisch, oder?

    Digitale Schaltungen mit Bleistift und Papier zu zeichnen, gerät auf die Dauer umständlich. Mit Logisim dagegen entwerfen Sie Schaltungen nicht nur, sondern können sie auch direkt testen.

  • Smarter Schreiberling

    Gerade kleine Texteditoren für die Konsole verfügen oft über erstaunlich umfangreiche Fähigkeiten – da macht Micro keine Ausnahme.