Spracherkennung für den Anrufbeantworter

Grundsätzlich ist ein Anrufbeantworter auch in der heutigen Zeit noch praktisch, um Personen, die einen nicht per E-Mail oder Messanger kontaktieren wollen / können, die Möglichkeit zu geben, eine Nachricht zu hinterlassen.
Unpraktisch ist allerdings, das man als Angerufener diese Nachricht nicht genauso einfach wie eine E-Mail überall nebenbei abrufen und überfliegen kann.

Glücklicherweise bietet die Fritzbox die Möglichkeit, die Nachricht auch per E-Mail zu verschicken. Was noch fehlt, ist die Möglichkeit, aus der Audio-Nachricht eine Text-Nachricht zu machen.
Dies klappt inzwischen sehr gut über die existierenden Spracherkennungssysteme als Cloud-Lösungen, z.B. von Google, Amazon, Microsoft Azur.

Im Folgenden wird gezeigt, wie man 1. aus einer Anrufbeantworter-E-Mail der Fritzbox die Audio-Nachricht extrahiert, und 2. diese Nachricht transkribiert und den Text hinzufügt.

Für Teil 1 siehe https://github.com/mwalliczek/parse_fritzbox_voicemail

Für Teil 2 siehe https://github.com/mwalliczek/wav2text

Zusätzlich braucht man noch einen API-Key für die Google Speech API.

Wem das alles zu kompliziert ist: Ich biete das auch als fertigen Service an, einfach per Mail an mailto:firma@walliczek.com.


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert