12. Februar 2026. Schon vor einigen Jahren unkte eines der führenden Online-Magazine, Tastatur und Maus hätten ausgedient. Mit der Sprachsteuerung würde alles fünfmal so schnell gehen. Außerdem hätten Menschen mit Einschränkungen (Hände, Augen) immer noch eine Chance online zu gehen. Auf dieser Seite berichtete ich darüber.
Nun bin ich bei connect,de auf einen umfassenden Bericht gestoßen: "Windows hört aufs Wort - Windows der Zukunft mit Spracheingabe und KI." - Der Computer der Zukunft wird ganz nach der Idee des Star-Trek-„Computers“ nicht mehr mit der Tastatur bedient. Windows und Zusatzprogramme bieten jetzt schon fortschrittliche Bedienmethoden über Spracheingabe und KI.
Ich bin mir sicher, diese Entwicklung wird kommen. Technische Probleme der Spracherkennung gibt es nicht mehr. Aber nicht jeder hat gelernt, druckreif zu sprechen, muss immer mal ein Päuschen einlegen. Und wer möchte schon seine Stimme im Internet geklont hören? Ich schwanke immer noch! -DM
10. März 2026. Schließlich habe ich es doch wissen wollen! Ich wollte die Sprachsteuerung mit dem Notebook ausprobieren, ohne das Stimmen-Clone zu riskieren und ebenso auch mit dem Android-Smartphone. Das erste scheiterte an technischen Problemen; mit dem Smartphone wurde es aber ein voller Erfolg!
Sehen Sie live, wie Sie mit dem Smartphone sprechen – ChatGPT schreibt automatisch mit, Sie kontrollieren den Text, dann senden – fertig!
Optional: „Sprechen statt tippen – ChatGPT versteht Sie, sogar Ihre Kommas und Punkte!“
Ein kleiner Praxisversuch
In letzter Zeit hört man immer häufiger von sogenannten „Stimmklonen“. Gemeint ist eine Technik der Künstlichen Intelligenz, mit der Stimmen nachgeahmt werden können. In manchen Medienberichten klingt es so, als könnten Kriminelle bereits mit wenigen Sekunden Sprachmaterial eine Stimme täuschend echt kopieren.
Das hat mich neugierig gemacht. Ich nutze Chatbots gern – und wollte wissen, ob es eine einfache Möglichkeit gibt, mit einem Chatbot zu sprechen, ohne dass meine Stimme als Aufnahme übertragen wird.
Meine Idee war:
Sprache sprechen – aber nur Text übertragen.
Die naheliegende Lösung schien zunächst die eingebaute Diktierfunktion von Windows zu sein. Sie wird normalerweise mit der Tastenkombination Windows-Taste + H gestartet. Der Computer wandelt dann die gesprochene Sprache direkt in Text um.
Genau das wollte ich ausprobieren.
Leider scheiterte der Versuch an einer typischen Windows-Eigenheit: Bestimmte Datenschutzeinstellungen blockierten die Funktion, und mehrere Optionen waren ausgegraut. Trotz verschiedener Versuche ließ sich die Spracheingabe nicht aktivieren.
Solche technischen Hürden sind übrigens kein Einzelfall. Viele Nutzer erleben Ähnliches, wenn Windows-Funktionen durch System- oder Datenschutzeinstellungen eingeschränkt werden.
Also probierte ich es mit einem Android-Smartphone. Dort gibt es zwei einfache Möglichkeiten, ChatGPT zu nutzen:
Ich habe mich für die App „ChatGPT“ entschieden, die man im Google Play Store herunterladen kann.
Die Bedienung ist sehr einfach: Auf der Bildschirmtastatur befindet sich ein kleines Mikrofonsymbol. Tippt man darauf, kann man sprechen – und das Smartphone schreibt den Text automatisch.
Genau das habe ich ausprobiert.
Ich diktierte einige Fragen an ChatGPT – und der Text erschien sofort im Eingabefeld.
Ein wichtiger Vorteil: Man kann den geschriebenen Text zunächst lesen, kontrollieren und bei Bedarf korrigieren.
Erst wenn alles stimmt, tippt man auf „Senden“. In diesem Moment erhält ChatGPT den Text und kann darauf antworten.
Der entscheidende Punkt dabei:
Das Smartphone wandelt die Sprache zuerst in Text um. An den Chatbot wird anschließend nur dieser Text übertragen, nicht die eigene Stimme.
Beim Tippen schafft man im Durchschnitt etwa 30 bis 40 Wörter pro Minute.
Beim Sprechen sind oft über 100 Wörter pro Minute möglich.
Gerade längere Fragen lassen sich deshalb sehr bequem formulieren.
ChatGPT speichert Gespräche online. Wenn man sich auf verschiedenen Geräten mit demselben Konto anmeldet, erscheinen die Chats automatisch auf allen Geräten.
Man kann zum Beispiel:
Viele Nutzer kombinieren deshalb beide Geräte: das Smartphone zum schnellen Fragenstellen – den Computer zum längeren Lesen oder Schreiben.
Mein ursprüngliches Ziel war eine einfache Lösung:
Der Versuch mit dem Windows-Notebook scheiterte zwar an technischen Einstellungen. Doch mit dem Smartphone funktionierte es sofort und ohne besonderen Aufwand.
Sprache sprechen → Smartphone schreibt mit → Chatbot erhält nur den Text.
Damit verbindet man drei Vorteile:
1. ChatGPT-App auf dem Smartphone öffnen.
2. In das Eingabefeld tippen, sodass die Tastatur erscheint.
3. Auf das Mikrofonsymbol der Tastatur tippen.
4. Frage oder Text sprechen.
5. Den geschriebenen Text kurz kontrollieren.
6. Auf „Senden“ tippen – ChatGPT beantwortet die Frage.
So kann man bequem sprechen – technisch wird jedoch nur Text übertragen.
ChatGPT im Browser nutzen
Offizielle Webseite von OpenAI. Hier kann man ChatGPT direkt im Browser verwenden – auch auf dem Smartphone.
https://chat.openai.com
ChatGPT-App im Google Play Store
Die offizielle App für Android-Smartphones. Sie ermöglicht den Zugriff auf ChatGPT auch unterwegs.
https://play.google.com/store/apps/details?id=com.openai.chatgpt
Sprachassistenten und Datenschutz
Informationen des Bundesamts für Sicherheit in der Informationstechnik über Sprachsysteme und Datenschutzfragen.
https://www.bsi.bund.de/DE/Themen/Verbraucherinnen-und-Verbraucher/Informationen-und-Empfehlungen/Sprachassistenten/sprachassistenten_node.html
Informationen zu KI und Sprachtechnologie
Überblick über moderne Sprachtechnologie und deren Einsatzmöglichkeiten in der Forschung.
https://www.fraunhofer.de/de/forschung/forschungsfelder/kuenstliche-intelligenz/sprachtechnologie.html
1. Zu schnell sprechen
Wer wie im normalen Gespräch redet, überfordert die Spracherkennung. Wörter werden falsch oder gar nicht geschrieben. Tipp: Etwas langsamer und deutlich sprechen.
2. Satzzeichen vergessen oder falsch aussprechen
Satzzeichen wie „Punkt“, „Komma“, „Fragezeichen“ oder „neuer Absatz“ müssen bewusst mitgesprochen werden. Ansonsten erscheint ein langer Text ohne Struktur.
3. Text sofort absenden, ohne Kontrolle
Fehler schleichen sich leicht ein. Tipp: Den Text immer zuerst lesen, korrigieren und erst dann senden.