2. November 2025. Ein Begriff geistert durch die KI-Gemeinde: Halluzinieren. Es hat nichts mit Wahnvorstellungen zu tun, sondern basiert auf dem der KI zugrundeliegenden Sprachmodell - Large Language Model. Es ist eine Tatsache: Das Internet beruht auf unendlich vielen Einträgen, von denen einige nicht mehr aktuell sind, aber bei der Recherche immer noch zur Verfügung stehen. Wenn der Chatbot diese Einträge zurate zieht, die vielleicht schon längst überholt sind, dann verkündet er das als immer noch unumstößliche Wahrheit, mit dem Brusttone der Überzeugung! Hier werden Dir die Zusammenhänge erklärt.
Chatbots und moderne Sprachmodelle (häufig „LLMs“ genannt) können oft sehr überzeugend und kompetent klingen. Gleichzeitig liefern sie gelegentlich falsche, irreführende oder frei erfundene Informationen — sogenannte Halluzinationen. In diesem Artikel erkläre ich in klaren Worten, warum das geschieht, wo die größten Risiken liegen, welche Mittel es dagegen gibt und wie insbesondere das Gesundheitswesen damit umgeht.
Eine Halluzination liegt vor, wenn ein Modell eine Aussage trifft, die faktisch falsch, unbelegt oder frei erfunden ist — zum Beispiel ein nicht existierendes Zitat, ein falsches Datum oder eine erfundene Studie. Wichtig: Das ist meist keine böse Absicht oder Betrug, sondern eine Folge davon, wie diese Systeme gebaut sind. Sie schreiben Wahrscheinlichkeiten für Wortfolgen — nicht Wahrheitswerte.
Kurz gesagt: Sprachmodelle werden so trainiert, dass sie sinnvoll weiter texten. Sie lernen Muster und Gemeinsamkeiten in riesigen Textmengen. Wenn Informationen lückenhaft sind, widersprüchlich oder schlicht nicht vorhanden, „füllt“ das Modell die Lücke mit einer plausiblen, aber nicht unbedingt wahren Antwort. Technische Einflussfaktoren sind u. a. die Trainingsdaten, Modellarchitektur und die Art der Textgenerierung.
Generell gilt: Je seltener, spezifischer oder neuer die Information, desto größer das Risiko einer Halluzination. Typische Risikobereiche:
Die Folgen reichen von harmlosen Missverständnissen bis zu ernsten Schäden: falsche medizinische Empfehlungen, fehlerhafte juristische Hinweise, Falschinformationen in journalistischen Texten oder irreführende Archivdaten in historischen Recherchen. Vor allem dort, wo Entscheidungen direktes menschliches Wohlbefinden betreffen (Medizin, Pflege), ist besondere Vorsicht geboten.
NotebookLM (ein Google-Tool) zielt ausdrücklich auf Recherche und Notizen ab und nutzt Retrieval-Techniken sowie Quellenangaben. Das macht es zu einem nützlichen Hilfsmittel — gerade für das strukturierte Arbeiten mit Dokumenten. Allerdings ist auch hier Vorsicht geboten: automatische Zusammenfassungen und die „Discover“-Funktionen müssen geprüft werden, weil auch Quellen falsch zusammengefasst oder unzuverlässig sein können. NotebookLM reduziert Risiken, eliminiert sie aber nicht.
Die Forschung arbeitet an besseren Messgrößen für „gefährliche“ Halluzinationen, robusteren Domänenlösungen (v. a. Medizin) und Interfaces, die Quellen sichtbar und prüfbar machen. Ganz verschwinden werden Halluzinationen wohl nie – aber sie lassen sich deutlich verringern.
Halluzinationen sind eine systemische Eigenschaft heutiger Sprachmodelle – keine Absicht, sondern eine technische Folge ihrer Funktionsweise. Mit den richtigen Werkzeugen (z. B. RAG, Quellenanzeige) und kritischem Nutzerverhalten lässt sich das Risiko stark senken. In sensiblen Bereichen bleibt menschliche Expertise unverzichtbar.
ChatGPT kann Fehler machen. Überprüfe wichtige Informationen.