KI-Halluzinationen in der Kundenkommunikation verhindern: 5 Stufen aus der Praxis
- Werner Graser

- 5. Mai
- 5 Min. Lesezeit
Wie wir in der automatisierten Kommunikation sicherstellen, dass KI keine Preise, Termine oder Fakten erfindet.
Stellen Sie sich vor: Ein Kunde schreibt Ihrem WhatsApp-KI-Assistenten um 23 Uhr und fragt nach dem Preis für eine Pellets-Lieferung. Der Assistent antwortet freundlich – und nennt einen Preis, den es gar nicht gibt. Am nächsten Morgen ruft der Kunde an und pocht auf genau dieses Angebot.
Das ist kein hypothetisches Szenario. Das ist uns passiert.
Mit getVIA entwickeln wir eine SaaS-Plattform für KI-gestützte Kundenkommunikation via Telefon, WhatsApp und E-Mail. Unsere Kunden sind KMUs aus dem DACH-Raum – von Ärzten und Steuerberatern bis hin zu Handwerksbetrieben. Für sie ist eine falsche Preisauskunft nicht nur ärgerlich, sondern geschäftsschädigend.
Dieser Artikel zeigt in fünf konkreten Schritten, wie wir das Halluzinationsproblem im laufenden Betrieb gelöst haben.

Warum halluzinieren KI-Modelle überhaupt?
Jedes Large Language Model (LLM) – ob Mistral, ChatGPT oder Claude – generiert Text auf Basis von Wahrscheinlichkeiten. Es wählt das nächste Wort danach aus, was statistisch am besten passt. Das funktioniert bei allgemeinen Fragen hervorragend, wird bei spezifischen Fakten wie Preisen oder Terminen jedoch gefährlich: Die KI „rät“ Werte, die plausibel klingen, aber falsch sind.
Ein Beispiel aus unserer Praxis: Ein KI-Assistent für einen Brennstoffhändler sollte Pellets-Preise nennen. Da das LLM keinen aktuellen Preis in der Knowledge Base (KB) fand, erfand es einen „marktüblichen“ Preis – der leider 20 % unter dem tatsächlichen Wert lag. Ein einziger solcher Vorfall kann das Kundenvertrauen nachhaltig zerstören.
Schritt 1: Strictness-Level – Die kreative Leine ziehen
Nicht jeder KI-Agent benötigt die gleiche kreative Freiheit. Während ein Agent für eine Steuerkanzlei exakt antworten muss, darf ein Assistent für ein Yoga-Studio locker plaudern. Wir haben dafür einen Strictness-Slider mit fünf Stufen entwickelt:
Stufe | Name | Funktionsweise |
|---|---|---|
1 | KB Only | Antworten ausschließlich aus der verifizierten Wissensbasis (KB). Kein externes Wissen. |
2 | Strict | Geringe Kreativität, hoher Mindest-Score. Nur sehr sichere Treffer. |
3 | Balanced | Standardmodus. Ausgewogene Mischung aus Wissen und natürlicher Sprache. |
4 | Conversational | Mehr Freiheit, niedrigerer Schwellenwert. Ideal für Smalltalk. |
5 | Creative | Maximale Freiheit. Nur für Inhalte ohne Haftungsrisiko. |
Der Clou: Die Stufe wird automatisch über Branchen-Templates festgelegt. Eine Arztpraxis startet auf Stufe 1, eine Eventagentur auf Stufe 3.
Schritt 2: Der dreischichtige Prompt – Ein unsichtbarer Schutzwall
Hinter jedem Agenten arbeiten drei Prompt-Schichten, die aufeinander aufbauen:
Agent-Grundeinstellung: Der Nutzer definiert Tonalität (z. B. „Sei freundlich und duze den Kunden“).
Verhaltensregeln: Feste Regeln, die sichtbar, aber für den Nutzer nicht löschbar sind (z. B. „Nenne niemals Preise, die nicht in der KB stehen“).
Protected PromptBuilder: Eine systemweite, unsichtbare Schicht, welche die technische Strictness-Logik erzwingt.
Warum dieser Aufwand? LLMs sind Meister darin, einfache Anweisungen kreativ zu umgehen. Die dritte Schicht setzt harte technische Grenzen, die nicht „wegdiskutiert“ werden können.
Schritt 3: Branchen-Templates – Schutz auf Knopfdruck
Um KMUs nicht mit technischer Komplexität zu überfordern, nutzen wir 42 Branchen-Templates. Jedes Template konfiguriert automatisch das Strictness-Level, branchenspezifische Regeln (z. B. Verweis auf Preislisten) und passende CRM-Felder.
Schritt 4: Vektor-Suche mit Mindest-Score
Unsere KB ist als Vektoren in einer Datenbank gespeichert. Bei einer Kundenanfrage sucht das System nach passenden Einträgen, wobei jeder Treffer einen Score zwischen 0 und 1 erhält.
Hier greift die Strictness: Je höher die Stufe, desto höher der erforderliche Mindest-Score. Auf Stufe 1 werden nur Treffer über 0,85 akzeptiert. Liegt der Wert darunter, gibt der Agent ehrlich zu: „Das kann ich leider nicht beantworten“ – anstatt zu halluzinieren. Technischer Background: Wir nutzen Cosine Similarity mit 1024-dimensionalen Embeddings.
Schritt 5: Wissensbasis-Hygiene – Garbage In, Garbage Out
Die beste Architektur scheitert an schlechten Daten. Ein Kunde lud testweise seinen gesamten E-Mail-Verlauf hoch, was zu 97,9 % „Rauschen“ (Signaturen, Disclaimer) führte. Unsere Lösung:
Automatisches Cleaning: HTML wird vor der Vektorisierung entfernt.
Zuweisung: Jeder Eintrag muss zwingend einem Agenten zugeordnet sein.
Synchronisation: Gelöschte Einträge werden sofort aus der Vektordatenbank entfernt.
Audits: Regelmäßige Prüfungen der Score-Verteilung identifizieren schwache Datenpunkte.
Lessons Learned: 3 Fehler und ihre Lösungen
Fehler | Auswirkung | Lösung |
|---|---|---|
Ungefilterte E-Mail-Dumps | 97,9 % Rauschen, KI zitiert fremde Mails | Upload-Filter & HTML-Bereinigung |
Fehlende Agenten-Zuweisung | 75 % der Daten wurden nie gefunden | Auto-Assign & Audit-Scripts |
Daten-Leichen in der DB | Veraltete/gelöschte Infos in Antworten | Synchroner Cascade-Delete |
Fazit: Vertrauen durch Sicherheit
Nach sechs Monaten im Produktivbetrieb ziehen wir eine positive Bilanz: Null Preis-Halluzinationen auf den Stufen 1–2 und ein deutlich verbesserter durchschnittlicher KB-Score von 0,854.
Was Sie für Ihr eigenes KI-Projekt mitnehmen können:
Halluzinationen sind kein Bug, sondern eine Systemeigenschaft, die Schichten zur Kontrolle erfordert.
Die Qualität der Knowledge Base ist wichtiger als das gewählte Modell.
Sicherheit geht vor Geschwindigkeit. Ein halluzinierender Bot ist schlimmer als gar kein Bot.
Fangen Sie bei den Daten an, nicht beim Prompt-Engineering. Und geben Sie Ihrer KI klare Leitplanken – je sensibler die Branche, desto enger.
FAQ: KI-Halluzinationen sicher im Griff
Was versteht man unter einer „KI-Halluzination“?
KI-Modelle wie ChatGPT oder Mistral basieren auf statistischen Wahrscheinlichkeiten. Sie berechnen, welches Wort als Nächstes am besten passt. Wenn das System keine Fakten in seiner Wissensbasis findet, „rät“ es plausible, aber inhaltlich falsche Antworten – das nennt man Halluzination. In der Kundenkommunikation kann das zu falschen Preis- oder Terminauskünften führen.
Warum ist die Knowledge Base (KB) so wichtig?
Die Knowledge Base ist die verifizierte Wissensquelle, aus der die KI ihre Informationen bezieht. Ohne eine saubere KB greift die KI auf ihr allgemeines Trainingswissen zurück, was im geschäftlichen Kontext oft zu Fehlern führt. Eine gut strukturierte Datenbasis ist für die Genauigkeit wichtiger als das verwendete KI-Modell selbst.
Was bewirkt der „Strictness-Slider“?
Der Strictness-Slider steuert die kreative Freiheit der KI in fünf Stufen:
Stufe 1 (KB Only): Die sicherste Stufe; Antworten werden ausschließlich aus der verifizierten Wissensbasis generiert.
Stufe 5 (Creative): Maximale Freiheit für lockeren Smalltalk ohne Haftungsrisiko. Dazwischen liegen Abstufungen, die je nach Branche (z. B. Arztpraxis vs. Eventagentur) automatisch voreingestellt werden.
Wie funktioniert der Schutz durch den „Mindest-Score“?
Jeder Treffer in der Vektordatenbank erhält bei einer Suche einen Score zwischen 0 und 1. Je höher das gewählte Strictness-Level, desto höher muss dieser Score sein, damit die KI die Information nutzt. Auf Stufe 1 werden beispielsweise nur Treffer über 0,85 akzeptiert – liegt der Wert darunter, gibt die KI lieber zu, die Antwort nicht zu wissen, anstatt etwas zu erfinden.
Warum sollte ich keine ungefilterten E-Mails als Wissensquelle nutzen?
E-Mail-Verläufe enthalten oft bis zu 97,9 % „Rauschen“ wie Signaturen, Disclaimer oder fremde Inhalte. Lädt man diese ungefiltert hoch, kann es passieren, dass der KI-Agent private Daten oder falsche Informationen aus alten Korrespondenzen zitiert.
Kann ich die Sicherheitsstufen für meinen Betrieb selbst anpassen?
Ja. Zwar setzen 42 verschiedene Branchen-Templates automatisch einen sicheren Standard (z. B. Stufe 1 für eine Arztpraxis), aber der Unternehmer kann diese Stufe jederzeit manuell an den eigenen Bedarf anpassen.
Über den Autor
Werner Graser ist CTO und Co-Founder von getVIA, einem österreichischen SaaS-Startup, das sich auf KI-gestützte Kundenkommunikation spezialisiert hat. Mit über 20 Jahren Erfahrung in der Web- und Datenbankentwicklung sowie als zertifizierter KI-Consultant verantwortet er die gesamte technische Architektur der Plattform – vom Backend bis zur komplexen Vektordatenbank.
Als „Sole Developer“ hat er getVIA mit über 465.000 Zeilen Code aufgebaut, um KMUs den Zugang zu leistungsstarker KI zu ermöglichen, ohne dass diese eigenes Technik-Wissen benötigen. Sein Fokus liegt dabei auf der Entwicklung einer Anti-Halluzinations-Architektur, die sicherstellt, dass KI-Assistenten ausschließlich auf Basis verifizierter Daten antworten.
Sein Antrieb: Er möchte verhindern, dass kleine und mittlere Unternehmen bei der Digitalisierung zurückbleiben. Werner Graser setzt sich leidenschaftlich für verantwortungsvolle KI ein – „Made in Austria“, 100 % DSGVO-konform und für jeden Betrieb vom Installateur bis zum Versicherungsmakler erschwinglich.
Kontakt:
E-Mail: werner@getvia.at
Web: getvia.at




Kommentare