IVR und Voicebots: Zwei bedeutende Systeme, die die Kommunikation zwischen Unternehmen und ihren Kunden mit dem Fortschritt der Technologie stark verändern. Doch während IVR-Systeme seit vielen Jahren weit verbreitet sind und grundlegende Aufgaben in der Kundeninteraktion übernehmen, bieten Voicebots eine modernere und intelligentere Lösung.

Dieser Artikel beleuchtet die wesentlichen Unterschiede zwischen IVR und Voicebots, zeigt die technologischen Entwicklungen auf und erläutert, wie Large Language Models wie ChatGPT Voicebots erheblich verbessern. Zudem gehen wir auf den Aspekt der Agilität ein, der es ermöglicht, Kundeninteraktionen mit Voicebots kontinuierlich zu optimieren.

 

IVR (Interactive Voice Response)

Definition und Funktionsweise von IVR

IVR, kurz für Interactive Voice Response, ist eine Technologie, die es Computern ermöglicht, mit Menschen über die Verwendung von sprachlichen Schlüsselbefehlen und Tastendruck über ein
Telefonnetz zu interagieren. IVR-Systeme werden häufig in Contact Centern und für Telefonservices eingesetzt, um Anrufer:innen durch vordefinierte Menüoptionen zu führen und grundlegende Aufgaben automatisch abzuwickeln.

Die Funktionsweise eines IVR-Systems umfasst mehrere Schritte:
1. Begrüßung der Anrufer: Das System spielt eine vorab aufgezeichnete Nachricht ab, die die Anrufer begrüßt und die verfügbaren Optionen erklärt.
2. Menüführung: Die Anrufer werden durch eine Reihe von Menüoptionen geleitet, die durch Drücken bestimmter Tasten auf dem Telefon oder durch das Aussprechen von Schlüsselwörtern ausgewählt werden.
3. Eingabe und Verarbeitung: Das System erfasst die Eingaben der Anrufer (z.B. durch Tastendruck oder Spracherkennung) und verarbeitet diese, um die entsprechenden Aktionen auszuführen.
4. Weiterleitung oder Abschluss: Basierend auf den Eingaben der Anrufer leitet das System den Anruf entweder an einen menschlichen Agenten weiter oder führt die gewünschte Aktion automatisch aus (z.B. Kontoinformationen abrufen).

Historische Entwicklung der IVR

Die Entwicklung der IVR-Technologie begann langsam in den 1970er Jahren, als die ersten einfachen Systeme zur automatischen Anrufbearbeitung eingeführt wurden. Diese frühen Systeme
nutzten Tonwahltelefone (DTMF-Telefone), um Eingaben der Anrufer zu erfassen und einfache Aufgaben zu automatisieren.
In den 1980er und 1990er Jahren wurde die IVR-Technologie weiterentwickelt und verbreitete sich zunehmend in verschiedenen Branchen. Die Einführung von Spracherkennungstechnologien
ermöglichte es IVR-Systemen, nicht nur Tasteneingaben, sondern auch gesprochene Befehle zu verstehen, so dass sich die Benutzerfreundlichkeit erheblich verbesserte.

Typische Anwendungsfälle für IVR-Systeme

• Kundensupport: Automatisierte Beantwortung häufig gestellter Fragen und Weiterleitung von Anrufen an entsprechende Abteilungen.
• Bankdienstleistungen: Bereitstellung von Kontoinformationen, Überweisungen und anderen Bankdienstleistungen über das Telefon.
• Telekommunikation: Verwaltung von Telefonkonten, Aktivierung von Diensten und Unterstützung bei einfachen technischen Problemen.
• Umfragen und Feedback: Durchführung von Kundenumfragen und Sammeln von Feedback nach einem Servicekontakt.

Genau genommen bezeichnet IVR, also „Interactive Voice Response“, jede Form der Kommunikation zwischen einem System und einem Menschen, wozu auch moderne, ausgefeilte Systeme wie Voicebots gehören. Seit einigen Jahren versteht man unter dem Begriff „IVR“ allerdings zunehmend eher einfache Systeme, während fortschrittlichere Systeme mit natürlicher Kommunikation mit dem Terminus „Voicebot“ abgegrenzt werden.
IVR-Systeme haben sich als kosteneffiziente Lösungen etabliert, um hohe Anrufvolumen zu bewältigen und einfache Anfragen zu automatisieren. Trotz ihrer Vorteile stoßen sie jedoch aufgrund ihrer starren Menüstrukturen und eingeschränkten Interaktionsmöglichkeiten zunehmend an ihre Grenzen. Im Gegensatz dazu stellen moderne Voicebots die nächste Generation der Kundeninteraktionstechnologie dar und überwinden viele der Einschränkungen, die IVR-Systeme mit sich bringen.

Voicebots: Die nächste Generation

Definition und Abgrenzung zu IVR

Voicebots sind fortschrittliche, KI-gesteuerte Systeme, die es ermöglichen, mündliche Anfragen von Kunden zu verstehen und zu beantworten. Sie arbeiten ähnlich wie IVR-Systeme, indem sie Anrufe automatisieren und Anfragen bearbeiten, gehen jedoch weit über die Möglichkeiten traditioneller IVR-Systeme hinaus.

Rufen wir bei einer Hotline an, sind wir schon lange nicht mehr überrascht, wenn wir zunächst mit einem „sprechenden Roboter“ reden. Eine herkömmliche IVR führt uns dabei durch ein Menü:
„Haben Sie Fragen zu Ihrer Rechnung? Dann sagen Sie ‚Rechnung‘. Möchten Sie ein Angebot?
Dann sagen Sie ‚Angebot‘…“

Eine natürliche Art der Kommunikation ist das nicht. Der moderne Voicebot verfolgt daher einen anderen Ansatz, indem er zum Beispiel eine offene Frage stellt:
„Wie kann ich Ihnen helfen?“

Bei herkömmlichen menübasierten IVR-Systemen sind die Anrufer gefragt: Sie müssen ihr Anliegen in die richtige „Schublade“ – also in die passende Organisationseinheit des Unternehmens
– einordnen. Aus der Aufzählung des IVR-Systems wählen sie dabei das naheliegendste Schlagwort aus. Das kann eine Geduldsprobe sein, und wenn kein Schlüsselwort zutrifft, ist Ärger
vorprogrammiert. Kein guter Start für die Kommunikation mit einem Service Center. Ein moderner Voicebot geht anders vor: Er übernimmt die Aufgabe für die Anrufer, das Anliegen in die passende Organisationseinheit einzuordnen und öffnet ihnen die richtige Tür.

Anrufer:innen haben die Möglichkeit, Voicebots zu unterbrechen, so dass sie Gespräche, die in die falsche Richtung gehen, umlenken können. Außerdem geben moderne Voicebots Kund:innen
Hilfestellung, falls ihre Anfragen unpräzise sind. Auch Rückfragen oder Zusatzinformationen, die in die Äußerung eingeschoben werden, lassen sich einfacher verarbeiten.

Der große Unterschied zwischen Voicebots und IVR liegt also hauptsächlich in der Flexibilität und Intelligenz der Interaktion. Während IVR-Systeme auf vorgegebene Menüstrukturen und Tasteneingaben angewiesen sind, können Voicebots natürliche Sprache verstehen und verarbeiten.
Dies ermöglicht eine deutlich flüssigere und intuitivere Kommunikation.

Technologische Fortschritte und Hauptmerkmale

Die Entwicklung von Voicebots wurde durch erhebliche technologische Fortschritte ermöglicht. Zu den wichtigsten Merkmalen moderner Voicebots gehören:

1. Natürliche Sprachverarbeitung (NLP und NLU):
• NLP (Natural Language Processing) ermöglicht es Voicebots, gesprochene Sprache in Text umzuwandeln und die wesentlichen Informationen daraus zu extrahieren.
• NLU (Natural Language Understanding) geht einen Schritt weiter und hilft dabei, die Bedeutung und den Kontext der Anfragen herauszufinden, was eine präzise und kontextbezogene Antwort ermöglicht.

2. Künstliche Intelligenz und Machine Learning:
Anhand von KI und Machine Learning werden die Interaktionen und die Antworten des Voicebots kontinuierlich optimiert. Das Ergebnis: Voicebots können immer besser auf die individuellen Bedürfnisse der Kunden eingehen.

3. Dialogmanagement:
Im Gegensatz zu starren IVR-Systemen, die nur lineare Gesprächsabläufe unterstützen, verwenden Voicebots ein dynamisches Dialogmanagement. Sie können auf unvorhergesehene Wendungen im Gespräch flexibel reagieren und somit eine natürliche und menschliche Interaktion nachahmen.

4. Spracherkennung und -synthese:
Hochentwickelte Spracherkennungstechnologien machen es Voicebots möglich, gesprochene Eingaben präzise zu erkennen. Die Sprachsynthese sorgt dafür, dass die Antworten des Voicebots natürlich und flüssig klingen – eine enorme Steigerung der Benutzererfahrung. Alternativ können auch „Sprachschnipsel“ von professionellen Sprechern vorab aufgenommen und zu besonders hochwertigen und natürlichen Dialogen zusammengestellt werden.

5. Vereinheitlichung der Schnittstellen in Unternehmenssysteme:
Voicebots werden über passende Schnittstellen nahtlos in bestehende Unternehmenssysteme und Datenbanken integriert. Diese basieren immer mehr auf REST-Services und JSONDatenformat,
was die Integration deutlich vereinfacht. Dadurch können Voicebots auf umfangreiche Kundeninformationen zugreifen und personalisierte Antworten zu geben.

Durch diese technologischen Fortschritte bieten Voicebots eine wesentlich reichhaltigere und effizientere Interaktion als herkömmliche IVR-Systeme. Sie sind in der Lage, komplexe Aufgaben zu übernehmen, die weit über die Möglichkeiten der traditionellen IVR hinausgehen, und bieten so einen erheblichen Mehrwert für Unternehmen und ihre Kunden.

IVR versus Voicebot

Flexibilität und Anpassungsfähigkeit

IVR-Systeme (Interactive Voice Response) arbeiten mit starren Menüstrukturen und vordefinierten Pfaden. Anrufer navigieren durch feste Tasteneingaben, und Änderungen an diesen Strukturen erfordern beträchtlichen technischen Aufwand.

Voicebots hingegen bieten eine wesentlich höhere Flexibilität und Anpassungsfähigkeit. Sie nutzen fortschrittliche Spracherkennungstechnologien und Natural Language Understanding (NLU), um natürliche Sprache zu verstehen und auf eine Vielzahl von Anfragen zu reagieren. Dies ermöglicht es ihnen, sich dynamisch an die Bedürfnisse der Nutzer anzupassen und auf unvorhergesehene Wendungen im Gespräch zu reagieren. Voicebots können kontinuierlich aktualisiert und verbessert werden, ohne dass umfangreiche technische Änderungen erforderlich sind. Effizienzsteigerungen sind die Folge, da sie sich schneller an neue Anforderungen anpassen.

Benutzerfreundlichkeit und Interaktionsmöglichkeiten

IVR-Systeme bieten eine begrenzte Benutzerfreundlichkeit, da sie auf numerische Eingaben und vordefinierte Menüoptionen beschränkt sind. Anrufer müssen oft durch mehrere Menüstufen
navigieren, um die gewünschte Information zu erhalten oder einen menschlichen Agenten zu erreichen – was nicht selten zu Frust und Ärger auf Kundenseite führt.

Voicebots hingegen verstehen und verarbeiten natürliche Sprache. Die Anrufer:innen können ihre Anfragen frei formulieren, ohne an feste Menüstrukturen gebunden zu sein. Dies führt zu einer
deutlich intuitiveren und angenehmeren Interaktion. Darüber hinaus geben Voicebots kontextbezogene und personalisierte Antworten – ein deutlicher Pluspunkt für die Kundenbeziehung.

Übrigens: Die Bereitschaft der Anrufer:innen, mit Voicebots zu kommunizieren, ist erheblich gestiegen. Siri, Alexa oder Google Assistant machen es vor und zeigen, was möglich ist. Und nun
präsentiert auch das um eine Sprachfunktion erweiterte ChatGPT-System die heutigen Möglichkeiten der Technik. Das führt dazu, dass Kunden IVR-Systeme als altmodisch und starr wahrnehmen, während Voicebots ein moderneres Image genießen.

Effizienz und Anwendungsbereiche

IVR-Systeme sind besonders effektiv bei einfachen, wiederkehrenden Aufgaben wie das Abrufen von Kontoinformationen oder das Weiterleiten von Anrufen an die entsprechenden Abteilungen. Sie sind kosteneffizient und können hohe Anrufvolumina bewältigen. An der richtigen Stelle eingesetzt, haben IVR-Systeme nach wie vor ihre Berechtigung. Manchmal ist eine schnelle Auswahl durch Tastendruck effizienter, wie etwa bei der Eingabe von PINs. In solchen Fällen bleibt IVR eine kosteneffektive und zuverlässige Lösung.

Voicebots bieten jedoch eine weitaus größere Effizienz, insbesondere bei komplexen und variablen Anfragen. Durch den Einsatz von Künstlicher Intelligenz (KI) und Machine Learning werden ihre Antworten kontinuierlich besser. Sie sind in der Lage, komplexere Probleme zu lösen, detaillierte Informationen zu liefern und personalisierte Dienste anzubieten. Voicebots finden Anwendung in einer Vielzahl von Branchen, darunter Kundenservice, Gesundheitswesen, Finanzen und Telekommunikation. Sie können nicht nur einfache Aufgaben automatisieren, sondern auch umfassende Serviceanfragen bearbeiten, die über die Möglichkeiten traditioneller IVR-Systeme hinausgehen.

Voicebots und ChatGPT

Wie helfen ChatGPT & Co. heute dabei, Voicebots zu erstellen? Sollen Large Language Models bei der Entwicklung von Voicebots Unterstützung leisten, müssen sie mit dem Unternehmenswissen
verknüpft sein. Sämtliche Daten „einfach so“ hochzuladen, ist allerdings technisch nicht möglich und widerspricht den Prinzipien des Datenschutzes und der Vertraulichkeit.

OpenAI stellt teilweise Zugriff auf ChatGPT über die Azure-Cloud bereit und entwickelt seine Schnittstellen weiter – mit PlugIns oder einer Function-API, mit deren Hilfe auch allgemeine Informationen in eine ChatGPT-Antwort einfließen. Die Entwicklung sogenannter „Retrieval Agents“, die Informationen mittels KI aus dem Datenpool ziehen, ist in vollem Gange.

„ChatGPT“ wird häufig als Synonym für KI und Large Language Models im Allgemeinen verwendet. Das ist jedoch zu einfach. Denn es gibt verschiedene Modelle für unterschiedliche Aufgaben, deren Hardwareanforderungen (Cloud/lokal) und Preise variieren.

Doch auch die beste KI kann keine guten Ergebnisse liefern, wenn die zugrunde liegenden Unternehmensdaten unvollständig oder gar falsch sind. Entscheidend für den erfolgreichen Einsatz von KI ist daher eine hohe Datenqualität, die Verantwortliche wie „Data Scientists“ ständig überwachen. Besonders im Analyse- und Verbesserungsprozess bringen Large Language Models entscheidende Vorteile:

Spracherkennung

Liefert die Spracherkennung die richtigen Wörter? Die korrekte Feststellung der Äußerungen ist die Grundlage für die Antworten der KI. Um die Qualität der Spracherkennung stetig zu verbessern, werden Sprachaufzeichnungen früherer Telefongespräche durch verschiedene Spracherkenner geschickt und die Ergebnisse miteinander verglichen. Dafür eignen sich auch Spracherkenner, die für den produktiven Einsatz im Voicebot zu langsam sind oder besondere Hardware erfordern. Verbesserungsbedarf fällt auf diese Weise schnell auf und der produktive Erkenner kann entsprechend korrigiert werden.

Intent Recognition

Einfach ausgedrückt ist die Intent Recognition nichts anderes als das Herausfiltern der Absicht des Anrufers. Denn der Voicebot klassifiziert die Äußerungen der Anrufer:innen und ordnet sie einem Themengebiet zu. Produktive KI-Systeme müssen innerhalb von etwa 30 Millisekunden antworten und verfügen nicht über das Allgemeinwissen von Large Language Models. Im Nachhinein jedoch geben Large Language Models, die langsamer, aber oft qualitativ besser arbeiten, wertvolle Hinweise darauf, ob der Voicebot die Absicht der Anrufer richtig erfasste und die Klassifizierung korrekt war.

Außerdem eignen sich Large Language Models hervorragend für die Suche nach variierenden Äußerungen, da Anrufer:innen häufig ein und dieselbe Absicht mit vielen verschiedenen Wörtern
ausdrücken. Die vielfältigen Aussagen der KI dienen als Grundlage für das Training des Spracherkenners.

Doch trotz der bahnbrechenden Neuerungen, die ChatGPT & Co. mit sich bringen, bleibt der Mensch dem Voicebot und der IVR weiterhin durch sein Allgemeinwissen und Sprachverständnis
überlegen. Setzt er die KI jedoch geschickt ein, nimmt sie ihm Routineaufgaben zuverlässig ab, so dass er sich auf schwierige und anspruchsvolle Aufgaben konzentrieren kann.

Zusammenfassung

Voicebots bieten im Vergleich zu traditionellen IVR-Systemen eine modernere, flexiblere und effizientere Lösung für die Kundeninteraktion. Sie verbessern nicht nur die Benutzererfahrung,
sondern ermöglichen auch erhebliche Effizienzsteigerungen und Kosteneinsparungen. Die gestiegene Akzeptanz auf Kundenseite als Folge von bekannten Sprachassistenten und fortschrittlichen KI-Modellen macht die immer wichtiger werdende Rolle der Voicebots deutlich.

Dennoch bleibt IVR in bestimmten standardisierten Szenarien eine sinnvolle und kosteneffiziente Option.

Die Einführung von Large Language Models wie ChatGPT verbessert Voicebots kontinuierlich. Einen großen Effekt haben sie auf die Agilität moderner Voicebots: Anhand agiler Methoden bleiben Voicebots immer auf dem neuesten Stand und passen sich nahtlos an neue Situationen an.

 

Mehr über die Leistungen und Services der Sympalog Voice Solutions GmbH erfahren?

HIER ZUM PROFIL KLICKEN