Was ist ein Sprachdialogsystem?

„Computer… Computer?… Hello, Computer?…“
(Scotty in Star Trek IV im Dialog mit einem MacPlus – ein erstes Sprachdialogsystem?)

Symbolfoto Sympalog für SprachdialogsystemAls die Zuschauer der ersten Star-Trek-Folgen gebannt vor dem klobigen 60-Jahre-Fernseher saßen, waren Gespräche mit einem Computer noch reinste Science-Fiction. Heute sind natürlichsprachliche Dialoge mit einem Computer längst möglich, die uns immer häufiger in Form von Sprachdialogsystemen am Telefon begegnen. Doch was genau sind Sprachdialogsysteme eigentlich?

Der folgende Artikel informiert Sie kurz und knapp über alles Wissenswerte zu Sprachdialogsystemen:

Abgrenzung der Begrifflichkeiten: Sprachdialogsystem oder IVR

Sprachdialogsysteme, Voice Portale, IVR, VoiceBots, Digitale Assistenten – in der Welt der natürlichsprachlichen Dialogsysteme werden Begrifflichkeiten durcheinandergewürfelt und nicht einheitlich verwendet. Wir versuchen, Licht ins Dunkel des Begriff-Wirrwarrs zu bringen:

Sprachdialogsysteme machen es möglich, dass Anrufer mit einem Computer beinahe wie mit einem menschlichen Gegenüber telefonieren. Natürlichsprachlichkeit steht im Fokus: Ganze Sätze und synonyme Ausdrücke versteht der automatische Gesprächspartner ebenso wie sprachliche Umschreibungen.

Anrufer: „Wie sind denn die Öffnungszeiten?“
Sprachdialogsystem: „Wir sind werktags von 08.00 bis 20.00 Uhr und samstags von 08.00 bis 12.00 Uhr persönlich für Sie erreichbar. Kann ich noch etwas für Sie tun?“
Anrufer: „Ja, ich möchte mit Herrn Müller sprechen.“
Sprachdialogsystem: „Meinen Sie Herrn Hubert Müller aus der Abteilung Marketing oder Herrn Ralf Müller aus der Abteilung IT/Netzwerke?“
Anrufer: „Den Herr Müller aus der IT“.
Sprachdialogsystem: „Einen kleinen Moment bitte. Sie werden sofort mit Herrn Ralf Müller aus der Abteilung IT/Netzwerke verbunden.“

Der englische Begriff „Voice Portal“, zuweilen auch mit „Sprachportal“ übersetzt, ist das Sprachäquivalent zu Webportalen. So wie ein Internet-Surfer Informationen aus einer Webseite sucht oder dort Self Service Dienste in Anspruch nimmt, kann sich ein Anrufer, der mit einem Voice Portal spricht, per Sprache Informationen holen oder Transaktionen anstoßen. Der Begriff Sprachdialogsystem deckt sich darin mit dem Begriff „Voice Portal“, geht allerdings noch weiter: Wie im Beispiel oben fallen darunter auch die automatische Telefonzentrale oder die Datenerfassung zur Vorqualifizierung der Anrufer. Im allgemeinen Sprachgebrauch bezeichnet „Voice Portal“ allerdings auch häufig diese Einsatzmöglichkeit.

Im englischen Sprachraum wird der Begriff IVR (Interactive Voice Response) meist synonym zu dem deutschen Begriff „Sprachdialogsystem“ verwendet. Unter IVR verstehen dagegen viele im deutschen Sprachraum jedoch die weitverbreiteten touch-tone IVR-Systeme, die sich über Tasten bedienen lassen und entsprechend schwerfällig sind. Soweit Spracherkennung überhaupt eingesetzt wird, dient diese hier leider oft nur der Verarbeitung von Schlagwörtern und Ziffernketten.

Der Begriff VoiceBot ist in Anlehnung an „Chatbot“ entstanden. Anders als beim Chatbot erfolgt allerdings die Ein- und Ausgabe über gesprochene Sprache. Unter „VoiceBot“ verstehen die meisten Sprachdialogsysteme im allgemeinen sowie teilweise auch Sprachsteuerungen, wie sie zum Beispiel im Smart Home Bereich zu finden sind.

Bei den „Digitalen Assisten“ handelt es sich in erster Linie um beispielsweise Alexa von Amazon, Siri von Apple oder den Google Assistant – immer öfter jedoch wird der Begriff auch für Sprachdialogsysteme verwendet.

Meilensteine in der Geschichte der Sprachdialogsysteme

Spielzeughund Rex als Urvater des SprachdialogsystemsEs begann 1911, als ein kleiner Spielzeughund namens Rex aus seiner Hütte gesprungen kam, wenn man seinen Namen rief – das erste Beispiel für eine automatische Spracherkennung.

1939 präsentierte Bell Labs auf der Weltausstellung in New York den ersten Speech Synthesizer – zwar noch holprig, doch der erste Versuch Sprache automatisch zu erstellen war gemacht.

Es folgte 1952 ein kleiner Worterkenner für telefonisch übermittelte Ziffern – ebenfalls von Bell Labs entwickelt.

Den ersten Text-to-speech Synthesizer für Englisch stellte 1968 Noriko Umeda (Electro-technical Lab. in Japan) vor.

Ab den 1970ern folgten dann die ersten einfach gehaltenen touch-tone IVR-Systeme (vgl. http://kai-uwe-carstensen.de/Publikationen/Sprachtechnologie.pdf, S. 141-142).

Anfang der 1990er Jahre ging die Geschichte der Sprachdialogsysteme dann richtig los: Evar und FränKi waren die weltweit ersten natürlichsprachlichen Dialogsysteme, die am Erlanger Lehrstuhl für Mustererkennung entwickelt wurden. Evar war ein Auskunftssystem zur Deutschen Bahn und FränKi wusste stets, in welchem Kino der Region und wann der neueste James Bond lief. „Damals waren wir weltweit führend, sogar vor den Amis“, sagt Prof. Elmar Nöth, der Evar und FränKi mitentwickelt hatte. Zur Vermarktung dieser Produkte wurde die Firma „Sympalog“ gegründet, die heute als „Sympalog Voice Solutions GmbH“ zahlreiche weitere Einsatzmöglichkeiten für unterschiedlichste Projekte entwickelt.

Zwischen 2004 und 2010 hatten Sprachdialogsysteme in Deutschland mit den VoiceDays eine eigene Veranstaltung. Unter anderem wurden dort die Voice Awards für das beste Sprachdialogsystem gekürt.

Die Enkelinnen dieser Technologie finden sich auch in Siri oder Alexa wieder. Ein großer Unterschied zu damals besteht jedoch in der Menge der Sprachdaten: Hinter Google heute stecken etwa eine Million Stunden aufgezeichneter Sprache, während im Jahr 2000 im mit fast 170 Millionen DM geförderten Projekt „Verbmobil“ gerade einmal 600 Stunden Sprache gespeichert waren – kein Wunder also, dass die Spracherkennung seitdem einen Siebenmeilenstiefel-Sprung zurücklegte.

Branchenübergreifende Einsatzmöglichkeiten eines Sprachdialogsystems

Einige der entwickelten Sprachdialogsysteme sind universell einsetzbar. Das gilt vor allem für die automatische Vorqualifizierung, die Telefonzentrale sowie die Kundenbefragung:

Die automatische Vorqualifizierung

Im Kundenservice ist ein schnelles und zielgerichtetes Routing elementar: Die präzise Vorqualifizierung, d.h. den richtigen Service unkompliziert und schnell mit einem Satz oder einem Stichwort auszuwählen, ist dementsprechend wichtig. Sowohl offene, als auch geschlossene Fragestellungen führen je nach Organisationsstruktur schnell zum Ziel:

  • Beispiel einer offenen Frage: “Wie kann ich Ihnen helfen?”
  • Beispiel einer geschlossenen Frage: “Haben Sie Fragen zu einer Rechnung?”

Wenn nur wenige unterschiedliche Serviceleistungen angeboten werden, sind geschlossene Fragen vollkommen ausreichend. Ein Dialog mit einer offenen Frageform hingegen ermöglicht dem Betreiber, weitaus mehr Fragestellungen und Themen zu unterscheiden: Eine feinere Einteilung der Anrufe ist so gewährleistet.

Häufig werden Vorqualifizierungen nahtlos um einen Identifikations- oder Authentifizierungsdialog, beispielsweise zur Erfassung der Kundennummer und einer PIN, erweitert.

Die automatische Telefonzentrale

Ob als direkt erreichbares System oder als Ergänzung im Überlauf — bei einer automatischen Telefonzentrale können Anrufer frei sprechen und sich mit dem gewünschten Ansprechpartner verbinden lassen. Eine Weiterleitung des Gesprächs erfolgt auf Basis von Personen- oder Abteilungsnamen sowie aufgrund eines Anliegens.

Erweiterungen, wie zum Beispiel um eine Auskunft der Öffnungszeiten, eine Mailbox-Funktionalität oder eine Vorqualifizierung der Anrufer, sind häufig vorzufinden.

Die automatische Kundenzufriedenheitsbefragung

Sprachdialogsysteme bieten sich dazu an, Kunden nach ihrer Zufriedenheit zu befragen: „Wurden Sie freundlich bedient?“ oder „Wie schätzen Sie die fachliche Kompetenz unseres Servicemitarbeiters ein?“ Bei einem Sprachdialogsystem geben Anrufer häufiger ein ehrlicheres Feedback als bei einem menschlichen Gegenüber.

Qualifizierte Anbieter machen eine einfache Bedienung per Internet möglich, so dass sich der Betreiber den Fragenkatalog seiner Kundenbefragung auch ohne Programmierkenntnisse selbst zusammenstellen kann. Bewertungen des Anrufers sind dabei durch Ja/Nein-Fragen oder nach dem Schulnotensystem möglich. Möchten Kunden Kommentare abgeben, können diese aufgezeichnet und im Nachhinein abgehört oder mittels einer Speech-to-Text-Umwandlung als Text angezeigt werden. Die Kundenangaben sollten in einer grafischen Darstellung per Internet abrufbar sein, die einen schnellen Überblick über die Beurteilung der Anrufer verschafft.

Doch wie erreicht die automatische Kundenbefragung den Anrufer? Entweder fragen Servicemitarbeiter den Anrufer am Ende eines Gesprächs, ob dieser bereit ist, an einer automatischen Kundenzufriedenheitsbefragung teilzunehmen – oder alle Gespräche werden im Anschluss an die automatische Kundenzufriedenheitsbefragung weitergeleitet. Als kostenlose Alternative für den Kunden kann das Sprachdialogsystem auch einen Rückruf einleiten. Die Rufnummer wird dafür entweder während des Gesprächs ermittelt oder aus einer Kundendatenbank gelesen.

Auf Branchen maßgeschneiderte Sprachdialogsysteme

Häufig sind Sprachdialogsysteme auf bestimmte Branchen zugeschnitten. Vor allem für die folgenden Branchen sind maßgeschneiderte Lösungen erhältlich, die den individuellen Gegebenheiten des Betreibers leicht angepasst werden können:

Neben den bereits erwähnten universellen Einsatzmöglichkeiten sind für die genannten Branchen vor allem folgende maßgeschneiderte Lösungen erhältlich:

Sprachdialogsystem für Financial Services

Sprachdialogsystem für Banken und Versicherungen

  • Legitimation: über die Eingabe von PIN und TAN oder über Sprecherverifikation
  • Kontostands- und Umsatzauskunft: erteilt Auskünfte über Kontostände und getätigte Umsätze
  • Überweisungen und Daueraufträge: Annahme von Überweisungen und Verwaltung von Daueraufträgen
  • PIN-Verwaltung: Erstlegitimation, Änderung und Sperrung von PINs
  • Filialinformationen: Auskunft zu Adressen, Öffnungszeiten sowie SB-Ausstattung
  • Brokerage: Depotinformationen, Kauf und Verkauf von Wertpapieren
  • Sonstiges: Formularbestellungen, Termin- oder Rückrufwunsch

Anrufer: Wie ist gerade mein Kontostand?
Sprachdialogsystem: Ihr Kontostand beträgt X Euro.
Anrufer: Hmm… dann möchte ich 300 Euro überweisen. Und zwar auf die IBAN XXX. Das ist, glaube ich, bei der XY-Bank.
Sprachdialogsystem: Sie möchten 300 Euro auf das Konto mit der IBAN Nr. XXX bei der XY-Bank in XY überweisen?
Anrufer: Genau.
Sprachdialogsystem: Ihre Überweisung wurde angewiesen. Kann ich sonst noch etwas für Sie tun?

Sprachdialogsystem für Energieversorgung

Sprachdialogsystem und Energieversorgung

  • Legitimation: Ermittlung des Anrufers über die Erfassung der Vertragskundennummer
  • Zählerstandserfassung: automatische Erfassung von Zählerständen über das Telefon mit Realtime-Anbindung an das Backend
  • Ansagemanagement: Bei Anrufpeaks durch Störfälle erteilt das System aktuelle Störungsmeldungen über eine komfortable Ansage
  • Rückrufannahme: Einstellung von Rückrufwünschen

Sprachdialogsystem für Tourismus & Verkehr

Sprachdialogsystem und Tourismus

  • Reservierungen und Buchungen: automatische Reservierung und Buchung
  • Allgemeine Informationen: Auskünfte zu verschiedenen Themen (beispielsweise Tarifen)
  • Änderungen: Über das System lassen sich Reservierungen oder Rechnungsanschriften ändern
  • Statusverfolgung: Auskunft zum aktuellen Stand von Lieferungen oder Bestellungen
  • Bestellung: Anforderung und Versand von Dokumenten wie Rechnungskopien oder Katalogen

 

Sprachdialogsystem für Entertainment

  • Programmauskunft: verschiedene Informationen, beispielsweise zu Veranstaltungen oder Events
  • Reservierung: telefonische Auswahl und Reservierung von Karten

Anrufer: Ich wohne in Erlangen und ich möchte heute Abend den Film „Jojo Rabbit“ anschauen. Wann kommt der denn?
Sprachdialogsystem: Der Film „Jojo Rabbit“ läuft um 20.20 Uhr in dem Kino CineStar in Erlangen. Möchten Sie Tickets reservieren?
Anrufer: Nö, das ist mir zu spät. Gibt‘s den nicht auch früher?
Sprachdialogsystem: Der Film „Jojo Rabbit“ läuft auch schon um 16.30 Uhr in dem Kino CineStar in Erlangen. Möchten Sie Tickets reservieren?
Anrufer: Ja, mach mal.

Sprachdialogsystem für Telekommunikation

  • Allgemeine Informationen: Auskünfte zu verschiedenen Themen, wie beispielsweise Tarifen
  • Statusanfragen: Auskünfte zum Liefer- und Bearbeitungsstatus
  • Gewinnspiele/Aktionen: telefonische Befragungen und Datenerfassung
  • Bestellung: Anforderung und Versand von Dokumenten, wie Rechnungskopien
  • Ansagemanagement: Bei Anrufpeaks durch Störfälle erteilt das System aktuelle Störungsmeldungen über eine komfortable Ansage

Sprachdialogsystem im Versandhandel

  • als Bestellservice von Versandhäusern oder Teleshopping
  • Statusanfragen: Auskünfte zum Liefer- und Bearbeitungsstatus

Anrufer: Ich möchte den Artikel mit der Nummer 12345GG bestellen.
Sprachdialogsystem: In welcher Farbe? In grün, blau oder gelb?
Anrufer: Blau… und mit 28 cm Durchmesser.
Sprachdialogsystem: Ich habe für Sie den Blumenübertopf, 28 cm in blau, eingetragen. Möchten Sie noch etwas bestellen?
Anrufer: Ja und zwar…

Sprachdialogsysteme: Das Für und Wider

Ausschlaggebend für den Einsatz eines Sprachdialogsystems ist meist die Kostenersparnis durch den optimierten Personaleinsatz. Die Motivation der Servicemitarbeiter steigt, da sie spürbar entlastet werden: Während das Sprachdialogsystem die Beantwortung von Standardanfragen oder die Ausführung von häufig wiederkehrenden Transaktionen übernimmt, können sie sich auf komplexere Anfragen und Problemlösungen konzentrieren.

Auch die Anrufer profitieren vom Einsatz eines Sprachdialogsystems: Das Call Center ist rund um die Uhr erreichbar und ärgerliche Wartezeiten am Telefon entfallen.

Durch den entstehenden Kostendruck fällt oft die Entscheidung auf herkömmliche touch-tone IVR-Systemen statt zeitgemäßer Sprachdialogsysteme: Allerdings werden durch Siri, Alexa oder den Google Assistant Gespräche mit einem Computer immer alltäglicher, so dass der Call Center Bereich mitziehen muss – überholte, schwerfällige touch-tone IVRs sorgen für ein schlechtes Image.

Vor allem in Bereichen, in denen ein persönlicher Kundenkontakt eine große Rolle spielt oder in denen vorrangig ältere Menschen zur Zielgruppe gehören, sind Sprachdialogsysteme mit Vorsicht zu genießen: An der falschen Stelle eingesetzt, können sie Kunden verärgern.

Für und Wider eines Sprachdialogsystems

So funktioniert’s: Die Technologie

Zunächst muss das Sprachdialogsystem den Anrufer verstehen: In den letzten Jahren wurden große Datenmengen gesammelt, die die Spracherkennung enorm verbessert haben. Nach unserer Schätzung wird etwa 90% des Gesprochenen richtig erkannt – eine enorm hohe Rate.

Sprache zu erkennen bedeutet allerdings nur, dass die Sprache – wie in einem Diktat – erfasst und als Text niedergeschrieben wird. Der Sinn hinter den Aussagen wird dabei noch nicht verstanden. Mittels NLP (Natural Language Processing) und NLU (Natural Language Understanding) geht das System der Bedeutung hinter den Worthülsen auf den Grund: NLP (Natural Language Processing) steht – kurz gesagt – für die Suche nach Schlüsselwörtern in einer Frage, zu der dann die dazu passende, gespeicherte Antwort ausgegeben wird. „Preis“ oder „kostet“ sind beispielsweise Schlüsselwörter dafür, die das Sprachdialogsystem Preise „ausspucken“ lässt. Sobald die Fragen komplizierter werden, ist NLU unerlässlich: Nicht nur Schlüsselwörter, sondern die ganze Frage nimmt das System unter die Lupe: Was ist das Subjekt und was das Objekt? Worauf beziehen sich die Pronomen? Um welchen Vorgang geht es? So können auch komplizierte Anfragen wie „Ich will die Ware umtauschen – ich habe sie aber schon ausgepackt“ beantwortet werden.

Um auf die verstandenen Fragen zu antworten, erhält das Sprachdialogsystem „Handlungsanweisungen“: Sorgfältig müssen dazu alle Fragen, die Anrufer häufig stellen, kategorisiert werden. Wie das Sprachdialogsystem auf die häufigen Fragen antworten soll, wird in einem Dialogbaum festgehalten, der je nach Reaktion des Anrufers den weiteren Gesprächsverlauf bestimmt.

Die „Sprachsynthese“ wandelt den Antworttext des Sprachdialogsystems, der im Dialogbaum festgehalten ist, wieder zu Gesprochenem um. Damit die Ausgabe des Textes ansprechend klingt, nehmen professionelle Sprecher die Antworten oder Antwort-Teile im Vorhinein auf.

Herkömmliche IVR-Systeme führen den Anrufer und leiten ihn mittels Frage/Antwort-Bäumen durch das festgelegte Gesprächsschema durch. Moderne Sprachdialogsysteme jedoch können auf den Menschen, der den Gesprächsablauf bestimmt, reagieren.

Nicht der Anrufer passt sich an das Sprachdialogsystem an, sondern das System passt sich dem Anrufer an.

Anrufer müssen deshalb Sprachdialogsysteme unterbrechen können, so dass sie Gespräche, die in die falsche Richtung gehen, umlenken können. Außerdem wird von modernen Sprachdialogsystemen mittlerweile erwartet, dass sie Anrufern Hilfestellung geben, falls ihre Anfragen zu unpräzise sind. Und nicht zuletzt muss das System mit Rückfragen des Anrufers, die sich auf vorangegangene Teile des Dialogs beziehen, umgehen oder eingeschobene Zusatzinformationen sowie korrigierte Versprecher verarbeiten können.

Das Projekt „Einführung eines Sprachdialogsystems“

Wie geht man dabei vor?

Möchte ein Unternehmen vom Einsatz eines Sprachdialogsystems profitieren, muss es sich zunächst einen genauen Überblick über alle eingehenden Anrufe verschaffen. Eine Art Etikett, das jedem Anruf über mehrere Wochen anheftet, ist dazu ein gutes Mittel.

Im Kern der Analyse sollten folgende drei Fragen stehen:

  • In welcher Situation befindet sich der Anrufer, wenn er zum Telefon greift?
  • Wie kann ein Sprachdialogsystem dem Unternehmen am besten helfen?
  • Was ist die häufigste Art mit dem Unternehmen zu kommunizieren?

Bei der anschließenden Auswertung lassen sich zwei Arten von Anrufen unterscheiden:

  • diejenigen, die von einem Sprachdialogsystem bearbeitet werden können
  • diejenigen, die von einem Menschen bearbeitet werden müssen

Abhängig von der Branche kann die Anzahl der Anrufe, die ein Sprachdialogsystem bearbeiten kann, variieren – nach unserer Erfahrung sind jedoch meist knapp die Hälfte der Anrufe automatisierbar.

Die Anrufe, die von einem Menschen bearbeitet werden müssen, können wiederum unterteilt werden in:

  • diejenigen, die „vorqualifiziert“ werden können
  • diejenigen, die sofort zu einem Menschen weitergeleitet werden sollten

Vorqualifizierung bedeutet, dass das Sprachdialogsystem feststellt, welchem Bereich der Anruf zugeordnet werden kann, um dann an den zuständigen Mitarbeiter durchzustellen. Zuvor kann das Sprachdialogsystem bereits die Kundennummer oder ähnlich relevante Informationen abfragen, so dass diese dem Agenten bei Anrufannahme bereits vorliegen. Nach unserer Erfahrung können knapp die Hälfte der Anrufe, die von einem Menschen bearbeitet werden müssen, vorqualifiziert werden.

Webinartipp

Im Contact Center Network e.V. haben wir unlängst unter dem Titel „IVR 4.0 – Individuell und Intuitiv!“ die Einführung eines Sprachdialogsystems vorgestellt.

Ab welchem Callvolumen braucht man ein Sprachdialogsystem?

Die Kosten eines Sprachdialogsystems lassen sich in drei Kategorien unterteilen

  • Lizenzkosten für Spracherkennung, Dialogsystem und Sprachsynthese
  • Projektkosten zur Erstellung des Sprachdialogsystems
  • Betrieb, Wartung und Anpassung während der Laufzeit

Lizenzkosten werden typischerweise in „Kanälen“ berechnet: So wird beispielsweise anhand der Erlang-C-Formel bestimmt, wie viele Telefonkanäle gleichzeitig bedient werden müssen. Die Anforderungen an die Spracherkennung sowie die Notwendigkeit, synthetische Sprache zu verwenden, sind ebenfalls Einflussfaktoren.

Bei den Projektkosten spielen die Komplexität des Dialogs, die notwendigen Anpassungen und Optimierungen des Spracherkenners maßgeblich eine Rolle. Hinzu kommt Schnittstellenprogrammierung, soweit nicht auf Standardschnittstellen wie REST-Services oder SQL zurückgegriffen werden kann.

Für Betrieb und Wartung fallen in der Regel zwischen 15 und 20 Prozent der Lizenzkosten an. Ansonsten sind die Betriebskosten eher gering, da Sprachdialogsysteme in der Regel auf Standardhardware aufbauen und nur bei Störungen reagiert werden muss.

Ein Sprachdialogsystem braucht nicht Tausende von täglichen Anrufen, um sich zu rechnen. Eine kleine Beispielrechnung soll das verdeutlichen: Wenn täglich 250 Anrufe eingehen und bei jedem Anruf 1€ an Kosten eingespart werden können, ergeben sich bei 200 Arbeitstagen schon eine Summe von 50.000€/Jahr. Ein Sprachdialogsystem für 250 Anrufe/Tag kostet normalerweise weniger, d.h. die Wirtschaftlichkeitsrechnung für ein Sprachdialogsystem fällt in der Regel immer positiv aus.

Warum muss ein Sprachdialogsystem heute agil sein?

Sprachdialogsystem und agile Methoden

Mit dem Wandel von statischen touch-tone gesteuerten Sprachdialogsystemen zu Systemen mit natürlichsprachlicher Bedienung gewinnt die Betreuung/Anpassung von existierenden Systemen stark an Bedeutung. Zum Teil laufen einfache IVR-Systeme jahrelang unverändert, während sich die Kundenerwartungen permanent ändern.

Moderne Systeme hingegen müssen „mit der Zeit“ gehen und sich immer wieder aktuellen Situationen anpassen. Und mit dem Einzug agiler Methoden auch im Contact Center steigen die Anforderungen an Sprachdialogsysteme. Sie müssen Werkzeuge für automatische Tests über alle Bereiche eines Sprachsystems (Spracherkennung, Verstehenskomponente, Dialogmanagement) anbieten, um bei häufigen Änderungen eine hohe Qualität zu gewährleisten.

In agilen Unternehmen wandelt sich die Position eines Sprachdialogsystems. Von einem „vorgelagertem“ System wird es integraler Bestandteil der Kundenkontakte und selbstverständlich in die Optimierungen der „Customer Journey“ miteinbezogen. Möchten Sie mehr über agile Sprachdialogsysteme erfahren? Dann laden Sie sich schnell und einfach unser Whitepaper hinunter.

Agil durch die Krise

Erinnern wir uns einmal, wie unsere Welt noch vor drei Monaten aussah: In weiter Ferne lag noch der Corona-Virus – sowohl geographisch als auch mental. Die kommende Krise hatte kaum einer auf dem Radar. Und nun? Die Ereignisse haben sich überschlagen. Servicemitarbeiter wurden Hals über Kopf ins Home Office geschickt – das eine Ohr beim Kunden, das andere bei den Hausaufgaben des Pennälers, während das dritte Ohr zwecklos versucht, die nicht enden wollenden Rufe des Nesthäkchens („Mama, guck mal!“) zu überhören.

Sprachdialogsysteme, die die Servicemitarbeiter entlasten, sind nun noch wichtiger als je zuvor. Doch gerade in Corona-Zeiten zeigt sich, dass sich auch die Technik schnell auf die Veränderungen, die die Krise nach sich zieht, einstellen und mit ihnen wachsen muss. Ein neues Routing oder überstürzte Themenänderungen dürfen nun keine Stolpersteine sein, sondern müssen schnell, unkompliziert und kompetent umgesetzt werden. Starre Systeme haben hier keine guten Karten. Wo schnelle Lösungen hermüssen, sind agile, flexible Sprachdialogsysteme unerlässlich.

Voraussetzung ist eine systematische Herangehensweise und eine klare Fokussierung auf Effizienz der Customer Journey und Customer Experience. Immer leistungsfähigere Spracherkenner und KI-gestützte Systeme zur Verarbeitung natürlicher Sprache können auch komplexe Kundenanliegen fallabschließend lösen – während sich die Servicemitarbeiter den Aufgaben widmen, die menschliche Empathie und Einfühlungsvermögen erfordern. Der Schlüssel dazu liegt in einem agilen Verständnis von Organisation, Technologie und der ersten telefonischen Kundenschnittstelle, dem Sprachdialogsystem. Möchten Sie mehr über agile Sprachdialogsysteme wissen? Dann laden Sie sich unser Whitepaper schnell und unkompliziert herunter.

Agile Sprachdialogsysteme

„Agilität“ – die Fähigkeit einer Organisation sowohl flexibel als auch proaktiv zu handeln, ist seit der Verabschiedung des „Agilen Manifests“ aus dem Jahre 2001 ein mittlerweile fast schon gebetsmühlenartig wiederholtes Mantra. „Agile“ Organisationsformen haben sich seitdem auf viele Unternehmensorganisationen ausgebreitet, so dass man regelrecht von einem Hype sprechen kann. Auch im Kundenservice findet derzeit ein Umdenken statt. Die Einführung agiler Arbeitsweisen ist eine der großen Aufgaben, vor denen Führungskräfte heute stehen. Bisher weniger beachtet ist dabei allerdings der Aspekt der Automatisierung: Agil arbeitende Organisationen brauchen agile Sprachdialogsysteme, die diese iterative, sich kontinuierlich verbessernde Arbeitsweise ermöglichen und unterstützen.

Agile Sprachdialogsysteme bereiten den Weg

Will man Prozesse im Kundenservice agiler gestalten, ist das Sprachdialogsystem ein Schlüssel zum Erfolg.

Der Aufbau einer funktionierenden IVR erfordert von der Organisation ein Jonglieren mit mehreren Dimensionen – von sich ständig weiterentwickelnden Kundenbedürfnissen bis hin zu sich schnell verändernden Produkt- und Dienstleistungsportfolios.

Eric Buesing, McKinsey

„Agilität“ steckt bei den meisten Sprachdialogsystemen jedoch noch in den Kinderschuhen. Häufig ist nicht einmal festgelegt, in wessen Zuständigkeit das Sprachdialogsystem fällt. Oft sehen Contact-Center-Manager das System als eine vorgelagerte (technische) Komponente und betrachten den Anruf erst dann in ihrem Verantwortungsbereich, wenn dieser zu dem Mitarbeiter bzw. zu einer Wartegruppe weitergeleitet wurde. Die Kennzahlen aus dem Sprachdialogsystem beschränken sich meist auf Abbrecherquote und welche Optionen wie oft gewählt wurden.

Aus Kundensicht stellt sich das natürlich anders dar. Für sie ist das Sprachdialogsystem der „Erstkontakt“: Wie intuitiv das System zu bedienen ist und wie lange es dauert, bis der Anrufer die gesuchte Information erhält oder an den richtigen Mitarbeiter verbunden wird, spielt eine wesentliche Rolle für seine Wahrnehmung des gesamten Kontakts.

Der Kunde will: Schnelle Lösungen, ein personalisiertes und ein konsistentes Service-Erlebnis über alle Kanäle.

Um den Kundenservice agil zu gestalten, spielen agile Sprachdialogsysteme daher eine Schlüsselrolle. Bei einem bestehenden Sprachdialogsystem empfiehlt sich folgende Vorgehensweise:

Agile Sprachdialogsysteme: Analyse der Kennzahlen

Momentan lösen meist fachliche Anforderungen, z.B. neue oder geänderte Produkte oder eine modifizierte Teamorganisation, Änderungen an Sprachdialogsystemen aus. Doch auch die Analyse der Kennzahlen macht oft deutlich, dass Änderungen vorgenommen werden sollten. Neben den Kennzahlen, die eher das Ergebnis eines Dialogs betrachten (wie z.B. die bereits oben erwähnte Abbrecherquote), ergibt eine Auswertung des Anruferverhaltens häufig interessante Hinweise: An welcher Stelle legte der Anrufer auf? Welche Fragen mussten wiederholt werden, und führte die Wiederholung dann zum Erfolg? Die notwendigen Daten liefert das Sprachdialogsystem anhand einer detaillierten Aufzeichnung der einzelnen Dialogschritte. Wieweit Datenbankabfragen ausreichen oder individuell erstellte Auswertungsprogramme notwendig sind, hängt dabei stark davon ab, welchen Aspekt man betrachten möchte.

Auch die Ergebnisse der Spracherkennung sollten ausgewertet werden. Dafür muss jedoch die Aufzeichnung des „tatsächlich Gesagten“ herangezogen werden – die Zustimmung des Anrufers natürlich vorausgesetzt. Hier bieten sich entweder automatische Transkriptionen der Aufzeichnungen oder manuelle Stichproben an.

Viele Sprachdialogsysteme unterstützen auch das Unterbrechen von Ansagen („Barge-In“). Ob und wann eine Ansage unterbrochen wurde, gibt wertvolle Hinweise auf die Wirkung der Ansage auf den Anrufer.

Der nächste Schritt ist, nicht nur auf der Basis von historischen Daten Prozessbrüche zu erkennen. Mit Predictive Analytics lassen sich Forecasts und Projektionen ermitteln, die wertvolle Ansatzpunkte geben. So lässt sich das Sprachdialogsystem optimal konfigurieren und nutzen. Ausleitungsziele oder Eskalationen können bereits im Voraus oder unmittelbar bei Auftreten von Veränderungen angepasst werden, um eine kontinuierliche Kundenerfahrung sicherzustellen. Übrigens: Ein häufig auftretender Fehler liegt beispielsweise in der Formatänderung von Stammdaten. Werden Kundennummern im Backend-System verändert, die IVR erwartet diese allerdings noch im alten Format, führt dies zu Fehlern.

Festlegen der Veränderungen

Bei agilen Vorgehensmethoden umfasst eine Iteration typischerweise den Zeitraum von zwei Wochen. Abhängig von den Änderungen und der Anzahl der Anrufe, die man benötigt, um aussagekräftige Kennzahlen zu erhalten, kann der Zeitraum natürlich auch länger oder kürzer sein.

Typische Veränderungen sind das Hinzufügen oder Entfernen von Fragen, um bestimmte Sachverhalte bei dem Kunden zu erfassen und die Anrufe besser auf verschiedene Mitarbeitergruppen zu verteilen.

Ebenfalls lässt sich mit der Formulierung der Ansagen spielen und prüfen, welche für den Anrufer besser verständlich sind. Auch die Reihenfolge der möglichen Optionen hat auf die Verteilung der Anrufer Einfluss.

Dabei ist zu beachten, inwieweit bei Änderungen auch Schnittstellen zu anderen Systemen betroffen sind, die dann gegebenenfalls mit anderen Teams abzustimmen sind.

Dokumentation der Erwartungshaltung

Die Erwartungshaltung, die an die Veränderung gestellt wird, muss dokumentiert werden. Zunächst untersucht man, ob die notwendigen Daten aus den Aufzeichnungen des Sprachdialogsystems ausreichen. Auch wenn eine Vielzahl von Daten bereits vorhanden ist, können zusätzliche Daten im Dialog die Auswertung wesentlich erleichtern. Besonders Kennzahlen, die nicht auf das Ergebnis, sondern auf den Verlauf des Dialogs zielen, sind nicht immer problemlos zu ermitteln.

Agile Sprachdialogsysteme und deren Umsetzung

Die Umsetzung erfolgt entweder durch das Team oder den Dienstleister, der das Sprachdialogsystem betreut. Soweit Ansagen von den Änderungen betroffen sind, muss auch das Tonstudio eingebunden werden.

Bei häufigen Änderungen ist eine Tool-Unterstützung von Test und Deployment unabdingbar: Sind Dialoge zu komplex, ist es kaum noch möglich, alle Folgen der Änderungen auf dem „Papier“ zu durchdenken. Auch durch manuelles Testen lässt sich nur schwer sicherstellen, dass die Änderungen keine negativen Auswirkungen auf bereits bestehende Teile haben.

Noch mehr gilt das für Anpassungen an dem Spracherkenner (entweder durch Editieren von Grammatiken oder Adaption von Sprachmodellen). Ohne umfangreiche Tests gibt es keine Möglichkeit festzustellen, ob sich die Spracherkennung eventuell „verschlimmbessert“ hat.

Analog zur Softwareentwicklung erfordern häufige Veränderungen automatische Tests, die immer wieder die „Standarddialoge“ durchspielen und das Ergebnis auf Korrektheit überprüfen. Es muss festgelegt werden, welche Tests welche Backend-Systeme benötigen und ob dort ebenfalls Testsysteme mit einem gleichbleibenden Datenbestand existieren.

Dies kann so weit gehen, dass das System die Testfälle im Sinne eines „Nigthly-build“ jede Nacht überprüft. Soweit das auf Produktivsystemen erfolgt, ist allerdings sicherzustellen, dass das Reporting dies entsprechend berücksichtigt.

Alternativ bieten sich A/B-Tests entweder parallel mit zwei Sprachdialogsystemen oder periodisch nacheinander an: Dabei werden ähnliche Konfigurationen nicht nur auf Benutzerfreundlichkeit und Effizienz getestet. Über den periodischen Vergleich ist einfach festzustellen, welchen Einfluss das Sprachdialogsystem unmittelbar auf die Gesprächsdauer hat.

Agile Sprachdialogsysteme: Ein Beispiel

Ein Unternehmen plante zusammen mit einem Partner eine größere Marketingaktion: Produkte beider Unternehmen sollten als Paket beworben werden. Eine größere Zahl von Anzeigen und Fernsehspots wurden zu diesem Zweck geschaltet, in denen nur eingeschränkt auf Vertragsdetails eingegangen wurde. Deshalb rechnete das Unternehmen mit einer deutlichen Zahl von Anrufern, die ausführlichere Informationen wünschten. Das bereits bestehende Sprachportal sollte daher so angepasst werden, dass diese Anrufe an eine separate Bearbeitungsgruppe weitergeleitet wurden, die sich sowohl aus internen als auch für diesen Zweck extern eingebundenen Mitarbeitern zusammensetzte.

Speziell zu dieser Marketingaktion veröffentlichte das Unternehmen eine gesonderte Telefonnummer, das zu einem separaten Dialogsystem führte. Doch aus der Erfahrung aus vorherigen Aktionen war bekannt, dass Anrufer häufig dennoch die „Haupteinwahlnummer“ wählen würden. Im ersten Schritt wurde daher – direkt nach der Begrüßung – eine weitere Frage in das bestehende Sprachportal eingefügt: Wünschen Sie genauere Informationen zu unserer aktuellen Aktion XY? So konnten nicht nur die Anrufer zum Thema der aktuellen Aktion von den sonstigen Anrufern separiert werden, sondern zudem entstand ein zusätzlicher Werbeeffekt.

Die Teamverantwortlichen konnten die Zusatzfrage jederzeit im laufenden Betrieb aktivieren bzw. deaktivieren, je nachdem, wie viele Anrufer die neue Aktion wählten. Sank der Anteil unter 10%, wurde die Ansage deaktiviert, bis weitere Anzeigen und Fernsehspots wieder zu neuen Anfragen führten.

Nachdem die Aktion gestartet war, stellte sich in einer Teambesprechung heraus, dass sich manche Anrufer bereits beinahe sicher zum Kauf der beworbenen Produkte entschlossen hatten und nur noch wenige Detailfragen vor demVertragsabschluss klären wollten, während andere allgemeine Informationen zu der Aktion suchten. Daraufhin beschloss das Team, dass die internen Mitarbeiter vermehrt die Kunden erhalten sollten, die sich bereits praktisch sicher zu einem Kauf entschlossen hatten, so dass – direkt nach der Klärung der Fragen – ein Vertragsabschluss im IT-System angestoßen werden konnte. Die externen Mitarbeiter sollten dahingegen hauptsächlich allgemeinere Anfragen bearbeiten.

So wurden zwei weitere Fragen in das separate Dialogsystem eingefügt, anhand deren Antworten ermittelt werden konnte, ob der Anrufer kurz vor Vertragsabschluss stand oder nur allgemeine Informationen zur Aktion wünschte. In regelmäßigen Abständen wurde nun die Quote der Abschlüsse zwischen internen und externen Mitarbeitergruppen verglichen und daraus abgeleitet, inwieweit die Fragen von Bedeutung waren. Im Laufe der 6-wöchigen Aktion kam es so zu zwei weiteren Anpassungen.

Zusammenfassung

Die Entwicklung eines agilen, kundenzentrierten Sprachdialogsystems ist kein Produkt, sondern ein Prozess. Es ist ein Prozess, der Unternehmen rasch nach vorn bringen kann. Voraussetzung ist eine systematische Herangehensweise und eine klare Fokussierung auf Effizienz der Customer Journey und Customer Experience. Wenn die agile Organisation in die Lage versetzt wird, sich iterativ dem Optimum dieser beiden Leitgrößen zu nähern, zeigt der Prozess schnell und dauerhafte Erfolge.

Aktuelle und künftige Technologien wie immer leistungsfähigere Spracherkenner, KI-gestützte Systeme zur Verarbeitung natürlicher Sprache und vorausschauende Analysen schaffen neue Möglichkeiten. Wenn diese Voicebots dann nicht nur einfache, sondern auch komplexere Kundenanliegen fallabschließend lösen, zahlt sich dies gleich mehrfach aus: Der Kunde wird schnell bedient. Und der personelle Aufwand sinkt. Die Mitarbeiterinnen und Mitarbeiter erledigen in der Folge dann die Aufgaben, für die menschliche Empathie und Einfühlungsvermögen wichtig sind. Der Schlüssel dazu liegt in einem agilen Verständnis von Organisation, Technologie und der ersten telefonischen Kundenschnittstelle, dem Sprachdialogsystem.

Agilität im Kundenservice

„Agilität“ – ein vielversprechendes Schlagwort, das momentan in aller Munde ist. Wer möchte nicht agil sein? Was dahinter steckt, und vor allem, wie Agilität im Kundenservice aussehen kann, zeigen wir im Folgenden.

Was bedeutet „Agilität“ eigentlich?

„Agilität“ ist die Lösung für die Herausforderung, dass sich die Umwelt der Unternehmen immer schneller wandelt. Das betrifft nicht nur die Kundenanforderungen, sondern auch den globalen Wettbewerb und gesellschaftliche bzw. gesetzgeberische Rahmenbedingungen. Eine klassische Mehrjahresplanung, die über Jahre Strategie, taktische Überlegungen und operative Maßnahmen vorgibt, ist hier überfordert. 

 

„Individuen und Interaktionen stehen über Prozessen und Werkzeugen

Funktionierende Software steht über umfassender Dokumentation

Zusammenarbeit mit dem Kunden steht über Vertragsverhandlungen

Reagieren auf Veränderungen steht über Planeinhaltung“

Die vier agilen Prinzipien des Agilen Manifest

„Agiles Vorgehen“ bedeutet antizipativ, proaktiv und iterativ zu handeln: Änderungen werden vorausgeahnt und in kurzen Zyklen umgesetzt. Den Handlungsrahmen geben Strategie und Vision vor, um ein „planloses“ Agieren zu vermeiden.

 

Agile Mitarbeiter stehen für Qualität

Im Kundenservice herrscht traditionell ein stark prozessorientiertes und arbeitsteiliges Denken vor. Bei Vorgängen, die in hoher Zahl immer gleich ablaufen, werden einzelne Schritte definiert und optimiert, um eine gleichbleibende Qualität, aber auch eine einfache Einarbeitung neuer Mitarbeiter zu erlauben. Die Erfolgsmessung basiert auf Kennzahlen, die stark auf die Performance der Mitarbeiter abzielt.

Doch auch im Kundenservice setzt sich Agilität immer mehr durch. Wenn es immer schwieriger wird, die richtigen Mitarbeiter zu finden und zu binden, suchen Unternehmen nach neuen Ideen und Lösungen. Agile Arbeit soll ein Schlüssel sein, dem Fachkräftemangel entgegen zu wirken. Kleine Teams entwickeln gemeinsam und zeitnah Prozessverbesserungen: Die Trennung zwischen 1st- und 2nd-Level-Support wird aufgehoben – anstatt dessen lernen die Teammitglieder voneinander. Durch dieses „agile“ Verhalten steigt nicht nur die Mitarbeiterqualifikation und -zufriedenheit, sondern auch die Kundenzufriedenheit, da eine größere Anzahl an Anfragen bereits beim Erstkontakt abschließend bearbeitet werden kann.

Das große Momentum agilen Managements liegt darin, Freiheit und Verantwortung in die Ebenen hinein zu verlagern. Wenn nicht mehr das Festhalten an starren Abläufen, sondern das Verändern im Sinne der Zielerreichung Leitmotiv des Handelns ist, dann wirkt dies sowohl auf die Motivation und Qualifikation der Mitarbeiterinnen und Mitarbeiter als auch positiv auf den Outcome der Organisation – gleich ob Produkte oder Kundenservice.

Hohe Anpassungsgeschwindigkeit für überzeugende Customer Experience

Der McKinsey Brand Survey zeigt ein Dilemma auf: Unternehmen investieren zwar viel in die Gestaltung von Produkt und Kauf-Erlebnis – und wecken damit hohe Erwartungen beim Kunden. Die Vorschusslorbeeren werden jedoch häufig von einem unzureichenden Kundenservice zunichte gemacht: Auch wenn hohe Customer Experience heute das Zielbild der meisten Serviceorganisationen ist – die Prozesse sind wenig flexibel, das Mind-Set der Organisation vielfach nicht passend zum eigenen Anspruch.

Agile Methoden im Service schaffen die Voraussetzung dafür, eine hohe Entwicklungsgeschwindigkeit im Service umzusetzen. Soll ganz grundsätzlich effektiv an der Verbesserung der Customer Experience gearbeitet werden, ändern sich die Erwartungen der Kunden oder werden neue Kampagnen umgesetzt, braucht es eine reaktionsfreudige und schnelle Organisation. Diese Geschwindigkeit ist mit einem traditionell hierarchisch aufgebauten Customer Service kaum zu erreichen. Hier verspricht eine agile Organisation, schnell näher an den Kunden heranzurücken.

Agile Sprachdialogsysteme bereiten den Weg

Die Einführung dieser agilen Arbeitsweisen, Feedbackschleifen und Delegation von Entscheidungen in die Teams, ist eine der großen Aufgaben, vor denen Führungskräfte in solchen Service-Organisationen heute stehen. Gleichzeitig müssen sie den technologischen Unterbau des Service fit machen, um diese Prozessveränderungen schnell und effizient umzusetzen. Technik darf diesen agilen Ansatz, hohe Customer Experience zu liefern, nicht behindern, sondern muss gleichsam zum Treiber dieser Entwicklung werden.

Will man Prozesse im Kundenservice agiler gestalten, ist das Sprachdialogsystem ein Schlüssel zum Erfolg. Lesen Sie mehr dazu, wie eine agile IVR hilft, die Customer Experience wirksam zu optimieren: Unser aktuelles Whitepaper „Agile Sprachdialogsysteme“ steht Ihnen zum Download bereit.