Kennen Sie schon unseren Podcast? Wir sprechen mit Gästen aus Wirtschaft und Wissenschaft über den konkreten Nutzen von Chatbots und KI. Mehr erfahren

Chatbot-Training: Was ist Overfitting und wie kann es vermieden werden?

von Christina,
assono GmbH, Standort Kiel,

Bevor ein KI-Chatbot live geschaltet werden kann, muss er mehrere Phasen durchlaufen. Vor allem die Trainingsphase ist essenziell wichtig, um den Umgang mit Nutzern zu optimieren. Diese Phase birgt jedoch auch einige Stolperfallen, die erkannt und vermieden werden sollten. Denn viel Training bedeutet nicht automatisch bessere Ergebnisse.

Was ist Overfitting und warum tritt es auf?

KI-Chatbots haben die Fähigkeit, Nachrichten von Benutzern in menschlicher Sprache zu verstehen und dazu passende Antworten auszugeben. Künstliche Intelligenz funktioniert jedoch niemals ohne Daten. Bei einem KI-Chatbot bestehen die Daten aus Beispielformulierungen, wie Benutzer nach Anliegen fragen können.

Pro Anliegen benötigt ein Chatbot ein Set an Beispielformulierungen, die möglichst unterschiedlich formuliert sein sollen. Beispielformulierungen für das Anliegen „Öffnungszeiten“ wären zum Beispiel: „Wie sind die Öffnungszeiten?“, „Wann haben Sie auf?“ oder „Bis wann ist geöffnet?“.

Damit der Chatbot die unterschiedlichen Formulierungen seiner Nutzer versteht, werden ihm mehrere Beispielfragen trainiert. Im Idealfall liegt die Anzahl zwischen 5 und 25 Formulierungen pro Anliegen.

Weniger ist oft mehr

Nun würde man meinen, dass ein Chatbot besser funktioniert, je mehr Beispielformulierungen man ihm beibringt. Das ist jedoch nicht der Fall. Zu viele Daten können sich sogar negativ auf dessen Leistung auswirken und dazu führen, dass der Chatbot die Benutzer nicht mehr gut versteht. Dies geschieht vor allem dann, wenn sich Formulierungen zu stark im Aufbau ähneln oder wenn sie sich innerhalb eines Anliegens zu stark thematisch unterscheiden. Dieses Problem wird Overfitting (dt. Überanpassung) genannt.

Nicht nur bei Chatbots, sondern bei Machine-Learning-Modellen im Allgemeinen tritt das Phänomen des Overfitting häufig auf. Dabei lernen die Modelle Details in den Trainingsdaten in einem so starken Ausmaß, dass diese sich negativ auf die Verallgemeinerungsfähigkeit bei neuen Daten auswirken. Die Modelle sind dann nicht mehr in der Lage, neue Daten korrekt zu verarbeiten.

Woran erkennt man Overfitting?

Overfitting lässt sich daran erkennen, dass der Chatbot Fragen von Benutzern schlecht zuordnen kann, wenn seine Formulierung von den Beispielen (leicht) abweicht. Der Chatbot erscheint dann fehlerhaft, obwohl viele Beispielformulierungen vorliegen.

Wie vermeidet man Overfitting bei Chatbots?

Overfitting lässt sich vermeiden, indem darauf geachtet wird, nicht zu viele Formulierungen für ein Anliegen zu verfassen. Im Idealfall liegt die Anzahl zwischen 5 und 25 Formulierungen. Die ausgewählten Formulierungen sollten sich außerdem nicht zu sehr ähneln. Es ist sinnvoll Menschen aus der Zielgruppe dazu zu befragen, wie sie verschiedene Anliegen formulieren würden. Damit kann sichergestellt werden, dass sie die Zielgruppe beim Anfangstaining in Ihren Beispielformulierungen abgebildet wird.

Wenn Overfitting durch thematisch zu unterschiedliche Beispielformulierungen entstanden ist, die sich in mehrere Anliegen unterteilen lassen könnten, sollte man dies tun.

Chatbots mit der KI von IBM Watson besonders stark

Chatbots, die die Künstliche Intelligenz von IBM Watson Assistant verwenden, erzielen mit einem Trainingsdatensatz von 5-10 Beispielformulierungen pro Anliegen bereits sehr gute Ergebnisse. Das unterscheidet sie von vielen anderen Anbietern auf dem Markt, bei denen größere Datensätze für eine zuverlässige Spracherkennung benötigt werden. Das heißt für unsere Kunden: Weniger Aufwand beim Anfangstraining des Chatbots, in den Trainingsphasen und nach der Live-Schaltung.

Overfitting vs Underfitting

Neben dem Overfitting gibt es auch das Phänomen des Underfittings (dt. Unteranpassung). Hierbei hat der Chatbot zu wenig Trainingsdaten, um Muster in Sprachäußerungen zu erkennen. Underfitting zeichnet sich dadurch aus, dass bereits im Training der Chatbot Schwierigkeiten hat, Anliegen richtig zuzuordnen. Dieses Problem kann allerdings sehr simpel behoben werden, indem mehr Beispielformulierungen für die einzelnen Anliegen verfasst werden. Es ist nur wichtig, darauf zu achten, dass sich diese nicht zu stark ähneln, damit wiederrum Overfitting vermieden werden kann.

Wie können wir Sie unterstützen?

Sie würden gerne unverbindlich mehr darüber erfahren, inwiefern ein KI-Chatbot bei ihrem individuellen Anwendungsfall Ihr Unternehmen unterstützen kann? Gerne beraten wir Sie dazu in einem kostenlosen Erstgespräch. Vereinbaren Sie doch einfach einen Termin über unsere Webseite. Telefonisch erreichen Sie uns unter +49 4307 900 407. Wir freuen uns auf Sie!

Fachbeitrag Chatbot Künstliche Intelligenz Für Unternehmen

Sie haben Fragen zu diesem Artikel? Kontaktieren Sie uns gerne: blog@assono.de

Sie haben Interesse an diesem Thema?

Gerne bieten wir Ihnen eine individuelle Beratung oder einen Workshop an.

Kontaktieren Sie uns

Weitere interessante Artikel

Sie haben Fragen?

Wenn Sie mehr über unsere Angebote erfahren möchten, können Sie uns jederzeit kontaktieren. Gerne erstellen wir eine individuelle Demo für Sie.

assono GmbH

Standort Kiel (Zentrale)
assono GmbH
Lise-Meitner-Straße 1–7
24223 Schwentinental

Standort Hamburg
assono GmbH
Bornkampsweg 58
22761 Hamburg

Telefonnummern:
Zentrale: +49 4307 900 407
Vertrieb: +49 4307 900 411

E-Mail-Adressen:
kontakt@assono.de
bewerbung@assono.de