Blog
Robuste KI-Modelle:
Was ist Overfitting und wie kann man es vermeiden?
Von Oliver Schick am 15. November 2023
In diesem Blogeintrag geht es um eines der häufigsten Probleme im Bereich der Künstlichen Intelligenz – das Overfitting (=Überanpassung). Overfitting tritt auf, wenn ein KI-Modell zu komplex wird und anfängt, sich zu eng an die Trainingsdaten anzupassen, was zu einer schlechten Generalisierung bei unbekannten Daten führt. Dieses Problem tritt im Bereich der KI und des maschinellen Lernens in fast jedem Projekt auf, deshalb werde ich erklären, was Overfitting ist und wie man es vermeiden kann.
Beispiele zu Overfitting
Beginnen wir mit einem alltäglichen Beispiel. Sie wollen vorhersagen, ob morgen schlechtes Wetter ist. Sie sammeln eine Reihe von Daten, darunter die Temperatur, die Luftfeuchtigkeit und die Windgeschwindigkeit. Sie geben diese Daten in Ihr KI-Modell ein, und es sagt Ihnen mit 100-prozentiger Sicherheit, dass es morgen regnen wird. Sie sind begeistert, immerhin haben Sie gerade die Wetterprognose revolutioniert! Haben Sie das wirklich? Sie stellen fest, dass sich Ihr Modell zu stark an die Daten angepasst hat – es hat gelernt, Regen mit einer bestimmten Reihe von Eingaben zu assoziieren, auch wenn diese in keiner Verbindung zur Regenwahrscheinlichkeit stehen. Genau wie Menschen, neigen komplexe KI-Systeme dazu, in Daten Zusammenhänge zu erkennen, die es gar nicht gibt. Sie müssen auf diese Art der Überanpassung vorbereitet sein, sonst erleben Sie am Ende jede Menge durchnässte Picknicks!
Hier noch ein weiteres Beispiel zu Overfitting:
Stellen Sie sich vor, Sie sind ein Schüler, der sich auf eine Geschichtsprüfung vorbereitet. Sie haben Zugang zu allen Fragen und Antworten aus der Prüfung des Vorjahres. Sie verbringen Stunden damit, jede einzelne Antwort auswendig zu lernen, und gehen mit einem guten Gefühl in die Prüfung. Beim Aufschlagen der ersten Aufgabe sind Sie erstaunt, die Aufgabenstellung noch nie gesehen zu haben. Sie haben zwar die Prüfung vom letzten Jahr auswendig gelernt, haben aber kein Geschichtswissen. Sie sind soeben dem Overfitting zum Opfer gefallen. Ähnlich verhalten sich KI-Modelle, die sich zu stark an die Trainingsdaten anpassen und keine sinnvollen Zusammenhänge erkennen können.
Beim Trainieren eines Machine Learning Modells können Sie frühzeitig ein Overfitting erkennen. Wenn die Vorhersagen des Programms auf den Trainingsdaten sehr gut funktionieren, aber auf den Testdaten versagen, dann ist wahrscheinlich eine Überanpassung das Problem.
Lösungsansätze
Wie können wir also eine Überanpassung vermeiden?
Eine Möglichkeit ist der Einsatz von Regularisierungsmethoden.
Möglichkeiten sind unter anderem:
- Das Hinzufügen eines Strafterms zur Verlustfunktion
- der Wechsel des Modells oder
- die Anpassung des Lernalgorithmus.
➡️ Diese Methoden zielen darauf ab, das Modell zu vereinfachen und damit eine Überanpassung zu vermeiden.
Auch die Beschaffung von mehr Trainingsdaten für das Modell könnte das Problem beheben.
Overfitting ist ein häufiges Problem beim maschinellen Lernen, das es zu vermeiden gilt. Denken Sie daran, dass das Ziel nicht nur darin besteht, die Trainingsdaten auswendig zu lernen, sondern generalisierbare Muster zu lernen, die auf neue Daten angewendet werden können. Wenn Sie also das nächste Mal ein KI-Modell erstellen und evaluieren, achten Sie auf das Phänomen des Overfitting!
Sie möchten mehr über die individuelle Entwicklung von KI-Projekten erfahren und interessieren sich dafür wie auch Ihr Unternehmen von Künstlicher Intelligenz profitieren kann?
Kontaktieren Sie uns gerne für eine unverbindliche Beratung.