Was ist Unsupervised Learning?
Beim „Unsupervised Learning“ wird ein KI-Modell anhand von ungekennzeichneten Daten trainiert, um verborgene Muster, Zusammenhänge und Ähnlichkeiten zu entdecken. Lesen Sie weiter, um mehr über Unsupervised Learning zu erfahren.
Was ist Unsupervised Learning?
Unsupervised Learning ist eine Methode zur Datenanalyse innerhalb des Gebiets der künstlichen Intelligenz. Hierbei orientiert sich ein künstliches neuronales Netzwerk an Ähnlichkeiten innerhalb verschiedener Inputwerte. Beim Unsupervised Learning versucht der Computer selbstständig Muster und Strukturen innerhalb der Eingabewerte zu erkennen.
Unsupervised Learning steht damit im Gegensatz zum Supervised Learning. Bei dieser Methode behalten Entwickelnde die Kontrolle komplett in der Hand und geben das Lernziel klar vor. Allerdings müssen die Trainingsdaten bei Supervised Learning vor dem Training manuell gekennzeichnet resp. kategorisiert werden, was einen erheblichen Zeitaufwand darstellt.
- In Sekunden zur Online-Präsenz
- Mehr Wachstum mit KI-Marketing
- Zeit und Ressourcen sparen
Wie funktioniert Unsupervised Learning?
Vereinfacht dargestellt ist die Lernmethode ein künstliches neuronales Netz, das eine große Menge an Informationseingaben analysiert, um mittels dieser Informationen Zusammenhänge, Muster und Ähnlichkeiten in Daten zu ermitteln. Dieser Vorgang basiert auf verschiedenen Verfahren. Eine Technik, der sich die Lernmethode bedient, ist das Clustering, auch bekannt als Clusterverfahren. Hierbei müssen die Algorithmen selbstständig Cluster – also Gruppierungen – bilden. Im Anschluss werden diesen Clustern dann Daten zugeordnet.
Wenn die Daten beispielsweise Fotos von Hunden und Katzen darstellen, würde das Programm beim Unsupervised Learning diese Fotos anhand ihrer Merkmale vergleichen und Gruppieren. Ob der Algorithmus dabei zwischen Hundefotos und Katzenfotos unterscheidet, ist anders als beim Supervised Learning nicht vorgegeben, aber möglich. Die Algorithmen beim Unsupervised Machine Learning treffen ihre Entscheidungen auf der Basis von Gemeinsamkeiten und Unterschieden in den Bildern, wie zum Beispiel anhand der Fellfarbe des Tieres.
Ein weiteres Verfahren ist Association. Hierbei werden Daten, die sich mit anderen Daten über bestimmte Attribute in Verbindung bringen lassen, kategorisiert. Die Aufgabe der Algorithmen ist es also, Objekte zu finden, die in Verbindung miteinander stehen – dafür müssen sie aber nicht gleich oder überhaupt ähnlich sein. Wieder das Beispiel mit den Hundefotos: Bei der Association würde der Unsupervised-Learning-Algorithmus nicht alle Hunde zusammenfassen, sondern beispielsweise eine Leine mit dem Hund in Verbindung bringen.
Wo und wann wird Unsupervised Learning eingesetzt?
Es gibt viele Beispiele für Unsupervised Learning in der Praxis. Dadurch, dass Programme aufgrund der Lernmethode in der Lage sind, Spielregeln und somit auch Gewinnstrategien zu erlernen, lassen sie sich z. B. gewinnbringend an der Börse einsetzen. So ist es möglich, die Börsenkurse als rohe Daten zur Verfügung zu stellen und das Programm bestimmte Börsenaktivitäten erkennen und Trends voraussehen zu lassen.
Künstliche Intelligenz und insbesondere Unsupervised Learning wird aber auch in vielen weiteren Bereichen bereits angewendet. Durch das Clusterverfahren lassen sich Personengruppen zusammenstellen, was vor allem im Marketing von Bedeutung ist. Dort ist nämlich die Zielgruppe der Mittelpunkt und die Grundlage für die Erarbeitung einer Werbestrategie. Algorithmen können selbstständig lernen, eine solche Gruppe an Menschen zusammenzufassen.
Ein Bereich, in dem das Prinzip des Unsupervised Learning bereits fest verankert ist, ist die Spracherkennung. Die Bedienung von Assistenzprogrammen wie Siri, Alexa oder Google Assistant wird beispielsweise erst durch Spracherkennung möglich. Hierbei lernen die Programme die Sprechgewohnheiten eines Nutzers bzw. einer Nutzerin und können mit der Zeit immer genauere Spracheingaben verstehen, auch wenn der Nutzer bzw. die Nutzerin eventuell einen Sprachfehler hat oder einen Dialekt spricht.
Viele Smartphones arbeiten bereits mit Unsupervised Learning und sorgen auf diese Weise in Fotogalerien für Ordnung. Durch das selbstständige und unüberwachte Lernen ist das Gerät in der Lage, dieselbe Person auf Fotos zu erkennen oder auch in den Meta-Daten gleiche Aufnahmeorte festzustellen. So können die Fotos nach Ort der Aufnahme oder auch nach Personen, die auf dem Foto abgebildet sind, geordnet werden.
In Chats hat sich Unsupervised Learning ebenfalls bewährt: Ein Großteil der Internetnutzenden hat bereits mit Chatbots Erfahrung gemacht. Sie regeln beispielsweise den sozialen Umgang innerhalb von virtuellen Gesprächen. So werden Beleidigungen, Hetze, rassistische Äußerungen und auch Diskriminierung von den Bots selbstständig erkannt und die betreffenden Nutzenden aus dem Chat entfernt oder ermahnt. Auch hier spielt künstliche Intelligenz eine Rolle. Ähnlich funktionieren die automatisierten Chats im Kundendienst und bei der Onlinebestellung. Egal ob in einem Messenger oder am Telefon – die Bots lernen selbstständig und zum Teil auch unüberwacht.
Negativ-Beispiel: Chatbot in Social Media
Dass unüberwachtes Lernen allerdings auch negative Auswirkungen haben kann, musste Microsoft 2016 feststellen. Deren KI „Tay“ hatte einen Twitter-Zugang und lernte durch die Kommunikation mit anderen Nutzenden der Plattform. Anfangs war das Programm noch recht einfältig, doch schnell benutzte es viele Smileys und bildete ganze Sätze.
Allerdings bewertete die KI die Aussagen nicht und hetzte überraschend schnell gegen Ausländer und Feministen und verbreitete Verschwörungstheorien – all dies geschah innerhalb von 24 Stunden. Das Programm an sich war weder rassistisch noch politisch motiviert, es hatte einfach von den Menschen gelernt. Ob und wie viele Twitter-Nutzende sich einen Scherz erlaubten und Tay mit diesen Daten fütterten, ist nicht bekannt.
Positiv-Beispiel: Genforschung
Durchaus positive Auswirkungen hat Unsupervised Learning allerdings auf die Genforschung. Hier hilft das Clusterverfahren bei der Analyse von Genmaterial. Der medizinische und technische Bereich wächst Dank der künstlichen Intelligenz und deren Lernmethoden dichter zusammen und die Forschung wird enorm beschleunigt, sodass Erbkrankheiten wie die Sichelzellenanämie oder auch eine vererbte Blindheit zukünftig behandelt und geheilt werden können.
Vorteil von Unsupervised Learning gegenüber anderen Methoden
Machine Learning bedeutet nicht nur technischer Fortschritt, sondern auch eine Entlastung und Erleichterung in vielen Bereichen des täglichen Lebens. Es ist eine Bereicherung für Alltag, Wirtschaft und auch Forschung. Im Gegensatz zu den anderen beiden Lernmethoden (Supervised und Reinforcement Learning) sind Entwickelnde nicht am eigentlichen Training beteiligt, was neben einer eventuellen Zeitersparnis auch noch einen weiteren Vorteil mit sich bringt: Mit Unsupervised Learning können Muster erkannt werden, die ein Mensch zuvor nicht erkannt hat. Somit haben Algorithmen auf der Basis von Unsupervised Machine Learning die Möglichkeit, kreative Ideen zu entwickeln.
Unterschiede zu Supervised Learning und Semi-supervised Learning
Zusätzlich zum Unsupervised Learning gibt es auch noch Supervised Learning und Semi-supervised Learning, die beide einige Unterschiede zum Unsupervised Learning aufweisen. Im Folgenden gehen wir jeweils kurz auf diese Unterschiede ein.
Unsupervised Learning vs. Supervised Learning
Anders als beim Unsupervised Learning sind beim Supervised Learning sowohl die Eingabedaten als auch die zugehörigen Ausgaben von vornherein bekannt. Supervised Learning hat aber auch andere Ziele als Unsupervised Learning. Da es beim Supervised Learning für jeden Datenpunkt schon eine „richtige“ Antwort gibt, zielt dieses Lernverfahren darauf ab, dass die KI nach dem Training „richtig“ antworten kann.
Zusätzlich zu den unterschiedlichen Zielen und Einsatzmöglichkeiten sind Supervised Learning und Unsupervised Learning auch in ihrer Effizienz und Klarheit sehr unterschiedlich. Unsupervised Learning benötigt lediglich Rohdaten, um zu trainieren und Muster zu erkennen. Dafür sind die Ergebnisse im Vergleich zu Supervised Learning aber oft sehr abstrakt und müssen manchmal anschließend manuell analysiert werden. Demgegenüber sind die Vorlaufkosten beim Supervised Learning sehr hoch, da das Training nur mit vollständig gelabelten Daten erfolgen kann. Der Vorteil davon ist, dass die Ziele des Trainings durch das Kennzeichnen der Daten sehr klar definiert werden und die Endergebnisse in der Regel sehr nachvollziehbar sind.
Unsupervised learning vs. Semi-supervised learning
Beim Semi-supervised Learning werden sowohl gekennzeichnete als auch nicht gekennzeichnete Daten für das Training verwendet. Dabei lernt das Modell zuerst aus den gekennzeichneten Daten, um ein rudimentäres Klassifizierungsmodell zu erzeugen. Dieses Modell wird dann verwendet, um Vorhersagen für die ungelabelten Daten zu treffen. Anschließend wird das Modell erneut trainiert, diesmal sowohl mit den gekennzeichneten Daten als auch den Vorhersagen, die als Kennzeichen benutzt werden. Dieser Prozess kann dann iterativ fortgesetzt werden.
Da Semi-supervised Learning wie Supervised Learning eher für Klassifizierungsprobleme geeignet ist, ist dieses Verfahren grundsätzlich anders zu Unsupervised Learning, was hauptsächlich fürs Clustering und Association eingesetzt wird. Allerdings weist Semi-supervised Learning in seinen relativ niedrigen Vorlaufkosten eine Ähnlichkeit zu Unsupervised Learning auf.
Weitere KI-Lernverfahren: Reinforcement Learning
Zwischen den beiden Lehrmethoden steht noch eine dritte: Beim Reinforcement Learning geben Entwickelnde nur Impulse, um das Training der Algorithmen zu beeinflussen. Ein Computer lernt hierbei durch Versuch und Irrtum, welche Entscheidungen die richtigen sind. Auf jede Entscheidung bekommt der Computer von der Trainingsumgebung entweder positives oder negatives Feedback. So kann die künstliche Intelligenz langfristig Zusammenhänge erkennen und Strategien entwickeln, um möglichst viel positives Feedback zu bekommen.
Beispielsweise könnte man einen Roboter mittels Reinforcement Learning dazu trainieren, ein Objekt in einem Raum zu finden, das jedes Mal an einer anderen Stelle platziert wird. Der Roboter würde für Kollisionen und verschwendete Zeit negatives Feedback bekommen. Langfristig würde der Roboter Strategien entwickeln, um sein Suchverfahren zu optimieren.