Maschinelles Lernen und insbesondere Deep Learning sind zentrale Kompetenzen von Künstlicher Intelligenz. Selbstlernende Programme werden heute in immer mehr Produkten und Lösungen eingesetzt. Algorithmen des maschinellen Lernens finden sich bei der Spracherkennung auf Smartphones genauso wie im Spam-Filter der Virenprogramme. Auch personalisierte Online-Werbung funktioniert nur so gut aufgrund lernender Systeme. Dabei gibt es eine ganze Bandbreite verschiedener Konzepte, Methoden und theoretischer Ansätze. Ihnen allen gemein ist das Ziel: Der Computer oder die Maschine soll selbstständig Wissen aus Erfahrung erwerben und darauf basierend eigenständig Lösungen für neue und unbekannte Probleme finden. Damit ist das Maschinenlernen eines der zentralen Teilgebiete Künstlicher Intelligenz, ohne das andere Kernkompetenzen smarter Systeme wie Mustererkennung oder die Verarbeitung der natürlichen Sprache kaum denkbar wären. Die Technologie ist eigentlich nicht besonders neu, schon der KI-Pionier Marvin Minsky baute in den 1950er Jahren eine erste lernende Maschine. Den Durchbruch und die praktische Anwendung der entsprechenden Methoden ermöglichte jedoch erst die rasante Entwicklung der letzten Jahre im Bereich der Halbleitertechnologie. Nur mit der jetzt zur Verfügung stehenden Prozessortechnologie konnten große Datenmengen in hoher Geschwindigkeit parallel verarbeitet werden.
Viele Experten sehen in Deep Learning aktuell das Gebiet innerhalb der KI mit dem größten Potenzial.
Deep Learning dominiert aktuell die Lernverfahren
Eine Methode des maschinellen Lernens ist Deep Learning: Viele Experten sehen hier aktuell das Gebiet innerhalb der KI mit dem größten Potenzial. Deep Learning nutzt komplexe neuronale Netzwerke, um eigenständig zu lernen, wie etwas klassifiziert werden kann. Dazu nimmt das System große Mengen an bekannten Informationen – zum Beispiel Bilder oder Geräusche – in eine Datenbank auf und vergleicht sie mit unbekannten Daten.
Das Verfahren macht viele Arbeitsschritte des klassischen Maschinenlernens überflüssig. Denn der Trainingsaufwand ist deutlich geringer: Der „Trainer“ muss dem neuronalen Netzwerk nur noch Daten wie zum Beispiel Bilder präsentieren – wie die darauf zu sehenden Dinge zu klassifizieren sind, findet das System von allein heraus. Der Mensch muss einzig markieren, ob der Gegenstand, dessen Erkennung gelernt werden soll, auf dem Bild zu sehen ist (also zum Beispiel ob das Bild einen Fußgänger zeigt oder nicht). Das Deep-Learning-Programm verwendet die Informationen aus den Trainingsdaten, um typische Merkmale eines Fußgängers zu definieren und daraus ein Vorhersagemodell zu erzeugen. Dabei arbeitet sich das System von Ebene zu Ebene immer tiefer in das neuronale Netz vor – daher der Name Deep Learning. So registrieren die Knoten der ersten Ebene zum Beispiel nur Helligkeitswerte der Bildpixel. Die nächste Ebene erkennt, dass einige der Pixel Linien bilden. Die dritte unterscheidet dann zwischen horizontalen und vertikalen Linien. Dieser iterative Prozess geht so lange, bis das System Beine, Arme und Gesichter erkennt – und gelernt hat, wie ein Mensch auf dem Bild zu klassifizieren ist. Dieser Lernprozess benötigt allerdings große Rechenleistung und stellt damit hohe Anforderungen an die Prozessortechnik. Forscher und Hersteller arbeiten daher intensiv daran, spezielle KI-Chips zu entwickeln, die noch mehr Rechenprozesse in noch kürzerer Zeit durchführen können.
Erlerntes Wissen einfach weitergeben
Gleichzeitig wird überlegt, wie das Wissen, das sich ein System aufwändig angeeignet hat, auch anderen Systemen verfügbar gemacht werden kann. Denn so müsste zum Beispiel nicht jedes autonome Auto für sich allein lernen, wie ein Fußgänger aussieht, sondern könnte auf die Erfahrungen von Fahrzeugen, die schon länger auf der Straße unterwegs sind zurückgreifen. Die Khronos Gruppe, ein offenes Konsortium führender Hardware- und Software-Firmen, hat daher Ende 2017 ein Austauschformat für neuronale Netzwerke vorgestellt. Mit dem Neural Network Exchange Format 1.0 sollen Wissenschaftler und Ingenieure bereits trainierte Netzwerke von der Training-Plattform auf viele andere Systeme übertragen können – also ähnlich funktionieren wie das PDF-Format in der Textverarbeitung.