Blog

Wozu Maschinen menschliches Sehen übernehmen

Von Daniel Zettler am 19. Mai 2020

Maschinelles Sehen (Computer Vision) ist ein Teilbereich des Forschungsgebiets rund um Künstliche Intelligenz. Die Entwicklung begann vor über 50 Jahren als Wissenschaftler auf der Suche nach einer allgemeinen und menschenähnlichen künstlichen Intelligenz waren – wozu natürlich auch die visuelle Wahrnehmung der Umgebung über ein (Kamera)auge gehört. Anfangs hielt man die Aufgabe „Verbinde eine Kamera mit einem Computer und bringe den Computer dazu die Eingabe zu beschreiben” für einen wichtigen, aber trivialen Schritt in Richtung allgemeine KI. Bald musste man allerdings feststellen, dass das Problem weitaus komplexer war.

Eines der wichtigsten Gebiete aus dem Bereich Computer Vision ist die Objekterkennung. Es geht darum, bestimmte, vorher festgelegte Objekte (Gegenstände, Personen, Gesichter …) auf einem Bild zu erkennen und zu lokalisieren. Damit ist vor allem entscheidend, welches Objekt sich an welcher Position befindet.

Seit etwa zehn Jahren wird auch im Bereich Objekterkennung auf Deep Learning gesetzt – mit überwältigendem Erfolg. Heutige State-of-the-Art Detektoren verwenden ausschließlich tiefe neuronale Netzwerke.

Man kann die Objekterkennungs-Systeme grob in zwei Gruppen einteilen:

Wo Objekterkennung bereits eingesetzt wird

Vor allem die anwendungsorientierte Objekterkennung ist bereits Teil des alltäglichen Lebens geworden. So bieten die meisten Smartphones eine Personen- bzw. Gesichtserkennung in der Kamera-App an. So ist es möglich, die Foto-Bibliothek nach Portraits oder bestimmten Personen zu sortieren. Dieselbe Technologie ist auch in digitalen Kameras zu finden, die mittels Objekterkennung eine Aufnahme perfekt auf die Augen fokussieren können. Deep Learning hat dabei die Generalisierung ermöglicht, auch Augen von Tieren zuverlässig zu erkennen. Des Weiteren sind diese Systeme auch bei schnellen Bewegungen, schlechten Lichtverhältnissen oder teilweiser Verdeckung der Augen zuverlässig.

Ein weiteres aktuelles (aber vor allem zukünftiges) Anwendungsgebiet stellt der Bereich autonomes Fahren und Robotik dar. Ein großer Teil der Informationen über die Umgebung von autonom agierenden Maschinen wird über Kamerasysteme gewonnen. Autonomes Fahren stellt dabei natürlich eine besondere Herausforderung dar – über die Erkennung von Fußgängern, Fahrrädern sowie anderen Verkehrsteilnehmern und die richtige Einordnung von Verkehrsschildern bis hin zur Erkennung der Fahrbahn.

Weniger komplexe Anwendungen finden sich bereits heute in der Industrie. In der Qualitätskontrolle werden Objekterkennungs-Systeme eingesetzt, um defekte oder beschädigte Produkte automatisch zu entfernen. Speziell bei komplexeren Produkten wie Leiterplatten mit vielen Bauteilen ergeben sich hier Vorteile gegenüber händischer Selektion. Ähnliches ist natürlich auch in der Lebensmittelproduktion vorstellbar z.B. die automatische Kontrolle auf Beschädigungen von Eiern.

Weitere Anwendungsgebiete finden sich im Handel und der Logistik, um Produktlieferungen auf Vollständigkeit zu kontrollieren oder Produkte ohne Strichcode (frische Lebensmittel) zu erfassen. Unlängst hat Amazon ein Konzept des zukünftigen Einkaufens vorgestellt, bei dem ein Kunde die Produkte nur noch aus dem Regal nehmen muss und diese automatisch dem (digitalen) Warenkorb hinzugefügt werden. Am Ende des Einkaufs kann der Kunde das Geschäft einfach ohne weiteres verlassen. Das Warten an der Kasse oder das Einscannen der Produkte durch den Kunden entfallen vollkommen.

Beeindruckend an dem System ist, dass es ausschließlich über Kameras betrieben wird, die sich überall im Supermarkt befinden. Das System muss damit konstant jeden Kunden im Geschäft erkennen und dem richtigen Kundenkonto zuordnen. Jedes Produkt, das aus dem Regal genommen wird, muss ebenfalls richtig erkannt und der richtigen Person zugeordnet werden. Letztendlich muss das System auch erkennen, ob ein Produkt im Lauf des Einkaufs wieder zurückgelegt wird, um es auch aus dem digitalen Warenkorb zu entfernen. (Für einen tieferen Blick sei dieser Artikel empfohlen: „How the Amazon Go Store’s AI Works”. „Amazon Go” zeigt damit wie mächtig ein Objekterkennungs-System sein kann und scheint dem nahe zu kommen, was die KI-Pioniere sich Anfang der 1970er Jahre erträumt hatten. Im nächsten Teil dieser Artikelserie werden wir einen genaueren Blick auf die Technik hinter der Objekterkennung werfen.

Wollen Sie in Zukunft benachrichtigt werden, wenn es wieder einen neuen Blogartikel gibt?
Folgen Sie uns auf LinkedIn und bleiben Sie auf dem Laufenden.

Bringen Sie Ihr Unternehmen auf die nächste Stufe!

Wir entwickeln KI-Lösungen für den innovativen Mittelstand.