3D-Brillen unterstützen Sehbehinderte im Alltag: Die Brillen sind mit Stereokameras ausgestattet; intelligente Algorithmen übersetzen die visuellen Signale in haptische und akustische Informationen.

Bild: Framos

Bildbasierte KI Clevere Staubsauger sind der Anfang

25.09.2018

Die nächste Entwicklungsstufe der Bildverarbeitung macht Maschinen zu intelligenten Partnern und nützlichen Kollegen. Innovative Anwendungen in Industrie und Alltagsleben profitieren von der Kombination aus 3D-Technologie und künstlicher Intelligenz.

Bildverarbeitung ist eine der Schlüsseltechnologien für die Automatisierung, Robotik und die Smart Factory. Mit bildbasierter künstlicher Intelligenz (KI) bieten Vision-Systeme exakte Analysen von Umgebungen und Objekten. Die 3D-Technologie entwickelt sich dabei mit einfach zu integrierenden Bausteinen zur neuen Normalität und generiert eine neue Wahrnehmungsebene in Echtzeit. Mit noch präziseren und schnelleren Analysen können intelligente Algorithmen damit valide Entscheidungen treffen. Mit neuartigen Anwendungen und Geschäftsmodellen werden Maschinen vom repetitiven Dienstleister zum intelligenten Partner.

3D-Imaging und künstliche Intelligenz als einzelne Bausteine sind nicht mehr ganz neu, doch erst jetzt erreicht die Bildverarbeitung mit der Kombination der beiden Technologien das nächste Level. Der Grund dafür liegt vor allem in der technischen Entwicklung und Digitalisierung der Bildverarbeitung, die in den letzten Jahren einen enormen Marktbedarf geschaffen und für Vision-Systeme den Sprung auf den Massenmarkt ermöglicht hat.

Perceptional Computing dank KI

Das sogenannte Perceptional Computing generiert mit 3D-Sensing eine neue Wahrnehmungsebene und die KI ermöglicht exakte Echtzeit-Analysen ohne die bei 2D übliche Verzerrung und Verzögerung durch Annahmen und Simulationen. Die Maschinen werden quasi mit menschlichen Sinnen ausgestattet. Die visuelle 3D-Sensorik lässt sehen; die KI verstehen. Beides zusammen ermöglicht Maschinen und Geräten das Interagieren mit ihrer Umwelt und kognitives Lernen. In der industriellen Automatisierung können Maschinen und Roboter selbst valide Entscheidungen treffen.

Maschinen und Geräte mit integrierter Vision-Technologie lassen sich zudem berührungslos steuern. Das Tracking von Augen, Gesichtern und Bewegung ist Grundlage für intelligente und neuartige Konsumgüter, Sicherheitsanwendungen und auch industrielle Lösungen. Smart Homes etwa können mit einer Fingerbewegung gesteuert werden; Kaffeemaschinen erkennen, wer vor ihnen steht und bereiten automatisch den Lieblingskaffee zu und Autos bremsen ab, sollte der Fahrer einschlafen. In der Industrie kommen vor allem die präzise Erkennung von Objekten sowie die exakte Erfassung von Position und Distanz zum Tragen. 3D-Sensing ermöglicht es Robotern, wie Menschen zu greifen, und vermeidet während der Bewegung Kollisionen mit der Umgebung. Die Vernetzung mehrerer Roboter oder mit 3D-Sensing ausgestattete Geräte erlauben es Unternehmen, für ihre Prozesse das volle Optimierungspotenzial intelligenter Algorithmen ausschöpfen.

Roboter sind in der Industrie bereits seit Jahrzehnten im Einsatz. Sie wurden programmiert, konnten Hindernisse in 2D erkennen, mithilfe von Markern im Raum navigieren und waren damit verlässliche Hilfsmittel. 3D-Sensing und KI-Algorithmen dagegen lassen industrielle Roboter zu wirklichen Partnern, zu mitdenkenden Kollegen werden. 3D-Technik macht Roboter schnell, sie erkennen in Echtzeit für sie bisher unbekannte Objekte. Die Positions- und Distanzmessung basiert nicht mehr auf alten Daten, CAD-Modellen oder vage getroffenen Annahmen – die Roboter erkennen und handeln sofort und sehr präzise. So können etwa Random-Picking-Anwendungen umgesetzt werden und in der Qualitätssicherung sind 3D-Kameras ebenfalls wesentlich schneller und genauer, dazu noch weniger kompliziert im Aufbau. Gerade dort, wo Mensch und Maschine sich einen Arbeitsraum teilen, ist die von 3D bereitgestellte Schnelligkeit und Präzision sicherheitsrelevant und kann beispielsweise Schutzzäune obsolet werden lassen. Mensch und Maschine können im wahrsten Sinne des Wortes Hand in Hand arbeiten.

3D-Imaging für die Logistik

Selbstlernende Algorithmen ermöglichen eine Vernetzung der verschiedenen Geräte und Maschinen, so dass diese sich eigenständig untereinander abstimmen können. Im Logistikbereich mit vielen unerwarteten und unvorhersehbaren Ereignissen ist diese Möglichkeit besonders relevant. Sie ermöglicht aber auch eine Fertigung in Losgröße 1. Der große Vorteil liegt darin, dass 3D-Imaging nicht trainiert werden muss. Mit Hilfe dieser Technik sieht eine Maschine wie ein Mensch und lernt mit KI selbst dazu. Dadurch ermöglicht diese Technologie die einfache Interaktion und Zusammenarbeit zwischen Robotern und Menschen. Momentan erleben etwa kleine Logistikroboter einen großen Boom. Sie sind intelligent, untereinander vernetzt, fahren durchs Lager, heben und bewegen Kisten, können Objekte greifen oder zum Menschen bringen, und räumen diese Kisten und Objekte natürlich auch wieder auf.

Mit einer exakten Objekt-, Positions- und Distanzerkennung, basierend auf den 3D-Daten der Kamera, können die Roboter mittels SLAM-Kartographie ihre Umgebung sekundenaktuell erfassen und selbständig navigieren. Sie erkennen sowohl feststehende als auch bewegliche Hindernisse und vermeiden Kollisionen auch in neuen, unbekannten Situationen. Mehrere vernetze Roboter kommunizieren untereinander und stimmen ihren Handlungen ab. Sie sorgen damit selbstständig für einen reibungslosen Ablauf im Lager und eine optimale Unterstützung des Menschen und der entsprechenden Prozesse. Diese kleinen Allround-Roboter steigern die Effizienz in der Logistikkette immens. Zukünftig sind die Helfer auch als digitaler Liftboy und Zimmerservice in Hotels oder als Inventurservice in Supermärkten denkbar. Der Flughafen München testet mit „Josie Pepper“ bereits gerade einen mobilen Serviceroboter zur Information von Reisenden und begleitet sie zum richtigen Abfluggate.

Neue Anwendungen im Smart Home

Von digital überwachten Häusern und selbständig einkaufenden Kühlschränken wurde bereits sehr viel gesprochen. Die 3D-Technologie und intelligente Algorithmen eröffnen in den sogenannten Smart Homes viele neue Anwendungsmöglichkeiten. Gerade die Haussicherheit und -überwachung kann davon immens profitieren. Vieles ist bereits Realität, wie etwa Drohnen, die ein Live-Bild an das Handy des Hausbesitzers übertragen, sobald im Garten verdächtige Bewegungen erfasst werden – und es keine streunende Katze ist.

Den höchsten sichtbaren praktischen Nutzen im Alltag generiert die intelligente 3D-Technologie momentan für Staubsauger und Rasenmäher. Auch hier wurde mit 2D-Imaging bereits gute Arbeit geleistet, 3D aber macht den Unterschied. Mittels 3D-Erkennung werden Objekte nicht einfach anhand ihrer Umrisse erfasst, vielmehr kann die KI Dinge einordnen und kategorisieren. So wird der Ehering eben nicht eingesaugt, sondern als „wertvoller Schmuck“ gesichert. Und der Hundehaufen auf dem Rasen wird umfahren statt überfahren. Mittels 3D-Navigation und dem intelligenten Kartografieren der Umgebung wird zusätzlich eine strukturierte Reinigung möglich. Statt mit taktiler Sensorik auf Kollisionskurs werden Möbel, Teppiche und Bäume vorab visuell erkannt und umfahren. Ein intelligenter Rasenmäher erkennt, wo die Rasenkante endet, stoppt genau dort und realisiert auch, dass der kleine Haufen im Gras ein Igel ist, dem er ausweichen muss.

Neue Geschäftsmodelle werden möglich

Diese „Next Level“-Bildverarbeitung ermöglicht neben den technologischen Vorteilen auch neue Geschäftsmodelle. Wer heute noch hohe Summen für einen Staubsaugerroboter ausgeben muss, könnte zukünftig mit werbebasierten Leasing-Modellen viel Geld sparen. Der intelligente und vernetzte Staubsauger kennt exakt die Größe der zu reinigenden Wohnung, den Grundriss, die Marken und den Zustand der Möbelstücke sowie den individuellen Einrichtungsstil. Damit lassen sich Rückschlüsse auf das Einkommen ziehen und bei entsprechendem Einverständnis individualisierte Werbung anbieten. Ein Möbelhaus kann damit potenziellen Kunden eine Couch vorzuschlagen, die von den Maßen, dem Stil und dem Preis exakt zu ihren Wohnverhältnissen passt. Mit diesen datenbasierten Modellen wäre die Anschaffung des Staubsaugers sehr günstig, da der Hersteller seinen Gewinn mit dem Datenverkauf erzielt. Denkbar sind auch Leasing-Modelle, bei denen der Kunde pro Nutzung zahlt und dann einen entsprechenden Umfang an Werbung präsentiert bekommt.

Keine autonomen Drohnen ohne 3D-Technik

Drohnen bieten nachweislich bereits ein hohes praktisches Nutzungspotenzial für die integrierte 3D-Technologie mit KI. Keine der populären selbstfliegenden „Follow-Me“-Drohnen könnte ohne diese Kombination navigieren. Intelligente Drohnen überwachen das Wachstum in der Landwirtschaft und Hyperspektral-Drohnen können während der Ernte Steine von Kartoffeln unterscheiden. Die Überwachung von Industrieanlagen in unzugänglichem Gelände ist ohne 3D-fähige Drohnen gar nicht mehr vorstellbar, sie liefern bessere und genauere Daten als je zuvor und das in Echtzeit. Dank der Miniaturisierung ist die moderne 3D-Technik so leicht und die Verarbeitungsprozessoren so klein, dass sie auch für ultraleichte Drohnen keine Einschränkung mehr darstellen.

Den hohen Effizienz- und Innovationsgrad der Drohnen für Unternehmen spiegeln zwei kreative Praxisbeispiele: Ein Stromunternehmen etwa nutzt intelligente Drohnen für die Überwachung seiner Strommasten. Ein Techniker muss heute also nicht mehr zwingend in die Höhe klettern. Vielmehr kann er von unten eine Drohne steuern, welche die Bilder überträgt und die Daten selbstständig auswertet. Dabei misst und hält sie automatisch den korrekten Abstand und teilt dem Techniker mögliche Auffälligkeiten mit. Dieser muss also nur noch dann Sichtprüfungen durchführen, wenn Abweichungen auftreten sollten.

Eine zweite, über den Tellerrand gedachte Anwendung ist die Optimierung von Waren- und Logistikströmen eines Unternehmens basierend auf der Überwachung aus der Luft. Drohnendaten können alle Warenwege, LKW- und Förderbewegungen sowie Prozesse eines Unternehmens sehr genau aus der Vogelperspektive betrachten und virtuell simulieren. So kann erkannt werden, dass etwa die LKWs für die Anlieferung immer zu früh an der Rampe ankommen und damit für einen Stau in der Lieferkette sorgen. Mit dem Wissen der Drohnen lässt sich die innerbetriebliche Logistik hocheffizient gestalten.

Amazons Go setzt auf intelligente Kameras

Eines der jüngsten und prominentesten Beispiele für den Einsatz von 3D-Technik in Verbindung mit künstlicher Intelligenz ist Amazons Pilot-Supermarkt Go. Kunden brauchen dort kein Bargeld und müssen an keiner Kasse zahlen. Sie gehen einfach hinein, laden die gewünschten Produkte ein und gehen mit einem vollen Einkaufswagen hinaus. Der Markt ist komplett kameraüberwacht und erkennt, welche Waren ein Kunde in seinen Wagen gelegt hat. Momentan ist der Markt für Mitarbeiter von Amazon geöffnet. Er erkennt die Kunden per Gesichtserkennung und bucht direkt von der hinterlegten Kreditkarte ab. Intelligente Kameras registrieren den Gesichtsausdruck der einkaufenden Menschen. So kann ein Mitarbeiter seine Hilfe anbieten, wenn der Algorithmus einen fragenden Blick einfängt. Amazon selbst kann anhand dieser Daten sehr genau das Kundenverhalten, Reaktionen auf Produkte sowie Lauf- und Entscheidungswege analysieren und daraus gewinn- und umsatzsteigernde Rückschlüsse ziehen.

Neben industriellen und kommerziellen Anwendungen gibt es auch rein humanitäre Applikationen, wie etwa eine intelligente 3D-Brille für die Unterstützung Sehbehinderter im täglichen Leben. Die Brillen sind mit neuesten Stereokameras ausgestattet. Intelligente Algorithmen übersetzen die visuellen Signale in haptische und akustische Informationen. Über die Brille bekommt der Blinde Straßennamen, Tramlinien oder Schilder an Geschäften vorgelesen; die Audioinformation basieren auf der Erkennung von Formen, Objekten und Schriften. Positionen und Distanzen werden als haptische Rückmeldung über ein mit Vibrationsmotoren ausgestattetes Armband geliefert. Je nachdem, wo sich ein Hindernis befindet, vibriert es an einer anderen Stelle am Arm. Der Blinde lernt auf diese Weise quasi eine neue Art der Wahrnehmung, die es ihm ermöglicht, seine Umgebung vollständig zu verstehen und sich zu orientieren.

Eine neue Normalität

Das nächste Level der Bildverarbeitung hat längst begonnen. Anwendungen, die eine Kombination aus 3D-Technologie und künstlicher Intelligenz nutzen, haben längst ihren Weg in den industriellen und gesellschaftlichen Alltag gefunden. In naher Zukunft werden diese Applikationen und solche, die die Menschheit sich heute noch gar nicht vorstellen kann, eine neue Normalität beschreiben. Was vor rund 150 Jahren die Glühbirne bewirkte, könnte auch für das Potenzial von Bildverarbeitung und künstlicher Intelligenz gelten: Irgendwann wird die Industrie und der Mensch sich nicht mehr vorstellen können, wie es ohne ging.

Bildergalerie

  • Der Blinde bekommt Straßennamen, Tramlinien oder Schilder an Geschäften vorgelesen. Die Audio­Information basieren auf der Erkennung von Formen, Objekten und Schriften.

    Bild: Framos

Firmen zu diesem Artikel
Verwandte Artikel