OCR neu gedacht Edge Learning für eine schnelle und genaue Zeichenerkennung

COGNEX Germany, Inc.

Mit seinem Bildverarbeitungssystem In-Sight 3800 bietet Cognex Anwendern eine leistungsfähige Option für die Realisierung schneller, präziser Prüfanwendungen auf Basis von Künstlicher Intelligenz an.

Bild: iStock, CoffeeAndMilk
08.05.2024

Edge Learning ist eine benutzerfreundliche Form der Künstlichen Intelligenz, mit der die Lieferkette schnell und zuverlässig mit optischer Zeichenerkennung automatisiert werden kann. Verglichen mit regelbasierten OCR-Systemen ist Edge Learning jedoch überlegen und einfacher zu konfigurieren als Deep-Learning-basierte Systeme.

Sponsored Content

Viele Branchen sehen sich mit zunehmenden Compliance-Anforderungen, der Nachfrage der Verbraucher nach detaillierten Verpackungsinformationen auf Losebene und dem Wettbewerbsdruck in Bezug auf Geschwindigkeit und Effizienz der Lieferkette konfrontiert. Angesichts strenger Vorschriften zur Rückverfolgbarkeit und zum Schutz vor Fälschungen hat die Pharmaindustrie eine Vorreiterrolle bei der Nutzung der optischen Zeichenerkennung (Optical Character Recognition, OCR) zur Gewährleistung der Sicherheit über die gesamte Lieferkette hinweg übernommen. Dies erforderte erhebliche Investitionen, den Aufbau von Fachwissen und einen langen Lernprozess.

Angesichts unterschiedlicher Schriftarten und Trägermaterialien, sowie der komplexen visuellen Umgebung von Fertigungs- und Logistiklinien war die Automatisierung von OCR-Applikationen schon immer eine Herausforderung, die nur mit geschulten Automatisierungsingenieuren, hohem Zeiteinsatz und einem beträchtlichen finanziellen Engagement zu lösen war. Selbst bei bester Leistung konnten herkömmliche OCR-Systeme in puncto Genauigkeit allerdings nie annähernd 100 Prozent erreichen, was manuelle Eingriffe erforderte und den Durchsatz einschränkte. Die Anforderungen an Geschwindigkeit und Genauigkeit von Hochgeschwindigkeits-Lieferketten zeigen nun die Grenzen der herkömmlichen OCR auf. Edge Learning, eine benutzerfreundliche Form der KI, bietet hingegen eine schnelle und zuverlässige Möglichkeit zur Automatisierung von Lieferketten mit OCR.

Anwendungsfälle und Herausforderungen

OCR kommt bereits seit langer Zeit in verschiedensten Anwendungen zum Einsatz. Dabei haben sich vier wesentliche Einsatzfelder herauskristallisiert:

  1. Das Auffinden und Verifizieren alphanumerischer Zeichen

  2. Die Umwandlung von Codes in eine digitale Form, mit der sich jedes Teil oder Produkt in der Lieferkette verfolgen lässt

  3. Die Bestätigung, dass der gedruckte Code mit dem Teil oder Produkt und dem Barcode übereinstimmt

  4. Die Überprüfung, ob der entsprechende Code korrekt gedruckt wurde

Trotz aller Praxistauglichkeit bringen herkömmliche OCR-Systeme gewisse Herausforderungen bei ihrer Nutzung mit sich. So erfordern sie eine präzise Beleuchtung und müssen mit unterschiedlich reflektierenden Materialien, einer großen Designvarianz von Verpackungen sowie mit teilweise unsauberen Drucken zurechtkommen. Wird auch nur eine dieser Bedingungen nicht richtig erfüllt, so erhöht sich die Fehlerquote.

Edge Learning hat das Thema OCR verändert, indem es sowohl die Geschwindigkeit als auch die Genauigkeit verbessert und eine einfachere Anwendung in einer größeren Anzahl von Branchen und Situationen ermöglicht.

Intelligentere KI für einfachere OCR

Mit Hilfe von Edge Learning können hochentwickelte KI-Algorithmen auf die spezifischen Anforderungen von Hochgeschwindigkeits-Lieferketten ausgerichtet werden, so dass OCR schnell und präzise ist, einfach eingesetzt und schnell trainiert werden kann.

Herkömmliche regelbasierte OCR kann unter idealen Bedingungen eine Genauigkeitsrate von bis zu 98 Prozent erreichen. Bei den Mengen, die in modernen Lieferketten gehandhabt werden, führt diese Rate immer noch zu vielen Ausschussteilen, was den Gesamtdurchsatz verringert.

Vortrainierte Edge-Learning-Algorithmen übertreffen diese Genauigkeitsrate, denn sie sind auf die Herausforderungen beim Lesen von Text unter den Bedingungen von Fertigungs-, Prüf- und Logistiklinien zugeschnitten, die mit hoher Geschwindigkeit arbeiten. Die Edge-Learning-Verarbeitung wird dabei auf dem Gerät selbst durchgeführt, direkt an der Fertigungs- beziehungsweise Logistiklinie, ohne dass eine Kommunikation mit einem anderen Prozessor erforderlich ist. Dies führt zu Geschwindigkeitsvorteilen gegenüber herkömmlichen OCR-Systemen.

Komplexere KI-gestützte Deep-Learning-Algorithmen sind ebenfalls in der Lage, OCR durchzuführen. Sie erreichen unter passenden Bedingungen eine Genauigkeit von nahezu 100 Prozent und können jede Art von Text lesen lernen. Ihr Nachteil: Sie sind zu langsam für den unmittelbaren Einsatz an Fertigungs- beziehungsweise Logistiklinien, erfordern hochentwickelte Prozessoren sowie umfangreiches Fachwissen bei der Implementierung. Für die jeweilige Anwendung vorab trainierte Edge-Learning-Tools erreichen aufgrund ihrer Spezifität die Genauigkeit von generalisierten Deep Learning-Systemen und sind dabei in der Lage, die von der Industrie geforderten Geschwindigkeiten zu erzielen.

Die herausragende Geschwindigkeit und Genauigkeit von Edge-Learning-Tools wird dabei im Idealfall durch eine hochentwickelte Hardware wie dem Bildverarbeitungssystem In-Sight 3800 von Cognex gewährleistet. Diese Smart-Kamera verfügt über einen leistungsstarken Sensor, eine integrierte Beleuchtung, ein Autofokus-Flüssiglinsen-Objektiv für eine schnelle Fokussierung und hohe Geschwindigkeiten sowie einen integrierten Prozessor. Ihre HDR+-Funktion ermöglicht verkürzte Belichtungszeiten, wodurch sich Anwendungen mit schnelleren Liniengeschwindigkeiten realisieren lassen. Das kleine Gehäuse des In-Sight 3800 ist unempfindlich gegen Vibrationen. In-Sight 3800 ist einfach zu platzieren, mit Strom zu versorgen und mit einer Fertigungs- beziehungsweise Logistiklinie zu verbinden, um Bilder zu erzeugen, die gut für die Edge-Learning-OCR geeignet sind.

Trainingsaufwand reduziert

Herkömmliche regelbasierte OCR-Bildverarbeitungssysteme haben einen hohen Programmieraufwand bei der Einrichtung. Sie erfordern Zeit, Fachwissen und eine Neuprogrammierung, wenn sich die Anforderungen ändern.

Im Gegensatz dazu werden Deep Learning-basierte Systeme trainiert, indem man ihnen spezifische, mit Tags versehene Bilder der entscheidenden Merkmale vorlegt. Deep Learning kann erstaunliche Fähigkeiten entwickeln, um feine Unterscheidungen zu treffen und Texte unter einer Vielzahl von schwierigen Bedingungen exakt zu lesen. Um diese Genauigkeit zu erreichen, können jedoch Hunderte oder sogar Tausende von markierten Bildern für das Training erforderlich sein.

Für die vortrainierte Edge-Learning-OCR reicht dagegen bereits eine kleine Zahl an Bildern zum spezifischen Anwendungsfall aus, um die Fähigkeit zu entwickeln, die gewünschten Schriften zu lesen. Für dieses spezifische Training der OCR ist zudem kein spezielles Wissen über Bildverarbeitung oder KI-Algorithmen erforderlich, sondern lediglich die Kenntnis der erforderlichen OCR-Aufgabe.

Einfache Implementierung

Auch in Bezug auf die Implementierung bieten Edge Learning-basierende OCR-Systeme Vorteile im Vergleich zu regelbasierten oder Deep-Learning-Bildverarbeitungssystemen. So sind damit weder unterschiedliche Schriftenbibliotheken noch detaillierte Analysen der möglichen Fehllesung verschiedener Symbole nötig.

Herkömmliche OCR-Programme verwenden eine Reihe spezifischer Techniken, um die Gefahr der Fehllesung eines Symbols zu verringern, zum Beispiel spezielle Schriftenbibliotheken oder eine Feldeinteilung, die eine sorgfältige Definition jeder möglichen Stelle in einem Code und die Festlegung des Typs erfordert, so dass zum Beispiel die Ziffer „8“ in einem definierten numerischen Feld nicht fälschlicherweise als ein „B“ gelesen werden kann.

Wenn die Edge-Learning-OCR einen Fehler macht, lernt sie durch eine einfache Korrektur durch den Bediener, ähnliche Fehler in Zukunft zu vermeiden. Sie lernt von selbst, welche Merkmale für Genauigkeit sorgen, ohne spezielle Programmierung, Feldeinteilung oder andere zeitaufwendige Verfahren.

KI-Optionen integriert

Mit seinem Bildverarbeitungssystem In-Sight 3800 bietet Cognex Anwendern eine leistungsfähige Option für die Realisierung schneller, präziser Prüfanwendungen auf Basis von Künstlicher Intelligenz an. Das für Hochgeschwindigkeits-Produktionslinien konzipierte System stellt ein umfangreiches Vision-Toolset, leistungsstarke Bildverarbeitungsfunktionen und eine flexible Software zur Verfügung, um vollständig integrierte Lösungen für eine breite Palette von Prüfanwendungen zu liefern. Ein wesentliches Element des In-Sight 3800 ist der umfangreiche Satz an Bildverarbeitungswerkzeugen, die sowohl die auf KI-basierende Edge-Learning-Technologie als auch traditionelle regelbasierte Algorithmen umfassen.

Mit Hilfe von In-Sight 3800 lassen sich somit zahlreiche Anwendungen zum Lesen von Klarschrift und zur Fehlererkennung an Codes in unterschiedlichsten Branchen wie unter anderem in den Bereichen Automotive, Lebensmittelproduktion, Logistik und vielen weiteren schnell und zuverlässig realisieren. Auf diese Weise steht Anwendern eine effiziente Möglichkeit zur Verfügung, die Rückverfolgbarkeit von Produkten entlang der Lieferketten mit OCR zu maximieren.

Bildergalerie

  • Das Bildverarbeitungssystem In-Sight 3800 von Cognex arbeitet mit KI-basierenden Edge-Learning-Tools und traditionellen regelbasierten Algorithmen und ermöglicht damit leistungsfähige Lösungen, unter anderem zum schnellen Lesen von Zeichen.

    Das Bildverarbeitungssystem In-Sight 3800 von Cognex arbeitet mit KI-basierenden Edge-Learning-Tools und traditionellen regelbasierten Algorithmen und ermöglicht damit leistungsfähige Lösungen, unter anderem zum schnellen Lesen von Zeichen.

    Bild: Congex

  • Der erste Teil des Anlernens bei Edge Learning-Systemen erfolgt anhand eines für die industrielle Automatisierung optimierten Datensatzes, der Anwender ergänzt den zweiten Teil um Bilder seines spezifischen Anwendungsfalls.

    Der erste Teil des Anlernens bei Edge Learning-Systemen erfolgt anhand eines für die industrielle Automatisierung optimierten Datensatzes, der Anwender ergänzt den zweiten Teil um Bilder seines spezifischen Anwendungsfalls.

    Bild: Congex

  • Edge Learning ist insbesondere für Aufgabenstellungen in den Bereichen Klassifizierung, Montageprüfung und Zeichenlesen geeignet.

    Edge Learning ist insbesondere für Aufgabenstellungen in den Bereichen Klassifizierung, Montageprüfung und Zeichenlesen geeignet.

    Bild: Congex

  • Das Lesen von Codes auf Lebensmittelverpackungen oder auf Haushaltsprodukten wie Waschmitteln sind nur zwei von vielen typischen OCR-Anwendungsfällen.

    Das Lesen von Codes auf Lebensmittelverpackungen oder auf Haushaltsprodukten wie Waschmitteln sind nur zwei von vielen typischen OCR-Anwendungsfällen.

    Bild: Congex

  • Präzise Lebensmittelkennzeichnung durch diese OCR-Technologie ermöglicht eine zuverlässige Rückverfolgbarkeit entlang der Lieferkette.

    Präzise Lebensmittelkennzeichnung durch diese OCR-Technologie ermöglicht eine zuverlässige Rückverfolgbarkeit entlang der Lieferkette.

    Bild: Congex

Firmen zu diesem Artikel
Verwandte Artikel