Industrie 4.0 und Computer Vision

KI für Embedded Systeme – Der Schlüssel zu Industrie 4.0

Industrie 4.0 und Künstliche Intelligenz in der Praxis

Im Bereich der industriellen Bildverarbeitung existieren für die Erkennung von Objekten und deren Klassifizierung zwei unterschiedliche softwaretechnische Ansätze: die klassischen Methoden der Bildverarbeitung sowie KI-basierte Algorithmen, wie das Deep Learning. Können die Möglichkeiten der Deep Learning Algorithmen Industrie 4.0 Anwendungen im Anlagen- und Maschinenbau auf ein neues Level heben?

Die Aufgabenstellung für den Praxistest: Mit Deep Learning Algorithmen Objekte erkennen und klassifizieren. Deep Learning Algorithmen sind jedoch extrem rechen- und ressourcenintensiv. Wir wollten wissen, ob dieser Lösungsansatz auch mit einfacher Hardware realisierbar ist, schnelle Erkennung ermöglicht und außerdem ohne Online-Zugriff auf Cloud-Dienste bzw. Webservices auskommt. Für unseren Proof of Concept verwendeten wir als Embedded-Komponente einen Raspberry Pi 3 B+, der mit einer einfache CMOS HD Kamera verbunden wurde.

Industrie 4.0
Computer Vision, IoT und künstliche Intelligenz

Vor- und Nachteile der Lösungsansätze

1. Objekt-Klassifikation mittels klassischer Bildverarbeitung

VorteileNachteile
  • Benötigt keine Trainingsbilder mit Annotationen
  • Bewährte Technologie
  • Aufwändig zu justieren
  • Empfindlich gegenüber schwankender Helligkeit und Kontrast

2. Objekt-Klassifikation mittels Deep Learning

VorteileNachteile
  • Robust gegenüber Drehungen, schwankender Helligkeit, Kontrast etc. (falls dies beim Trainingsdatensatz berücksichtigt wurde)
  • Hohe bis sehr hohe Genauigkeiten möglich.
  • Einfache Skalierbarkeit auf weitere Objekte (Re-Training)
  • Erfordert viele Trainingsdaten, falls keine „Tricks“ verwendet werden.
  • Sehr rechenaufwendig, erfordert GPU beim Training und in der Regel auch bei der Inferenz in der Produktions-umgebung. Auf einem Embedded Controller oder Industrie-PC sind aber selten GPUs verfügbar und diese haben in der Regel eine relative hohe Leistungsaufnahme.

Unser Lösungsansatz

Bei unserer Lösung kombinieren wir beide Ansätze, die klassischen Methoden der Bildverarbeitung für die Erkennung der Objekte auf dem Bild sowie Deep Learning Algorithmen für die Klassifizierung der Objekte.

Objekt-Detektion
  • HoughCircle-Detection (OpenCV)
Objekt-Klassifikation
  • Es wurde ein speziell optimiertes Deep Learning-Netzwerk verwendet, das auch auf Rechnern mit begrenzten Ressourcen ohne GPU performant ist und trotzdem relativ hohe Genauigkeiten erzielen kann.
  • Es stand nur ein kleiner Trainings- und Testdatensatz für die 8 verschiedenen Euromünzen zur Verfügung: 1281 Fotos für Training, 707 fürs Testen
  • Da der Trainingsdatensatz sehr klein ist, wird sogenanntes Transfer Learning verwendet. Dazu wurde ein vortrainiertes Deep Learning-Netzwerk verwendet, das auf dem ImageNet Trainingsdatensatz (circa 1.2 Millionen Bilder aus 1000 Kategorien) trainiert wurde.
  • Um die Klassifikation robuster gegenüber Rotationen, Helligkeit, Kontrast etc. zu machen, wurden beim Training die Trainingsbilder zusätzlich zufällig rotiert sowie Helligkeit und Kontrast geändert (Data-Augmentation).

Ergebnisse

Die Ergebnisse können sich sehen lassen. Nicht nur die Genauigkeit der Erkennung und Klassifizierung der Testobjekte ist hoch, sondern auch die Erkennungszeit ist mit 50 ms pro Objekt nahe dem Echtzeitbereich. Somit ist dieser Lösungsansatz auch für bewegte Objekte geeignet und dies auf einer kostengünstigen Hardwarebasis.

Erzielte
Validierungsgenauigkeit
Erzielte TestgenauigkeitLaufzeit für die Klassifikation

93,3%*

93,4%*

50ms

*abhängig von den Lichtverhältnissen sowie den Kameraeinstellungen

Desweiteren ergaben sich beim Einsatz der KI-basierten Algorithmen weitere Vorteile:

  • sehr hohe Genauigkeit bei der Klassifizierung der Testobjekte
  • hohe Robustheit (weniger empfindlich gegenüber unterschiedlichen Lichtverhältnissen, oder Störobjekten die, die zu erkennenden Objekte teilweise verdeckten)
  • Einfache Erweiterbarkeit für neue Objektklassen

Wir haben unser Proof of Concept “KI für Industrie 4.0” auf dem VDMA EMINT Event im September letzten Jahres in Berlin präsentiert. Hier das Video dazu:

Im Vorfeld der Herbsttagung der VDMA – dem Verband der deutschen Maschine- und ANlagenbauer fand das 3. Startup-Event des Fachverbandes EMINT statt. Neben unserem Unternehmen hatten 3 weitere innovative Startups die Möglichkeit sich in der StartAFactory des Fraunhofer IZM den Teilnehmern in kurzen Pitches zur präsentieren. In der anschließenden Tabletop-Session konnten interessierte Unternehmer und Experten der Elektronikproduktion, Mikrotechnologie und #Photovoltaik unser Proof of Concept in Aktion zeigen und Fragen zu unserem innovativen Lösungsansatz beantworten.

Möchten auch Sie Künstliche Intelligenz in der Produktion, im Anlagenbau oder Maschinenbau einsetzen oder mehr darüber erfahren?

Schreiben Sie uns: info@aisoma.de

 

Weitere Artikel zum Thema Industrie 4.0 und Computer Vision:

Computer Vision: Object Detection and Segmentation with Mask R-CNN