Effiziente und sichere Prozesse dank KI-gestützter Datenverarbeitung vor Ort
Künstliche Intelligenz direkt auf lokalen Geräten ("Edge Devices") zu nutzen bietet zahlreiche Vorteile für industrielle Anwendungen. Durch die Verarbeitung von Daten vor Ort anstatt in der Cloud entfallen Latenzen und Datenschutzrisiken. in-tech setzt diese Technologie ein, um industrielle Prozesse effizienter zu gestalten und gleichzeitig die Datensicherheit zu erhöhen. Der reduzierte Datenverkehr erleichtert zudem die Integration in bestehende Infrastrukturen und optimiert die Prozesssteuerung.
Moderne neuronale Netze haben klassische Verfahren der Bilderkennung längst überholt. Heute ermöglichen leistungsstarke Edge-KI-Systeme eine hochpräzise Bilderkennung auch ohne Cloud-Anbindung.
Unser Showcase zeigt, wie ein autonomes ADAS-System Verkehrsschilder erkennt und die darauf sichtbaren Geschwindigkeitsvorgaben einhält. Dabei kommen drei zentrale Technologien zum Einsatz:
Ein Edge-KI-System mit angebundener Kamera zur Erkennung von Verkehrszeichen und Übermittlung der erkannten Geschwindigkeit an ein MBSE-Modell.
Ein Mini-Rechner mit dem MBSE-Modell zur Sicherstellung der korrekten Reaktion auf die erkannte Geschwindigkeitsvorgabe.
Ein Gaming-/Simulationsrechner, der mit der Simulationsumgebung CARLA die Verkehrssituation und die Einhaltung der Geschwindigkeit durch einen Tempomaten darstellt.
Um industrietauglich und für Produktivsysteme einsetzbar zu sein, erfüllt die Showcase-Hardware folgende Kriterien:
Formfaktor: Kompakte Bauweise zur Integration in Maschinen und Anlagen.
Rechenleistung: Genügend Speicher und GPU-Kapazität für multimodale Modelle und Echtzeitanwendungen.
Software-SDK: Kompatibilität mit KI-Stacks wie NVIDIA CUDA.
Zum Einsatz kommt ein NVIDIA Jetson Orin NX, der die erforderlichen Leistungsmerkmale bietet und eine Echtzeit-KI-Modellverarbeitung ermöglicht.
Die Architektur basiert auf CUDA, einer parallelen Computing-Plattform von NVIDIA. Diese ermöglicht es, Grafikprozessoren für rechenintensive Aufgaben wie KI-Modelle zu nutzen. Zur Bildverarbeitung wird OpenCV eingesetzt, um Videoströme in Einzelbilder zu zerlegen und der KI weiterzugeben. Die KI-Erkennung erfolgt mit spezialisierten Python-Bibliotheken wie Torch, wodurch sowohl maschinelles Lernen als auch die Anwendung vortrainierter neuronaler Netze realisiert wird.
Diese Architektur erlaubt ein schnelles Prototyping für KI-Anwendungen. Kundenanforderungen können in einem Minimal Viable Product (MVP) umgesetzt und demonstriert werden. Anschließend kann die MVP-Anwendung für den Serieneinsatz auf kostengünstigere Hardware portiert werden. Dies erfolgt durch Modelloptimierungstechniken wie Quantifizierung, Distilling, Pruning oder OBD, um das KI-Modell effizienter zu gestalten.
Das im Showcase verwendete Modell basiert auf YOLOv5, einem vortrainierten Modell für Objekterkennung. Zur Anpassung an die spezifische Aufgabe wurde Transfer-Learning genutzt, um das Modell auf Verkehrszeichen zu optimieren. Dies ermöglicht ein effizientes Feintuning mit geringem Datenaufwand und verkürzten Trainingszeiten.
Eine wichtige Plattform für vortrainierte Modelle ist Hugging Face, die eine breite Auswahl an Modellen für Text- und Bildverarbeitung bietet. Durch Transfer-Learning können diese Modelle für spezifische industrielle Anwendungsfälle angepasst werden.
Klassische KI-basierte Bilderkennung nutzt fest trainierte Kategorien und ist bereits in vielen Anwendungsgebieten etabliert. Die jüngste Entwicklung multimodaler Large Language Models (LLMs) erlaubt nun die Kombination von Bilderkennung mit sprachlicher Beschreibung. Dies ermöglicht ein semantisches Bildverständnis und komplexe Anwendungen, die visuelle und sprachliche Informationen vereinen.
Ein prominentes Beispiel ist Gemma 3 von Meta, das sich durch On-Edge-Fähigkeiten und flexible Modellgrößen auszeichnet. Durch Retrieval-Augmented Generation (RAG) kann Gemma 3 mit domänenspezifischem Wissen erweitert werden, um in spezialisierten Industriebereichen präzise Fachbegriffe und Prozessabläufe zu interpretieren.
Die Fortschritte in der Edge-KI erschließen neue Möglichkeiten für den Maschinen- und Anlagenbau. Neben der Personenerkennung erlaubt semantische Bilderkennung nun auch materialabhängige Konfigurationsaufgaben und Qualitätskontrollen auf einem neuen Niveau. Mit Edge-KI lassen sich industrielle Prozesse intelligenter, sicherer und effizienter gestalten, während gleichzeitig Datenschutz- und Latenzprobleme minimiert werden.
in-tech unterstützt Unternehmen dabei, diese Technologien gewinnbringend in ihre Produkte und Lösungen zu integrieren.
Autor:
Klaus Wiltschi
Director Smart Industry Germany