Mit den drei Modulen der No-Code AI Pipeline ist es ihnen möglich direkt in die aufregende Welt der künstlichen Intelligenz einzusteigen und selber die ersten Erfahrungen mit dieser Technologie zu machen. Da die Tools alle Open Source sind und auf der eigenen Infrastruktur installiert werden können sinkt die Hürde auch für Unternehmen diese einzusetzen. Alle diese Software Module wurden intensiv getestet und befinden sich im industriellen Einsatz. Die dort gesammelten Erfahrungen und das Feedback der weltweiten Community fließt in die Weiterentwicklung der No-Code AI Pipeline ein um die einzelnen Module weiter zu verbessern. Der folgende Beitrag stellt die drei wesentlichen Module der No-Code AI Pipeline vor. Neben diesen drei Modulen gibt es weitere spannende Module die die AI Pipeline abrunden und auf die in dieser Beitragsserie weiter eingegangen wird wie z. B. die Anonymization-Api.
Die Drei Bestandteile der No-Code AI Pipeline
Die AI Pipeline besteht im Wesentlichen aus den nachfolgenden drei Bestandteilen dem Labeltool Lite, der Training Suite und der AI Pipeline Image App. Mit diesen drei Tools hat man alle wesentlichen Werkzeuge vereint ein neuronales Netz zu trainieren und eine Anwendung zu entwerfen die auf ein neuronales Netz zur Bilderkennung setzt. Neben diesen drei Tools werde ich noch eine Lösung zum Anonymisieren von Bildern vorstellen oder auch wie synthetische Trainingsdaten automatisch erstellt werden können mit ein paar wenigen Bildern eines Objektes. Also lasst uns loslegen und auf die Reise in die AI Tools begeben.
Labeltool Lite
Damit ein neuronales Netz, also die künstliche Intelligenz, lernen kann welche Informationen in einem Bild welche Bedeutung haben müssen diese Informationen in den Bildern erst einmal mit Marken sogenannten Labeln markiert werden. Dazu müssen diese Bereiche eines Bildes in der die relevante Information zu sehen ist markiert also mit einem Label in Form z. B. einer rechteckigen Box durch z. B. einen Menschen markiert werden. Diese mit Labeln versehenen Bilder sind dann die Trainingsdaten (Bild + Label) für das spätere Training der neuronalen Netze. Die Markierungen in vielen tausenden Bildern zu setzen ist sehr zeitaufwändig aber für den Erfolg also einer guten Erkennungsrate des später trainierten neuronalen Netzes sehr wichtig.
Damit das Labeln der Bilder schnell und einfach klappt unterstützt das Labeltool Lite mit seinem durchdachten Oberflächendesign diesen Prozess des setzen der Markierungen in den Bildern ideal. Auch können mehrere Menschen bzw. Mitarbeiter gleichzeitig in dem Labeltool Lite einen Trainingsdatensatz bestehend aus den Bildern noch ohne Label bearbeiten und so viele tausend Bilder zügig mit Labeln versehen.
Auch hat das Labeltool Lite die Möglichkeit ein bereits trainiertes neuronales Netz zu hinterlegen welches einem Vorschläge für Labels geben kann die der Anwender, also der Mensch, nur noch kontrollieren muss und in seltenen Fällen optimieren muss. So beschleunigt sich der Prozess des Labelns deutlich und wird qualitativ hochwertiger. Noch schneller geht es mit dem Tool für die synthetische Datengenerierung die zehntausende Trainingsdatensätze voll automatisch erzeugen kann. Mehr dazu in einem späteren Beitrag hier auf meinem Blog.
Für die Installation und Nutzung des Labeltool Lite wird keine spezielle Hardware benötigt. Sollen mehrere Mitarbeiter gleichzeitig auf das Labeltool Lite und den gleichen Datensatz zugreifen so ist die Installation auf einem zentralen Server sinnvoll. Mit dem Labeltool Lite wird die Basis an Trainingsdaten geschaffen die in einem weiteren Schritt in der Training Suite für das Training der neuronalen Netze verwendet werden.
Die nachfolgende Abbildung zeigt das Labeltool Lite in seiner aktuellen Version aus Januar 2022.
Im jetzt folgenden Kapitel wir die Training Suite vorgestellt.
Die No-Code Training Suite
Die Training Suite wird benötigt um neuronale Netze auf der Datenbasis der mit Labeln versehenen Trainingsbilder zu trainieren. Da das Training von neuronalen Netzen sehr Zeit und Energie intensiv ist bietet die Training Suite einige Vorteile bei der Zeit und der Energie einzusparen und so Kosten zu sparen. Das schont die Umwelt und die erzielten Ergebnisse sind auch deutlich besser. Um diese Vorteile auch nutzen zu können setzt die Training Suite auf bereits vortrainierte neuronale Netze aus dem TensorFlow 2 Detection Model Zoo auf. So erreichen sie in kürzester Zeit sehr gute Ergebnisse ohne zehntausende Bilder selber mit Labeln für das Training eines neuronalen Netzes erstellen zu müssen. Häufig reichen bei diesem Ansatz bereits ein paar hundert Bilder aus um schon ein neuronales Netz zu trainieren das ganz gut funktioniert. Die Zeit und Kosten für solch ein umfangreiches Training wie dies den Netzen aus dem Model Zoo zugrunde liegt können sich private Personen oder kleinere Firmen kaum leisten. So schont dieser Ansatz Ressourcen und damit die Umwelt. Auch gibt es die Möglichkeit innerhalb der Trainings Suite auf Check-Points der eigenen Trainings von neuronalen Netze immer wieder aufzusetzen was auch wiederum Ressourcen einspart. Durch die interne Verwaltung der neuronalen Netze in der Training Suite stehen diese Netze allen Anwendern zur Verfügung die Zugriff auf den Server über die Web Oberfläche haben. Die zur Verfügung gestellten neuronalen Netze können so in weiteren Anwendungen verwendet werden. Die Verwendung der bereits trainierten neuronalen Netzes über das Netzwerk in z. B. eigenen Web-Anwendung wird durch die integrierte API der Training Suite ganz einfach möglich. So können Entwickler die sich z. B. mit NodeJS gut auskennen in wenigen Stunden eine funktionieren Anwendung schreiben die die bereits trainierten neuronalen Netze verwendet. Solch eine Beispielanwendung ist die AI Image APP die im nachfolgenden Abschnitt vorgestellt wird.
Die nachfolgende Abbildung zeigt die Training Suite in ihrer aktuellen Version aus Januar 2022.
AI Pipeline Image App
Die Entwicklung der AI Pipeline Image App wurde notwendig, da die Vielzahl der Anwender in der bereits erwähnten AI Challenge 2021 bei BMW und im weiteren Verlaufe des Jahres 2021 um eine einfacher zu bedienen Web Anwendung gebeten haben an Stelle der SWAGGER API der Training Suite. So hat mein Kollege Joscha E. diese kleine Web Anwendung innerhalb ein paar Stunden auf Basis von NodeJS erstellt und war so nett diese der weltweiten Community zur Verfügung zu stellen. Mit dieser AI Image App ist es jetzt möglich ein Bild hoch zu laden, dieses Bild einem bestimmten bereits trainierten neuronalen Netz zur Bewertung zu übergeben und sich das Ergebnis anzeigen zu lassen. Das Ergebnis also die Wahrscheinlichkeiten und Anzahl gefundener Klassen (erkannten Objekte im Bild) kann auch als CSV-Datei zur weiteren Verwendung herunter geladen werden.
Die Kombination von Training Suite und der AI Image App macht die AI Pipeline so attraktiv da die Komplexität für die Auswertung von Bildern so deutlich gesenkt wurde. Es sind somit keine Vorkenntnisse zum Thema AI beim Anwender mehr notwendig.
Die nachfolgende Abbildung zeigt die AI Pipeline Image App in ihrer aktuellen Version aus Januar 2022.
Vorteile der No-Code AI Pipeline
Einer der größten Vorteile dieser No-Code AI Pipeline ist somit, dass mit ihr auf ganz einfacher Art und Weise erste Erfahrungen zum Thema AI gesammelt werden können. In einem weiteren Schritt kann sich jeder Anwender anschließend Gedanken darüber machen für was alles diese neue Technologie in jeweiligen Umfeld wie dem Berufsleben oder eben privat einsetzen kann.
So werden falsche Erwartungen an eine künstliche Intelligenz ganz schnell revidiert und Ängste können durch die eigene Verwendung und somit Beurteilung dieser Technologie live beim Einsatz abgebaut werden. Es werden keine speziellen Vorkenntnisse im Beriech Machine Learning, der Mathematik oder Statistik benötigt. Lediglich ein Interesse an Daten und die Bereitschaft sich mit solch einer neuen Technologie auseinander setzen muss der einzelne mitbringen. Die Bausteine der AI Pipeline sind Open Source und die Anforderungen an die Hardware überschaubar. Dank der modernen Entwicklung kann der zentrale Server auf dem die Pipeline eingerichtet wird durch Skalierung der Anzahl der GPUs den eventuell wachsenden Anforderungen angepasst werden. Die Kosten sind transparent, gut planbar und die Daten verbleiben in der Hoheit jedes Einzelnen ohne z. B. das eigene Firmennetzwerk verlassen zu müssen. Die Vorteile liegen damit ganz klar auf der Hand und mit dieser Schritt für Schritt Anleitung werde ich ihnen beschreiben wie die Installation und der Einsatz dieser No-Code AI Pipeline möglich ist.
Meine persönliche Meinung zum Thema Cloud und die damit einhergehenden ganz offensichtlichsten Vorteile müssen individuell bewertet und die eventuellen Risiken den Kostenvorteilen gegenüber gestellt werden.
Artikelübersicht - Wie setze ich die AI Pipeline auf:
AI Pipeline - Vorstellung der AnleitungAI Pipeline - Die No-Code AI Pipeline ein Überblick
AI Pipeline - Die drei Bestandteile der No-Code AI Pipeline
AI Pipeline - Grundlagen zum Thema AI Hardware
AI Pipeline - Hardware Beispiel-Konfigurationen
AI Pipeline - Software Installation der No-Code AI Pipeline
AI Pipeline - Labeltool Lite - Installation
AI Pipeline - Labeltool Lite Vorbereitung der Trainingsdaten
AI Pipeline - Labeltool Lite - Bedienung
AI Pipeline - Tensorflow-Object-Detection-Training-GUI - Installation
AI Pipeline - Tensorflow-Object-Detection-Training-GUI - Ausführen
AI Pipeline – Tensorflow-Object-Detection-Training-GUI - Bedienung
AI Pipeline - Tensorflow-Object-Detection-Training-GUI - Inference API testen des neuronalen Netzes
AI Pipeline - AI Image App Einrichten und Bedienen - Teil 1-2
AI Pipeline - AI Image App Einrichten und Bedienen - Teil 2-2
AI Pipeline - Trainingsdaten Download
AI Pipeline - Bilder und Video Anonymization API
Hallo, ich habe ihre Anleitung befolgt und bekomme im letzten Schritt leider immer folgende Meldung im Terminal: bash <(wget -qO-…
Hi Dennis, vielen Dank für den Hinweis, ich habe die URLs angepasst so das diese wieder gehen. Ich bin gespannt…
Ich weiss, es ist noch im Aufbau. Aber hier ist ein Broken Link: https://www.ai-box.eu/smurf_training_data_small.zip Freue mich drauf, die ganze Serie…