Data Science als Schlüssel für erfolgreiche KI

Medizinische Assistenzsysteme oder Software-Lösungen zur vorausschauenden Wartung von Industrieanlagen versprechen großen Nutzen. Sie basieren auf Daten, die mit Methoden der Künstlichen Intelligenz (KI) ausgewertet werden. Voraussetzung ist ein umfassendes Datenmanagement.

Große Mengen an Daten plus intelligente Algorithmen ergeben nutzbringende KI-Anwendungen. Was ist falsch an dieser Rechnung?

Große Datenmengen allein genügen leider nicht. Zwar werden gerade für das Lernen mit tiefen Netzen große Trainingsdaten benötigt, aber dies erhöht natürlich auch den Aufwand der Datenerfassung, -vorbereitung und des Trainings. Daher kommt es darauf an, die "richtigen" Daten als Trainingsdaten zur Verfügung zu haben.

So sollten die Trainingsdaten, beispielsweise für die Bilderkennung, natürlich die zu identifizierenden Objekte enthalten. Aber eben auch Negativbeispiele in allen möglichen beziehungsweise auftretenden Variationen. Hierbei sind Bias (Voreingenommenheit) und Diskriminierung schon bei der Datenauswahl zu vermeiden.

In der Literatur ist eine ganze Reihe von Beispielen für Bias und Diskriminierung beschrieben, die zeigen, welche Auswirkungen dies haben kann.

Wie werden aus Daten brauchbare Daten? Worauf kommt es beim Data Engineering an?

Zunächst müssen überhaupt geeignete Daten erfasst werden, die das zu bearbeitende Problem repräsentieren. So sollten für eine Anwendung im Bereich Predictive Maintenance eben auch Fehlerzustände, und nicht nur normale Betriebsdaten erfasst werden. Sind Daten erfasst, müssen sie aufbereitet werden.

Dies umfasst die Bereinigung wie das Erkennen und Entfernen fehlerhafter Werte, die Verknüpfung mit anderen Daten und gegebenenfalls die Annotation der Daten. Sowohl die Daten als auch die Erfassungs- und Verarbeitungsprozesse sollten dokumentiert und durch Metadaten beschrieben werden, um eine Nachvollziehbarkeit zu gewährleisten. Der Aufwand dieser Vorbereitung kann in KI-Projekten bis zu 80 Prozent des Gesamtaufwands betragen.

Data Engineering stellt die Methoden und Infrastrukturen für diese Prozesse zur Verfügung und umfasst Datenmanagement, Datenintegration und Datenaufbereitung – beispielsweise durch Datenbanksysteme, Big Data-Systeme oder Data Cleaning-Werkzeuge.

Welche Fähigkeiten benötigen Entwicklerinnen und Entwickler, um vertrauenswürdige KI-Anwendungen zu schaffen?

Neben Methodenkenntnissen aus dem Bereich des maschinellen Lernens beziehungsweise der Künstlichen Intelligenz sind dies insbesondere Kenntnisse zur Datenmodellierung, -transformation und -integration, aber auch Kenntnisse der Statistik, um Eigenschaften der Daten und die Qualität der Ergebnisse bewerten zu können.

Ferner sind Kenntnisse aus den Bereichen Ethik und Recht hilfreich, um verantwortungsvoll mit den Daten umgehen zu können. Und natürlich ist auch umfassendes Anwendungswissen unabdingbar. Dies zeigt schon, dass es sich nicht mehr allein um klassische Softwareentwicklung handelt.

Vielmehr sind dies Anforderungen, die einen interdisziplinären Zugang erfordern: Anwendungsexpertinnen und -experten benötigen zunehmend sogenannte Data Literacy-Expertise und Data Science-Fachleute müssen auch die Anwendungsdomänen verstehen. Hier wird sich sicher ein großer Bedarf an Weiterbildungsangeboten entwickeln.

KI und Digitaler Zwilling: Turbo der Industrie

Data Science als Schlüssel für erfolgreiche KI

TU Ilmenau

89 Prozent weniger Energie: So wird KI endlich grün

Mehr Produktivität, mehr Wertschöpfung: So gelingt die KI-Disruption!

KI-Agent als Datendieb: Erkenntnisse aus dem Hugging-Face-Vorfall

Zukunftssicheres Maschinendesign beginnt mit Daten

So hängen KI-Innovation und Quantum-Readyness zusammen

Ver- oder Misstrauen schüren: KI-Kennzeichnung wird Teil der Markenstrategie

KI, Passwörter, öffentliches WLAN: Cybersicherheit scheitert am Alltag

Paradigmenwechsel bei Software: Chatbots ersetzen Menüs und Formulare

Rezension: „Industrial AI: from Pilot to Profit“ von Boris Scharinger

KI und Digitaler Zwilling: Turbo der Industrie

BECKHOFF Automation GmbH & Co. KG

Conrad Electronic SE

Hellma GmbH & Co. KG

ILME GmbH

VEGA Grieshaber KG

Helmholz GmbH & Co. KG

Finder GmbH

ATVANTAGE GmbH