Mit GANs automatisiert ein Sicherheitsdatenblatt verfassen | KI-Experiment

Seminararbeit von Florian Rottach 2018 (FZI&KIT) – Data Science and Real-Time Big Data Analytics

Im Bereich des maschinellen Lernens erzielten neue Methoden wie Deep Learning in den letzten Jahren enorme Fortschritte, was sich besonders bei der Klassifizierung von Daten zeigt. Die verwendeten Modelle werden durch Anpassungen immer präziser und kategorisieren vorliegende Daten mit abnehmendem Fehler.

Eine bekannte Herausforderung, die beim überwachten Training auftreten kann, ist der Mangel an klassifizierten Daten. Daraus resultiert, dass der Trainingssatz nicht umfangreich genug ist, um der Lernmaschine alle notwendigen Parameter mitzugeben. Im Zuge dessen wurden Lernverfahren entwickelt, welche es ermöglichen Daten zu erzeugen, welche unter anderem als Trainingsdaten verwendet werden können.

Anstelle von Sammlung, Extraktion und Transformation beliebiger Daten, ist somit die Idee, die gewünschten Instanzen gezielt herzustellen. Hierzu werden generative Modelle verwendet, welche aus vorgegebenen Daten, ähnliche, aber komplett neue Instanzen generieren können. In der Vergangenheit haben diese Ansätze bislang keine durchbrechenden Erfolge verzeichnet, was vor allem an der Struktur bisheriger Methoden liegt. Im Rahmen dieser Hausarbeit werden Generative Adversarial Networks (GANs) vorgestellt, welche deutlich bessere Ergebnisse im Vergleich zu bisherigen Methoden mit sich bringen. Insbesondere treibt das effektive Erzeugen neuer Daten die Umsetzung von Kreativität im Bereich des maschinellen Lernens voran.

Diese Kreativität bei maschinellem Lernen kann ein grundlegender Faktor zur Umsetzung von künstlicher Intelligenz, ähnlich zu der des Menschen, sein. Dies bietet die Möglichkeit, verschiedenste gestaltende Aufgaben auf diese Modelle zu übertragen. So könnte man sich beispielsweise vorstellen, dass selbstständig ein Buch geschrieben wird, welches auf ähnlichen Werken basiert.

Bislang wurden Menschen vor allem dadurch von intelligenten Maschinen abgegrenzt, dass diese Kreativität besitzen und völlig neue Ideen und Ansätze erarbeiten können. Durch generative Modelle sind KI-Systeme jedoch zunehmend in der Lage, diese Fähigkeit zu adaptieren. Dies wirft speziell die Frage auf, welche Konsequenz aus der Tatsache folgt, dass künstlich erstellte Daten nicht mehr von den realen zu unterscheiden sind.

Auszug aus der Seminararbeit von Florian Ottach

Die Frage, die sich daraus für uns ergibt, ist folgende: Können wir automatisiert mit Künstlicher Intelligenz ein künstliches SDB erstellen, das Inhaltlich und optisch einem echten SDB nahekommt? Wir wissen auch, dass das generierte SDB der Plausibilitätsprüfung nicht standhalten wird, aber das ist ein Thema für die Zukunft. Uns geht es darum, die Potentiale von GANs für das Thema SDBs herauszufinden, so dass wir diese gezielt einsetzen können. Nun, die Arbeit von Florian ist eine hervorragende Grundlage. Er hat gezeigt, dass dieser Ansatz für die Generierung von handschriftlichen Zeichensätzen super funktioniert.

Wir werden in der Zukunft das Thema weiter verfolgen und sind gespannt auf die Erkenntnisse, die wir in diesem Zusammenhang gewinnen werden.