7 hilfreiche Rückmeldungen bei der automatisierten Verarbeitung eines Sicherheitsdatenblatts

Wenn wir als Mensch uns ein Sicherheitsdatenblatt (SDB) anschauen, dann stellen wir sofort fest, wie das Sicherheitsdatenblatt aufgebaut ist und ob sichtbare Qualitätsprobleme bei dem Dokument vorhanden sind.

Da wir bei Datalyxt mit unseren Systemen immer die menschliche Wahrnehmung von Informationen und die Interaktion mit diesen imitieren, haben wir SdbHub diese Fähigkeiten auch relativ früh in die Wiege gelegt. Unser Ziel ist es, Unternehmen mit unseren KI-Lösungen einen digitalen Assistenten zur Seite zur stellen. SdbHub übernimmt die hochmonotonen Tätigkeiten der Datenbeschaffung aus Dokumenten.

Bedeutung von Künstlicher Intelligenz (KI) für Sicherheitsdatenblätter

Was genau bedeutet es, wenn wir sagen, ein mit KI ausgestattetes System imitiert einen Menschen und gibt qualitative Rückmeldungen bei der Verarbeitung eines Sicherheitsdatenblatts aus?

Um die Qualität der Informationen grundsätzlich beurteilen zu können, muss man zunächst die Bestandteile eines SDBs kennen:
Was ein Sicherheitsdatenblatt beinhalten soll, ist im Anhang II der REACH-Verordnung detailliert beschrieben. Nationale Angaben sind in technischen Regeln Gefahrstoffe (TRGS) 220 „Nationale Aspekte beim Erstellen von Sicherheitsdatenblättern“ näher erläutert und wurde in einem anderen Artikel bereits kurz zusammengefasst. Demnach sollten alle SDBs mehr oder weniger ähnlich strukturiert sein: 16 Abschnitte, Versionsangabe, Revisionsdatum und nicht leere, mit Informationen gefüllte Abschnitte.

Jedoch sieht die Realität anders aus, sowohl inhaltlich als auch optisch. Nachfolgend ein Auszug aus unserer Liste:

  • Zwei Sprachen: Es gibt immer wieder zweisprachige SDBs. Das ist per se nicht ein Problem. Wenn Übersetzungstexte optisch nicht von zu übersetzenden Texten getrennt wahrnehmbar sind, wird es zu einem sowohl menschlichen als auch technischen Extraktionsproblem. Die Fehlerquote steigt und die Qualität der Datenextraktion leidet. SdbHub erkennt Zweisprachigkeit und gibt dem Anwender den entsprechenden Hinweis über die Mehrsprachigkeit des Dokuments, führt die Extraktion des SDBs allerdings eingeschränkt durch.
  • Doppelspalten: Die Sinnhaftigkeit von mehrspaltigen SDBs erschließt sich nicht. Für Menschen sind diese zum Teil sehr schwer lesbar. Auch die KI hat in solchen Fällen zu kämpfen. Daher geben wir in solchen Fällen einen Hinweis auf Mehrspaltigkeit des Dokumentes aus.
  • SDB in schlechter optischer Qualität: Die meisten SDBs sind digitalisiert und deshalb zumindest informationstechnisch verarbeitbar. Hin und wieder treffen wir allerdings sehr schlecht abgelichtete SDBs an. Da hilft vermutlich nicht mal der Forensiker, der die einzelnen Buchstaben und Ziffern mühselig unterm Mikroskop rekonstruiert. SdbHub gibt in diesem Fall die höchste Fehlermeldungsstufe zurück: „Dokument ist für die automatische Extraktion ungeeignet“. Zusätzlich fragt SdbHub den Anwender, ob es sich bei dem Dokument tatsächlich um ein SDB handelt. Nicht selten kommt es nämlich vor, dass versehentlich das falsche Dokument hochgeladen wird. Der Nutzer kann daraus die nächsten Schritte für sich ableiten.
  • Fehlende Abschnitte: SdbHub führt bei jedem SDB eine initiale Qualitätsprüfung durch. Fehlende Hauptabschnitte werden identifiziert und gemeldet.
  • Fehlende Versions- oder Datumsangabe: Nicht nur Hauptabschnitte können in SDBs fehlen, sondern auch Versions- und Datumsangaben. Die initiale Qualitätsprüfung von SdbHub beinhaltet auch die Prüfung dieser Angaben. Die Fehler werden ganz genau identifiziert und ausgegeben.
  • Magische für den Menschen unsichtbare Texte: Wenn die Textfarbe der Hintergrundfarbe des Dokuments entspricht, kann der Text vom Menschen nicht wahrgenommen werden. Die Maschine nimmt solche Texte allerdings wahr, das allerdings zu einem Fehlverhalten führen würde. SdbHub erkennt solche Szenarien und gibt auch einen Hinweis für die „unsichtbaren“ Informationen.
  • Ein Dokument mit zahlreichen SDBs: Manchmal liegen dem Anwender mehrere SDBs in einem einzelnen Dokument vor. Je nach Kunden-Konfiguration wird die Extraktion durch SdbHub vorgenommen und dem Kunden eine Rückmeldung über die enthaltenen multiplen SDBs gegeben.

Die oben genannten Fälle treffen in der Praxis eher seltener auf. Trotzdem ist die Devise in SdbHub dem Anwender so viel qualitativ hochwertiges Feedback zu geben wie möglich. Mit diesen Informationen ist es möglich den nachgelagerten Prozess der Datenverarbeitung gezielt zu steuern.