Top-News

Neue Möglichkeiten der KI-basierten Datenqualitätsprüfungen

Headerbild mfür Datenanalyse und KI

Ein Large Language Model (z. B. ChatGPT) versteht Sprache, Kontext, Einheiten, Relationen und kann dadurch Daten „wie ein Mensch“ prüfen – damit ergeben sich ganz neue Möglichkeiten der Datenqualitätsprüfung in PIM und MDM.

Klassische Datenqualitäts-Regeln vs. KI-gestützte Kontextanalyse

Mit Standard-Datenqualitätsmodulen werden Regeln definiert, die dann auf ein oder mehrere Attribute angewendet werden. Dies sind in der Regel Prüfmethoden wie „Ist der Wert leer“, „Ist der Text zu kurz“, „Wenn Attribut A gefüllt, dann kann nicht Attribut B auch gefüllt sein“ oder „Entspricht der Wert folgender Regel“.

Mit Künstlicher Intelligenz (KI) ergeben sich völlig neue Möglichkeiten. Unlogische Werte werden auch ohne definierte Regeln erkannt, wie z.B. „Wenn Akkuschrauber 18V hat, dann wirken 2 Nm Drehmoment unplausibel“. Außerdem kann identifiziert werden, ob der Text doppelte, aber widersprüchliche Aussage enthält, wie z.B. „Der Text spricht von Edelstahl, die Materialangabe ist aber Kunststoff“ oder es wird erkannt, dass ein Produkt mit der angegebenen Farbe Schwarz visuell blau abgebildet ist.

Anbindung LLM an das PIM-/MDM-System

Voraussetzung ist dabei natürlich, dass das LLM sinnvoll mit dem PIM/MDM-System verbunden ist, und entsprechende Prompts generiert, abgeschickt und das Ergebnis wieder verarbeitet werden kann.

Dabei gibt es vier typische Integrationswege:

  • API-basierte Prüfung einzelner Datensätze (On-Demand-Check)
  • Batch-Prüfung kompletter Produktgruppen (nächtliche Jobs)
  • Event-basierte Prüfung (Onboarding neuer Artikel)
  • Kombination mit bestehender DQ-Engine (Regeln + KI-Ergebnisse)

Risiken und Grenzen beim KI-Einsatz in der Datenqualitäts-Prüfung

Bei aller berechtigten Euphorie über die neuen Möglichkeiten darf man die Risiken und Grenzen beim Einsatz von KI in der Datenqualitäts-Prüfung nicht ausblenden. KI-Systeme können halluzinieren, also inhaltlich falsche oder nicht belegbare Ergebnisse erzeugen. Deshalb müssen sämtliche Resultate fachlich validiert werden. Zudem sind KI-Verfahren nicht dafür geeignet, bestehende Werte automatisch zu überschreiben oder verbindlich zu ersetzen; sie sollten stets als unterstützendes Instrument verstanden werden. Ein weiterer zentraler Aspekt ist der Datenschutz, denn sensible Daten müssen konsequent geschützt und regulatorische Vorgaben eingehalten werden.

Darüber hinaus entscheidet die Qualität des Promptings maßgeblich über die Güte der Prüfergebnisse – unklare oder unscharfe Anweisungen führen zwangsläufig zu unzuverlässigen Resultaten. Nicht zuletzt müssen die Fachabteilungen die erzeugten Ergebnisse nachvollziehen und einordnen können, weshalb Transparenz über Vorgehensweise und Entscheidungslogik der KI zwingend erforderlich ist.

KI als Ergänzung bestehender Datenqualitäts-Methoden

Vor diesem Hintergrund empfehlen sich für eine erfolgreiche Einführung einige essenzielle Schritte. Der Einstieg sollte bewusst in klar abgegrenzten Pilotbereichen erfolgen, etwa bei Top-Sellern oder besonders kritischen Produktgruppen, um Erfahrungen zu sammeln und Risiken zu minimieren. KI-gestützte Prüfungen sollten dabei als Ergänzung und nicht als Ersatz etablierter Methoden implementiert werden. Ein besonderer Fokus sollte auf einer klaren Governance liegen, einschließlich definierter Freigabeprozesse für KI-generierte Vorschläge.

Entscheidend ist zudem die intelligente Kombination aus bestehenden DQ-Regeln, bewährter Business-Logik und den zusätzlichen Erkenntnissen der KI. Perspektivisch eröffnet sich so die Möglichkeit einer automatischen Regelerzeugung sowie einer stärker semantisch ausgerichteten Datenqualitätsprüfung, die über rein formale Prüfmechanismen hinausgeht.

Autor

Michael Irmen
SDZeCOM GmbH & Co. KG – Senior Business Consultant

Tel.: +49 7361 594-344
E-Mail: m.irmen@sdzecom.de


Das könnte Sie auch interessieren

Das richtige PIM-System finden – Tipps für die Auswahl


Checkliste zur Überprüfung der Produkt-Datenstrategie


ChatGPT und Datenanalyse: Vielversprechende Ansätze mit praktischen Hürden