Skip to main content

The Data Economist Blog (DE) | Etablierung einer Data Inspired & Digital Culture

Wie Sie schnell bewerten können, ob Sie ein Problem mit der Datenqualität haben

Datenqualitätsmanagement nach der "Friday Afternoon Measurement" Methode

Entscheidungsträger, Führungskräfte, Datenwissenschaftler und Manager müssen oft schnell beurteilen, ob sie einem Datensatz vertrauen können, ob sie ihn in eine Analyse einbeziehen oder ob eine neue Richtung einschlagen werden muss. Es gibt viele Möglichkeiten, aber die grundlegende Frage ist, "habe ich ein Problem mit der Datenqualität?"

Mit der Methode "Friday Afternoon Measurement (FAM)" von Thomas C. Redman, kann diese Frage schnell beantwortet werden. Die Methode richtet sich an Manager auf jeder Ebene, deren Entscheidungsfähigkeit stark von Daten abhängig ist. Mit der fortschreitenden Digitalisierung von Geschäftsprozessen steigt zunehmend das Risiko fehlerhafter Entscheidungen sowie einer verzögerten Erfüllung von Prozesszielen aufgrund schlechter Datenqualität. Die FAM-Methode hilft, das aktuelle Niveau der Datenqualität zu messen, die möglichen Auswirkungen gut einzuschätzen und  entsprechende Handlungsoptionen abzuleiten. Die Methode ist unabhängig von Branche, Unternehmen, Prozesse und Daten einsetzbar.

Folgen Sie den vier Schritten, um die FAM-Methode erfolgreich anzuwenden.

Schritt 1

Stellen Sie die letzten 100 Datensätze, die Ihr Team verwendet oder erstellt hat, in einer Tabelle zusammen. Beispiel: Wenn Ihr Team Kundenaufträge entgegennimmt, so stellen Sie die letzten 100 Bestellungen zusammen. Dann fokussieren Sie sich auf die 10 - 15 kritischsten Datenelemente (Attribute), z.B. Kundenname, Adresse, Artikel, Menge, usw.

Schritt 2

Holen Sie sich zwei bis drei Personen mit entsprechendem Wissen über die Daten und setzen ein Meeting für maximal 2 Stunden an. (Die Methode FAM hat ihren Namen, weil diese Meetings im amerikanischen Raum häufig am Freitagnachmittag durchgeführt werden.)

Schritt 3

Arbeiten Sie Datensatz für Datensatz mit Ihren Kollegen durch und markieren Sie offensichtliche Fehler in einer auffälligen Farbe, wie z.B. rot oder orange. Ihre Teammitglieder werden Fehler schnell erkennen, wie  z.B. falsch geschriebene Kundennamen, leere Felder oder Informationen, die dem falschen Attribut zugeordnet wurden. In einigen Fällen werden Sie Diskussionen darüber führen, ob ein Dateneintrag wirklich falsch ist. In der Regel sollten Sie nicht mehr als 30 Sekunden für einen Datensatz aufbringen.

Schritt 4

Fassen Sie die Ergebnisse zusammen. Fügen Sie zuerst eine Spalte "Datensatz richtig?" zu Ihrer Tabelle hinzu. Markieren Sie "ja", wenn es keine Fehler gibt und "nein", wenn Felder im Datensatz rot oder orange markiert wurden. Ermitteln Sie die Gesamtzahl der richtigen Datensätze.

Beispielabbildung:

Datenqualität - FAM-Methode

Die "Anzahl der richtigen Datensätze" interpretieren Sie wie folgt:

Von den letzten 100 erstellten Datensätzen des Teams oder Abteilung sind nur zwei Drittel, 67 von 100, richtig vollendet. Jeder wird dieses Ergebnis anerkennen müssen. (Anmerkung: Thomas C. Redman nutzt diese Übung häufig in Lehre und Beratungsmandaten. Laut seiner Aussage habe er viele schlechtere Ergebnisse und ein paar bessere gesehen. Eine Datenqualität von 67% am oberen Ende sei typisch. Aus meiner langjährigen Beratungs-Erfahrung heraus kann ich die Beobachtung bestätigen.)

Das Ergebnis aus der Tabelle zeigt auf, Sie haben ein Problem mit der Datenqualität!

Um die Auswirkungen auf Ihr Unternehmen einschätzen zu können, gehen Sie einen Schritt weiter. Schlechte Daten verursachen alle Arten von Schwierigkeiten - gute Entscheidungsfindung ist schwieriger, Kunden sind verärgert - und es werden zusätzliche Kosten verursacht. Die so genannte "10er Regel" bietet eine einfache Möglichkeit, diese Kosten abzuschätzen. Sie basiert auf der Beobachtung, dass es "10-mal so viel kostet", bei schlechten Daten eine Arbeitseinheit durch Korrektur vollständig abzuschließen, im Gegensatz zum regulären Arbeitsumfang einer Arbeitseinheit, bei korrekten Daten.

In dem obigen Beispiel wird der Mitarbeiter der die Daten verwendet in der Lage sein, in zwei Drittel der Zeit ohne zusätzlichen Aufwand, seine Arbeit zu erledigen, aber bei einem Drittel der Zeit wird es etwa 10 Mal so viel kosten, um Korrekturen vorzunehmen und die Arbeit abzuschließen .

Ein einfaches Rechenbeispiel: Nehmen wir an, Ihr Arbeits-Team muss 100 Einheiten pro Tag abschließen und jede Einheit kostet 1,00 €, sofern die Daten korrekt sind. Wenn alles korrekt ist, kostet ein Arbeitstag 100 € (100 Einheiten mal 1,00 €). Mit nur 67 korrekten Datensätzen (Einheiten) sieht die Kostenrechnung allerdings wie folgt aus:

Total cost = (67 x 1,00 €) + (33 x 1,00 € x 10) = 67 € + 330 € = 397 €

Eindeutig ist erkennbar, dass die Gesamtkosten fast viermal so hoch sind (Kostensteigerung von fast 400%), als es bei vollständig korrekten Daten der Fall gewesen wäre. Unternehmen können und dürfen solche Kosten nicht tolerieren.

Mit dem Wissen, dass Sie ein Datenproblem haben und jetzt die damit verbundenen Kosten kennen, können Sie sich nun um die Verbesserungen der Datenqualität kümmern! In der Tabelle können Sie sehen, welche Attribute Fehler haben und priorisieren, welche Attribute zuerst behoben werden müssen. Zur Priorisierung nehmen Sie die Anzahl der Fehler je Spalte, und konzentrieren sich auf zwei bis drei Attribute, die die höchsten Summen haben. Finden und beseitigen Sie die Ursachen.

Schaffen Sie personelle Datenverantwortlichkeiten und nehmen Sie "regelmäßige Datenqualitätssicherung" als Aufgabe in die Arbeit der Mitarbeiter mit auf. Dies kann entweder Ihr Team selber sein oder ein anderes, abhängig wo die Daten entstehen und korrekt in den Prozess einfließen müssen. Das Ganze sollte mit möglichst geringen oder keinen Investitionen ermöglicht werden. Sie werden feststellen, die Fehlerrate wird zurückgehen und die damit verbundenen Kosten deutlich sinken.

Jeder sollte die Datenqualität zu einem Teil seiner Arbeit machen. Diese Übung bietet eine einfache Möglichkeit, Schritte in Richtung Verbesserung der Datenqualität zu ergreifen. Dieser Vorgang soll keine einmalige Übung sein - Sie können die FAM-Methode regelmäßig nutzen, um Ihre Datenqualität zu beurteilen. Indem Sie Zeit mit der FAM-Methode verbringen, können Sie nicht nur identifizieren, ob Sie ein Datenqualitätsproblem haben, sondern auch das Bewusstsein für bessere Datenqualität in Ihrem Unternehmen steigern, sowie Verbesserungsmaßnahmen zielgerichtet Steuern.

Sehen Sie die FAM Methode als einen guten Start zu einem prozessorientierten und nachhaltigen Datenqualitätsmanagement.

Anmerkung:

Originaltext in englischer Sprache von Thomas C. Redman, übersetzt und mit eigenen Erfahrungen, Erkenntnissen und Empfehlungen angereichert.

Quelle: https://hbr.org/2016/07/assess-whether-you-have-a-data-quality-problem

 

Lesen Sie auch:

Datenqualität, Datenqualitätsmanagement, Datenmanagement, Datenqualitätsmethoden, Datenqualität messen, Datenqualität verbessern

  • Geändert am .
  • Aufrufe: 13762