Goodhart’s Law besagt sinngemäß: Wenn eine Kennzahl zur Zielvorgabe wird, verliert sie ihre Aussagekraft als Messgröße. Ursprung ist die ökonomische Forschung von Charles Goodhart (1975) im Kontext der britischen Geldpolitik. Das Phänomen wurde später durch Sozialwissenschaften (Marilyn Strathern) und die Organisationsforschung verallgemeinert und gilt heute als zentrales Konzept in Ökonomie, Controlling, agiler Produktentwicklung und KI-Sicherheit.
Ursprung und Zweck
Charles Goodhart stellte fest, dass statistische Indikatoren – z. B. Geldmengenaggregate – ihre Prognosekraft verlieren, sobald Regierungen sie zur Steuerung einsetzen. In moderner Form wird das Gesetz auf Organisationen aller Art übertragen: Kennzahlen verändern das Verhalten der Beteiligten, sobald sie zu Zielvorgaben mit Anreiz- oder Sanktionswirkung werden.
Kernelemente
- Grundgedanke: Jede Kennzahl ist zunächst ein Proxy für den eigentlichen Zweck. Wird sie zum Ziel, optimieren Menschen das Proxy, nicht mehr den Zweck.
- Mechanismen: Forschung und Praxis unterscheiden mehrere Versagensmuster – etwa regressional (Optimierung von Messrauschen), causal (Intervention zerstört die Kausalität), adversarial (gezieltes „Gaming“) und extremal (Optimierung weit außerhalb des Datenbereichs).
- Abgrenzung: Goodhart’s Law ist verwandt, aber nicht deckungsgleich mit Campbell’s Law (Korruption sozialer Indikatoren) und der Lucas-Kritik (Verhaltensänderungen unter Politikdruck).
Practical Relevance
Goodhart’s Law ist überall dort relevant, wo Organisationen komplexe Ziele auf wenige Kennzahlen reduzieren. Beispiele:
-Agile Entwicklung: Einseitiger Fokus auf „Velocity“ führt oft zu künstlicher Story-Zerlegung und Qualitätsverlust.
-Kundenservice: Starke Gewichtung der „Average Handling Time“ kann dazu führen, dass Servicequalität und Kundenzufriedenheit sinken.
-Gesundheitswesen: Strikte Zeitvorgaben für Notaufnahmen verbessern zwar Wartezeiten, können aber zu „Clock-Stopping“ oder Umgehungspraktiken führen.
-Bildung: „Teaching to the test“ ist ein typischer Effekt hoher Testfokussierung.
Organisationen jeder Größe können betroffen sein – von Start-ups mit einfachen OKRs bis zu globalen Konzernen mit ausgefeilten KPI-Systemen.
Implementation in Practice
Um Goodhart-Effekte zu vermeiden, empfehlen Forschung und Praxis ein mehrschichtiges Vorgehen:
- Mehrdimensionale Messsysteme: Mehrere Kennzahlen und qualitative Ergänzungen (z. B. Balanced Scorecards) verhindern, dass eine einzige Zahl das Verhalten dominiert.
-Regelmäßige Überprüfung: Kennzahlen als Hypothesen behandeln, nicht als ewige Wahrheit. Retrospektiven und Audits dienen dazu, ihre Wirkung und Relevanz zu prüfen.
-Anreizdesign: Bonussysteme so gestalten, dass sie nicht nur kurzfristige, leicht messbare Ergebnisse belohnen, sondern auch nachhaltigen Kundennutzen, Qualität und Lernen.
-Governance und Transparenz: Klare Kommunikation des eigentlichen Zwecks einer Metrik. Verantwortliche sollten erläutern, warum gemessen wird und welche Nebenwirkungen möglich sind.
-Technische Schutzmaßnahmen: KI- und algorithmische Systeme gezielt auf „Gaming“ oder Proxy-Optimierung testen (z. B. durch Red-Team-Ansätze).
Real-World Examples
Gesundheitswesen: Einführung einer 4-Stunden-Maximalwartezeit in Notaufnahmen (UK, Neuseeland) senkte offiziell die Wartezeiten, führte aber zu Zwischenlagerungen von Patienten außerhalb der Statistik.
Banking/Finance: Callcenter wurden ausschließlich nach Gesprächsdauer gesteuert. Folge: steigende Wiederanrufquote und sinkender Net Promoter Score, bis zusätzliche Qualitätsmetriken eingeführt wurden.
Softwareentwicklung: Teams, die nach Anzahl geschlossener Tickets bewertet wurden, optimierten auf Ticketzahl, nicht auf Kundennutzen – bis qualitative Produktmetriken ergänzt wurden.
Limitations, Weaknesses, and Criticism
- Überverallgemeinerung: Nicht jede Kennzahl verliert zwangsläufig ihren Wert; gut konzipierte und breit abgestützte Messsysteme können dauerhaft verlässlich sein.
- Begriffsvermischung: Häufige Gleichsetzung mit Campbell’s Law oder der Lucas-Kritik verwischt Unterschiede in Ursache und Lösungsansatz.
- Mechanismenvielfalt: Verschiedene Fehlsteuerungsarten (regressional, causal, adversarial, extremal) verlangen unterschiedliche Gegenmaßnahmen.
- Ein-Metrik-Risiko: Die Reduktion komplexer Ziele auf eine einzelne Zahl begünstigt Wertverzerrung („Surrogation“) und Missbrauch.
- Performativer Effekt: Zahlen prägen das Verhalten und die Organisationskultur – bis hin zur Verdrängung intrinsischer Motivation.
- Kosten und Aufwand: Maßnahmen wie Balanced Scorecards, Auditmechanismen und fortlaufendes Monitoring erhöhen den Governance-Aufwand und verlangen Disziplin.
- Notwendigkeit von Zielwerten: In sicherheitskritischen Bereichen sind harte Kennzahlen unverzichtbar; hier geht es darum, sie verantwortungsvoll einzubetten, nicht sie zu vermeiden.
CALADE-Sichtweise
CALADE betrachtet Goodhart’s Law nicht als Argument gegen Messung, sondern als Einladung zu besserem Messdesign. In Transformationsprojekten setzen wir auf:
- Mehrdimensionale Steuerung statt Single-KPI, um komplexe Wertströme abzubilden.
- Metriken als Hypothesen: Jede Kennzahl wird regelmäßig überprüft und bei Bedarf ersetzt.
- Bewusstseinsbildung im Führungsteam, damit wirtschaftliche und kulturelle Ziele nicht dem Diktat einzelner Zahlen unterliegen.
Related Terms
- Campbell’s Law
- Lucas-Kritik
- Balanced Scorecard
- Metrics and Measurement Anti-Patterns
- Surrogation
← zurück zur Übersicht