Können wir unserer Wahrnehmung trauen?

von Prof. Dr. med. Dr. h.c. Peter Paul Nawroth

Können wir unserer Wahrnehmung trauen? Oder ist es besser, Zahlen stehen zur Verfügung? Stimmt es, dass wer richtig rechnet selbstverständlich Recht hat? Wäre es so einfach, bräuchte es nicht diesen Exkurs über Statistik. Doch wie eine Statistik, ohne zu rechnen, richtig „lesen“ und einordnen? Diese Serie will Hilfestellung geben, wie man mit Informationen, die auf Statistiken fußen, umgehen kann. Fallen werden erklärt, um erkennen zu können, was, obwohl korrekt berechnet, nicht die Wirklichkeit abbildet.

Therapieerfolge und damit in der inneren Medizin auch die Verschreibung von Präparaten werden oft durch Zahlen begründet die in etwa so lauten: Wenn man den bei Diabetes Typ 2 erhöhten HbA1c Wert um 1 weiteres Prozent senkt, dann senkt man das Risiko eines diabetischen Folgeschadens pro gesenktem HbA1c Prozent um 14-37% (je nach Folgeschaden). Klingt überzeugend. Oder?

  1. Die Studiendaten am Beispiel der UKPDS Studie

Eine der wichtigsten Studien zur Therapie des Typ 2 Diabetes heißt UKPDS (1). Die eine Gruppe wurde mit einem mittleren Blutzuckerlangzeitwert (=HbA1c-Wert) von 7,9 „wie üblich“ eingestellt, die andere intensiviert und der Wert wurde auf 7,0 gesenkt. Die bessere Blutzuckereinstellung reduzierte das Risiko für diabetische Folgeschäden. Auf Details dieser Studie soll hier nicht eingegangen werden, aber auf die Interpretationen, die mittels statistischer Methoden (vollkommen korrekt!) errechnet wurden (2) und trotz korrektem Rechenweg irreführend, Menschen schadeten.  Die in (1) zitierte Interventionsstudie wurde nachträglich in eine „prospective observational study“ (2) umgewandelt, also eine Beobachtungsstudie, in der man Daten aus der Interventionsstudie nutzte, um herauszurechnen, wie effizient wohl eine HbA1c Senkung von jeweils 1% bis zum Normwert von 6% sein würde. Das Ergebnis dieser Berechnung: Jedes Prozent Senkung des HbA1c Wertes reduziert das relative Risiko für alle Folgeschäden zusammengenommen um 21%, bei einem 95%-igem Konfidenzintervall  von 15-27% und einem hochsignifikantem p-Wert von 0,0001. Die Schlussfolgerung der Autoren: Jede Senkung des HbA1c Wertes bis in den Beriech unter 6% (weil ein HbA1c Wert unter 6 als „normal“ gilt) ist sinnvoll. Es soll in diesem Kontext nicht besprochen werden, wer sich warum über solche Nachrichten freute. Aber: Spätere Studien zeigten, dass eine so aggressive Zuckerkontrolle Menschen tötet.

  1. Warum stimmt die Berechnung einer Beobachtungsstudie nicht?

Zum Glück wurde diese Hochrechnung von Beginn an von den meisten Ärzten mit Skepsis betrachtet. Denn die ursprüngliche Interventionsstudie war auf solch eine Analyse nicht ausgelegt. Dann der erste große Irrtum: Der HbA1c-Wert korreliert aus statistischer Sicht gut mit dem Zuckerspiegel. Aber: Es gibt dennoch mehrere Faktoren, die den HbA1c-Wert unabhängig vom Blutzucker bestimmen. Es gibt Menschen die bei einem hohem Zuckerwert relativ wenig HbA1c bilden, andere umgekehrt. Also kann nicht jede HA1c Erhöhung nur auf erhöhten Blutzucker zurückgeführt werden, demnach kann auch nicht bei jedem eine Zuckersenkung sinnvoll sein. Das führt wieder zur Vergleichbarkeit von Gruppen: Haben die Diabetiker mit einem HbA1c von 7 bei einem bestimmten Zuckerwert wirklich die gleiche Erkrankung wie diejenigen mit einem Wert von 9% bei gleich hohem Zuckerspiegel? Inzwischen weiß man: Nein!

Lehre 1: Es gibt Subgruppen, wie der milde altersbedingte Diabetes mit einem geringen Risiko für Folgeschäden und andere Subgruppen mit hohem Risiko. Also können solche Berechnungen bestenfalls den Wert einer Hypothese haben, die durch eine Therapiestudie bestätigt werden muss. Die später durchgeführten Therapiestudien belegten, dass die Hochrechnungen falsch waren, denn es starben mehr Patienten in der Gruppe der aggressiven Zuckerkontrolle. Zudem: Die Interventionsstudie (1) hatte nur den Unterschied zwischen einem HbA1c Wert von 7,9% zu 7,0% getestet. Alles weitere waren Hochrechnungen, für die die Studie nie ausgelegt war!

Noch eines war von Anfang an auffällig: Schaut man sich die Abbildungen 1 und 2 an, scheint es nur auf den ersten Blick eine lineare Relation zwischen erreichtem HbA1c-Wert und einer Komplikation zu geben. Nimmt man aber den Bereich heraus, der für Patient und Arzt relevant ist, also zwischen HbA1c 7 bis 8,5%, den Bereich in dem die meisten Patienten mit Diabetes liegen, dann kann man erkennen, dass die Kurve zum Beispiel für Herzinfarkt recht flach ist, die Konfidenzintervalle sich weit überlappen. Die Konsequenz: Die scheinbar so erfolgreiche Wirkung jeder HbA1c Senkung stammt rechnerisch aus den Extremwerten, also einem HbA1c von unter 6,5 und über 9% und repräsentiert nicht, die klinische Wirklichkeit.

Lehre 2: Wie kann ein Patient sich vor solchen Irrtümern schützen?

Zuerst: Immer vorsichtig sein, wenn eine Therapieempfehlung auf einem Surrogat-Parameter (HbA1c) beruht (siehe vorheriger Beitrag) und ein Risiko-Prädiktor, aber nicht eine Erkrankung therapiert werden soll. Dem Leser der Statistik-Beiträge ist auch klar: Eine Beobachtungsstudie kann nur eine Hypothese aufstellen, nie eine Therapieempfehlung, vor allem dann, wenn das berechnete Risiko nur gering ist (beim Rauchen und Lungenkrebs liegt der Effekt bei mehreren 100%!). Dann sollte jeder, der als Patient einen Rat erhält, seinen Arzt fragen, ob der Rat auf einer Berechnung beruht, die nur durch die in der klinischen Praxis relativ seltenen Extremwerte statistisch signifikant wurde. Oder ist in dem der für die meisten Patienten relevanten Bereich ein Effekt nachweisbar?

Zusammenfassung: Die Lust Surrogat-Parameter zu normalisieren und hochzurechnen, was das nutzen könnte, ist trotz vieler fehlgeschlagener Beispiele ungebrochen. Ein einfacher Weg, um zu statistisch signifikanten Zahlen zu kommen, ist die Nutzung der obersten und untersten Extremwerte. Klinisch relevant sind für die meisten Patienten aber die Werte in der Mitte, beim Diabetes also HbA1c Werte die leicht bis mittelgradig erhöht sind. Hätte man in dem Bereich die Berechnungen angestellt, in welchem die meisten Patienten und die durchgeführte Studie lagen, wäre wegen der überlappen Konfidenzintervalle der beeindruckende Effekt kein Effekt und spätere Interventionsstudien, die den Blutzucker sehr niedrig einstellten und Menschen töteten, wären nicht durchgeführt worden. Wichtig: Die Diabetes Typ 2 Therapie ist hier nur ein Beispiel. Es gibt noch viele andere Erkrankungen und Therapien, bei denen die Extremwert-Problematik nachweisbar ist. Zu fordern wäre von den Wissenschaftlern eine differenziertere Interpretation ihrer Daten (z.B. mit und ohne Extremwerte).

Referenzen:

  1. UKPDS group: Intensive blood glucose control with sulphonylureas or insulin compared with conventional treatment and risk of complications in patients with type 2 diabetes (UKPDS 33). Lancet 1998, 352:837-853.
  2. M. Stratton et al: Associations with glycemia with macrovascular and microvascular complications of type 2 diabetes (UKPDS 35):prospective observational study. BMJ 2000; 321:405-412.

Disclaimer

Für die Richtigkeit der Aussage in Bezug auf Ihre Gesundheit oder mögliche Missverständnisse kann keine Haftung übernommen werden. Daher ersetzen die Aussagen auf dieser Seite nicht das persönliche Gespräch mit Ihrem Arzt, Apotheker oder Therapeuten. Bitte handeln Sie daher nicht, bevor Sie Ihren Arzt oder Therapeuten befragt haben.