Home | Was ist MS? | Forschung im Bereich MS | Forschungsergebnisse verstehen lernen

Forschungsergebnisse verstehen lernen

Maria Pia Sormani, Department von Health Sciences – DISSAL, Genua, Italien

Die moderne Medizin ist eine Medizin, die auf Beweisen basiert (evidenzbasiert): Das bedeutet, dass die Bewertung der Risiken und des Nutzens für Behandlungen und Diagnostiktests auf der Grundlage derbesten wissenschaftlichen Beweisführung erfolgen muss. Die wissenschaftliche Methode bei der Entwicklung neuer Medikamente ist die klinische Studie, d. h. eine Forschungsstudie an Menschen, die einem vordefinierten Protokoll folgt.

Die randomisierte Kontrollstudie

Die Wissenschaftler entwickeln einen Plan für die klinische Studie, nachdem sich ein neues Medikament oder eine neue Behandlungsmethode im Labor als erfolgversprechend erwiesen hat. Die am besten vorbereitete Studie ist die Kontrollstudie, bei der eine Gruppe von Personen, die mit der neuen medizinischen Intervention behandelt wird (Versuchsgruppe) mit
einer Kontrollgruppe verglichen wird (einer Gruppe, die mit der Standardbehandlungsmethode für diese Erkrankung behandelt wird). Die Entscheidung, ob eine Person in einer klinischen Studie der Versuchs- oder der Kontrollgruppe zugeteilt wird, geschieht zufällig (randomisiert). Randomisierung ist ein Prozess, der die Teilnehmer an einer Studie zufällig entweder der versuchsgruppe oder der Kontrollgruppe zuteilt. Ziel der Randomisierungistes,vergleichbare Gruppen in Bezug auf die allgemeinen Teilnehmer charakteristika zu erhalten und so eine Befangenheit bei der Auswahl oder eine systematische Differenzierung zwischen den beiden Gruppen zu vermeiden, die von der Prognose oder der Reaktionsfreudigkeit auf die Behandlung beeinflusst würde. Die verlässlichste und unparteiischste Methode, um festzustellen, wie medizinische Interventionen funktionieren, ist deshalb die randomisierte Kontrollstudie (RCT), das Herzstück der experimentellen Forschungsarbeit in der Medizin.

Das vorrangige Ziel

Das Ergebnis der klinischen Studie ist der Vergleich des Krankheitsverlaufs zwischen zwei randomisierten Gruppen (der Versuchs- und der Kontrollgruppe). Vorrangiges Ziel einer Studie, auch als primärer Endpunkt bezeichnet, ist die Variable, die am Ende der Studie gemessen werden kann, die den Krankheitsverlauf quantifiziert.

Bei der Planung einer Studie können verschiedene Ziele, je nach wissenschaftlichen und klinischen Vorgaben der Studie, definiert werden. Bei MS kann der primäre Endpunkt einer Studie zum Beispiel darin bestehen, die Gesamtzahl derLäsionen mittels MRT zum essen, die Menschen mit MS im Verlauf der Studie entwickelt haben. In diesem Fall wird das Hauptergebnis der Studie der Vergleich der durchschnittlichen Anzahl an MRT-Läsionen zwischen den beiden Gruppen sein, um zu bewerten, ob die experimentelle Behandlung in der Lage ist, deren Auftreten zu mindern. Primärer Endpunkt könnte aber auch die Anzahl der Schübe sein, die im Verlauf der Studie gemessen werden; auch hier wird das Ergebnis der Studie wieder der Vergleich der Schubanzahl zwischen den beiden Gruppen sein, um zu erfassen, ob diese in der Versuchsgruppe niedriger ist. Die Studie kann sich aber auch den Grad der Behinderung als Maßstab setzen. Dabei würde dann zum Beispiel die Anzahl der Teilnehmer mit einer Zunahme der Behinderung in den beiden Gruppen miteinander verglichen.

Der Endpunkt ist eng mit der jeweiligen Phase der klinischen Forschung verbunden. Wie schon im einleitenden Artikel dieser Ausgabe von MS in focus beschrieben (siehe Seite 3), wird in Studien der Phase I die Sicherheit und Verträglichkeit des neuen Medikaments bewertet. Dabei kann es sich um unkontrollierte, offene Studien, aber auch um kleinere, kontrollierte Studien handeln. Normalerweise beginnt man mit einer kleinen Kohorte von Teilnehmern mit einer experimentellen Therapie bei einer niedrigen Dosierung. Die Teilnehmer können gesunde Freiwillige, Menschen mit der Erkrankung ohne andere oder nur mit geringen therapeutischen Optionen (bei MS könnten das zum Beispiel Menschen mit primär progrediente MS sein) oder Menschen mit ähnlichen Erkrankungen, z. B. anderen Autoimmunerkrankungen. Die Dosis wird dann nach und nach bei derselben oder einer unabhängigen Gruppe von Teilnehmern erhöht, bis ein bestimmter Zielpunkt erreicht ist oder nachteilige Auswirkungen beobachtet werden. Oft wird nach einer einzelnen oder auch nach mehreren Verabreichung(en) Pharmakokinetik (der Zweig der Pharmakologie, der sich um die Art und Weise kümmert, in der Medikamente vom Körper aufgenommen werden, dort regierenund wieder ausgeschieden werden) eingesetzt, um zu verstehen, wie der Medikamentenmetabolismus funktioniert.

Studien der Phase II werden auch‚ Konzeptprüfungsstudien‘ genannt, da ihr Ziel ist zu bewerten, ob das neue Medikament überhaupt wirksam ist; das vorrangige Ziel dieser Studien ist also ein instrumenteller oder Labormarker, der einen ersten Hinweis auf die Wirkung des Medikamentes gibt. Eine Studie der Phase III bewertet die Wirksamkeit des neuen Medikamentes, d. h., ob die Behandlung die Lebensqualität der Menschen oder (bei tödlich verlaufenden Krankheiten) die Lebensdauer erhöht. Bei MS zielen Studien der Phase III auf die Lebensqualität der Teilnehmer ab, in der Regel auf die Anzahl der Schübe und das Risiko des Fortschreitens der Behinderung.

Messungen der Wirksamkeit der Behandlung

Sobald der Endpunkt klar definiert wurde, muss entschieden werden, welche Messung für die Wirksamkeit der Behandlung passend ist, um zu quantifizieren, inwieweit die Behandlung wirklich angeschlagen hat. Abschätzungen des Behandlungseffekts können in zwei Hauptkategorien eingeteilt werden: Absolute und relative Messungen. Um deren Bedeutung zu verstehen ist es hilfreich, die Ergebnisse der fünf ausschlaggebenden Placebo- kontrollierten klinischen Studien bei MS als Beispiel zu nehmen, die zur Zulassung von Natalizumab, Interferon Beta-1a (intramuskulär und subkutan), Glatirameracetat und Interferon Beta-1b führten, wie in der Tabelle (siehe Seite 20) aufgeführt.

Die Absolute Risikominderung (ARR von engl. Absolute Risk Reduction) ist eine absolute Messung der Behandlungswirksamkeit: Sie repräsentiert einfach den Unterschied zwischen der Häufigkeit der Schübe bei der Kontrollgruppe und der Häufigkeit der Schübe in der behandelten Gruppe. Der Vorteil bei einem ARR- gemessenen Behandlungseffekt besteht darin, dass er einfach zu erfassen und zu interpretieren ist und eine eindeutige Reflektion sowohl des zu Grunde liegenden Risikos der Nicht-Behandlung und der Risikominderung, die mit der medikamentösen Behandlung einhergeht, bietet. Die größte Einschränkung dieser Methode, einen Behandlungseffekt zu messen besteht darin, dass sie stark abhängig ist vom Wert der Referenzgruppe: Falls die Häufigkeit der Schübe oder die Progressionshäufigkeit in der Referenzgruppe niedrigist muss die ARR zwangsläufig auch niedrig ausfallen.

Die Anzahl der notwendigen Behandlungen (NNT von engl. Number Needed to Treat) ist eine zweite absolute Messung der Behandlungswirksamkeit: Sie wird numerisch als der Kehrwert der ARR definiert und kann als Anzahl der Personen, die mit einem Medikament behandelt werden müssen, um 1 negatives Event (z. B. einen Schub oder eine Progression) im Gegensatz zur Kontrollgruppe

zu verhindern, ausgedrückt werden. Ein Beispiel: In der Natalizumab-Studie (erste Spalte) betrug die auf das Jahr umgerechnete Risikoreduktion nach 2 Jahren Behandlung mit Natalizumab 0,50 Schübe/Person/Jahr; die NNT betrug demnach 1/0,50 = 2. Das zeigt auf, dass im Durchschnitt bei jedem zweiten Teilnehmer, der zwei Jahre lang mit Natalizumab behandelt wurde, ein Schub unterbunden wurde.

Die relativen Messungen – das relative Risiko und dierelativeRisikoreduktion-sind die am Häufigsten verwendeten Messungen für die Quantifizierung eines Behandlungseffekts. Das relative Risiko der Schübe wird als Verhältnis der Häufigkeit der Schübe in der behandelten und der Kontrollgruppe ausgedrückt. Auf ähnliche Weise wird die relative Risikoreduktion berechnet, indem man das relative Risiko von 1 abzieht. Das relative Risiko und die relative Risikoreduktion sind einfach zu erfassen und zu interpretieren und sind in jeder standardisierten Statistiksoftware enthalten. Diese relativen Messungen sind auch weniger abhängig von der Rate der Events für einen gemessenen Zielwert in der Placebo-Gruppe und, im Gegensatz zur ARR, bieten eine einfache Abschätzung des Behandlungseffekts, der in der MS-Gemeinde mit variierenden Ausgangsrisiko stabil bleibt.

Man sollte dabei immer beachten, dass es sehr schwierig ist, die Ergebnisse verschiedener klinischer Studien miteinander zu vergleichen und dass diese Vergleichswerte zu unterschiedlichen Ergebnissen führen können, je nachdem, wie sie präsentiert werden. So weicht die Natalizumab-Wirksamkeit nicht sehr von der von Interferon Beta-1a (hochdosiert) ab, wenn die absolute Differenz der Häufigkeit der Schübe mit einbezogen wird: Die absolute Minderung der Häufigkeit der Schübe (ARR) beträgt 0,50 und 0,43 für die mit Natalizumab, bzw. die mit Interferon Beta-1a behandelten Teilnehmer. Wenn man auf der anderen Seite die relative Reduktion einbezieht, dann ist die Natalizumab-Wirksamkeit doppelt so hoch wie der von Interferon Beta-1a (Schub-Reduktionshäufigkeit 68 Prozent im Gegensatz zu 34 Prozent).

Fazit

Um ein umfassendes Bild der Ergebnisse einer klinischen Studie zu erhalten ist es unumgänglich, die Unterschiede zwischen relativen und absoluten Messungen zu verstehen; der Vergleich der Ergebnisse verschiedener Studien kann gefährlich sein und muss immer so ausgeführt werden, dass man alle Möglichkeiten mit einbezieht, wie man die Behandlungswirksamkeit ausdrücken könnte.