Subpopulationen im AMNOG – Oder: das große Sieben

150 Verfahren sind im Rahmen des AMNOG mittlerweile abgeschlossen – davon fast 60 Prozent mit einem zugestandenen Zusatznutzen. Doch bei genauem Hinsehen zeigt sich: Das ist nur ein Teil der Wahrheit.

Das Gesetz zur Neuordnung des Arzneimittelmarktes (AMNOG) hat das deutsche Gesundheitssystem nicht einfacher gemacht – dabei wollte die Legislative durchaus auch etwas gegen die Überregulierung tun. Doch der Gemeinsame Bundesausschuss (G-BA) unterscheidet bei der Bewertung eines Arzneimittels nach Kategorie des Zusatznutzens, nach Ergebnissicherheit, Subpopulation und Anwendungsgebiet. Im internationalen Vergleich gilt das AMNOG deshalb auch als „over-engineered“. Das Problem ist: Mit zunehmender Komplexität steigt die Fehleranfälligkeit der Bewertung.

 

Von den bis Anfang November abgeschlossenen AMNOG-Verfahren haben exakt 56,67 Prozent der Präparate einen irgendwie gearteten Zusatznutzen attestiert bekommen  – von gering bis erheblich. Doch der G-BA bewertet nicht nur die Anwendungsgebiete, sondern bricht die Indikationen zusätzlich auch auf Teilpopulationen herunter. Und da zeigt sich: Hinter den 150 abgeschlossenen Verfahren verbergen sich 321 Subpopulationen. Hier wird das AMNOG engmaschiger: Schaut man auf die Untergruppen, bekommen nur 41 Prozent der Subpopulationen einen Zusatznutzen.

Hinter diesen Subgruppen stehen konkrete Patientenzahlen – die 150 Verfahren mit ihren 321 Subgruppen korrespondieren insgesamt mit rund 46 Millionen Patienten. Nun zeigt sich das ganze Ausmaß des „AMNOG-Siebes“: Bricht man die Verfahren auf die in Frage kommenden Patienten herunter, wird deutlich: Für annährend 80 Prozent dieser Patienten sehen die AMNOG-Macher keinen Zusatznutzen. Ein Trend, so der Bundesverband der Pharmazeutischen Industrie (BPI), der sich in den vergangenen drei Jahren verstärkt hat.

Medizinisch sinnvoll: Bildung von Subpopulationen

Es hat medizinisch und pharmakologisch Sinn, sich einzelne Patientengruppen genau anzuschauen – Patientensegmentierung ist deshalb Teil der von den pharmazeutischen Unternehmern eingereichten Dossiers im Rahmen der AMNOG-Prüfung. Ein Beispiel: Das Hepatitis-C-Virus tritt in verschiedenen Untergruppen auf. Diese Genotypen können auf Arzneimittel unterschiedlich reagieren. Deshalb ist es sinnvoll, die Patienten in den klinischen Studien nach Genotypen zu sequenzieren und sich die Ergebnisse getrennt voneinander anzuschauen. Ein „One-size-fits-all“-Ansatz greift hier nicht.

 

Mehr noch: Genetische Eigenheiten können dafür sorgen, dass Arzneimittel bei manchen Patienten nicht wirken oder nicht tolerierbare Nebenwirkungen nach sich ziehen – was im ersten Fall bestenfalls unschädlich ist, kann im zweiten Fall lebensgefährlich sein. Auch Alter, Geschlecht, Schwere der Krankheit, Vor- oder Begleiterkrankungen sind gängige Unterscheidungsmerkmale, die die Bildung und Analyse von Subgruppen sinnvoll machen.

Ein Armutszeugnis?

Wenn also nur für 22 Prozent des Patientenpotenzials ein Zusatznutzen herausspringt, dann gibt es nur zwei Möglichkeiten: Entweder sind die Arzneimittel in ihrer Innovationskraft eher bescheiden – und das wäre für die pharmazeutische Industrie dann wohl ein Armutszeugnis. Oder aber es ist etwas falsch am AMNOG – und dann guckt nicht nur die Industrie in die Röhre, sondern letztlich auch der Patient.

In der Tat zeigt sich beim Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) eine gewisse Vorliebe für die Bildung von Subpopulationen. In fast einem Drittel der Verfahren werden vier Subgruppen oder mehr gebildet – und zwar unabhängig davon, ob sie in den vorgelegten klinischen Studien untersucht wurden. Der Rekord liegt bisher bei 16 gebildeten Subgruppen für ein einzelnes Produkt. Allerdings: Nicht immer übernimmt der G-BA dieses sogenannte Slicing – der Bundesausschuss ist da deutlich zurückhaltender.

Dabei sind solche Analysen methodisch nicht gerade der Hit, wie das IQWiG in seinem Methodenpapier selbst festhält: „Subgruppenanalysen werden in der methodischen Literatur sehr kritisch diskutiert2.“ Dafür gibt es im Wesentlichen drei Gründe:

  • Sie haben selten Beweischarakter, weil sie oft nachträglich aus bestehenden Daten herausgefiltert werden müssen und folglich methodisch nicht dem Goldstandard klinischer Studien entsprechen.
  • Sie bergen durch das mehrfache Testen von mehreren Subgruppen-Merkmalen das Risiko falsch positiver Resultate – und das mit einer „manchmal recht hohe(n) Wahrscheinlichkeit“, so das IQWiG. Eine statistische Signifikanz könnte in Wahrheit ein zufälliges Ergebnis sein.
  • Ihnen fehlt die statistische Power – was umso mehr gilt, je kleiner die Subgruppen sind. Denn dann erreichen sie für eine hinreichende Aussagekraft nicht die notwendige Größe. Das Risiko: Falsch negative Resultate.

Was wie ein Hobby für Statistiker klingt, hat Folgen. Falsch positive Ergebnisse heißt: Ein Medikament wird durch statistische Klimmzüge besser bewertet, als es ist. Falsch negativ ist das Gegenteil: Hinter dem schlechten Votum steht ein Medikament mit Zusatznutzen. Beides kann niemand wollen. Deshalb sollen Subgruppenanalysen zwar in die Bewertung einfließen, aber „nicht das Ergebnis der primären Analyse dominieren“, so die Interpretation des IQWiG. „Tatsächlich findet genau dies regelmäßig statt, wenn eine Bewertung nur für Subgruppen erfolgt, ohne die Gesamtbewertung zum primären Bewertungsgegenstand zu machen“, schreibt Markus Frick, Geschäftsführer Markt und Erstattung beim Verband Forschender Arzneimittelhersteller (vfa)3. Nota bene: Das IQWiG, das sich gerne als Gralshüter der Evidenz-basierten Medizin versteht, gibt sich ausgerechnet hier großzügig.

Slicing – das Fallbeil für Innovationen?

Das sogenannte Slicing in dieser Form ist den Unternehmen denn auch ein Dorn im Auge. Das gilt gerade dann, wenn Daten zu Subpopulationen eingefordert werden, die nicht in den vorgelegten Studien ausgewiesen sind bzw. nicht ausgewiesen sein können. Das „große Sieb“ AMNOG, das mit immer feinerem Netz durch den Teich neuer Arzneimittel zieht, droht immer mehr Innovationen den Garaus zu machen.

Aber es kommt noch ärger: Ist ein Bewertungsverfahren abgeschlossen und das Produkt nun in seinen Subgruppen unterschiedlich bewertet, steht die Preisverhandlung an, bei der die Krankenkassen einen „Mischpreis“ anstreben. Das ist ein „gemittelter“ Preis, der für das gesamte Produkt gilt, und letztlich berücksichtigen soll, dass das neue Arzneimittel in der Subgruppe A vielleicht einen beträchtlichen, in der Gruppe B aber einen geringen Zusatznutzen hat.

Im echten Leben führt dies dazu, dass die Verordnungen für Patientengruppen mit geringem Zusatznutzen von Krankenkassen und Kassenärztlichen Vereinigungen als „unwirtschaftlich“ gebrandmarkt werden. Auf diese Weise wird auf regionaler Ebene eine Mengenbegrenzung eingeführt. Der Mischpreis ist also nur für die Kassen ein Mischpreis – für die Industrie ist es nichts als eine weitere Rabattstufe. Und für die Patienten ist es eine weitere Hürde beim Zugang zu Innovationen und vielleicht lebensrettenden Therapien.

Verschreibungen von im AMNOG positiv bewerteten Medikamenten

Für den Arzt ist das alles auch keine Hilfe. Ein AMNOG, das Bewertungen in über 300 Teilpopulationen auffächert: Wer soll da noch den Überblick behalten? Es ist deshalb kein Wunder, dass selbst positiv AMNOG-bewertete Arzneimittel oft deutlich hinter ihrem Verschreibungspotenzial hinterherhinken.

 

Im fünften Jahr zeigt sich das AMNOG in seinen fein ziselierten, wenig durchschaubaren, sich in der Wirkung aber verstärkenden Zwischenschritten als ein komplexes Instrument, das in seiner Wirkung zumindest langfristig nur schwer abzuschätzen ist. Die Industrie beklagt, dass es im Endergebnis übermäßig auf Kostensenkung schielt und zu wenig den Patienten-Nutzen neuer Medikamente im Blick hat. In mehr als der Hälfte der Beschlüsse ohne Zusatznutzen wurde die verfügbare Evidenz gar nicht ausgewertet – ein Fakt, der sich bei den negativ bewerteten Subpopulationen noch einmal verstärkt.

 

Von den 321 Subpopulationen erhielten 190 keinen Zusatznutzen, aber nur 19 davon auf Basis der ausgewerteten Dossiers. Für den Rest gilt, dass das negative Urteil auf methodischen Gründen beruht: Die Daten reichten dem IQWiG und G-BA nicht aus oder waren aus deren Sicht unvollständig. Für diese Verfahren gilt: Der nicht anerkannte Zusatznutzen beruht auf einer Nicht-Prüfung.

Quellen:

1 Daten des Bundesverbands der Pharmazeutischen Industrie (BPI)

2 IQWiG: Allgemeine Methoden 4.2. vom 22.4.2015, S. 158.

3 S. Frick, ebda. S. 32

Verwandte Nachrichten

Anmeldung: Abo des Pharma Fakten-Newsletters

Ich möchte per E-Mail News von Pharma Fakten erhalten: