Der Wert von klinischen Prüfungen – warum Evidenzgrade so spannend sind wie Ihre Lieblingsserie

Die wissenschaftliche Aussagekraft (Evidenz) klinischer Studien wird nach international gültigen Konventionen hierarchisch eingestuft. Dies verdeutlicht die Schlüsselrolle, die die Evidenz für die Markteinführung von innovativen Medizinprodukten spielt.

Es ist daher wichtig, dass die Entwickler innovativer Produkte für den Gesundheitsmarkt die Evidenzanforderungen sowohl der Regulierungsbehörden wie auch aller anderen Akteure in Zulassungsprozessen verstehen, damit die Evidenzerstellung allen Anforderungen gerecht wird.

Der folgende Beitrag will – mit den notwendigen Vereinfachungen – einen ersten Ein- und Überblick geben, da dieser Bereich für Laien, die innovative Medizinprodukte, auch DiGA oder DiPA, entwickeln, von essentieller Bedeutung ist.

Hierarchische Klassifizierung von Evidenzeinteilungen verstehen

Sowohl international als auch innerhalb Deutschlands werden unterschiedliche Begriffe und Skalen für die Bewertung von Evidenz von klinisch-wissenschaftlichen Fragestellungen verwendet. Für Wissenschaftler ist dies ein unnötig kompliziertes Durcheinander, für Hersteller von Medizinprodukten geradezu eine Zumutung.

Nebeneinander und ohne klare Abgrenzung werden von verschiedenen Institutionen, Bundesbehörden, nationalen und internationalen Fachgesellschaften und Verbänden, in europäischen und nationalen Behörden, Benannten Stellen oder Gesetzestexten unterschiedliche Formulierungen verwendet, die alle etwas ähnliches bedeuten, wie Evidenzlevel, Evidenzstufe, Evidenzniveau, Evidenzklasse, Evidenzgrad oder wissenschaftliche Evidenz.

Je besser das Studiendesign ist, desto höher ist die Qualität einer klinischen Prüfung

Allen Klassifizierungen und Formulierungen gemeinsam ist, dass sie Berichte oder wissenschaftliche Publikationen über klinisch-wissenschaftliche Studien nach bestimmten Qualitätskriterien einstufen. Generell gilt, dass höhere Evidenzklassen eine breitere Basis haben und Grad Ia die höchste Evidenzqualität aufweist, während Grad IV oder V die geringste Qualität haben. Die Anforderungen an klinische Nachweise für die jeweiligen Klassifizierungen ist recht ähnlich, aber es gibt Unterschiede bei der Wahl der Vergleiche, den bevorzugten Wirksamkeitsendpunkten oder der Zielpopulation. Dies erschwert den Vergleich von Studien und Therapieempfehlungen.

In den letzten Jahren gibt es zunehmend Bemühungen in der evidenzbasierten Medizin, eine einheitliche Vorgehensweise mit vergleichbaren Klassifizierungen und einheitlichen Auslegungen zu erreichen. Zunehmend wird die seit über 20 Jahren entwickelte und weltweit anerkannte GRADE-Methodik (Grading of Recommendations, Assessment, Development and Evaluation) von Fachgesellschaften empfohlen als Methode, die Qualität von Evidenz und Stärke von Empfehlungen für Leitlinien zu klassifizieren.

Warum sollten Hersteller Unterstützung im Wissen um Evidenzgrade bekommen?

Sind Experten bei der Entwicklung des Studiendesigns von Anfang an involviert, wirkt sich dies positiv auf die Qualität der Evidenz aus.

Es ist wichtig, diese Evidenzgrade zu kennen und zu wissen, wie sie erreicht werden, da z. B. im Rahmen eines Zulassungsverfahrens oder zur Erstattung durch Krankenkassen bestimmte Evidenzgrade (oder ggf. auch „wissenschaftliche Erkenntnisse“) gefordert werden und diese durch eine klinische Prüfung oder eine Leistungsstudie erreicht werden müssen. Damit ein therapeutisches oder diagnostisches Medizinprodukt nicht nur zugelassen, sondern später auch durch die Leitlinien der Fachgesellschaften empfohlen wird, muss ein möglichst hoher Evidenzgrad erreicht werden.

Einflussvariablen für die Bewertung der Qualität der Evidenz

Es handelt sich bei der Bewertung von Evidenz nach GRADE um ein komplexes Verfahren, bei dem vier Stufen der Vertrauenswürdigkeit in die Ergebnisse einer oder mehrerer klinischer Studien angegeben werden. Faktoren, die einen Einfluss auf die Klassifizierung haben sind: Wahl des Studiendesigns zur Vermeidung systematischer Fehler und verzerrter Ergebnisse, Gültigkeit (interne Validität), Durchführungsqualität, Größe und Präzision sowie Übertragbarkeit und Anwendbarkeit der Ergebnisse (externe Validität).

Der Begriff "Evidenzstufen" bezieht sich auf die Stärke, Robustheit und/oder Qualität der Evidenz. Diese Stufen spiegeln die Quelle der Evidenz, die statistische Validität, die klinische Relevanz und die Akzeptanz durch Gutachtenprozesse bei Fachzeitschriften wider. Evidenzstufen können herabgestuft werden wegen: Studienqualität, Ungenauigkeit, Indirektheit (fehlende Übereinstimmung von tatsächlicher Studien-PICO (Population, Intervention, Komparator und Endpunkt) mit Fragestellungs-PICO), wegen Inkonsistenz zwischen Studien oder weil die absolute Effektgröße sehr gering oder zu groß ist. Dies muss durch Erfahrung und wissenschaftliche Sorgfalt vermieden werden.

Entsprechend den vorliegenden Evidenzgraden werden nachfolgend in den Leitlinien durch die jeweiligen Fachgesellschaften unter der Berücksichtigung von medizinischem Nutzen, Risiken und Nebenwirkungen nach Konsistenz der Studienlage Empfehlungsgrade ausgesprochen. Dies ist nicht nur für Wissenschaftler wie auch für Hersteller von Medizinprodukten entscheidend.

Spezifikationen für Evidenzkriterien für Medizinprodukte und In-vitro-Diagnostika meistern

Im Bereich der klinischen und sonstigen klinischen Prüfungen von Medizinprodukten, DiGA und / oder In-vitro-Diagnostika werden hohe Anforderungen an die Evidenz gestellt. Allerdings sind in (EU) 2017/745 (MDR), im Medizinprodukterecht-Durchführungsgesetz (MPDG), Digitale-Versorgung-Gesetz (DiGAV) bzw. Verordnung (EU) 2017/746 über In-vitro-Diagnostika (IVDR) an keiner Stelle die tatsächlichen Anforderungen an die Qualität der Evidenz näher spezifiziert.

Kenntnis der gesetzlichen Hinweise zur wissenschaftlichen Qualität von klinischen Prüfungen von Medizinprodukten, DiGA bzw. Leistungsstudien von IVD wirkt sich positiv aus

In der MDR wird zur wissenschaftlichen Qualität ausgeführt, dass klinische Daten und klinische Bewertungsergebnisse zu einem Produkt in „ausreichender Menge und Qualität“ vorliegen müssen, um eine qualifizierte Bewertung der Sicherheit des Produkts und der Erzielung des beabsichtigten klinischen Nutzens bei bestimmungsgemäßer Verwendung durch den Hersteller zu ermöglichen. Diese Vorgaben lassen aktuell noch einen hohen Ermessensspielraum zu und geben keine Hilfestellung für die Auslegung durch Hersteller.

In der IVDR soll der Hersteller den „Umfang des klinischen Nachweises“ festlegen, der erforderlich ist, um die Übereinstimmung mit den einschlägigen allgemeinen Sicherheits- und Leistungsanforderungen nachzuweisen. Das Niveau der „wissenschaftlichen Erkenntnis“ soll im Hinblick auf die Merkmale des Produkts und seine Zweckbestimmung angemessen sein. Es liegt demnach in der Verantwortung des Herstellers zu entscheiden, was für sein Produkt auf der Grundlage der beabsichtigten Verwendung und der Risikoklasse angemessen ist.

Hier wird Wissenschaftlern und Herstellern eine erhebliche Bürde aufgelegt, da sie nur schwer – wie unsere Erfahrungen belegen – antizipieren können, welche Qualitätskriterien in den Anforderungen bzw. in der abschließenden Bewertung nach welcher Auslegung bewertet werden. Hinzu kommt aktuell, dass es abhängig von personenbezogenen Eigenschaften der Begutachtenden in den unterschiedlichen Gremien jeweils zu unterschiedlichen Auslegungen kommen kann. Daher besteht aktuell die dringende Notwendigkeit, Leitlinien und unmissverständliche Vorgaben für die Erstellung dieser klinischen Nachweise und der jeweils geforderten Evidenzgrade zu erarbeiten sowie eine detaillierte und verbindliche Mitteilung, in wie weit und auf welcher Grundlage z. B. in einem DiGA-Fast-track-Verfahren die Ermessensspielräume wie ausgelegt werden.

Besonderheit: Beratung und Unterstützung für die Evidenz für DiGAs durch das BfArM

Für DiGA gibt das Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM) in seinem Leitfaden zum Fast-Track-Verfahren für digitale Gesundheitsanwendungen (DiGA) nach § 139e SGB V Informationen zu den von ihnen geforderten Evidenzstufen. Allerdings werden die in dem DiGA Fast-Track-Verfahren angesprochenen Ermessensspielräume nicht näher ausgeführt und auch hier sind nach unseren Erfahrungen aus den letzten Jahren für Hersteller und wissenschaftlich tätige Ärztinnen und Ärzte weitere Informationen und genauere Angaben nur im direkten Gespräch mit dem BfArm erhältlich, die oft jedoch nicht verbindlich sind. Dieses Potential kann sicher noch gefestigt werden .

Die Medical Device Coordination Group (Medizinprodukte-Koordinierungsgruppe, MDCG) hat für In-vitro-Diagnostika in ihrem Positionspapier als Komponenten der Evidenz für den klinischen Nachweises gemäß IVDR 2017/746 die wissenschaftliche Validität, analytische Leistungsfähigkeit und klinische Leistung benannt.

Wenn Sie sich näher dafür interessieren, wer welche Begriffe verwendet:

Evidenzgrad: Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften (AWMF), Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG), Oxford Centre for Evidence-Based Medicine (OCEBM), engl. “level of evidence”
Evidenzklasse: Agency for Healthcare Research and Quality (AHCR)
wissenschaftliche Erkenntnis: in der deutschen Fassung der Verordnung (EU) 2017/745 (MDR), Verordnung (EU) 2017/746 über In-vitro-Diagnostika (IVDR) und im Medizinprodukterecht-Durchführungsgesetz (MPDG), engl. „clinical evidence“
Evidenz: wird gleichgesetzt mit „Studientypen“
medizinische Erkenntnisse: im Digitale-Versorgung-Gesetz (DiGAV)
Evidenzstufen: Gemeinsamer Bundesausschuss (G-BA), Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM), GKV-Spitzenverband

Zusammenschau

In Zusammenschau der aktuellen Lage ist, obwohl es verschiedene Gemeinsamkeiten im Hinblick auf den Bedarf an Nachweisen über klinisch-wissenschaftliche Studien gibt, das Verständnis für ihre Bedürfnisse von Herstellern und wissenschaftlich Tätigen derzeit suboptimal, so dass die konzipierten und durchgeführten Studien und deren Berichte nicht immer den Bedürfnissen entsprechen können.

Dies führt zu erwartbaren Verzögerungen bei der Entscheidungsfindung, was sich negativ auf den Zugang von Innovationen im Europäischen Raum auswirkt. Sinnvoll wäre eine standardisierte und einheitliche Formulierung des Evidenzbedarfs aller europäischen Behörden und Institutionen ,um die Zusammenarbeit in Hinblick auf Evidenzgenerierung, Evidenznutzung und Evidenzpräsentation zu optimieren.

Bis dahin ist das frühzeitige Hinzuziehen von Experten auf dem Gebiet zur Unterstützung von Herstellern und die sehr frühe Absprache und das gemeinsame Festlegen von Standards mit Behörden unverzichtbar für ein erfolgreiches Verfahren.

Referenzen und Fachartikel können bei der MEDIACC erfragt werden.

(Stand Frühjahr 2024)

Sehr gerne stehen wir auch für ein persönliches Gespräch zur Verfügung. Bei MEDIACC bieten wir umfassende Unterstützung beim Entwickeln des geeigneten Studientyps. Kontaktieren Sie uns gerne für ein erstes unverbindliches Gespräch!

‍

Icon Quellen

Inhaltsverzeichnis

Zeigen Sie den medizinischen Nutzen Ihres Produkts

Mit unserer langjährigen Erfahrung und Expertise bieten wir effektive Lösungen, um den medizinischen Nutzen Ihres Produktes zu zeigen.

Von der Konzeption bis zur Durchführung von präklinischen und klinischen Studien unterstützen wir Sie mit maßgeschneiderten Dienstleistungen.

Erfahren Sie, wie MEDIACC Ihnen zur Erstattungsfähigkeit Ihrer Produkte helfen kann.

Jetzt kostenloses Beratungsgespräch vereinbaren