GRUNDLAGEN DER VERSUCHSPLANUNG in der Medizin P.Bauer März 2008 Guidelines • Oxford Centre of Evidence-based Medicine Levels of Evidence • ICH 9: Statistical Principles of Clinical Trials •
Download ReportTranscript GRUNDLAGEN DER VERSUCHSPLANUNG in der Medizin P.Bauer März 2008 Guidelines • Oxford Centre of Evidence-based Medicine Levels of Evidence • ICH 9: Statistical Principles of Clinical Trials •
GRUNDLAGEN DER VERSUCHSPLANUNG in der Medizin P.Bauer März 2008 Guidelines • Oxford Centre of Evidence-based Medicine Levels of Evidence • ICH 9: Statistical Principles of Clinical Trials • ICH 10: Choice of Control Group in Clinical Trials • EMEA, Points to Consider • Consort Statement • Good Scientific Practice (Richtlinien der medizinischen Universität Wien) • „Beratungsrichtlinien“ http://www.univie.ac.at/medstat/ Studienarten Querschnittstudie Merkmale werden lediglich zu einem Zeitpunkt erfasst Ursache ? Querschnittstudie Wirkung Durchbruch von bleibenden Zähnen • „Im Rahmen von zwei Querschnittserhebungen (1959 und 1971) wurden an annähernd 57000 Kindern im Alter von 4 Jahren 10 Monaten bis 15 Jahren 9 Monaten in zwei Städten der DDR (Karl-Marx-Stadt und Plauen) die Zahl der durchgebrochenen Zähne erhoben. Bei beiden Städten handelt es sich um Industriegebiete von gleicher ökologischer Struktur …. . Seit 1959, unmittelbar nach der ersten Erhebung, wurde in KMS der Fluoridgehalt des Trinkwassers … auf 1.0 ppm F- erhöht.“ Eruptionsbereiche der bleib. Zähne Weitere Beispiele • Nutrition Day • Zahnstatus bei Schulanfängern Querschnittstudie (Prävalenzstudie) • Pro‘s: Leicht durchführbar • Con‘s: Geringer Grad der Evidenz „Assoziation ≠ Kausaler Zusammenhang“ Studienarten Fall-Kontroll-Studie Zu jeder Kranken wird eine möglichst ähnliche Kontrollperson gematcht (nach Geschlecht, Alter,…) Fälle Ursache (Exposition) Wirkung Kontrollen Fall-Kontroll-Studie Gesundheit und Lebensnutzung chemischer Substanzen (SAN) • „Das primäre Studienziel ist die Beurteilung des Risikos phenacetinfreier Analgetika in Bezug auf das Auftreten von ESRD (end stage renal disease). Die Hauptfragestellungen der Untersuchung beziehen sich auf das allen phenacetinfreien Analgetika innewohnende Risiko – sowohl phenacetinfreier Kombinationsanalgetika als auch Monosubstanzen.“ SAN-Studie (Forts.) • „Das Design einer Fall-Kontrollstudie wurde gewählt, da die Diagnose ESRD selten auftritt, viele Expositionsgruppen analysiert werden müssen und eine angemessen schnelle vorläufige Risikoabschätzung angestrebt wird, um den Anforderungen der Arzneimittelzulassungsbehörden zu entsprechen.“ • „ wird multizentrisch an Krankenhäusern und niedergelassenen Dialyseeinheiten in Deutschland und Österreich durchgeführt und wird etwa 40-50 „Cluster kooperierender Dialysezentren“ umfassen, über 40 in Deutschland und etwa 10 in Österreich.“ SAN-Studie (Forts.) • Fälle: „Personen mit chronisch terminaler Niereninsuffizienz (ESRD), die erstmal in ein chronisches Dialysezentrum aufgenommen werden (inzidente Fälle).“ • Kontrollen: „Personen ohne ESRD aus der Bevölkerung“ • Stichprobenumfang: „ … Ziel der Studie ist die Identifikation und Studienaufnahme von 1000 Fällen und 5300 Kontrollen zur Bestimmung eines zweifach erhöhten Risikos …“ SAN-Studie (Forts.) • „Vier Indexdaten werden betrachtet: . . . (3) die Fälle, für die Kontrollen der Zeitpunkt von Indexdatum 3 des entsprechenden Falles. . Alle Informationen nach einem ausgewählten Indexdatum werden in den Fünf Jahre vor dem Beginn des Dialysepro-gramms für Analysen verworfen.“ • …“Ein Interview-Fragebogen (persönliches Interview) und ein Dokumentationsbogen zur Erhebung medizinischer Daten aus den Krankenakten“ werden verwendet. Hauptergebnis Weitere Beispiele • Plötzlicher Hörverlust und Risikofaktoren • Sendemast und Krebs Fall-Kontroll-Studie • Pro‘s : Bei seltenen Ereignissen anwendbar, wenn die Kosten einer Längsschnittstudie zu groß werden • CON‘s: Auswahl der Kontrollen; Unterschiedliche Teilnahmeraten („Response Bias“), unterschiedliches Antwortverhalten bezüglich der retrospektiv erhobenen Exposition („Recall Bias“), unterschiedliche Ausgangslage (z.B. durch „Confounder“), „Interviewer Bias“, „Survival Bias“, „Reverse Causality Bias“ … zwischen Fällen und Kontrollen; Studienarten Kohortenstudie 2 Kohorten (Raucher, Nichtr.); Unterscheiden sich Erkrankungshäufigkeiten einer best. Krankheit in beiden Kohorten im Laufe der Zeit? Exp. Wirkung Nicht-exp. ? Kohortenstudie TNM- Validation Study • „This multicenter observational study examined the survival of 1420 patients (recruitment April 1982- October 1984) with histologically proven carcinoma of the stomach. … The percentages of patients who have been followed up until death or 3 to 5 years was 99.4%. Patients were staged preoperatively and intraoperatively and by pathologists using the old (1978) and the new (1987) TNM stage groupings and 5-year survival was analyzed.” Alte Stadien (UICC 1978) Neue Stadien (UICC 1987) Weitere Beispiele • SAPS 3 • Vienna Transdanubia Aging Study (VITA) • Prognose des Therapieerfolgs aus dem Expressionsmuster von Proteinen Kohortenstudie • Pro‘s: Bei jedem Individuum wird die Exposition prospektiv erhoben; ebenso kann der Zeitpunkt eines Zielereignisses prospektiv erhoben werden; meist interne Kontrollgruppe • Con‘s: Sehr zeit- und kostenintensiv; Möglichkeit des informativen Follow-Up-Verlusts oder der Änderung des medizinischen Umfelds (verbunden mit Relevanzverlust der Ausgangshypothese durch die lange Studiendauer) Randomisierter kontrollierter Versuch Rand. kontr. Versuch R Exposition Wirkung Randomisierter kontrollierter Versuch • Pro‘s: Kausaler Schluss mit Quantifizierung der Wahrscheinlichkeiten für Fehlschlüsse ist möglich ! • Con‘s: Aufwand zur Einhaltung verschiedener Gütekriterien bei Randomisierung und Verblindung Zusammenfassung Ursache ? Querschnittstudie Wirkung Fälle Ursache (Exposition) Wirkung Fall-Kontroll-Studie Kontrollen Exp. Kohortenstudie Wirkung Nicht-exp. Rand. kontr. Versuch Start R Exposition Wirkung Zeit Studiendiagnostik (ein Ratgeber) Hat der Prüfer die Behandlung zugeteilt? ja nein Experimentelle Studie Beobachtungsstudie Zufällige Zuteilung? Kontrollgruppe? ja Randomisierte kontrolliertes Experiment ja nein Nichtrandomisiertes kontrolliertes Experiment nein Analytische Studie Deskriptive Studie Richtung? Exposition und Ergebnis zur gleichen Zeit Exposition → Ergebnis Kohortenstudie Exposition ← Ergebnis FallKontrollstudie Querschnittstudie Oxford Centre for Evidence - based Medicine Levels of Evidence Level Therapy/Prevention, Aetiology/Harm 1a SR (systematic review) (with homogeneity) of RCTs (randomized controlled trial) 1b Individual RCT (with narrow Confidence Interval) 1c All or none 2a SR (with homogeneity) of cohort studies 2b Individual cohort study (including low quality RCT; e.g., <80% follow-up) 2c "Outcomes" Research; Ecological studies 3a SR (with homogeneity) of case-control studies 3b Individual Case-Control Study 4 Case-series (and poor quality cohort and case-control studies) 5 Expert opinion without explicit critical appraisal, or based on physiology, bench research or "first principles" Therapiestudien: Vor-Nach-Vergleich Patient sucht Arzt auf; Studienbeginn y Zeit Änderung: Δy = + + + + Δyspontan ΔyStudie Δyandere Faktoren ΔyTherapie ΔyMessfehler Versuchsplanung Verfahren und Regeln, die es gestatten, durch geplante Auswahl und Anordnung der Versuchseinheiten die Möglichkeiten statistischen Schließens auf der Grundlage fachspezifischen Wissens zu verbessern. Studienplanung Fragestellung Einarbeitung in die Problemstellung Studienplanung Durchführung des Experiments / Beobachtung Analyse der Daten Interpretation und Präsentation der Ergebnisse Der Studienplan • Jedes wissenschaftliche Projekt ist durch einen Studienplan zu dokumentieren! Inhaltsvorgaben: • Good Scientific Practice der Medizinischen Universität • Statistical Principles in Clinical Trials Synopsis • • • • • Titelseite (Datum, Unterschrift) Zusammenfassung Inhaltsverzeichnis Projektmitarbeiter Autorenschaft Wissenschaftlich-medizinischer Abschnitt • • • • • • • • • • • • Einführung Ziele und Hypothesen der Studie Präliminäre Daten/Pilotversuche Studiendesign oder Versuchsprotokoll Grundprinzipien und Diskussion des Studiendesigns Beschreibung der Stichprobe Anzahl der Patienten, Versuchstiere bzw. in-vitro Beobachtungen Einschluss- bzw. Ausschlusskriterien Behandlung, Intervention Darstellung der Ergebnisvariablen Methoden der Evaluation (Diskussion der Methoden) Statistik und Datenanalyse • Berechnung der erforderlichen Stichprobengröße (Effektgrößenbestimmung) • Umgang mit fehlenden Werten (Datentransformation) • Beschreibung der anzuwendenden Methoden Versuchsansatz Zwei unterschiedliche Konzepte: • Unabhängige Stichproben (parallele Gruppen): Anwendung der Vergleichsbehandlungen an verschiedenen Beobachtungseinheiten (z.B. Pat.) • Abhängige Stichproben (Paarvergleich): Anwendung an derselben Beobachtungseinheit (z.B. Vergleich der Werte eines Patienten vor und nach Operation, Cross-Over-Versuchsplan) Unabhängige Stichproben Neurogene Blasenstörung Abhängige Stichproben Cross-Over-Versuchspläne Patient Behandlungsabfolge 1 AB AB 2 AB BA 3 AB BA 4 AB AB 5 AB BA 6 AB BA 7 AB AB 8 AB AB Cross-Over Homöopathie versus Pharmakologische Therapie RR syst. (liegend) Crossover-Versuchspläne Pros: Patientin ist ihre eigene Kontrolle Vergleich basiert auf der intra-individuellen Variabilität Geringer Stichprobenumfang Contras: Längere Beobachtungsdauer (Ausfälle, DropOuts) Zuordnung von Neben- und Nachwirkungen Modellvoraussetzungen Auswahl der Zielpopulation • Stichprobe bei medizinischen Studien meist relativ klein (Ggt.: Vollerhebung) • Hohe Anforderung an Planung der Studie, Stichprobenauswahl (Einschlusskriterien) • Je eingeschränkter das Patientenkollektiv, desto geringer die biologische Variabilität • Schlüsse gelten nur für eingeschränktes Kollektiv Auswahl der Zielpopulation (Forts.) • Einschränkende Eigenschaften (Ausschlusskriterien) • Z.B. Alter über 18 Jahren, Ausschluss eines fortgeschrittenen Krankheitsstadiums oder von bestimmten Begleiterkrankungen (wie Diabetes) • Fehlendes Einverständnis Was kann schief gehen ? • Stichprobe ist nicht repräsentativ für die Grundgesamtheit (Repräsentativität) • Systematische Fehler bei Zuteilung der Patientinnen zu den Therapien „Selection Bias“ „Bias“: Systematischer Fehler Neigung, Hang, Vorurteil Bias Jeder Effekt des Designs oder der Durchführung der Studie, der Resultate erzielt, die systematisch von der Wirklichkeit abweichen. Was kann schief gehen ? (Forts.) • Unterschiede in der Intensität der Pflege der Patientin durch voreingenommenes Personal (Behandlungsgleichheit) „Performance Bias“ • Unterschiede in der Messung oder Bewertung (Beobachtungsgleichheit) „Detection Bias“ • Unterschiedliche Vollständigkeit „Attrition Bias“ Ein häufiges Problem: Wiederholte statistische Test (Multiples Testen) • Wie verändern sich die Verhältnisse, wenn mehr als ein statistischer Tests zu einer Fragestellung ausgeführt werden? • Z.B. Mehrere Studien zur gleichen Frage, mehrere Zielvariablen innerhalb einer Studie, … Ein Rechenbeispiel • Es werden 5 unabhängige Studien zum Vergleich der Therapie A mit Placebo durchgeführt. Alle fünf statistischen Tests der Hauptzielvariablen werden auf dem zweiseitigen Signifikanzniveau von 5% (α=0.05) ausgeführt. Die Therapie A hat die exakt gleiche Wirkung wie Placebo. • Wie groß ist die Wahrscheinlichkeit mindestens eine falsch positive Studie zugunsten von A zu erhalten? Ein Rechenbeispiel (Forts.) • Wie groß ist die Wahrscheinlichkeit für ein falsch positives Testergebnis zugunsten von A in einem zweiseitigen Test zum Signifikanzniveau 0.05? • 0.025 • Wie groß ist die Wahrscheinlichkeit, unter fünf unabhängigen Studien kein einzig signifikantes Ergebnis zugunsten von A zu beobachten • (1-0.025)5=0.9755=0.88 • Wie groß ist die Wahrscheinlichkeit mindestens ein signifikantes Ergebnis zugunsten von A zu erhalten? 1-0.88=0.12 (~5 x 0.025) Primäre und sekundäre Zielkriterien innerhalb einer Studie • Nur eine oder wenige Zielvariable. • Die Irrtumswahrscheinlichkeiten (und der Stichprobenumfang) werden üblicherweise auf die Entscheidungen zu dem (den) primären Zielkriterium (-kriterien) bezogen. • Die Nebenzielkriterien werden häufig nur deskriptiv ausgewertet. Viele Fragen kosten mehr ! • Wer sicherstellen will, dass auch im Falle der Anwendung vieler Tests innerhalb einer Studie die Wahrscheinlichkeit für mindestens eine „falsch positive“ Entscheidung kontrolliert wird (z.B. dass diese Wahrscheinlichkeit insgesamt nicht größer als 0.05 ist) muss bei den einzelnen Tests einen Preis bezahlen. D.h. das individuelle Signifikanzniveau für die einzelne Frage muss verkleinert werden (z.B. auf 0.05/Anzahl der Tests). • Dies verringert allerdings die Chancen (Power), richtig positive Entscheidungen zu treffen! Auswertungsstrategie • Auswertungsstrategie ist vor der Durchführung des Experiments festzulegen • Fester Stichprobenumfang oder sequentiell (Zwischenauswertung) Zwischenauswertungen • Wenn während einer Studie mehrmals mit einem konventionellen Test ausgewertet wird (ohne ein signifikantes Ergebnis wird die Stichprobe vergrößert, und weiter getestet – „hunting for significance“) dann kann sich die Rate der falsch positiven Entscheidungen dramatisch erhöhen. • Zwischenauswertungen müssen in ihrer Anzahl und ihrem Timing vorgeplant werden! • Es ist ein Preis für die Möglichkeit früher Entscheidungen zu bezahlen (bei einer einzigen Zwischenauswertung z.B. nahezu Halbierung des Sinifikanzniveaus in der Zwischenanalyse und Endauswertung: 0.05/2=0.025). Prüfung auf Überlegenheit oder „Gleichheit“ • Überlegenheit: Aus der Studie muss gezeigt werden, dass die experimentelle Therapie der Kontrolle überlegen ist (z.B. das neue Medikament ist besser als das alte). • Gleichheit („equivalence“, „non-inferiority“): Es muss gezeigt werden, dass die experimentelle Therapie ähnlich wirkt wie (nicht nennenswert schlechter ist als) die aktive Kontrolltherapie (z.B. das neue Medikament ist gleich gut wie das alte, hat aber weniger Nebenwirkungen). Ein wichtiger Grundsatz • Exakte Gleichheit kann statistisch nicht bewiesen werden! • Nach dem Falsifizierungsprinzip kann allenfalls statistisch nachgewiesen werden, dass sich zwei Behandlungen nicht um mehr als ein bestimmtes Maß unterscheiden Überlegenheit (A,B) Negative Effekte werden A besser als B statistisch verworfen A=B A-B=0 Unterschied A-B Gleichheit (A,B) „Nicht-Unterlegenheit von A “ B besser als A A=B A besser als B Δ A-B=0 Unterschied A-B Diese Effekte werden A nicht nennenswert schlechter statistisch verworfen „Δ-non-inferiority“ Ein Dilemma • Wenn in einer Studie zum Nachweis der Nicht-Unterlegenheit mangelhaft gearbeitet wird, kann dies zu einer falschen Äquivalenzaussage führen • Wird in einer Studie Überlegenheit gezeigt, dann kann dies per se als Beleg für eine gute Durchführung der Studie gewertet werden (Einhaltung der Studienregeln, Erreichen einer geringen Variabilität …) • Assay Sensitivity Wahl des Stichprobenumfangs I Fehlentscheidung I: Breite Routineanwendung einer nicht effektiven und/oder nicht hinreichend sicheren Therapie Die Wahrscheinlichkeit für die irrtümliche Akzeptanz einer unwirksamen Therapie wird über das Signifikanzniveau a kontrolliert. Wahl des Stichprobenumfangs II Fehlentscheidung II: Vorenthaltung einer wirksamen Therapie für den Routineeinsatz Die Wahrscheinlichkeit für diese Fehlentscheidung kann durch große Stichprobenumfänge und/oder präzise Experimente mit geringer Streuung minimiert werden. Wahl des Stichprobenumfangs Abhängig von Signifikanzniveau Erwartetem (relevanten) Effekt Varianz Vorgesehener Auswertungsstrategie Power Die benötigte Stichprobe wird meist mit Hilfe von Computerprogrammen errechnet! Stichprobenumfang - Vergleich von zwei Erfolgsraten • In einer Studie werden zwei Populationen, z.B. Patienten mit einer Kontroll- (K) oder Testbehandlung (T), verglichen • Hauptzielkriterium ist die Erfolgsrate nach einer festen Nachbeobachtungsperiode Stichprobenumfang - Vergleich von Erfolgsraten (Bsp.) • Aus Vorstudien geht hervor, dass für die Vergleichsgruppe eine Erfolgsrate von 0.7 (70%) zu erwarten ist • Der Unterschied im Anteil zur experimentellen Gruppe, den wir als relevant und entdeckungswürdig erachten, sei 0.15 (15 Prozentpunkte), sodass wir dort auf einen Erfolgsanteil von 0.85 (85%) hoffen Stichprobenumfang - Vergleich von Anteilen (Bsp.) • Wir wollen am Ende die beiden Gruppenanteile mit einem zweiseitigen Test auf dem Signifikanzniveau α=0.05 vergleichen • Dabei soll die Gruppengröße so gewählt werden, dass die Differenz von 15% in den Anteilen (70% versus 85%) mit einer Wahrscheinlichkeit (Power) von 0.8 in der Studie auch tatsächlich als statistisch „signifikant“ nachgewiesen werden kann Stichprobenumfang – Vergleich von Anteilen (Bsp.- Forts.) • Durch das Signifikanzniveaus von 0.05 wird die Wahrscheinlichkeit kontrolliert, zwei gleich wirksame Behandlungen (T=K) irrtümlich als verschieden zu erklären • Die Power von 0.8 bedeutet, dass im Schnitt in 4 von 5 solchen Studien statistisch die Überlegenheit der Testbehandlung T gezeigt werden kann, wenn sie tatsächlich um 15 Prozentpunkte erfolgreicher ist (T>K) Stichprobenumfang – Vergleich von Anteilen (Bsp.- Forts.) Um diese Sicherheiten zu gewährleisten (die Wahrscheinlichkeiten für irrtümliche Entscheidungen zu kontrollieren) sind 134 Patienten pro Gruppe (insgesamt 268)* erforderlich * χ2-Test mit Kontinuitätskorrektur Stichprobenumfang - Vergleich von zwei Erfolgsraten Power=0.8, a=0.05, zweiseitig Erfolgsrate Erfolgsrate TestbeKontrolle handlung Differenz n pro Gruppe 0.7 0.75 0.05 1291 0.7 0.80 0.10 313 0.7 0.85 0.15 134 0.7 0.90 0.20 72 0.7 0.95 0.25 43 Vermeidung von Bias Randomisierung und Verblindung Was ist Bias? (Wiederholung) Jeder Effekt des Designs oder der Durchführung der Studie, der Resultate erzielt, die systematisch von der Wirklichkeit abweichen. Randomisierung Randomisierung ist die zufällige Zuteilung der Behandlungen zu Patientinnen. „Randomly dividing a single sample population into groups that receive the test or control treatments avoids systematic differences between the groups with respect to known or unknown baseline variables that could affect outcome.“ Wesentliches Qualitätsmerkmal medizinischer Forschung! Randomisierungsmethoden Vollständige Randomisierung: Bei jeder Stichprobeneinheit wird zufällig entschieden; Eingeschränkte Randomisierung: Jede Behandlung kommt gleich oft vor; Randomisierung in Blöcken: z.B. 3 Blöcke zu je 6 Patientinnen, 3 Behandlungen: Innerhalb jedes Blocks werden die 3 Behandlungen A, B, und C jeweils zweimal zufällig zugewiesen (siehe Beispiel). Bsp.: Patnr Bsp.: Patientinnen mit hohem Blutdruck: Medikament A Medikament B Placebo (C) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Eingeschränkte Randomisierung A A C C A C A B A B C B A C B B C B Randomisierung in Blöcken A B C C A B B C A A B C B C B A C A Oder variable Blöcke Wie erfolgt die tatsächliche Randomisierung? Randomisierungscode wird im allgemeinen von Computerprogrammen erstellt und steht z.B. in Form einzelner verschlossenen Kuverts den Studienzentrum lokal zur Verfügung (oder wird über Telefon oder das Internet von einer unabhängigen Stelle abgerufen). Liste selbst steht nicht im Studienprotokoll! An der MSI steht das Programm RANDOMIZER zur Verfügung (Zugang über die Homepage) Sequentielle (zentrale) Randomisierung Risikofaktoren A Treatment B C Σ Sex ♀ ♂ 9 8 10 7 Age ≤60 >60 8 9 6 11 Stage I II III 8 4 5 8 5 4 Σ 16 9 7 7 9 8 3 5 28 22 21 29 24 12 14 50 Patientin 51: ♀, >60, II A r(♀)=1 r(>60)=2 r(II)=2 5 17 17 B r(♀)=2 r(>60)=3 r(II)=3 8 C r(♀)=1 r(>60)=2 r(II)=1 4 Verblindung Einfache Verblindung: Patientin/Probandin wird nicht über ihre Behandlung informiert; Doppelte Verblindung: Auch die behandelnde Ärztin kennt Therapie nicht; „The groups should be treated and observed similiarly during the trial except for receiving the test and control treatments. Clinical trials are often double-blind (or „doublemasked“), meaning that both subjects and investigators as well as … are unaware of each subject‘s assigned treatment.“ Kontrollgruppen Kontrollgruppe Placebo-Gruppe Aktive Kontrolle Gesunde Kontrolle (Fall-Kontroll-Studie) Kontrollgruppe • Choice of Control Group for Clinical Trials, ICH 10 • Konvention von Helsinki, rev. Version „Control groups have one major purpose: to allow discrimination of patients outcomes (for example changes in symptoms, signs, or other morbidity) caused by the test treatment from outcomes, caused by other factors, such as the natural progression of disease, observer or patients expectations or other treatment..“ Wann braucht man keine Kontrollgruppe? „In unusual cases, the course of illness is in fact predictable in a defined population and it may be possible to use a similar group of patients previously studied as a historical control. In most situations,however, a concurrent group is needed because it is not possible to predict outcome with adequate accuracy or certainty.“ Parallele (gleichzeitige) Kontrollgruppen „A concurrent control group is one chosen from the same population as the test group and treated in a defined way as part of the same trial that studies the test treatment, and over the same period of time. The test and control groups should be similar with regard to all baseline and on-treatment variables that could influence outcome, expect for the study treatment.“ Zufällige Zuteilung (Randomisierung) Verblindung Placebo-Kontrollgruppe „Rather, the placebo control design, by allowing blinding and randomization and including a group that receives an inert treatment, controls for all potential influences on the actual or apparent course of the disease other than those arising from the pharmacologic action of the test drug.“ „The use of a placebo control group does not imply that the control group is untreated. In many placobo-controlled trials, the new treatment and placebo are each added to a common standard therapy (add-on).“ Aktive Kontrollgruppe „In an active control (or positive control) trial, subjects are randomly assigned to the test treatment or to an active control. … Active control trials can have two distinct objectives with respect to showing efficacy: (1) to show efficacy of the test treatment by showing it is as good as a known effective treatment or (2) to show efficacy by showing superiority of the test treatment.“ Der Gold Standard: Randomized Double-blind PlaceboControlled (Multicentre) Trials „In a placebo controlled trial, subjects are randomly assinged to a test treatment or to an identical-appearing treatment that does not contain the test drug. … „Such trials are almost always double-blind. The name suggests that its purpose is to control for „placebo“ effect (improvement in a subject resulting from thinking that he or she is taking a drug), but that is not its only or major benefit. Ethische Voraussetzungen Die Ethikkommission Jeder klinische Versuch an Tieren oder Menschen muss von einer Ethikkommission beurteilt werden. Die Ethikkommission hat dabei insbesondere zu beurteilen: • Prüfung der Zumutbarkeit für Individuum, Risiken • die Eignung der Prüferin • Studienplan, wissenschaftliche Aussagekraft, Nutzen/Risiko-Verhältnis; Ethics – four basic principles for human conduct • • • • Doing good (beneficience) Not harming (nonmaleficience) Respecting persons (autonomy) Distributing goods and evils fairly (justice) Dazu in der medizinischen Forschung • Quality / Excellence (e.g., of statistical planning and analysis) Declaration of Helsinki „Medical research involving human subjects must conform to generally accepted scientific principles, be based on a thorough knowledge of the scientific literature, other relevant sources of information, and on adequate laboratory and, where appropriate, animal experimentation.“ Placebo – Ethische Fragen I „In cases where an available treatment is known to prevent serious harm, such as death or irreversible morbidity in the study population, it is generally inappropriate to use a placebo control. There are occasional exception,… .“ „In other situations, when there is no serious harm, it is generally considered ethical to ask patients to participate in a placebo-controlled trial, even if they may experience discomfort as a result, provided the setting is non-coercive and patients are fully informed about available therapies and the consequences of delaying treatment.“ Placebo – Ethische Fragen II „When a treatment is tested for conditions for which no effective treatment is known, there is usually no ethical problem with a study comparing the new treatment to placebo.“ „Use of placebo control may raise problems of ethics, accepatibility, and feasibility, however, when an effective treatment is available for the conditions under study in a proposed trial.“ Declaration of Helsinki 52nd WMA General Assembly, Edinburgh, Oct. 2000 „The benefits, risks, burdens and effectiveness of a new method should be tested against those of the best current prophylactic, diagnostic, and therapeutic methods. This does not exclude the use of placebo, or no treatment, in studies where no proven prophylactic, diagnostic or therapeutic method exists.“ Publikation und Autorenschaft • Consort Statement (z.B. BMJ) –Richtlinien zur Publikation randomisierter, klinischer Studien • Good scientific practice –Urheberrechte –Autorenschaft → → → → → → → → → → → → → → → → → → → → → → Einige Grundsätze I • Statistischen Methoden und ihre Anwendung in der medizinischen Forschung sind eine wesentliche Grundlage zur Gewinnung von Evidenz für ärztliches Handeln. Die Methoden der Auswertung der Ergebnisse sollten nach Möglichkeit im voraus so definiert werden, dass verfälschte Schlüsse durch datenabhängige Auswahl vermieden werden (z.B.: durch Angaben zu den Zielvariablen, zu den statistischen Verfahren, zu der Anzahl und Art von Zwischenauswertungen, zum Umgang mit fehlenden Werten, …). Einige Grundsätze II Die Anzahl der in eine Studie eingeschlossenen Patientinnen sollte ausreichend groß sein, um die im voraus abgeschätzten Risken für Fehlentscheidungen klein halten zu können. Die Einhaltung der vorgeplanten Prozeduren innerhalb einer Studie sollte durch geeignete Methoden der Qualitätskontrolle und Qualitätssicherung laufend überprüft werden. Schlussbemerkungen • Für Patientinnen in der innovativen therapeutischmedizinischen Forschung wird naturgemäß ein Restrisiko bestehen bleiben • Es ist das Wesen einer experimentellen Situation, dass eben nicht alle für die Risikoabschätzung notwendigen Erkenntnisse vorliegen (sonst würde man vermutlich kein Experiment planen) • Würde dies (in wissenschaftlich unredlicher Weise) eingefordert werden, so sind die Konsequenzen für den medizinischen Fortschritt offensichtlich.