GRUNDLAGEN DER VERSUCHSPLANUNG in der Medizin P.Bauer März 2008 Guidelines • Oxford Centre of Evidence-based Medicine Levels of Evidence • ICH 9: Statistical Principles of Clinical Trials •

Download Report

Transcript GRUNDLAGEN DER VERSUCHSPLANUNG in der Medizin P.Bauer März 2008 Guidelines • Oxford Centre of Evidence-based Medicine Levels of Evidence • ICH 9: Statistical Principles of Clinical Trials •

GRUNDLAGEN DER
VERSUCHSPLANUNG
in der Medizin
P.Bauer
März 2008
Guidelines
• Oxford Centre of Evidence-based Medicine
Levels of Evidence
• ICH 9: Statistical Principles of Clinical Trials
• ICH 10: Choice of Control Group in Clinical Trials
• EMEA, Points to Consider
• Consort Statement
• Good Scientific Practice (Richtlinien der
medizinischen Universität Wien)
• „Beratungsrichtlinien“
http://www.univie.ac.at/medstat/
Studienarten
Querschnittstudie
Merkmale werden lediglich zu einem Zeitpunkt erfasst
Ursache ?
Querschnittstudie
Wirkung
Durchbruch von bleibenden Zähnen
• „Im Rahmen von zwei Querschnittserhebungen
(1959 und 1971) wurden an annähernd 57000
Kindern im Alter von 4 Jahren 10 Monaten bis
15 Jahren 9 Monaten in zwei Städten der DDR
(Karl-Marx-Stadt und Plauen) die Zahl der
durchgebrochenen Zähne erhoben. Bei beiden
Städten handelt es sich um Industriegebiete von
gleicher ökologischer Struktur …. . Seit 1959,
unmittelbar nach der ersten Erhebung, wurde in
KMS der Fluoridgehalt des Trinkwassers … auf
1.0 ppm F- erhöht.“
Eruptionsbereiche der bleib. Zähne
Weitere Beispiele
• Nutrition Day
• Zahnstatus bei Schulanfängern
Querschnittstudie (Prävalenzstudie)
• Pro‘s: Leicht durchführbar
• Con‘s: Geringer Grad der Evidenz
„Assoziation ≠ Kausaler Zusammenhang“
Studienarten
Fall-Kontroll-Studie
Zu jeder Kranken wird eine möglichst
ähnliche Kontrollperson gematcht (nach
Geschlecht, Alter,…)
Fälle
Ursache (Exposition)
Wirkung
Kontrollen
Fall-Kontroll-Studie
Gesundheit und Lebensnutzung
chemischer Substanzen (SAN)
• „Das primäre Studienziel ist die Beurteilung des
Risikos phenacetinfreier Analgetika in Bezug auf
das Auftreten von ESRD (end stage renal disease).
Die Hauptfragestellungen der Untersuchung
beziehen sich auf das allen phenacetinfreien
Analgetika innewohnende Risiko – sowohl
phenacetinfreier Kombinationsanalgetika als auch
Monosubstanzen.“
SAN-Studie (Forts.)
• „Das Design einer Fall-Kontrollstudie wurde gewählt,
da die Diagnose ESRD selten auftritt, viele Expositionsgruppen analysiert werden müssen und eine
angemessen schnelle vorläufige Risikoabschätzung
angestrebt wird, um den Anforderungen der
Arzneimittelzulassungsbehörden zu entsprechen.“
• „ wird multizentrisch an Krankenhäusern und niedergelassenen Dialyseeinheiten in Deutschland und
Österreich durchgeführt und wird etwa 40-50
„Cluster kooperierender Dialysezentren“ umfassen,
über 40 in Deutschland und etwa 10 in Österreich.“
SAN-Studie (Forts.)
• Fälle: „Personen mit chronisch terminaler
Niereninsuffizienz (ESRD), die erstmal in ein
chronisches
Dialysezentrum
aufgenommen
werden (inzidente Fälle).“
• Kontrollen: „Personen ohne ESRD aus der
Bevölkerung“
• Stichprobenumfang: „ … Ziel der Studie ist die
Identifikation und Studienaufnahme von 1000
Fällen und 5300 Kontrollen zur Bestimmung eines
zweifach erhöhten Risikos …“
SAN-Studie (Forts.)
• „Vier Indexdaten werden betrachtet:
.
.
.
(3) die Fälle, für die Kontrollen der Zeitpunkt von
Indexdatum 3 des entsprechenden Falles.
.
Alle Informationen nach einem ausgewählten
Indexdatum werden in den Fünf Jahre vor dem
Beginn des Dialysepro-gramms für Analysen
verworfen.“
• …“Ein Interview-Fragebogen (persönliches Interview) und ein Dokumentationsbogen zur Erhebung
medizinischer Daten aus den Krankenakten“ werden
verwendet.
Hauptergebnis
Weitere Beispiele
• Plötzlicher Hörverlust und Risikofaktoren
• Sendemast und Krebs
Fall-Kontroll-Studie
• Pro‘s : Bei seltenen Ereignissen anwendbar, wenn
die Kosten einer Längsschnittstudie zu groß
werden
• CON‘s: Auswahl der Kontrollen; Unterschiedliche
Teilnahmeraten („Response Bias“), unterschiedliches Antwortverhalten bezüglich der retrospektiv
erhobenen Exposition („Recall Bias“), unterschiedliche Ausgangslage (z.B. durch „Confounder“),
„Interviewer Bias“, „Survival Bias“, „Reverse
Causality Bias“ … zwischen Fällen und Kontrollen;
Studienarten
Kohortenstudie
2 Kohorten (Raucher, Nichtr.);
Unterscheiden sich Erkrankungshäufigkeiten einer best. Krankheit in beiden
Kohorten im Laufe der Zeit?
Exp.
Wirkung
Nicht-exp.
?
Kohortenstudie
TNM- Validation Study
• „This multicenter observational study examined
the survival of 1420 patients (recruitment April
1982- October 1984) with histologically proven
carcinoma of the stomach. … The percentages
of patients who have been followed up until
death or 3 to 5 years was 99.4%. Patients were
staged preoperatively and intraoperatively and
by pathologists using the old (1978) and the new
(1987) TNM stage groupings and 5-year survival
was analyzed.”
Alte Stadien (UICC 1978)
Neue Stadien (UICC 1987)
Weitere Beispiele
• SAPS 3
• Vienna Transdanubia Aging Study (VITA)
• Prognose des Therapieerfolgs aus dem
Expressionsmuster von Proteinen
Kohortenstudie
• Pro‘s: Bei jedem Individuum wird die Exposition
prospektiv erhoben; ebenso kann der Zeitpunkt
eines Zielereignisses prospektiv erhoben werden;
meist interne Kontrollgruppe
• Con‘s: Sehr zeit- und kostenintensiv; Möglichkeit
des informativen Follow-Up-Verlusts oder der
Änderung des medizinischen Umfelds (verbunden
mit Relevanzverlust der Ausgangshypothese durch
die lange Studiendauer)
Randomisierter kontrollierter
Versuch
Rand. kontr. Versuch
R
Exposition
Wirkung
Randomisierter kontrollierter
Versuch
• Pro‘s: Kausaler Schluss mit Quantifizierung der
Wahrscheinlichkeiten für Fehlschlüsse ist möglich !
• Con‘s: Aufwand zur Einhaltung verschiedener
Gütekriterien bei Randomisierung und Verblindung
Zusammenfassung
Ursache ?
Querschnittstudie
Wirkung
Fälle
Ursache (Exposition)
Wirkung
Fall-Kontroll-Studie
Kontrollen
Exp.
Kohortenstudie
Wirkung
Nicht-exp.
Rand. kontr. Versuch
Start
R
Exposition
Wirkung
Zeit
Studiendiagnostik (ein Ratgeber)
Hat der Prüfer die Behandlung zugeteilt?
ja
nein
Experimentelle Studie
Beobachtungsstudie
Zufällige Zuteilung?
Kontrollgruppe?
ja
Randomisierte
kontrolliertes
Experiment
ja
nein
Nichtrandomisiertes
kontrolliertes
Experiment
nein
Analytische Studie
Deskriptive
Studie
Richtung?
Exposition und Ergebnis
zur gleichen Zeit
Exposition → Ergebnis
Kohortenstudie
Exposition ← Ergebnis
FallKontrollstudie
Querschnittstudie
Oxford Centre for Evidence - based
Medicine Levels of Evidence
Level
Therapy/Prevention, Aetiology/Harm
1a
SR (systematic review) (with homogeneity) of RCTs (randomized
controlled trial)
1b
Individual RCT (with narrow Confidence Interval)
1c
All or none
2a
SR (with homogeneity) of cohort studies
2b
Individual cohort study (including low quality RCT; e.g., <80% follow-up)
2c
"Outcomes" Research; Ecological studies
3a
SR (with homogeneity) of case-control studies
3b
Individual Case-Control Study
4
Case-series (and poor quality cohort and case-control studies)
5
Expert opinion without explicit critical appraisal, or based on physiology,
bench research or "first principles"
Therapiestudien: Vor-Nach-Vergleich
Patient sucht Arzt auf; Studienbeginn
y
Zeit
Änderung: Δy =
+
+
+
+
Δyspontan
ΔyStudie
Δyandere Faktoren
ΔyTherapie
ΔyMessfehler
Versuchsplanung
Verfahren und Regeln, die es
gestatten, durch geplante Auswahl und
Anordnung der Versuchseinheiten die
Möglichkeiten statistischen Schließens
auf der Grundlage fachspezifischen
Wissens zu verbessern.
Studienplanung
Fragestellung
Einarbeitung in die Problemstellung
Studienplanung
Durchführung des Experiments / Beobachtung
Analyse der Daten
Interpretation und Präsentation der Ergebnisse
Der Studienplan
• Jedes wissenschaftliche Projekt ist durch
einen Studienplan zu dokumentieren!
Inhaltsvorgaben:
• Good Scientific Practice der
Medizinischen Universität
• Statistical Principles in Clinical Trials
Synopsis
•
•
•
•
•
Titelseite (Datum, Unterschrift)
Zusammenfassung
Inhaltsverzeichnis
Projektmitarbeiter
Autorenschaft
Wissenschaftlich-medizinischer
Abschnitt
•
•
•
•
•
•
•
•
•
•
•
•
Einführung
Ziele und Hypothesen der Studie
Präliminäre Daten/Pilotversuche
Studiendesign oder Versuchsprotokoll
Grundprinzipien und Diskussion des Studiendesigns
Beschreibung der Stichprobe
Anzahl der Patienten, Versuchstiere bzw. in-vitro
Beobachtungen
Einschluss- bzw. Ausschlusskriterien
Behandlung, Intervention
Darstellung der Ergebnisvariablen
Methoden der Evaluation
(Diskussion der Methoden)
Statistik und Datenanalyse
• Berechnung der erforderlichen
Stichprobengröße
(Effektgrößenbestimmung)
• Umgang mit fehlenden Werten
(Datentransformation)
• Beschreibung der anzuwendenden
Methoden
Versuchsansatz
Zwei unterschiedliche Konzepte:
• Unabhängige Stichproben (parallele Gruppen):
Anwendung der Vergleichsbehandlungen an
verschiedenen Beobachtungseinheiten (z.B. Pat.)
• Abhängige
Stichproben
(Paarvergleich):
Anwendung an derselben Beobachtungseinheit
(z.B. Vergleich der Werte eines Patienten vor und
nach Operation, Cross-Over-Versuchsplan)
Unabhängige Stichproben
Neurogene Blasenstörung
Abhängige Stichproben
Cross-Over-Versuchspläne
Patient
Behandlungsabfolge
1
AB
AB
2
AB
BA
3
AB
BA
4
AB
AB
5
AB
BA
6
AB
BA
7
AB
AB
8
AB
AB
Cross-Over
Homöopathie
versus
Pharmakologische
Therapie
RR syst. (liegend)
Crossover-Versuchspläne
Pros:
 Patientin ist ihre eigene Kontrolle
 Vergleich basiert auf der intra-individuellen
Variabilität
 Geringer Stichprobenumfang
Contras:
 Längere Beobachtungsdauer (Ausfälle, DropOuts)
 Zuordnung von Neben- und Nachwirkungen
 Modellvoraussetzungen
Auswahl der Zielpopulation
• Stichprobe bei medizinischen Studien meist
relativ klein (Ggt.: Vollerhebung)
• Hohe Anforderung an Planung der Studie,
Stichprobenauswahl (Einschlusskriterien)
• Je eingeschränkter das Patientenkollektiv,
desto geringer die biologische Variabilität
• Schlüsse gelten nur für eingeschränktes
Kollektiv
Auswahl der Zielpopulation (Forts.)
• Einschränkende Eigenschaften
(Ausschlusskriterien)
• Z.B. Alter über 18 Jahren, Ausschluss eines
fortgeschrittenen Krankheitsstadiums oder
von bestimmten Begleiterkrankungen (wie
Diabetes)
• Fehlendes Einverständnis
Was kann schief gehen ?
• Stichprobe ist nicht repräsentativ für die
Grundgesamtheit (Repräsentativität)
• Systematische Fehler bei Zuteilung der
Patientinnen zu den Therapien
„Selection Bias“
„Bias“: Systematischer Fehler
Neigung, Hang, Vorurteil
Bias
Jeder Effekt des Designs oder der
Durchführung der Studie, der Resultate
erzielt, die systematisch von der
Wirklichkeit abweichen.
Was kann schief gehen ? (Forts.)
• Unterschiede in der Intensität der Pflege
der Patientin durch voreingenommenes
Personal (Behandlungsgleichheit)
„Performance Bias“
• Unterschiede in der Messung oder
Bewertung (Beobachtungsgleichheit)
„Detection Bias“
• Unterschiedliche Vollständigkeit
„Attrition Bias“
Ein häufiges Problem:
Wiederholte statistische Test
(Multiples Testen)
• Wie verändern sich die Verhältnisse, wenn
mehr als ein statistischer Tests zu einer
Fragestellung ausgeführt werden?
• Z.B. Mehrere Studien zur gleichen Frage,
mehrere Zielvariablen innerhalb einer Studie, …
Ein Rechenbeispiel
• Es werden 5 unabhängige Studien zum
Vergleich der Therapie A mit Placebo
durchgeführt. Alle fünf statistischen Tests
der Hauptzielvariablen werden auf dem
zweiseitigen Signifikanzniveau von 5%
(α=0.05) ausgeführt. Die Therapie A hat
die exakt gleiche Wirkung wie Placebo.
• Wie groß ist die Wahrscheinlichkeit
mindestens eine falsch positive Studie
zugunsten von A zu erhalten?
Ein Rechenbeispiel (Forts.)
• Wie groß ist die Wahrscheinlichkeit für ein falsch
positives Testergebnis zugunsten von A in einem
zweiseitigen Test zum Signifikanzniveau 0.05?
• 0.025
• Wie groß ist die Wahrscheinlichkeit, unter fünf
unabhängigen Studien kein einzig signifikantes
Ergebnis zugunsten von A zu beobachten
• (1-0.025)5=0.9755=0.88
• Wie groß ist die Wahrscheinlichkeit mindestens ein
signifikantes Ergebnis zugunsten von A zu
erhalten?
1-0.88=0.12 (~5 x 0.025)
Primäre und sekundäre
Zielkriterien innerhalb einer Studie
• Nur eine oder wenige Zielvariable.
• Die Irrtumswahrscheinlichkeiten (und der
Stichprobenumfang) werden üblicherweise
auf die Entscheidungen zu dem (den)
primären Zielkriterium (-kriterien) bezogen.
• Die Nebenzielkriterien werden häufig nur
deskriptiv ausgewertet.
Viele Fragen kosten mehr !
• Wer sicherstellen will, dass auch im Falle der
Anwendung vieler Tests innerhalb einer Studie die
Wahrscheinlichkeit für mindestens eine „falsch
positive“ Entscheidung kontrolliert wird (z.B. dass
diese Wahrscheinlichkeit insgesamt nicht größer als
0.05 ist) muss bei den einzelnen Tests einen Preis
bezahlen. D.h. das individuelle Signifikanzniveau für
die einzelne Frage muss verkleinert werden (z.B.
auf 0.05/Anzahl der Tests).
• Dies verringert allerdings die Chancen (Power),
richtig positive Entscheidungen zu treffen!
Auswertungsstrategie
• Auswertungsstrategie ist vor der Durchführung des Experiments festzulegen
• Fester Stichprobenumfang oder sequentiell
(Zwischenauswertung)
Zwischenauswertungen
• Wenn während einer Studie mehrmals mit einem
konventionellen Test ausgewertet wird (ohne ein
signifikantes Ergebnis wird die Stichprobe
vergrößert, und weiter getestet – „hunting for
significance“) dann kann sich die Rate der falsch
positiven Entscheidungen dramatisch erhöhen.
• Zwischenauswertungen müssen in ihrer Anzahl und
ihrem Timing vorgeplant werden!
• Es ist ein Preis für die Möglichkeit früher
Entscheidungen zu bezahlen (bei einer einzigen
Zwischenauswertung z.B. nahezu Halbierung des
Sinifikanzniveaus in der Zwischenanalyse und
Endauswertung: 0.05/2=0.025).
Prüfung auf Überlegenheit oder
„Gleichheit“
• Überlegenheit: Aus der Studie muss gezeigt
werden, dass die experimentelle Therapie der
Kontrolle überlegen ist (z.B. das neue
Medikament ist besser als das alte).
• Gleichheit („equivalence“, „non-inferiority“): Es
muss gezeigt werden, dass die experimentelle
Therapie ähnlich wirkt wie (nicht nennenswert
schlechter ist als) die aktive Kontrolltherapie
(z.B. das neue Medikament ist gleich gut wie
das alte, hat aber weniger Nebenwirkungen).
Ein wichtiger Grundsatz
• Exakte Gleichheit kann statistisch nicht
bewiesen werden!
• Nach dem Falsifizierungsprinzip kann
allenfalls statistisch nachgewiesen werden,
dass sich zwei Behandlungen nicht um
mehr als ein bestimmtes Maß unterscheiden
Überlegenheit (A,B)
Negative Effekte werden A besser als B
statistisch verworfen
A=B
A-B=0
Unterschied A-B
Gleichheit (A,B)
„Nicht-Unterlegenheit von A “
B besser als A
A=B
A besser als B
Δ
A-B=0
Unterschied A-B
Diese Effekte werden A nicht nennenswert schlechter
statistisch verworfen
„Δ-non-inferiority“
Ein Dilemma
• Wenn in einer Studie zum Nachweis der
Nicht-Unterlegenheit mangelhaft gearbeitet
wird, kann dies zu einer falschen
Äquivalenzaussage führen
• Wird in einer Studie Überlegenheit gezeigt,
dann kann dies per se als Beleg für eine
gute Durchführung der Studie gewertet
werden (Einhaltung der Studienregeln,
Erreichen einer geringen Variabilität …)
• Assay Sensitivity
Wahl des Stichprobenumfangs I
Fehlentscheidung I:
Breite Routineanwendung einer nicht
effektiven und/oder nicht hinreichend
sicheren Therapie
Die Wahrscheinlichkeit für die irrtümliche
Akzeptanz einer unwirksamen Therapie
wird über das Signifikanzniveau a
kontrolliert.
Wahl des Stichprobenumfangs II
Fehlentscheidung II:
Vorenthaltung einer wirksamen Therapie
für den Routineeinsatz
Die Wahrscheinlichkeit für diese Fehlentscheidung kann durch große Stichprobenumfänge
und/oder präzise Experimente mit geringer
Streuung minimiert werden.
Wahl des Stichprobenumfangs
Abhängig von
 Signifikanzniveau
 Erwartetem (relevanten) Effekt
 Varianz
 Vorgesehener Auswertungsstrategie
Power
Die benötigte Stichprobe wird meist mit
Hilfe von Computerprogrammen errechnet!
Stichprobenumfang - Vergleich von
zwei Erfolgsraten
• In einer Studie werden zwei Populationen,
z.B. Patienten mit einer Kontroll- (K) oder
Testbehandlung (T), verglichen
• Hauptzielkriterium ist die Erfolgsrate nach
einer festen Nachbeobachtungsperiode
Stichprobenumfang - Vergleich von
Erfolgsraten (Bsp.)
• Aus Vorstudien geht hervor, dass für die
Vergleichsgruppe eine Erfolgsrate von 0.7
(70%) zu erwarten ist
• Der Unterschied im Anteil zur experimentellen Gruppe, den wir als relevant und
entdeckungswürdig erachten, sei 0.15 (15
Prozentpunkte), sodass wir dort auf einen
Erfolgsanteil von 0.85 (85%) hoffen
Stichprobenumfang - Vergleich von
Anteilen (Bsp.)
• Wir wollen am Ende die beiden Gruppenanteile mit einem zweiseitigen Test auf dem
Signifikanzniveau α=0.05 vergleichen
• Dabei soll die Gruppengröße so gewählt
werden, dass die Differenz von 15% in den
Anteilen (70% versus 85%) mit einer Wahrscheinlichkeit (Power) von 0.8 in der Studie
auch tatsächlich als statistisch „signifikant“
nachgewiesen werden kann
Stichprobenumfang – Vergleich von
Anteilen (Bsp.- Forts.)
• Durch das Signifikanzniveaus von 0.05 wird
die Wahrscheinlichkeit kontrolliert, zwei gleich
wirksame Behandlungen (T=K) irrtümlich als
verschieden zu erklären
• Die Power von 0.8 bedeutet, dass im Schnitt
in 4 von 5 solchen Studien statistisch die
Überlegenheit der Testbehandlung T gezeigt
werden kann, wenn sie tatsächlich um 15
Prozentpunkte erfolgreicher ist (T>K)
Stichprobenumfang – Vergleich von
Anteilen (Bsp.- Forts.)
Um diese Sicherheiten zu gewährleisten
(die Wahrscheinlichkeiten für irrtümliche
Entscheidungen zu kontrollieren)
sind
134 Patienten pro Gruppe (insgesamt 268)*
erforderlich
* χ2-Test mit Kontinuitätskorrektur
Stichprobenumfang - Vergleich von
zwei Erfolgsraten
Power=0.8, a=0.05, zweiseitig
Erfolgsrate
Erfolgsrate TestbeKontrolle handlung
Differenz
n pro
Gruppe
0.7
0.75
0.05
1291
0.7
0.80
0.10
313
0.7
0.85
0.15
134
0.7
0.90
0.20
72
0.7
0.95
0.25
43
Vermeidung von Bias
Randomisierung und
Verblindung
Was ist Bias? (Wiederholung)
Jeder Effekt des Designs oder der
Durchführung der Studie, der Resultate
erzielt, die systematisch von der
Wirklichkeit abweichen.
Randomisierung
Randomisierung ist die zufällige Zuteilung
der Behandlungen zu Patientinnen.
„Randomly dividing a single sample population into groups
that receive the test or control treatments avoids systematic
differences between the groups with respect to known or
unknown baseline variables that could affect outcome.“
Wesentliches Qualitätsmerkmal medizinischer
Forschung!
Randomisierungsmethoden
Vollständige Randomisierung:
Bei jeder Stichprobeneinheit wird zufällig entschieden;
Eingeschränkte Randomisierung:
Jede Behandlung kommt gleich oft vor;
Randomisierung in Blöcken:
z.B. 3 Blöcke zu je 6 Patientinnen, 3 Behandlungen:
Innerhalb jedes Blocks werden die 3 Behandlungen
A, B, und C jeweils zweimal zufällig zugewiesen
(siehe Beispiel).
Bsp.:
Patnr
Bsp.:
Patientinnen mit
hohem
Blutdruck:
Medikament A
Medikament B
Placebo (C)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Eingeschränkte
Randomisierung
A
A
C
C
A
C
A
B
A
B
C
B
A
C
B
B
C
B
Randomisierung
in Blöcken
A
B
C
C
A
B
B
C
A
A
B
C
B
C
B
A
C
A
Oder
variable
Blöcke
Wie erfolgt die tatsächliche
Randomisierung?
Randomisierungscode wird im allgemeinen von
Computerprogrammen erstellt und steht z.B. in
Form einzelner verschlossenen Kuverts den
Studienzentrum lokal zur Verfügung (oder wird
über Telefon oder das Internet von einer
unabhängigen Stelle abgerufen).
Liste selbst steht nicht im Studienprotokoll!
An der MSI steht das Programm RANDOMIZER
zur Verfügung (Zugang über die Homepage)
Sequentielle (zentrale) Randomisierung
Risikofaktoren
A
Treatment B
C
Σ
Sex
♀ ♂
9
8
10 7
Age
≤60 >60
8
9
6 11
Stage
I
II III
8
4
5
8
5
4
Σ
16
9
7
7
9
8
3
5
28
22 21
29
24
12
14 50
Patientin 51: ♀, >60, II
A
r(♀)=1
r(>60)=2
r(II)=2
5
17
17
B
r(♀)=2
r(>60)=3
r(II)=3
8
C
r(♀)=1
r(>60)=2
r(II)=1
4
Verblindung
Einfache Verblindung:
Patientin/Probandin wird nicht über ihre Behandlung
informiert;
Doppelte Verblindung:
Auch die behandelnde Ärztin kennt Therapie nicht;
„The groups should be treated and observed similiarly
during the trial except for receiving the test and control
treatments. Clinical trials are often double-blind (or „doublemasked“), meaning that both subjects and investigators as
well as … are unaware of each subject‘s assigned
treatment.“
Kontrollgruppen
Kontrollgruppe
Placebo-Gruppe
Aktive Kontrolle
Gesunde Kontrolle
(Fall-Kontroll-Studie)
Kontrollgruppe
• Choice of Control Group for Clinical Trials,
ICH 10
• Konvention von Helsinki, rev. Version
„Control groups have one major purpose: to allow
discrimination of patients outcomes (for example
changes in symptoms, signs, or other morbidity) caused
by the test treatment from outcomes, caused by other
factors, such as the natural progression of disease,
observer or patients expectations or other treatment..“
Wann braucht man keine
Kontrollgruppe?
„In unusual cases, the course of illness is in fact
predictable in a defined population and it may be
possible to use a similar group of patients previously
studied
as
a
historical
control.
In
most
situations,however, a concurrent group is needed
because it is not possible to predict outcome with
adequate accuracy or certainty.“
Parallele (gleichzeitige)
Kontrollgruppen
„A concurrent control group is one chosen from the same
population as the test group and treated in a defined way
as part of the same trial that studies the test treatment,
and over the same period of time. The test and control
groups should be similar with regard to all baseline and
on-treatment variables that could influence outcome,
expect for the study treatment.“
 Zufällige
Zuteilung (Randomisierung)
 Verblindung
Placebo-Kontrollgruppe
„Rather, the placebo control design, by allowing blinding and
randomization and including a group that receives an inert
treatment, controls for all potential influences on the actual or
apparent course of the disease other than those arising from
the pharmacologic action of the test drug.“
„The use of a placebo control group does not imply that the
control group is untreated. In many placobo-controlled trials,
the new treatment and placebo are each added to a common
standard therapy (add-on).“
Aktive Kontrollgruppe
„In an active control (or positive control) trial, subjects are
randomly assigned to the test treatment or to an active
control. …
Active control trials can have two distinct objectives with
respect to showing efficacy:
(1) to show efficacy of the test treatment by showing it is as
good as a known effective treatment or
(2) to show efficacy by showing superiority of the test
treatment.“
Der Gold Standard:
Randomized Double-blind PlaceboControlled (Multicentre) Trials
„In a placebo controlled trial, subjects are randomly
assinged to a test treatment or to an identical-appearing
treatment that does not contain the test drug. …
„Such trials are almost always double-blind. The name
suggests that its purpose is to control for „placebo“ effect
(improvement in a subject resulting from thinking that he or
she is taking a drug), but that is not its only or major benefit.
Ethische
Voraussetzungen
Die Ethikkommission
Jeder klinische Versuch an Tieren oder
Menschen muss von einer Ethikkommission
beurteilt werden.
Die Ethikkommission hat dabei insbesondere
zu beurteilen:
• Prüfung der Zumutbarkeit für Individuum,
Risiken
• die Eignung der Prüferin
• Studienplan, wissenschaftliche Aussagekraft,
Nutzen/Risiko-Verhältnis;
Ethics – four basic principles for
human conduct
•
•
•
•
Doing good (beneficience)
Not harming (nonmaleficience)
Respecting persons (autonomy)
Distributing goods and evils fairly (justice)
Dazu in der medizinischen Forschung
• Quality / Excellence
(e.g., of statistical planning and analysis)
Declaration of Helsinki
„Medical research involving human subjects must
conform to generally accepted scientific principles, be
based on a thorough knowledge of the scientific literature,
other relevant sources of information, and on adequate
laboratory
and,
where
appropriate,
animal
experimentation.“
Placebo – Ethische Fragen I
„In cases where an available treatment is known to prevent
serious harm, such as death or irreversible morbidity in the
study population, it is generally inappropriate to use a placebo
control. There are occasional exception,… .“
„In other situations, when there is no serious harm, it is
generally considered ethical to ask patients to participate in a
placebo-controlled trial, even if they may experience
discomfort as a result, provided the setting is non-coercive and
patients are fully informed about available therapies and the
consequences of delaying treatment.“
Placebo – Ethische Fragen II
„When a treatment is tested for conditions for which no
effective treatment is known, there is usually no ethical
problem with a study comparing the new treatment to
placebo.“
„Use of placebo control may raise problems of ethics,
accepatibility, and feasibility, however, when an effective
treatment is available for the conditions under study in a
proposed trial.“
Declaration of Helsinki
52nd WMA General Assembly, Edinburgh, Oct. 2000
„The benefits, risks, burdens and effectiveness of a new
method should be tested against those of the best
current prophylactic, diagnostic, and therapeutic
methods. This does not exclude the use of placebo, or no
treatment, in studies where no proven prophylactic,
diagnostic or therapeutic method exists.“
Publikation und Autorenschaft
• Consort Statement (z.B. BMJ)
–Richtlinien zur Publikation
randomisierter, klinischer Studien
• Good scientific practice
–Urheberrechte
–Autorenschaft
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
Einige Grundsätze I
• Statistischen Methoden und ihre Anwendung in
der
medizinischen
Forschung
sind
eine
wesentliche Grundlage zur Gewinnung von
Evidenz für ärztliches Handeln.
 Die Methoden der Auswertung der Ergebnisse
sollten nach Möglichkeit im voraus so definiert
werden, dass verfälschte Schlüsse durch datenabhängige Auswahl vermieden werden (z.B.:
durch Angaben zu den Zielvariablen, zu den
statistischen Verfahren, zu der Anzahl und Art von
Zwischenauswertungen,
zum
Umgang
mit
fehlenden Werten, …).
Einige Grundsätze II
 Die Anzahl der in eine Studie eingeschlossenen
Patientinnen sollte ausreichend groß sein, um die
im voraus abgeschätzten Risken für Fehlentscheidungen klein halten zu können.
 Die Einhaltung der vorgeplanten Prozeduren
innerhalb einer Studie sollte durch geeignete
Methoden der Qualitätskontrolle und Qualitätssicherung laufend überprüft werden.
Schlussbemerkungen
• Für Patientinnen in der innovativen therapeutischmedizinischen Forschung wird naturgemäß ein
Restrisiko bestehen bleiben
• Es ist das Wesen einer experimentellen Situation,
dass eben nicht alle für die Risikoabschätzung
notwendigen Erkenntnisse vorliegen (sonst würde
man vermutlich kein Experiment planen)
• Würde dies (in wissenschaftlich unredlicher Weise)
eingefordert werden, so sind die Konsequenzen für
den medizinischen Fortschritt offensichtlich.