Abstract
Bakgrunn
Kilde dataverifisering (SDV) er et ressurskrevende metode for kvalitetssikring hyppig brukt i kliniske studier. Det er ingen empiriske bevis som tyder på at SDV ville påvirke komparative behandlingseffekt resultater fra en klinisk studie.
Metoder
Dataavvik og sammenligningsbehandlingseffekter oppnås følgende 100% SDV ble sammenlignet med de som er basert på data uten SDV. Total overlevelse (OS) og progresjonsfri overlevelse (PFS) ble sammenliknet med Kaplan-Meier-kurver, log-rank tester og Cox-modeller. Tumor respons klassifikasjoner og komparative behandlings odds ratio (ORS) for utfallet objektiv responsrate, og antall alvorlige bivirkninger (SAE) ble sammenlignet. OS estimater basert på SDV data ble sammenlignet mot estimater fra sentralt overvåket data.
Funn
Data avvik ble identifisert mellom ulike overvåkningstiltak for de fleste av variablene undersøkes, med noe variasjon i avviks priser . Det var ingen systematiske mønstre til avvik og deres innflytelse var ubetydelig på OS, den primære utfallet av rettssaken (HR (95% CI): 1,18 (0,99 til 1,41), p = 0,064 med 100% SDV, 1,18 (0,99 til 1,42) , p = 0,068 uten SDV, 1,18 (0,99 til 1,40), p = 0,073 med sentral overvåking). Resultatene var lik for PFS. Mer ekstreme avvik ble funnet for den subjektive utfall ordnede målet respons (OR (95% CI): 1,67 (1,04 til 2,68), p = 0,03 med 100% SDV, 2,45 (1,49 til 4,04), p = 0,0003 uten SDV) som var for det meste på grunn av ulike CT-skanning.
Tolkning
Kvalitetssikring metoder som brukes i kliniske studier underrettes ved empirisk bevis. I denne empiriske sammenligning SDV var dyrt og identifisert tilfeldige feil som gjorde liten innvirkning på resultatene og kliniske konklusjoner av studien. Sentral overvåking ved hjelp av en ekstern datakilde var en mer effektiv tilnærming for den primære utfallet av OS. For den subjektive utfall objektiv respons, en uavhengig blindet komite og sporingssystem overvåke mangler skannedata kan være mer effektiv enn SDV
Citation. Tudur Smith C, Stocken DD, Dunn J, Cox T, Ghaneh P , Cunningham D, et al. (2012) Verdien av kildedata Verifikasjon i en Cancer Clinical Trial. PLoS ONE 7 (12): e51623. doi: 10,1371 /journal.pone.0051623
Redaktør: Salomon M. Stemmer, Davidoff Center, Israel
mottatt: 4 mai 2012; Godkjent: 05.11.2012; Publisert: 12.12.2012
Copyright: © 2012 Tudur Smith et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. CTS er støttet av Medical Research Council [tilskuddet antallet G0800792]. Kreften klinisk studie ble finansiert av Cancer Research UK. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
den internasjonale konferansen om harmonisering (ICH) Good Clinical Practice (GCP) retningslinje [1] definerer prøve overvåking som «det handler om å føre tilsyn med utviklingen av en klinisk utprøving og for å sikre at det blir gjennomført, registrert og rapportert i samsvar med protokollen, Standard Operating Procedures, GCP, og gjeldende forskriftskrav (s) «. Hovedmålet med prøve overvåking bør være å sikre pasientsikkerheten og datakvalitet. Mens flere tilnærminger finnes for å overvåke kliniske studier, er de vanligvis klassifiseres under overskriftene av
på stedet overvåking Hotell og
sentral overvåking
.
Kontroll på stedet inkluderer en rekke av ulike prosedyrer for overvåking, hver med et felles tema som et medlem av den kliniske studien teamet er nødvendig for å besøke en eller flere av de deltakende nettstedene på ett eller flere tidspunkter i løpet av rettssaken. Prosedyrer utført under besøk på stedet er mange og kan omfatte kontroll narkotika ansvarlighet, diskutere rekruttering og oppbevaring tall for området, og gjennomgang av screening logger og samtykkeerklæringer. En av de vanligste prosedyrer som utføres i løpet av on-site overvåking er kildedata Verification (SDV), en prosedyre som brukes til å kontrollere at data registrert i rettssaken sak Report Form (CRF) som møter den primære kilde data som finnes i den aktuelle kildedokumentet som journalen til pasienten.
Sentral overvåking omfatter også en rekke ulike prosedyrer, men er preget av å bruke sentraliserte prosedyrer i stedet for befaringer. Prosedyrer kan omfatte utforske samler data sentralt for å sjekke konsistens over tid og på tvers av ulike dataelementer, statistiske teknikker for å identifisere uvanlige data mønstre innenfor og på tvers av studiestedene, og ekstern validering av data elementer, for eksempel gjennom fødsels- og dødsregistre.
ICH GCP er ikke konkret om formatet for overvåking i kliniske forsøk, men antyder at «generelt er det behov for overvåkning på stedet, før, under og etter forsøket og ved bruk av sentrale overvåknings i forbindelse med andre framgangsmåter kan bli rettferdiggjort i unntakstilfeller «[1]. Dessverre retningslinjen blir ofte misforstått og kliniske studier ofte rutinemessig inkluderer on-site overvåking som kan være ineffektiv, unødvendig og kan føre til at allerede begrensede ressurser blir rettet mot kvalitetssikring prosedyrer som kan være uviktig. På grunn av en økende bekymring om effektiviteten og effektiviteten av overvåkingspraksis, og en mangel på empiriske bevis for å avgjøre hvilken praksis best kan nå målene i rettssaken overvåking angitt i ICH, kliniske studier Transformation Initiative (CTTI) prosjekt på effektiv overvåking [ ,,,0],2] ble igangsatt for å identifisere beste praksis og gi fornuftige kriterier for å hjelpe sponsorer velge den mest hensiktsmessige overvåkingsmetoder for en klinisk studie. En nylig utgang fra dette prosjektet er en kartlegging av dagens praksis som fremhevet de ulike tilnærminger til overvåking og mangel på tilstrekkelig empirisk bevis for å avgjøre hvilken på stedet overvåkingspraksis fører til økt pasientsikkerhet og kvalitet på data [3]. Den CTTI Prosjektet anbefaler å bygge kvalitet inn til rettssaken design og fokus tilsyn på feil som er mest sannsynlig å påvirke kvaliteten på studiene, erkjenner at dataelementene varierer i deres innvirkning på sikkerheten til deltakerne eller påliteligheten av prøveresultatene slik at en enkelt -minded fokusere på å sjekke /sikre nøyaktigheten av hver datapunkt er misforstått [2].
Bakobaki et al [4] søkte litteraturen nylig og ikke identifisere noen forsøk som formelt evaluert på stedet overvåking teknikker eller direkte sammenlignet flere overvåkingsstrategier mot hverandre. De senere foretok en retrospektiv gjennomgang av noen utvalgte på stedet overvåkingsrapporter fra et stort HIV-forebygging rettssaken, som konkluderte med at 95% av de på stedet overvåking funn anmeldt kunne identifiseres ved hjelp av sentrale overvåkingsstrategier. Videre Buyse et al [5], Baigent et al [6] og andre har foreslått at sentral overvåking er en mer effektiv metode for identifisering av svindel og anomalier i dataene som er mest sannsynlig å påvirke resultatene. Baigent et al [6] markere et eksempel fra Second European Stroke Prevention Study, hvor fabrikkert data på 438 pasienter fra ett område ble først oppdaget av sentrale overvåkingsmetoder som on-site overvåking hadde mislyktes i å identifisere.
den økonomiske, menneskelige og tid ressurs som kreves for overvåking på stedet er større enn for sentral overvåking og dette vil trolig være en betydelig faktor i valg av metode som brukes av kommersielle eller ikke-kommersielle kliniske studier. Resultater fra en undersøkelse blant svenske farmasøytiske selskaper i 2005 foreslo at femti prosent av kostnadene for GCP-relaterte aktiviteter i fase III studiene var grunnet SDV, med en anslått faktiske kostnadene for SDV for en fase III program beregnet til 90 millioner amerikanske dollar [ ,,,0],7]. I en annen undersøkelse, på stedet for overvåking ble anslått til omtrent 25 til 30% av kostnadene i fase III kliniske forsøk kardiovaskulære [8]. I 2000, Favalli
et al. Product: [9] evaluert den gjennomsnittlige kostnaden per befaring i onkologi prøve å være 1500 amerikanske dollar ikke inkludert lønn tapt gjennom tiden det tar fra vanlige plikter. På grunn av de høye kostnadene forbundet med befaringer og SDV, og usikkerhet om effektiviteten av disse metodene, er det et sterkt behov for å undersøke merverdien av overvåking på stedet i form av bedre datakvalitet og pasientsikkerhet. Valget av overvåkingspraksis skal, så langt det er mulig være basert på empiriske bevis som i dag mangler i dette viktige området.
Data er tilgjengelig fra en parallell, åpen, multisenter (Storbritannia), fase III, overlegenhet RCT sammenligner kontroll med eksperimentell behandling hos pasienter med avansert kreft. Forsøket ble utformet og iverksatt før innføringen av Storbritannia (UK) Kliniske Forskrift mai 2004 (Obligatorisk Instrument 2004 Antall 1031) og opprinnelig inkluderte en grad av sentral overvåking for manglende og uvanlige data identifisert ved hver interimanalyse og en planlagt blindet gjennomgang av alle svardata. I løpet av de stadier av siste datainnsamling, mot slutten av studien, Trial Management Group enige om å gjennomføre 100% SDV gjennom besøk på stedet for å styrke konklusjonene fra rettssaken ved å sikre datakvalitet. Dette notatet beskriver en empirisk sammenligning av 100% kilden bekreftet data mot tilsvarende ubekreftet data og utforsker verdien av SDV for denne rettssaken. Vi utforsker også verdien av sentraliserte prosedyrer i denne innstillingen.
Metoder
Mellom mai 2002 og januar 2005 ble rettssaken rekruttert 533 pasienter fra 75 sekundære og tertiære barnehager over hele Storbritannia, som alle hadde forskningserfaring, men variabel i mengden. Oppfølging av pasientene og døds data ble samlet inn og skrevet inn på studiedatabasen frem til mars 2006. Under gjennomføringen av rettssaken, ble alle data samlet inn på papir CRFs og inn på en sentral database. De prospektivt planlagte kvalitetssikrings aktivitetene som gjennomføres i hele tatt en programmert database utviklet for å minimere innspill feil (f.eks nedtrekkslisten heller enn manuell inntasting, dato sjekker i forhold til datoer for innreise og behandlinger), planlagt interimanalyser (3 interim analyser foretatt) som inkluderte statistiske data rengjøring av viktige variabler, og blindet gjennomgang av responsdata. Dette datasettet vil bli referert til som
opprinnelige data
.
Etter rettssaken hadde stengt for rekruttering, men med noen pasienter i aktiv oppfølging, ble en retrospektiv overvåkingsplanen utviklet til å omfatte 100 % SDV av alle viktige identifiserte dataelementer for alle pasienter for å bekrefte at dataene i CRF var konsistente, fullstendig og korrekt i forhold til kilden som pasientens sykehus notater. Et lite team av erfarne skjermer var ansatt for å gjennomføre de planlagte uavhengige SDV aktiviteter parallelt med selve rettssaken mellom 2006 og 2007. Alle kilde bekreftet data gjenåpnet på en ny database, uavhengig til den opprinnelige rettssaken database, med manuell og data generert kontroller. Dette datasettet vil bli referert til som
SDV data.
Siden SDV ble gjennomført mot slutten av rettssaken noen av hendelsene observert i SDV data var grunn til å ha observert en lenger oppfølging av pasientene i forhold til de opprinnelige data. Derfor, for å øke sammenlignbar og sikre så langt det er mulig at eventuelle forskjeller observert skyldes SDV, en felles «sensurere date «, kåret til den siste dødsdato registrert på den opprinnelige databasen (8/3/06), ble brukt på tvers begge datasettene. Oppfølgingsdata fra besøket før dette sensurere dato ble brukt der det er relevant i beregninger og data som er registrert etter denne sensurere dato ble ignorert for hensikten med denne empirisk sammenligning. En sensitivitetsanalyse ignorerer dette sensurere dato ble også undersøkt for den primære utfallet.
For å utforske verdien av SDV i denne innstillingen vi vurdert om SDV avdekket datafeil knyttet til kritiske elementer, men enda viktigere om disse dataene feil påvirket de viktigste studieresultatene og relaterte konklusjoner. Derfor ble begge datasettene sammenlignet i forhold til baseline data, primær utfallet (Total overlevelse (OS)), og sekundære utfall (progresjonsfri overlevelse (PFS), Mål respons, alvorlige bivirkninger (SAE)) av rettssaken. Rettssaken gjorde også samle inn data for to pasient rapporterte utfall men SDV har begrenset verdi for disse utfallene som kildedataene er de opprinnelige pasient utfylte spørreskjemaer som ble rutinemessig returnert til Clinical Trials Unit (CTU).
Følgende ble beregnet for hver pasient ved hjelp av begge datasettene:
tid fra randomisering til død uansett årsak eller siste oppfølging for de pasientene fortsatt i live på felles sensurere dato
tid fra randomisering til progresjon eller død uavhengig av årsak, eller siste oppfølging for de pasientene fortsatt i live og progresjon gratis på felles sensurere dato
Response vurdert i samsvar med Verdens helseorganisasjon (WHO) kriterier for sykdom respons (Response evalueringskriterier i solide tumorer (RECIST)) retningslinjer [10] og rapportert som best oppnås respons med kriterier fastsatt som følger:
Komplett respons (CR): forsvinningen av alle mållesjoner
partiell respons (PR): på minst en nedgang 30% i summen av de lengste diameter mållesjoner, tar som referanse referanse summen lengste diameter
Stabil sykdom (SD): Verken tilstrekkelig krymping å kvalifisere for delvis respons eller tilstrekkelig økning til å kvalifisere for progressiv sykdom, tar som referanse den minste summen lengste diameter siden behandlingen startet
progressive disease (PD): minst 20% økning i summen av de lengste diameter mållesjoner, tar som referanse den minste summen lengste diameter registrert siden behandlingen startet eller utseendet på en eller flere nye lesjoner
antallet avvik identifisert er oppsummert for klinisk relevante baseline karakteristika som vanligvis rapporteres i randomiserte kontrollerte studier (RCT) i denne spesielle klinisk setting. For tiden-til-event utfall (OS og PFS), Kaplan Meier overlevelseskurver, log-rank-analyser, og ujustert og justert (justert for stratifikasjonsfaktorer ved randomisering for bare OS) Hazard Ratio (HR) med 95% konfidensintervall ( CI) hentet fra Cox regresjonsmodeller, ble sammenlignet på tvers av datasettene beskrivende. For hvert datasett, ble samlet respons sammenlignet på tvers av behandlingsgruppene ved hjelp av en chi-kvadrat test og ved å estimere Odds Ratio (OR) og 95% CI. En enkel sammenligning av antall av alvorlige bivirkninger er registrert per pasient i hvert datasett ble foretatt. Forskjeller i registreringsmetoder mellom datasett gjort flere grundige sammenligninger av alvorlige bivirkninger vanskelig.
Central Monitoring for total overlevelse
The Office for National Statistics (ONS) samler registrering av fødsel og død data som kan gjøres tilgjengelig for forskning studier gjennom flagging, forutsatt at de aktuelle etikk godkjenninger er på plass. Bruk av uavhengig samlet fødsel og død data er en form for sentral overvåking og er nyttig for å bekrefte eksistensen, dato og dødsårsaken for kliniske studier deltakere.
ONS flagging ikke ble prospektivt planlagt for denne studien og så retrospektiv samling var nødvendig. En seksjon 60 søknaden ble sendt til pasientinformasjonen rådgivende gruppe (PIAG) for å få godkjenning til å samle inn pasient identifikatorer fra deltakende områder. Den multiforskningsetisk komité (MREC) ble varslet, og en betydelig endring sendes til medisiner og helseprodukter Regulatory Agency (MHRA). Etter disse godkjenningene, NHS nummer, navn og fødselsdato ble hentet fra nettsteder som deltar, og brukes for å matche med ONS. De papirkopier av ONS døds data ble deretter lagt inn på en database ved rettssaken team og verifisert gjennom dobbel dataregistrering.
ONS dataene gir en ytterligere kilde til den empiriske sammenligning av den primære utfallet OS. Tid fra randomisering til ONS dødsdato eller siste oppfølging for de pasientene fortsatt i live på vanlig sensurere dato, ble beregnet og sammenlignet med den opprinnelige og SDV data ved hjelp av metodene beskrevet ovenfor for OS.
Resultater
data for alle 533 randomiserte deltakerne ble verifisert mot kildedataene. Avvik i baseline ble påvist mellom de opprinnelige og SDV data (tabell 1). Prosentandelen av pasienter med et avvik for hver egenskap var generelt lav og likt fordelt på tvers av behandlingsgruppene (tabell 1) og deltakende områder (data ikke vist). I de opprinnelige dataene, ble 4 pasienter identifisert som kvalifisert etter randomisering. Tre pasienter hadde en pre-randomisering CT scan utenfor det tillatte 30 dagers intervall og en pasient hadde en annen krefttype til at oppført som kvalifisert i protokollen. Men prosessen med SDV ikke klarte å identifisere disse fire pasientene som ikke kvalifisert som førte til avviket i tabell 1. Ut over dette var det ingen systematiske mønstre i retning av avvik.
Total overlevelse
(i) Sammenligning av SDV mot originale data.
i alt 13 (2,4%) deltakere hadde et avvik i dødsdato mellom SDV og originale data. Andelen, størrelse, retning og type avvik i datoer var lik med noen systematisk mønster på tvers av behandlingsgruppene (tabell 2) eller områder (data ikke vist), og foreslår at transkripsjon feil var den mest sannsynlige forklaringen i de fleste tilfeller. For ytterligere 29 (5,4%) deltakere, SDV prosessen identifisert en dødsdato som ikke hadde blitt registrert i de opprinnelige dataene som hevet et avvik. Andelen av disse avvikene ble også likt fordelt på tvers av behandlingsgruppene [15] (5,6%) i kontrollgruppen og 14 (5,2%) i eksperimentgruppen). Alle ekstra dødsfall identifisert gjennom SDV inntruffet etter siste dato for oppfølging registrert i den opprinnelige datasettet og var for det meste dødsfall som inntraff mot slutten av rettssaken. Den Kaplan Meier overlevelseskurve for total overlevelse (figur 1) viser nesten identiske kurver for de opprinnelige og SDV data med en ubetydelig effekt på behandlingseffektivitet analyse uavhengig av om justert for
stadium Hotell og
ytelse eller ikke status product: (Tabell 3). Resultatene var nesten identiske i en sensitivitetsanalyse ved hjelp av alle tilgjengelige SDV data uansett sensurere dato brukes i empirisk sammenligning.
(ii) Sammenligning av sentrale overvåkings (ONS data) versus SDV.
Det var 53 (9,9%) avvik i dødsdato mellom ONS og SDV data. På tidspunktet for endelig analyse av prøvedata ONS var ikke i stand til å bekrefte en dato for død for fem av disse pasientene. SDV og originale data avtalt i fire av disse sakene og dødsdato ble også senere bekreftet av stedet personalet. Men for en av disse pasientene som ikke kunne bekreftes som død av ONS, originale data registreres pasienten som fortsatt er i live mens SDV data registrert denne pasientens status som «fortsatt i live», men også spilt inn en dødsdato (01/04/2005 ). Selv sannsynlig at denne pasienten var død ved tidspunktet for analyse, og dermed burde vært inkludert i ONS dataposter, vi følger pasienten som en sensurert observasjon i disse analysene. For en ytterligere pasient, ONS identifisert en dødsdato som ikke hadde blitt registrert i enten SDV eller de opprinnelige dataene.
Kaplan Meier overlevelseskurve (figur 1) og ujusterte behandlingseffektivitet analyse (tabell 3) ved hjelp av sentralt overvåket data er nesten identisk med SDV og originale dataanalyser.
progresjonsfri overlevelse
for sammenligningen mellom SDV og opprinnelige dataene, var det totalt 132 pasienter (24,8 %) med et avvik i avledet PFS tid (median avviks 0,1 måneder, nedre kvartil -1.8 måneder, øvre kvartil 1,5 måneder, minimum -13.3 måneder, maksimum 12,7 måneder). Prosentandelen av avvikende observasjoner er lik på tvers av behandlingsgruppene med noen systematisk mønster til retningen eller omfanget av avvik. De Kaplan Meier overlevelseskurver for PFS (figur 2) for SDV og originale data er igjen nesten identisk med en ubetydelig effekt på behandlingseffektivitet analysen (tabell 3).
Response
RECIST respons klassifikasjoner er basert på CT scan resultater gjennomført på bestemte tidspunkter i løpet av prøveperioden for å vurdere endringer i tumorstørrelse fra baseline. Across både SDV annonse opprinnelige dataene var det totalt 620 CT, men bare 460 (74,2%) hadde fått tildelt en RECIST klassifisering i begge datasettene. For disse 460 skanninger, var det enighet i RECIST klassifisering for 398 (86,5%), men uenighet for 62 (13,5%). De fleste av disse uoverensstemmelser (58 (93,5%)) var på grunn av en endring i klassifikasjon av ett nivå opp eller ned et nivå, f.eks PD til SD, med de resterende 4 skanner klassifisert som PR i de opprinnelige datasettet, men klassifisert som PD i SDV data. Totalt 160 skanninger ble ikke er felles for begge datasett; 125 skanninger som ble identifisert gjennom SDV og 35 skanninger som var savnet i løpet av denne prosessen, men som hadde blitt registrert i de opprinnelige dataene (tabell 4). Informasjon er ikke tilgjengelig for å utforske årsaken til disse avvikene. SDV prosessen er sannsynlig å ha identifisert flere skanninger som ble foretatt utenfor rettssaken protokoll 12-ukers timeplan.
For å utforske hvordan disse skanne nivå avvik sette til pasientens nivå generelle responsanalyse, den beste oppnådde respons på tvers av alle skanninger ble identifisert for hver pasient innenfor hvert datasett. Disse respons klassifikasjoner (pasientnivå snarere enn scan nivå) og behandling effekt-analyser for dette utfallet ble sammenlignet på tvers av behandlingsgruppene og datasettet (Tabell 5). Selv om begge datasett foreslår en betydelig bedre svarprosent for eksperimentell behandling sammenlignet med kontrollgruppen (nedre del av tabell 5), gir den opprinnelige data en mer ekstrem resultat (odds ratio 2,45) til fordel for eksperimentell behandling enn SDV data (odds ratio 1,67) . Dette kan tyde på en potensiell skjevhet i den opprinnelige datasettet som klinikere tolke skannedata ikke var blind for behandling tildeling og kan derfor være mer sannsynlig å favorisere en bedre respons klassifisering for pasienter på eksperimentell behandling. Men under rettssaken, ble alle skanninger anmeldt av en enkelt kliniker uvitende om behandlingen tildeling (original klassifisering). I tillegg vil forslaget av skjevhet ikke ut til å bli støttet av dataene som prosentandelen av pasienter som hadde en bedre respons utfall i SDV data i forhold til den opprinnelige (7,5% på kontroll, 7,6% på eksperimentell), eller en verre respons utfallet i SDV i forhold til de opprinnelige data (6,7% på kontroll, 8,9% av pasientene som eksperimentell) er lik på tvers av behandlingsgruppene. Opplysningene er basert på 134-kontroll og 158 eksperimentelle pasienter med en samlet reaksjon klassifisering tilgjengelig i begge datasett (data ikke vist).
alvorlige bivirkninger
Totalt var det 53 pasienter ( 9,9%) med et avvik i antall alvorlige bivirkninger mellom datasett; 20 pasienter hadde 29 flere alvorlige bivirkninger er registrert i det opprinnelige datasettet og 33 pasienter hadde 36 flere alvorlige bivirkninger registrert i SDV data (Tabell 6). Det er flere forskjeller mellom datasett for pasienter på kontroll (33 pasienter med 40 hendelser) sammenlignet med eksperimentelle (20 pasienter med 25 hendelser). Denne ubalansen er ikke betydelig, men kunne foreslå skjevhet i rapporteringen av alvorlige bivirkninger.
estimerte kostnader
Det er vanskelig å få tak i de fulle kostnadene ved alternativ overvåking tilnærminger for en retrospektiv analyse som dette. I dette eksempelet, vil de viktigste ekstra økonomiske kostnader for SDV har vært for skjermer lønn og utgifter som påløper under overvåkings besøk. Det var 533 pasienter rekruttert fra over 75 områder med et gjennomsnitt på 7,1 pasienter per nettsted. Antar det ville ta et gjennomsnitt på 2 timer per pasient for å foreta en fullstendig SDV for total overlevelse primære utfallet, ville prosessen har tatt anslagsvis 1066 timer, noe som tilsvarer anslagsvis 30,5 arbeidsuker (7 timer per dag, 5 dager i uken ). Forutsatt en gjennomsnittlig lønn for en klinisk studie skjerm på £ 26 000 per år (£ 31 306 årlig brutto kostnad), og et gjennomsnitt på £ 100 per uke i utgifter, et konservativt anslag av kostnadene for SDV for den primære utfallet er £ 21412. Kostnaden for den alternative sentrale overvåkingsprosessen ble anslått til å være ca £ 2023 for å inkludere ONS kostnader (ca kr 500) og Data Manager kostnader (kr 1523) basert på 3 arbeidsuker på lønn på £ 22 000 per år (£ 26 406 årlig brutto kostnad ) for å søke om § 60 tillatelse, får pasienten identifikatorer fra nettstedet, sender til ONS (navn, fødselsdato og NHS antall der det er tilgjengelig – minimum data var navnet og fødselsdato), computerize og validere datoene for døden. Ingen av disse estimatene har stått for den tid og økonomiske ressurser som kreves på hvert sted som med rimelighet kan forventes å være større for SDV prosessen.
Diskusjoner
Resultatene er presentert for en empirisk sammenligning av SDV data mot opprinnelige studiedata, og også mot sentralt overvåket data for den primære utfallet total overlevelse. Dataene brukes til dette empirisk sammenligning er ganske unik som sammenligningen gjelder en ikke-kommersiell klinisk utprøving av et utprøvingspreparat (CTIMP) som 100% SDV ble utført uavhengig av hoved rettssaken. Dette forsøket ble igangsatt før EU-kliniske studier direktiver og dagens britiske Clinical Trial krav som nå krever GCP opplæring av prøve ansatte, Clinical Trial tillatelsen og MHRA inspeksjoner av prøve dokumenter samt språk filer. Kreft kliniske studier i Storbritannia har også nytt godt av store endringer i forskning kultur med initiativ fra National Cancer Research Network. Den nåværende kultur for forskning styresett og regler som tar sikte på å sikre kvaliteten på kliniske forsøk og sikkerhet for pasientene ville gjøre dette empirisk sammenligning vanskelig å gjenta i fremtiden.
Sammenligningen identifiserte avvik mellom overvåkningstiltak for de fleste av variabler undersøkt, med noe variasjon i avviks priser. Potensialet for forspenningen er størst når feil er ikke-tilfeldig med hensyn til behandling allokering [6]. I dette eksempel er de identifiserte avvik for baseline variabler og data som er nødvendig for å konstruere resultater OS og PFS skilte seg ikke systematisk tvers av behandlingsgruppene eller på tvers av områder, noe som tyder på at tilfeldige transkripsjon feil var den mest sannsynlige forklaring for de fleste av variabler. For de to tid til hendelsen utfall effekten av disse avvikene på de samlede kliniske resultater og konklusjoner ble ubetydelig.
En viktig, om ikke overraskende funn av dette arbeidet er at SDV ikke nødvendigvis gir feilfrie data . I dette eksempel SDV mislyktes i å identifisere fire pasienter som ble klassifisert som ikke kvalifisert i de opprinnelige dataene. På grunn av alder og retrospektive natur av disse dataene, kan vi bare spekulere i at dette var på grunn av skjermens mangel på klinisk kunnskap. I virkeligheten SDV er en iterativ prosess, og så er det mulig at dette avviket i kvalifiserte pasienter ville ha slutt blitt identifisert og løst av rettssaken team. Men uoverensstemmelser i datoene for døden ble også identifisert når SDV data ble sammenlignet med sentralt overvåket data fra ONS. Det er usannsynlig at ONS data vil inneholde feil, men selv om det gjorde, disse kan forventes å oppstå helt tilfeldig og være uten tilknytning til rettssaken, utfall eller behandling, og vil derfor gi deg data for estimering av behandlingseffekten. Sammen med den ekstra tid og bekostning av SDV, anslått til å være rundt £ 19 389, disse funnene tyder på at alarm prosedyre for å bruke ONS data er den optimale tilnærmingen for å kvalitetssikre primære utfallsdata for denne rettssaken.
analysen av RECIST klassifiseringsinformasjon uthevet viktige spørsmål både når det gjelder identifisering av flere skanninger, og når det gjelder tolkning av skannedata. Avvik var mest tydelig, og også hadde størst innvirkning på resultatene, for dette subjektive utfall. Antallet flere skanninger identifisert gjennom SDV var tilsvarende fordelt på behandlingsgruppene og de mest sannsynlig gjenspeiler fortsatt klinisk oppfølging av pasienter på steder som ikke ble forespurt som en del av studieprotokoll, eller kanskje ikke har alltid blitt matet tilbake til studiene enhet . Videre, gitt at det var avvik identifisert mellom SDV og ONS dødsdato, og at SDV ikke klarte å identifisere 4 uegnet pasienter og 35 skanninger som var til stede i det opprinnelige datasettet, kan vi ikke være sikre på at SDV opplysningene nødvendigvis nøyaktig for dette resultat, særlig på grunn av sin subjektive natur. Det er mulig at skjermen vurdere skannedataene ikke kan ha hatt full medisinsk informasjon eller kunnskap som kreves for å gjøre en nøyaktig klinisk vurdering, en bekymring som er tatt opp i en tidligere studie [11], som skjermer kan være mindre erfaren og kunnskapsrik i den kliniske området sammenlignet med etterforskere på nettsteder. Alternativt kan klinikere /prøve forskere som gjorde det opprinnelige vurdering er partisk på noen måte fordi deres vurdering var blindet for pasientens behandling tildeling. Imidlertid ble en andre gjennomgang foretatt av en blindet kliniker, og dataene vi utforsket viste en tilsvarende fordeling mellom behandlingsgrupper på prosentandelen av pasienter med en bedre respons klassifisering mellom datasett. For dette subjektive utfall et robust system for sporing for å overvåke mottak av forventede skanninger under rettssaken, og en uavhengig endepunkt komite blindet for behandling tildeling kan ha vært den optimale metoden for kvalitetssikring.
Overvåking tilnærminger var vanskelig å sammenligne i forhold til SAE data på grunn av variasjonen i opptak og nødvendig bruk av åpne tekstfeltene. Imidlertid avvik i antall av alvorlige bivirkninger per pasient ble påvist mellom datasettene.