Abstract
Mål
For å vurdere om kommersielt sponsede studier er forbundet med høyere suksessrate enn offentlig sponsede studier.
Studiedesign og innstillinger
Vi foretok en systematisk gjennomgang av alle på rad, publiserte og upubliserte fase III kreft randomiserte kontrollerte studier (RCT) utført av GlaxoSmithKline (GSK) og NCIC Clinical Trials Group (CTG). Vi inkluderte alle fase III kreft RCT vurdere behandling overlegenhet fra 1980 til 2010. Tre beregninger ble vurdert til å bestemme behandling suksesser: (1) andelen av statistisk signifikante forsøk favoriserer eksperimentell behandling, (2) hvor stor andel av studier der nye behandlinger ble betraktet som overlegne ifølge etterforskerne, og (3) kvantitativ syntese av data for primær utfall som definert i hvert forsøk.
Resultater
GSK gjennomført 40 kreft RCT påløper 19,889 pasienter og CTG gjennomført 77 forsøk melde 33,260 pasienter. 42% (99% CI 24 til 60) av resultatene var statistisk signifikant å begun eksperimentelle behandlinger i GSK sammenlignet med 25% (99% CI 13-37) i CTG kohort (RR = 1,68, p = 0,04). Etterforskerne konkluderte med at nye behandlinger var bedre enn standard behandling i 80% av GSK sammenlignet med 44% av CTG studier (RR = 1,81; p 0,001). Meta-analyse av den primære utfallet indikerte større effekter i GSK studier (odds ratio = 0,61 [99% CI 0,47 til 0,78] sammenlignet med 0,86 [0,74 til 1,00]; p = 0,003). Men testing for effekten av behandling over tid signalisert at behandling suksess har blitt sammenlignbare i det siste tiåret.
Konklusjoner
Mens samlet bransje sponsing er assosiert med høyere suksessrate enn offentlig sponsede studier synes forskjellen å ha forsvunnet over tid
Citation. Djulbegovic B, Kumar A, Miladinovic B, Reljic T, Galeb S, Mhaskar A, et al. (2013) Behandling Suksess i Cancer: Industri Sammenlignet Offentlig Sponsored randomiserte kontrollerte studier. PLoS ONE 8 (3): e58711. doi: 10,1371 /journal.pone.0058711
Redaktør: Christian Gluud, København universitetssykehus, Danmark
mottatt: 10. oktober 2012; Godkjent: 05.02.2013; Publisert: 21 mars 2013
Copyright: © 2013 Djulbegovic et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av en National Institutes of Health stipend (NIH /NCI, 1R01CA140408-01 /02). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Randomiserte kontrollerte forsøk (RCT) er avgjørende for oppdagelsen av nye terapeutiske intervensjoner. [1] Forskning på vurdering av nye kreftbehandlinger i RCT oppstår vanligvis i næringsliv og offentlig sektor. [2] Enten kommersielt eller offentlig sektor forskningsprogrammer generere høyere forekomst av nye vellykkede behandlinger er ikke kjent. [2] Tidligere forskning basert på analyser av offentlig sponsede RCT, tyder på at ca 25-50% av alle nye kreftbehandlinger som ble testet i RCT er vellykket. [3] til sammenligning industri-sponsede studier har vært assosiert med suksess priser som er 45-50% høyere i forhold til offentlig sponset RCT [4] -. [7] Men tilsynelatende høyere suksessrate i industri-sponsede studiene kunne reflektere skjevhet (som for eksempel valg av komparator) eller artefakt av rapportering (publikasjonsskjevhet) [6]. Dette er fordi ingen studier oppdatert tok hensyn til riktig vurdering av både evner som representerer det totale antall av alle studier utført av kommersielle og offentlige organer og teller, som refererer til antall «vellykkede» resultater favoriserer ny behandling i henhold til primære utfallet, som fungerer som grunnlag for prøve design. [8], [9] videre vanskeligheter for å nøyaktig vurdere sammenslutning av sponsing og resultater er også på grunn av mangel på studier som fokuserer på terapeutiske fremskritt i ett felt (for eksempel kreft ) og lignende periode med forskning utvikling i industrien og offentlig støttede studier.
i 2004, i settling en rettssak med staten New York, legemiddelfirmaet GlaxoSmithKline (GSK) enige om å sette opp en omfattende online kliniske studie registret making resultater fra alle studier, trykte eller utrykte, offentlig tilgjengelig. [10] Dette gjorde systematisk studie av mønsteret av behandling suksess i bransjen sponset studier i forhold til offentlig sponset RCT. I denne artikkelen sammenligner vi frekvensen av terapeutisk suksess for eksperimentell versus standardbehandling i RCT involverer kreftpasienter som ble gjennomført av NCIC Clinical Trials Group (CTG [tidligere National Cancer Institute of Canada kliniske forsøk gruppe] for ytterligere detaljer om CTG se Supplerende materiale), en akademisk kreft kliniske studier samarbeidsgruppe som gjennomfører nasjonale og internasjonale RCT til de av GSK, den nest største, privatfinansierte farmasøytiske selskap.
Metoder
vurderingen av behandling suksessen industrien sponset forhold til offentlig sponset fase III kreft RCT ble utført i henhold til metodene med suksess i tidligere studier [3], [11] – [13].
kriterier
Alle rad, publiserte og upubliserte, fase III kreft RCT vurdere overlegenhet av en behandling over en annen utført av GSK eller CTG og fullført innen juni 2010 var kvalifisert for inkludering. Siden vår hovedinteresse var å vurdere andelen RCT hvor eksperimentelle behandlingsformer var overlegne til eksisterende behandlinger, vi ekskludert fra våre analyse forsøk som hadde blitt utviklet for å vurdere likeverdighet eller non-inferiority snarere enn overlegenhet. Alle RCT fra begge kohorter dekke forskning utviklingsmiljø i samme periode (1980-2010).
Datakilder og studievalg
En omfattende liste over alle fase III randomiserte kontrollerte studier sammen med tilhørende protokoller og publiserings henvisninger ble hentet fra CTG. For GSK, en detaljert liste over alle fase III randomiserte kontrollerte studier i kreft ble skapt gjennom et bredt søk av GSK klinisk studie register som er tilgjengelig på det verdensomspennende nettet. [14] Alle prøveprotokoller fra GSK og CTG ble selvstendig av to korrekturlesere for å fastslå valgbarhet. Nøyaktigheten av den endelige listen (nevneren) av inkluderte studier ble verifisert av CTG og GSK representanter.
Data utvinning
To lesere uavhengig hentet data fra kvalifiserte studieprotokoller og publikasjoner ved hjelp av en standardisert form. [3], [11] – [13] Utgitt og upubliserte studier ble inkludert i den endelige analysen. I tilfelle av upubliserte CTG studier ble data levert av CTG. For upubliserte GSK studier ble data hentet fra prøveoppsummeringsrapporter. Data hentet inkludert trial egenskaper, offentliggjøring status, publikasjonstype, type kreft, behandling informasjon, behandling kategori, og valg av kontroll intervensjon. Metodisk kvalitet domener som er relevante for å minimere skjevheter og tilfeldige feil for hver inkluderte RCT ble registrert i henhold til etablerte metoder. [15]
Vurdering av behandlings suksess
overlegenhet eksperimentell eller standard behandling ble vurdert tre måter [3], [11] – [13]:
hver prøveresultatet ble klassifisert som statistisk signifikant eller ikke for
a priori
spesifisert primære utfallet (favoriserer eksperimentell eller standard behandling) og endelige utfallet ble oppsummert som proporsjoner;
som statistisk signifikans ikke fanger opp alle spissfindigheter involvert i å identifisere behandling suksess eller trade-off mellom fordeler og ulemper av konkurrerende tiltak, vi også vurdert suksessraten ved å bestemme andelen av forsøk som ble ansett ifølge søkernes dommer for å være vellykket (vurderes på en 6 punkts skala hvor en score på en favoriserer standard behandling og en score på 6 favoriserer den eksperimentelle behandling). I tilfeller hvor eksperimentelle behandlinger ble bedømt av etterforskere for å erstatte standard behandling som ny standard på omsorg, ble slike eksperimentelle behandlinger klassifisert som «fit for adopsjon som standard of care». Nærmere om vurderingsmetoder er gitt i supplerende materiale. Disse metodene har vært brukt med hell i tidligere studier av oss med høy pålitelighet, ansikt og innhold gyldighet [3], [11] – [13] samt av andre [16]. Ytterligere detaljer om vurdering av suksessrate som per forskernes skjønn er gitt i tilleggsmaterialet figur S1;
som de to første metodene er basert på «stemme telling «og ikke ta hensyn til omfanget av effekten, sample størrelse, eller tid til hendelsesdata, også utførte vi en kvantitativ syntese av aggregerte data fra hver studie på primære og sekundære utfall for å vurdere en fordeling av resultater som favoriserer standard eller eksperimentell behandling som per metoder anbefalt av The Cochrane Collaboration. [15]
et grunnleggende premiss i den samlede vurderingen av behandlingen suksess er at etterforskerne gjøre sine «spill» om overlegenhet en behandling over en annen før en rettssak er gjennomført. [3], [5], [11] – [13] evalueringen av suksessen til ny behandling avhenger av forskernes tro på effekten av behandlingen på den primære utfallet uavhengig av type behandlinger studert. Det vil si at en tilsvarende fordeling av behandling suksess bør observeres for kurativ, adjuvans, palliativ, etc. behandling uansett om primære utfallet var overlevelse, sykdomsfri overlevelse, responsrate, symptomlindring og så videre. [3], [5] , [11] – [13] Vi har derfor analysert for alle forsøkene sammen. Likevel gjør vi rapportere resultater i henhold til de ulike kategoriene også andre undergrupper (se resultater).
vevd med vurderingen av behandling suksess er spørsmålet om etterforskerne kan forutsi resultatene på forhånd med høy sannsynlighet. Det er, men som regel etterforskerne alltid håper at nye behandlinger ville slå bedre enn etablerte behandlingsformer [3], [11] – [13], [17], [18], vi har tidligere teori om at, på en objektiv testing, kan forskerne ikke forutsi resultatet [3], [5], [17] -. [19] det vil si, noen ganger undersøkernes spådommer vil være rett, noen ganger kan de være galt, og noen ganger ville det ikke være sant forskjell mellom de eksperimentelle og kontrollerte behandlinger. Som et resultat, ville vi forvente å observere om lik fordeling i andelen studier hvor eksperimentelle behandlingsformer er overlegen eller dårligere enn standard behandling [3], [5], [17] -. [19]
sensitivitetsanalyser
i tillegg til analyse med fokus på primær utfall, noe som gjenspeiler forskere /finansiører «hett tips på forventet suksessen testet behandlinger for å vurdere robustheten våre funn, gjennomførte vi sensitivitetsanalyser i henhold til metode kvaliteten på studiene (skjevhet og tilfeldige feil), publisering status, valg av kontroll intervensjon, samt i henhold til de viktigste kreft utfall, typer behandling, etc. (se resultater).
Statistiske analyser
Forskjeller i andel av suksess (eksperimentelt versus standard) i henhold til statistisk signifikans og forskernes skjønn innenfor hver kohort av studier (GSK og CTG) ble vurdert ved hjelp av en to-utvalgs binomisk test. Ved hjelp av en standard tilnærming, data om primære utfallet var meta-analysert og rapportert som odds /hazard ratio (OR /HR) med 99% konfidensintervall (KI) under en tilfeldig effekt-modell. [15] Disse dataene vanligvis inkludert tid til -event (f.eks overlevelse og overlevelse) og dichotomous data (f.eks svarprosent). I tilfelle dataene på primære utfallet var basert på den kontinuerlige data, ble de forvandlet til OR og samlet med resten av dataene. [15] Test av samhandling ble utført for å vurdere for forskjellene i behandlingseffekter mellom undergrupper. [15]
Vurdering av behandlingsmønsteret suksess over tid
for å vurdere om behandlingen suksess endret seg over tid, vi ansatt tidsserier metode og meta-regresjon. I tidsserieanalyse, hypotese vi at dersom behandling suksess påvirker hverandre, ville vi forvente å se signifikant korrelasjon mellom eksperimentell behandling på tidspunktet
t Kjøpe og foregående ganger. Ved testing i hvert forsøk er uavhengig av hverandre, ville en «hvit støy» mønster uten vesentlig autokorrelasjon i analysen forventes. Fordi tidsserieanalyse kan gå glipp av en trend i resultatene over tid på grunn av ulike eksogene faktorer som et skifte mot valg av komparator, eller økning i størrelsen på utvalget over tid, også utførte vi en meta-regresjon ved hjelp av studieår som en co -variate, og uttrykte data for endring i trenden av behandlingseffekten over hvert tiår inkludert testing for statistiske interaksjoner i behandlingseffekter mellom to årskull. [20]
Alle statistiske analyser ble utført ved hjelp av Stata programvare. Dette arbeidet er rapportert i henhold til PRISMA retningslinjer. [21]
Resultater
Trials og behandlingsmetoder Kjennetegn
Identifisering og utvelgelse av studier for GSK og CTG kohorter er illustrert i figuren 1. CTG kohorten besto av 77 studier (84 sammenligninger) melde 33,260 pasienter og GSK kohorten besto av 40 kreft RCT (50 sammenligninger) som registrert 19,889 pasienter. Prøve kjennetegn ved alt inkludert RCT for CTG og GSK kohorter er oppsummert i tabell 1. Data om primær utfall var utilgjengelig for 8 forsøk i CTG kohort (se figur 1). Overlevelse var det primære utfallet i 48% (40/84) av CTG-kohorten og 6% (3/50) av GSK sammenligninger (p 0,0001). Den hyppigste typen behandling studert av CTG og GSK var i domenet av palliativ /støttende terapi; imidlertid en forskjell i prosenter mellom to kohorter var signifikant (42% [35/84] i NCIC CTG vs. 84% [42/50] i GSK; p 0,001). Metodiske kvaliteten av inkluderte studier for begge kohorter er oppsummert i tabell 2. Totalt kvaliteten på studier utført av CTG og GSK var bra. Imidlertid, var det en signifikant forskjell (ved p 0,05) i det følgende risiko for skjevhet komponenter: skjuling av allokering er tilstrekkelig beskrevet i 100% av CTG-forsøk (n = 84) sammenlignet med bare 14% (7/50) av GSK-studier ; beskrivelse av uttak /utfall ble gitt i 75% (63/84) av CTG studier sammenlignet med 88% (44/50) av GSK studier. Tilsvarende blindende ble beskrevet i 35% (29/84) av CTG prøvelser, mens 82% (41/50) av GSK forsøk rapportert det. Konsekvenser av den metodiske kvaliteten på det samlede resultatet er videre gitt i diskusjonskapittelet.
Evaluering av behandlingssuksess
Figur 2 viser suksessrate på GSK og CTG kohorter i henhold til statistisk signifikans (Figure2A), søkernes dommer (Figure.2B) og kvantitativ syntese (Figure2C). Som vist detaljert i figur 3, resultatene var statistisk signifikant på 44% (99% CI 26-62, 22/50) av GSK sammenlignet med 31% (99% CI 18-44; 26/84) for CTG forsøk (RR = 1,42; p = 0,128). Men i GSK-kullet, 42% (99% CI 24 til 60, 21/50) av de resultater som var statistisk signifikante foretrukne eksperimentelle behandlinger sammenlignet med 25% (99% CI 13-37, 21/84) i den CTG kohort (RR = 1,68; p = 0,04) (figur 2A 3). Pr søkernes dommer, ble nye behandlinger favoriserte over standard i 80% (99% CI 65-94; 39/49) av GSK studier sammenlignet med 44% (99% CI 30-58; 37/84) i CTG studier (RR = 1,81; p 0,0001) (figur 2B). GSK etterforskere anses 32% (99% CI 14-50; 14/44) av intervensjoner som «fit for adopsjon som standard vare» i forhold til 10% (99% KI 1-18, 8/82) av CTG etterforskere ( RR = 3,3; p = 0,002) (figur 2B)
(A) Fordeling av suksessrate i henhold til statistisk signifikans av resultatene for primære utfallet.; (B) Fordeling av suksessrate i henhold til undersøkernes dommer. * Data for en sammenligning i GSK-kullet var ikke tilgjengelig for å ta en avgjørelse om undersøkernes dommer. For ti sammenligning i GSK kohort og to sammenligninger i CTG kohort data var ikke tilgjengelig for å gjøre en vurdering av om etterforskerne regnes som eksperimentell behandling for å være et gjennombrudd (= passer for adopsjon som standard of care «). ** Resultatene var tilgjengelig i sammendraget format (upublisert). Derfor etterforsker dommer var ikke mulig å vurdere for 10 sammenligninger. (C) Forest plot som viser kvantitative samkjøring av data på primær utfallet for studier utført av CTG og GSK. Sammendraget sammenslått estimat (odds /hazard ratio) er angitt med rektangler, med linjer som representerer 99% konfidensintervall (CIS).
Meta-analyse av de viktigste resultatene indikerte at intervensjonen effekten var større i GSK studier (som indikert av lavere OR /HR i sykelighet /dødelighet) enn i CTG kohort (OR /HR = 0,61 [99% KI 0,47 til 0,78] sammenlignet med 0,86 [99% KI 0,74 til 1,00]; p = 0,003 for test av samspillet mellom to undergrupper, figur 2C). Resultatene for andre viktige utfall er vist i figur 4. For utfallet av total overlevelse, viste resultatene at suksessrate på GSK kohorten var lik CTG og nye behandlinger er like sannsynlig å bli dårligere eller bedre enn standard behandling (OR = 0,91 [99% KI 0,73 til 1,13] sammenlignet med 0,91 [99% KI 0,83 til 1,01]; p = 1,00 for test av samspillet mellom to undergrupper). Nye behandlinger ble litt favoriserte for arrangementet overlevelse i både GSK (OR = 0,75, [99% CI0.57-0.97]) og CTG (OR = 0,84 [99% KI 0,75 til 0,93] kohorter men testen av samspillet mellom undergruppene var ikke signifikant (p = 0,28; figur 4). for utfallet av responsrater nye behandlinger ble favorisert i forhold til standard behandling i GSK kohorten (OR = 0,54 [99% CI 0,38 til 0,76]), men ikke for CTG kohort (OR = 0,77 [99% KI 0,52 til 1,14; p = 0,08 for test av samspillet mellom to undergrupper;. figur 4) for utfallet av behandlingsrelatert dødelighet nye behandlinger var like sannsynlig å være overlegen eller dårligere enn standard behandling for GSK (OR = 1,03 [99% KI 0,71 til 1,50]) og CTG kohort (OR = 1,39 [99% KI 0,57 til 3,38]; p = 0,423 for test av samhandling,. figur 4) på samme måte begrense analysen til antiemetika terapi bare (som representerte den største kategorien av behandling i GSK og den nest største i CTG forskningsportefølje), fant vi tilsvarende behandlingseffekter med ingen forskjeller mellom to årskull (OR = 0,52 [99% CI 0,34 til 0,81] sammenlignet med 0,55 [99% KI 0,25 1,23]; p = 0,873; figur 5).
Sammendraget sammenslått estimat (odds /hazard ratio) er angitt med rektangler, med linjer som representerer 99% konfidensintervall (CIS). Merk at i motsetning til den samlede analysen for alle primære utfall (fig 2) test av interaksjon oppdaget ingen statistisk signifikant forskjell mellom undergrupper, men antall sammenligninger var for liten til å påvise en forskjell mellom to årskull.
Gitt forekomsten av studier med kvalmestillende behandling, tar vi dette subgruppeanalyse. Sammendraget sammenslått estimat (odds /hazard ratio) er angitt med rektangler, med linjer som representerer 99% konfidensintervall (CIS). Testen av interaksjon er statistisk ikke-signifikant mellom de to kohortene, men antall forsøk var liten.
Sensitivitetsanalyser i henhold til risiko for bias, type kreft, behandling kategorier, og rettssaken utforming er showet i figurene 6 til 8. resultatene fra følsomhetsanalyser viste at suksessgrad på eksperimentell versus standard behandling for GSK og CTG kohorter ikke ble betydelig påvirket av risiko for systematiske feil (figur 6 og 7) til tross for forskjeller i risiko for skjevhet elementer innenfor og mellom de to kohortene (se tabell 2). Resultat av ytterligere sensitivitetsanalyse er rapportert i tilleggsmaterialet (figur S2). Som vist i figur 8, mens GSK og CTG anvendes placebo /ingen behandling som en komparator i like proporsjoner, effekten størrelse i GSK-studiene som anvender placebo /ingen behandling som en komparator var signifikant større enn i de CTG forsøkene (se tabell 1 ). Tilsvarende 100% (11/11) av forsøk som er ansatt placebo i GSK var statistisk signifikant sammenlignet med 30% (3/10) av studiene i CTG kohort (p = 0,001) (figur 9).
Sammendrag sammenslått estimat (odds /hazard ratio) er angitt med rektangler, med linjer som representerer 99% konfidensintervall (cIS).
sammendraget sammenslått estimat (odds /hazard ratio) er angitt med rektangler, med linjer som representerer 99% konfidensintervall (cIS). * Representerer en statistisk signifikant test for samhandling mellom undergrupper. Testen for samspillet var statistisk signifikant i kohort av GSK studier rapporterer versus ikke rapporterer forventet forskjell for primære utfallet.
Sammendraget sammenslått estimat (odds /hazard ratio) er angitt med rektangler, med linjer som representerer 99% konfidensintervall (cIS). * Representerer en statistisk signifikant test for samhandling mellom undergrupper. Legg merke til at de eksperimentelle behandlinger var statistisk bedre i GSK studier der komparatorer var placebo eller ingen behandling.
(A) Suksess rate i henhold til statistisk signifikante funn, klinisk skjønn og meta-analyse i placebokontrollerte studier. (B) Suksess rate i henhold til statistisk signifikante funn, klinisk skjønn og meta-analyse i forsøk med aktiv behandling som kontroll. Statistisk signifikante resultater ble observert i GlaxoSmithKline (GSK) forsøk i henhold til alle 3 beregninger av oppsummerer behandling suksess (andel av statistisk signifikante resultater som favoriserer eksperimentell behandling, i henhold til de søkernes dommer og kvantitativ pooling av data). (B). Når den aktive komparator ble brukt, var dette bare gjelder for beregningene i henhold til undersøkernes dommer. Test av interaksjoner i placebokontrollerte studier var meget signifikant i favør av GSK forhold til National Cancer Institute i Canada Clinical Trials Group (CTG) sammenligninger (p = 0,001), mens det ikke var signifikant (p = 0,154) mellom studiene når aktiv kontroll ble brukt som en komparator.
Figur 10 viser effekten av behandling over tid. Tidsserieanalyse var i overensstemmelse med den «hvit støy» mønster som indikerer at hvert forsøk adressert spørsmålet uavhengig av den foregående. Imidlertid viser en meta-regresjon en signifikant trend mot HR = 1 (logHR = 0) over tid i GSK kohort. Det er, redusert den gjennomsnittlige behandlingseffekter over tid med 48% per tiår (figur 10B). For CTG kullet, var det ingen endring i størrelsen av effektstørrelse over tid. Determinantkoeffisient (R
2) var 24,5% i GSK-analyse, dvs. modell utgjorde omtrent 25% av den observerte variasjon i resultatene, mens R «sup> 2 var praktisk talt lik null i CTG kohort.
A) Tidsserieanalyse analyse~~POS=HEADCOMP av behandlingseffekt (naturlig logaritme hazard ratio [ln HR]). Dataene er i samsvar med «hvit støy» mønster indikerer ingen signifikant autokorrelasjon mellom studier utført på ulike tidsintervaller. En ln HR mindre enn 0 indikerer overlegenhet av nye behandlinger; større enn 0, overlegenhet av vanlige behandlinger. B) Meta-regresjonsanalyse. Resultatene viser en signifikant trend mot HR = 1 (logHR = 0) over tid i GlaxoSmithKline (GSK) kohort. Det vil si at gjennomsnittlig effektstørrelse behandlinger redusert over tid [38% per tiår (= exp (0,48) = 1,62)] For National Cancer Institute i Canada Clinical Trials Group (CTG) kohorten var det ingen statistisk signifikant endring i behandlingen effekt over tid. R «sup> 2 = 24,48% for GSK dvs. modell utgjorde omtrent 25% av den observerte variasjon i resultatene, mens R» sup> 2 var praktisk talt lik null i CTG kohort. C) Meta-analyse stratifisert etter tidsperioder. Resultatene bekrefter funnene i meta-regresjon. Vertikale linjer indikerer linjer med ingen forskjell mellom nye og standard behandling. Legg merke til at en «ingen forskjell» resultat kan oppnås ved behandlinger er helt identiske, eller når eksperimentelle behandlinger er så vellykket som standard behandling (det vil si noen ganger nye behandlinger er bedre og noen ganger standardbehandlinger er bedre). Firkanter angir punktestimater. Horisontale linjer representerer 99% konfidensintervall (KI)
Prøvestørrelsen var noe større i GSK studier [median (spredning). 296 (20 to8231) sammenlignet med 244 (31-5157; p = 0,062 ). Det økte også over tid i begge kohorter. For GSK, i gjennomsnitt utvalgsstørrelsen doblet per tiår. For CTG i gjennomsnitt økte det med 50% per tiår. Den gjennomsnittlige utvalgsstørrelsen øker (dvs. helling) var statistisk signifikant mellom to gruppene (P 0,001). (Figur 11)
Det var en økning i størrelsen på utvalget over tid både for National Cancer Institute Canada Clinical Trials Group (CTG) og GlaxoSmithKline (GSK) kohort. For CTG i gjennomsnitt økt utvalgsstørrelsen med 50% per tiår, mens for GSK i gjennomsnitt det dobbelte. GSK studiene var også noe større enn CTG forsøk: [median (spredning): 296 (20-8231) vs. 244 (31-5157); p = 0,062]. Utvalgsstørrelse var noe større i GSK studier [median (spredning): 296 (20-8231) sammenlignet med 244 (31-5157); p = 0,062]. Det økte også over tid i begge kohorter. For CTG, i gjennomsnitt utvalgsstørrelsen økt med 50% per tiår, mens for GSK, i gjennomsnitt, det doblet per tiår. Den gjennomsnittlige utvalgsstørrelsen øker (dvs. helling) var statistisk signifikant mellom to gruppene (P 0,001).
For å undersøke om endring i bruken av komparator (aktiv vs. placebo /ingen behandling), og økning i prøvestørrelse kan forklare endringen av størrelsen av behandlingseffekt over tid, en meta-regresjon ved bruk av tid, ble komparator og prøvestørrelsen utført. Resultatene viser at ingen av disse variablene påvirket resultatene i CTG kohort (R
2 = -0,68%), som forble stabilt over tre tiår med observasjoner. Men i GSK kohort, tid (år utgivelses; p = 0,048), og valget av komparatoren (p 0,0001) ble forbundet med statistisk signifikant virkning på effekten størrelse mens prøvestørrelsen viste ingen slik sammenheng (p = 0,08; Figur 12 ). Disse to variable utgjorde om lag 72% av den observerte variasjonen i resultatene (R
2 = 71,7%). Andre følsomhet analyseresultatene fra meta-analyse for distribusjon av suksessraten for studier med multiple sammenligninger er illustrert i tilleggsmaterialet Figur S2.
Ingen av variablene var statistisk signifikant i NCIC CTG kohort av studiene (R
2 = -0,68%). I GSK kohort utvalgsstørrelse viste ingen statistisk signifikant sammenheng med resultatene (p = 0,08), mens i år (p = 0,048) og valg av komparator (p 0,000) ble statistisk assosiert med de observerte resultatene i GSK kohort. Disse to variable utgjorde om lag 72% av den observerte variasjonen i resultatene (R
2 = 71,69%). Generelt, effektstørrelse var nærmere 1 (ln HR = 0) når aktiv komparator var ansatt.
Diskusjoner
Mens andre studier evaluert en sammenheng mellom sponsing og helseutfall [5], [6], [22], ingen studie undersøkte spesielt spørsmål hvor ofte nye behandlinger er overlegne i forhold til etablert behandling som en funksjon av midler kilde. Vi presenterer den første studien evaluere behandlingen suksess og mønster av terapeutiske funn i bransjen sponset versus offentlig sponset forskning. Ved hjelp av tre beregninger for vurdering av terapeutisk suksess, viste vi at suksess priser varierer mellom næringsliv og offentlig sponsede studier. Eksperimentelle behandlinger var i gjennomsnitt favorisert i bransjen sponset forskning. Nye behandlinger som resulterer i statistisk signifikante resultater ble favorisert oftere i GSK enn i CTG kohort (42% versus 25%; p = 0,04). Tilsvarende vurdering av forskning suksess ifølge søkernes dommer viste at eksperimentelle behandlinger var bedre enn standard behandling i 80% av GSK sammenlignet med 44% av NCIC CTG studier (p 0,001). Til slutt, kvantitativ samlet analyse av data for den primære utfallet også indikert at suksessraten av GSK forsøk var bedre enn de av CTG studier (odds ratio = 0,61 sammenlignet med 0,86; p = 0,003). Dermed avhengig av det metriske brukes, industri-sponsede studier assosiert med 17 til 25% statistisk signifikant høyere rate av oppdagelsen av nye vellykkede behandlinger enn offentlig sponsede studier. Men tiden analyse indikerte at forskjellen er forsvunnet over tid, og at suksessraten mellom bransjen sponset og offentlig sponsede studier har blitt sammenlignbare (Figur 11).
Hvordan kan disse resultatene forklares? En grunnleggende del av noen forklaring må dreie seg om spørsmålet om forutsigbarhet i resultatene på forhånd og dens implikasjoner for klinisk utprøving system
Våre funn er i samsvar med flere hypoteser, som ikke er nødvendig gjensidig utelukkende.
resultatene representerer «sannheten». De observerte høyere suksessrate sett i industri-sponsede studier er forankret i veien kommersielle sponsorer investere i utvikling av legemidler, slik at kun forslag med svært lovende data og høy sannsynlighet for suksess fremgang å RCT testing. [7] Det er, jo høyere suksess priser sett i bransjen sponset forskning er forventet, og kan forklares med omfattende forskning og utviklingsarbeid, kombinert med multi dollar investering [23], intrikate kunnskap om narkotika, nøye planlegging og grundig og profesjonell utførelse, i samsvar med en tilhørende hensynet til å bringe et terapeutisk middel for lisensiering godkjenning og marked. [7], [23], [24] Derfor er de resultater som viser at andelen av nye behandlinger er overlegne i forhold til standard behandling er signifikant høyere i kommersielt sponset forsøk er ekte, og bør ikke tas som en overraskelse. [7], [24] Nedgangen i forskjellene i behandlings suksess mellom offentlig sponset og bransjen sponset over tid kan gjenspeile økende vanskeligheter med å utvikle «blockbuster» legemidler (for eksempel onandenstron i palliativ feltet, som sto for en rekke positive studier GSK denne kohort) som vanligvis er forbundet med store effektstørrelser. Som et resultat av forsøkene i senere tiår fokusert på å oppdage mindre bivirkninger, som krevde større utvalgsstørrelser.