PLoS ONE: Klinisk Verdien av Prognose genekspresjon signaturer i Colorectal Cancer: En systematisk Review

Abstract

Innledning

Den tradisjonelle iscenesettelse system er utilstrekkelig for å identifisere de pasienter med stadium II kolorektal kreft ( CRC) med høy risiko for tilbakefall eller med stadium III CRC med lav risiko. En rekke av genekspresjon signaturer for å forutsi CRC prognose har vært foreslått, men ingen er rutinemessig brukt i klinikken. Målet med dette arbeidet var å vurdere prediksjonsevne og potensielle kliniske nytten av disse signaturene i en rekke uavhengige datasett.

Metoder

En litteraturgjennomgang identifiserte 31 genekspresjonssignaturer som brukte genekspresjon data til å forutsi prognose i CRC vev. Søket ble basert på PubMed database og var begrenset til artikler publisert fra januar 2004 til desember 2011. Eleven CRC genuttrykk datasett med utfallet informasjon ble identifisert og lastet ned fra offentlige repositories. Tilfeldig Forest klassifikator ble brukt til å bygge prediktorene fra genet lister. Matthews korrelasjonskoeffisienten ble valgt som et mål for klassifisering nøyaktighet og dens tilhørende p-verdi ble brukt for å vurdere forbindelse med prognosen. For klinisk nyttevurdering, ble positive og negative ettertester sannsynligheter beregnet i trinn II og III prøver.

Resultater

Fem gen signaturer viste signifikant sammenheng med prognose og gitt rimelig prediksjon nøyaktighet i sin egen trening datasett. Likevel, alle signaturer viste lav reproduserbarhet i uavhengige data. Stratifiserte analyser av scenen eller mikro ustabilitet status viste signifikant sammenheng, men begrenset diskriminering evne, spesielt i stadium II svulster. Fra et klinisk perspektiv, de prediktive signaturer viste en liten, men signifikant forbedring i forhold til den klassiske staging system.

Konklusjoner

De publiserte underskrifter viser lav prediksjonsnøyaktigheten men moderat klinisk nytte. Selv om genuttrykk data kan informere prognosen er bedre strategier for signaturvalidering for å oppmuntre sine utbredt bruk i klinikken

Citation. Sanz-Pamplona R, Berenguer A, Cordero D, Riccadonna S, Solé X, Crous -Bou M, et al. (2012) Klinisk Verdien av Prognose genekspresjon signaturer i tykktarmskreft: en systematisk oversikt. PLoS ONE 7 (11): e48877. doi: 10,1371 /journal.pone.0048877

Redaktør: Wayne A. Phillips, Peter MacCallum Cancer Centre, Australia

mottatt: May 30, 2012; Godkjent: 02.10.2012; Publisert: 07.11.2012

Copyright: © 2012 Sanz-Pamplona et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble støttet av EU-kommisjonen gi FP7-COOP-Helse-2007-B HiPerDART. Også Instituto de Salud Carlos III tilskudd (FIS PI08 /1635, FIS PI08 /1359 og FIS PI09-01037), CIBERESP CB07 /02/2005, den spanske foreningen mot kreft (AECC) vitenskapelige grunnlag, og den katalanske regjeringen DURSI bevilgning 2009SGR1489 . Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP (CRC) er den tredje vanligste kreftformen i verden, og den nest største årsaken til kreft dødsfall. I løpet av de siste tiårene har forekomsten vært økende, mens dødeligheten har sakte gått ned [1]. Et bemerkelsesverdig trekk ved CRC er forskjellen i prognosen av de tidlige og sene stadier av sykdommen: fase I og II har moderat risiko for tilbakefall etter kirurgisk reseksjon, mens pasienter med stadium III har en høyere sjanse for tilbakefall [2]. Anerkjent kliniske risikofaktorer for tilbakefall er krise presentasjon, dårlig differensiert tumor, dybde av tumorinvasjon, og ved organaffeksjon (T4) [3] – [5]. Men disse faktorene er utilstrekkelig til å identifisere pasienter med stadium II CRC med høy risiko for tilbakefall og bakre metastaser eller de pasienter med stadium III CRC ved lav risiko [6], som fører til mulig under-behandling eller over-behandling [3].

Tykktarmskreft kreft~~POS=HEADCOMP metastase er en strengt regulert prosess som krever avvik i genuttrykk slik at kreftcellene å komme seg gjennom ulike trinn før de kolonisere et fjernt organ [7]. Sannsynligvis de endringer som er nødvendige for gjentakelse allerede er til stede i den primære colon carcinoma, som bør tillate identifisering av prognostiske signaturer [8] – [10]. Gen-ekspresjon profileringsbaserte analyser har vært vellykket som prognostisk verktøy i brystkreft [11], [12]. Imidlertid har ingen signatur er vedtatt i rutinemessig klinisk praksis i CRC tross for et stort antall av genekspresjon profilering studier på prognosen er blitt utført.

Formålet med dette arbeidet var å teste den prediktive evne til disse publiserte signaturer som prognostiske markører i et betydelig antall uavhengige datasett, for å forstå deres styrker og svakheter, og finne ut om noen av dem kan brukes klinisk til å veilede beslutninger om adjuvant behandling for pasienter med stadium II eller III CRC.

Material og metoder

Publisert genekspresjonssignaturer og validering datasett

En systematisk litteraturgjennomgang ble utført for å identifisere studier som brukte genuttrykk data til å forutsi prognose i CRC [13]. Søket ble basert på PubMed database og var begrenset til de siste papirene for å øke validiteten (fra januar 2004 til desember 2011). Filer S1-S2, Tabell S1 og figur 1 detalj utvalget protokollen og PRISM sjekkliste. Artikler som følger en liste over differensielt uttrykte gener i primærtumorprøver i forbindelse med CRC prognose ble inkludert i vår studie. Vi utydelig henvise til disse listene over genene som «signaturer» eller «profiler». Studier basert på vev microarray og de som utelukkende var fokusert på forskjeller mellom scener eller mellom primærtumor og metastaser ble ekskludert. Den endelig inkludert for analyse studier er beskrevet i tabell 1 [14] – [43]. Offentlig tilgjengelige datasett med hel-genom genuttrykk tiltak i CRC primær tumorprøver ble identifisert og lastet ned fra GEO [44] og ArrayExpress [45] microarray dataregistre (tabell 2 og 3). Forhånds bearbeidet serien matriser opprinnelig gitt av forfatterne ble brukt i vår analyse.

Fordi ulike plattformer og har identifikatorer ble brukt i signaturer og genekspresjon datasett, en oversettelse til det offisielle Gene Symbol ble gjort for å ha en felles merknad. Denne oversettelsen ble utført ved hjelp av Universal Protein Resource merknad database [46], online oppbevaringssted for HUGO Gene Nomenclature Committee [47] og chip merknadsfiler fra Affymetrix nettstedet [48]. Uunngåelig, ble ingen treff for noen funksjoner i enkelte datasett og de var tapt for påfølgende analyse (File S3).

Statistical Analysis

Siden oppfølgingstiden var ikke tilgjengelig for de fleste av datasett, en binær utfall ble definert som en prognose status (tabell 2). Når det er mulig, var minimum tre års oppfølging er nødvendig for pasienter uten tumor tilbakefall. Likevel ble to datasett med ingen oppfølging informasjon inkludert (GSE5206 og GSE10402) for å øke størrelsen på utvalget. Stage IV personer ble inkludert i analysen som tilbakefall hendelser som det var forventet at de konkrete uttrykk endringer i fattige prognostiske prøver forbli uendret i primærtumor når metastaser har oppstått. Når data var tilgjengelig, ble subgruppe analyse utført i henhold til scenen og mikro ustabilitet status (MSS /MSI).

Hver signatur evne til å forutsi prognose ble uavhengig testet i hvert datasett med et binært klassifisering tilnærming ved hjelp av

Random Forest

ensemble klassifikator (RF) [49], [50]. Skoger ble dyrket med et høyt antall trær (5.000) for å sikre out-of-bag feil konvergens. Den minste størrelsen på terminalnodene ble satt til ett. For signaturer evaluering, ble nøyaktighet tiltak beregnet fra et 10-fold kryssvalidering (10CV) prosess hvor skillevegger ble stratifisert basert på utfallet. Nestet i denne prosessen, ble antall kandidat variabler på hver splitt valgt for å minimalisere ut-av-bag feil. Som foreslått i [51], undersampling ble utført uten tilbakelegging og ved bruk av samme antall observasjoner i hver gruppe prognose (0,632 ganger frekvensen til den minste gruppe). På grunn av mangel på balanse i utfallet grupper i enkelte datasett, RF viste en trend å svis klassifisere i den hyppigste gruppen. For å rette opp dette gjenstand, ble klassifiseringen stemme cutoff endret i henhold til de tilsvarende prognose gruppe frekvenser. Alle disse analysene ble utført ved hjelp av R-pakken randomForest [52].

For å bekrefte våre resultater, ble en radial kernel Support Vector Machine (SVM) basert klassifiserer også brukt [53], [54]. På grunn av ubalanse, ble observert samme gjenstanden beskrevet ovenfor ved anvendelse av standard SVM klassifikator. Så vi prøvde å rette det opp ved hjelp av en under-prøvetakingsstrategi som følger [55]: i) velge alle prøver fra sjeldnere gruppe; ii) tilfeldig velge det samme antall prøver fra hyppigere gruppe; iii) gjenta prosessen 25 ganger; iv) definerer de forut etiketter med utfallet gruppe frekvensene som stemme andel cutoff for klassifisering regelen. En 10CV prosessen ble gjennomført for å beregne nøyaktighet tiltak med en nestet 10CV for parameter tuning, begge stratifisert etter utfallet grupper. Et bredt spekter av verdier for kostnader og radial kjerneparametere ble evaluert under innstillingsprosessen (20 like langt verdier fra 0,001 til 1,000 i logaritmen skala, 11 like langt verdier i området 0,05 ×

p

til 20 ×

p

, som

p

antall funksjoner i hvert tilfelle). ble utført alle disse analyse med R-pakken

svmpath product: [56].

Matthews korrelasjonskoeffisient (MCC) [57] ble valgt som mål for klassifisering nøyaktighet [58]. Denne indeksen kombinerer test sensitivitet og spesifisitet. Det spenner -1-1 og dens tolkning er lik den Pearsons korrelasjonskoeffisient. I forbindelse med en klassifisering problem er det forventet at MCC går fra 0 (ingen prediksjonsevne i det hele tatt) til en (perfekt prediksjon) med negative verdier nær null muligens forekommer i tilfeldige classifiers grunn av prøven variasjon. MCC-verdier lavere enn 0,3 kan betraktes som en indikasjon på lav prediktiv verdi som de svarer til mindre enn 65% nøyaktighet i balanserte data. Sensitivitet, spesifisitet og total nøyaktighet priser ble også beregnet for tolkningsformål.

Den potensielle nytten av signaturene på klinisk praksis ble evaluert ved hjelp av de positive og negative sannsynlighetsforhold (LR +, LR-) og den predikerte positive og negative post-test tilbakefall sannsynligheter (PPTpr, NPTpr) i stadium II og III prøver seg [59].

for å oppsummere signatur globale ytelse, hver av tiltakene ovenfor ble slått sammen på tvers av datasett til en entydig indeks ved hjelp av vekter proporsjonalt med hvert datasett utvalgsstørrelsen. For å dempe uroen og skjevhet i kryss-validering beregninger, ble datasett med mindre enn 10 prøver per gruppe og de som brukes i avledning av profilen i den opprinnelige studien ekskludert fra disse beregningene [60].

betydningen av MCC, nøyaktighet, sensitivitet, spesifisitet, LR +, LR-, og forskjeller i PPTpr og NPTpr ble vurdert ved hjelp av null distribusjoner basert på 100.000 permutasjoner. Beregningene som ble gjort i sammenheng med det teoretiske rammeverket for permutasjon tester [61] som er implementert i R pakken

mynt product: [62]. Intervaller på 95% ble bygget ved hjelp av Bias Korrigert og Accelerated bootstrap (BCA) metode med 5.000 resamples stratifisert etter prognose gruppe [63]. Empiriske påvirkning verdier ble beregnet ved den vanlige knytningsmetoden. Disse beregningene ble gjort ved hjelp av R-pakken

boot product: [64]. I alle tilfeller ble permutasjoner og resampling utføres direkte på den anslåtte verdier gitt av den opprinnelige modellene og ingen ombygging ble gjort. Siden denne strategien ikke tar hensyn til avhengighet i spådommer implisitt pålagt av 10CV, kan det potensielt beholde noen bias mot å nekte nullhypotesen i de statistiske testene når effektene er små [65].

Resultater

Globalt Prognose Utførelse av Publisert signaturer

litteratur~~POS=TRUNC identifiserte 29 avisene som rapporterer 31 underskrifter foreslått som gyldig multi-genet tumor utfallet klassifiseringsverktøy (tabell 1 og File S4). Nesten alle signaturer var basert på microarray eksperimenter med unntak av tre underskrifter fra PCR eksperimenter (

OC10, PL10, SC09

). Antallet gener (signatur størrelse) varierte fra 3 til 537.

Til tross for anbefalinger for å gi rådata for microarray eksperimenter, trening datasett var offentlig tilgjengelig kun for fem signaturer:

ST09, SM09, BD07, LN07 , etter og

VL10

. Seks ekstra genuttrykk datasett med informasjon om tilbakefall ble identifisert i GEO og ArrayExpress, for totalt 11 datasett tilgjengelig for analyse (tabell 2).

For alle kombinasjoner av signaturer og datasett, MCC og den tilsvarende p -verdi ble beregnet. Figur 2 viser et fargekart over MCC-verdier (detaljer i File S5 og figur S1). Som forventet, de fem signaturer som trening var tilgjengelig viste signifikant sammenheng og en rimelig forutsigbar nøyaktighet i sine opplærings datasett (svart-uthevet celler i øvre venstre kvadrant i plottet i figur 2). For alle disse signaturene, MCC verdier var større enn 0,35 bortsett fra

VL10 Hotell og datasett GSE17536 (MCC = 0,32). Likevel, i de uavhengige datasett forestillingen var heterogen, og ingen av disse fem signaturer kunne reprodusere graden av prediksjonsevne vist på trening datasett. Når de resterende 26 signaturer (disse uten treningssett tilgjengelig) ble evaluert på de 11 datasettene, ble tilsvarende resultater oppnådd: noen signaturer viste en signifikant sammenheng med pasientens resultater men diskriminering nøyaktighet var lav eller moderat

Rader tilsvarer. signaturer og kolonner til datasett. Siste kolonne viser en samlet MCC over datasett ved hjelp av utvalgsstørrelse som vekter. Svarte linjer avgrense de første fem signaturer som trening datasett var tilgjengelig (celler markert i svart). Celler som representerer signaturer og datasett som brukes til å validere dem er markert med rødt. Fargeskalaen representerer MCC verdier: jo mørkere farge, jo høyere MCC (se legenden). Negative verdier ble kollapset til null.

En global MCC ble beregnet for hver signatur for å oppsummere deres prediksjonsevne over datasett (se figur 2). Signaturer

BT04 Hotell og

KN11

dukket opp som den mest forutsigbare, både med en MCC verdi på 0,25 (95% KI 0,19 til 0,31 og 0,19 til 0,30 henholdsvis p-verdier og lt; 10

5). Selv om nesten alle underskriftene nådd 5% signifikansnivå i dette bassenget anslag som kombinerer 396 hendelser i 1077 pasienter, bare tre underskrifter overstige 0,20 global MCC. Den oppnådde for andelen av korrekt klassifisert tilfeller maksimal verdi var bare 63% (

BT04, etter følsomhet = 65% og spesifisiteten = 61%) og den varierte 52-61% for de resterende profiler (tabell 4, File S6).

for å vurdere påvirkningen av statistisk metode i resultatene, ble en re-analyser utført ved bruk av en alternativ metode (SVM). Selv ble observert noen variasjoner i signaturer rangeringen av ytelse, ble lignende resultater oppnådd i form av samle MCC (Figur S2 og File S7)

subgruppeanalyse. Prognose Utførelse av Publisert Signatures stratifisert etter Stage eller MSI status

for å kunne vurdere underskriftene prestasjoner i bestemte undergrupper av svulster, en stratifisert analyse ble gjort i henhold til stadium (stadium II /stadium III) og mikro ustabilitet status (MSS /MSI), da denne informasjonen var tilgjengelig ( se tabell 3). Datasett som bidrar med mindre enn 10 arrangementer ble ekskludert.

I likhet med analysen inkludert alle prøver, ytelsen av signaturene var heterogen når stadium II og III tumorprøver ble analysert separat (Tall S3 og S4) . I den samlede MCC, 17 underskrifter i stadium II og 22 underskrifter i stadium III viste en signifikant sammenheng med prognose (p-verdi 0,05). Seks signaturer rangert blant de ti beste i begge under analyser. MCC verdier oppnådd i trinn II var mye lavere enn i fase III. I fase II, ble den beste globale MCC oppnås ved å

YM06 plakater (MCC = 0,21; 95% KI 0,11 til 0,31) og

BT04 plakater (MCC = 0,20; 95% KI 0,10 til 0,31) . I fase III, de to beste signaturene var

AJ08 plakater (MCC = 0,42; 95% KI 0,28 til 0,55) og

VL10 plakater (MCC = 0,40; 95% KI 0,23 til 0,55). Tabell 4, filer S5, S6 og S7; Tall og S3, S4, S5, S6, S7 og S8 inneholde flere detaljer.

MSI statusinformasjon var bare tilgjengelig for to datasett (GSE13294 og GSE18088). I analysen av MSS prøver, de MCC verdier som nådde betydning var moderat (0,19 til 0,38) og bare tre signaturer viste foreningen i begge datasett (p-verdi 0,1). Når det gjelder MSI undergruppe, bare signatur

HO09

gitt en rimelig klassifisering nøyaktighet (MCC = 0,30) (Fil S5).

Potential klinisk verdi av signaturer i Stage II og III svulster

tross for den lave diskriminering evne (vist ved deres sammenslått MCC), signaturene kan fortsatt ha nytte i klinisk praksis. I korthet viser et nyttig klinisk test vanligvis stor LR + og lav LR- som oversetter til flere diskriminantfunksjoner post-test event sannsynlig: høy PPTpr og lav NPTpr sammenlignet med

a priori

forventet hendelse andel. I så fall kan til og med tester med lav diskriminering evne i henhold til rene statistiske kriterier likevel være nyttig i klinisk praksis hvis PPTpr og NPTpr er vesentlig langt nok fra sannsynlighets forventet i populasjonen når ingen testen utføres. For å utforske dette problemet, ble positive og negative ettertest sannsynligheten for tilbakefall beregnet for trinn II og III. Den tidligere gjentakelse risikoen for pasienter med CRC ble antatt å være 20% i trinn II og 34% i stadium III [4], [66].

For den beste signatur i trinn II (

YM06

), post-test tilbakefall sannsynlighet for høyrisikogruppen økt til 28%, og for lav-risikogruppe prediksjon var 12% sannsynlighet for tilbakefall (16% absolutt forskjell, figur 3A). Den beste profilen i fase III (

AJ08

) økte til 56% post-test sannsynlighet for tilbakefall for høyrisikogruppen, mens post-test sannsynlighet var 18% for lav-risikogruppe (38 % absolutte forskjell, figur 3B). Detaljerte resultater for alle signaturer er vist i filer S6 og S7.

Prevalens sannsynlighet for tilbakefall for stadium II og III ble antatt å være 20 og 34% henholdsvis. Signaturer er oppført i synkende post-tester sannsynlighets forskjeller.

Diskusjoner

Identifisering av molekylære prognostiske verktøy for å tilrettelegge behandlingsavgjørelser er et viktig skritt for individuell pasientbehandling [10] . Her rapporterer vi en uttømmende analyse av publisert multi-genet prognostiske classifiers i tykk- og endetarmskreft, analysere deres ekstern gyldighet i et stort antall uavhengige datasett som totalt mer enn 1.000 pasienter. Dette arbeidet er fokusert på to mål som er adressert av de to viktigste delene av analysen: å evaluere den globale resultatene av underskrifter fra et statistisk synspunkt, der alle faser ble inkludert, og for å vurdere deres potensial klinisk nytteverdi, begrenset til stadium II og III CRC pasienter, ved hjelp av egnede nøyaktighet tiltak (post-test sannsynligheter).

En meta-analyse av genuttrykk profiler i stadium II CRC har tidligere blitt rapportert av Lu

et al. product: [67]. I denne studien ble lovende resultater rapportert om prediktiv nøyaktighet, men analysen ble begrenset til de samme datasettene og spådommer som brukes i de opprinnelige studiene. Så vidt vi vet, er vår studie den første meta-analyse der prediksjonsnøyaktigheten av mange underskrifter er målt i et stort antall uavhengige CRC prøver å vurdere ekstern validitet og deres senere potensiell nytteverdi i klinikker.

Når det gjelder global ytelse, våre resultater tyder på at i forbindelse med trening datasettet, de fleste signaturer viste en signifikant sammenheng med prognose og rimelighet kunne forutse utfallet. Men ingen av underskriftene utført tilfredsstillende når prediksjonsevne ble vurdert i uavhengige datasett. Den beste samlede MCC var 0,25 (

BT04

), som bør betraktes som en lav klassifisering verdi. Som en referanse, gir scenen en MCC på 0,23 (data ikke vist).

Deretter fokuserte vi på konkrete resultater av underskrifter i stadium II og III pasienter som kan ha nytte mer av en nøyaktig prognose anslag siden adjuvant kjemoterapi kan skreddersys til deres forutsagte gjentakelse risiko. Selv ble observert sammen med resultatet for 17 underskrifter i fase II, kan deres prediksjonsevne bare betraktes dårlig fra et statistisk synspunkt. Ellers ble MCC-verdier i stadium III observert til å være nær dobbelt så store som i trinn II. Likevel oppnådde bare åtte underskrifter en 0,30 samlet MCC verdi, anses som en indikasjon på moderat prediktiv verdi.

Selv om dårlige resultater ble observert i form av klassifisering nøyaktighet, nesten alle profiler (30) viste en signifikant sammenheng med prognose når testet i uavhengige datasett (p-verdi 0,05). Legg merke imidlertid at signifikant sammenheng betyr bare at en signatur spådommen er ikke helt tilfeldig (MCC = 0). Foreningen er ikke tilstrekkelig til å være nyttig siden, med nok utvalgsstørrelsen, kan små effekter være betydelig. Bedre indikatorer for potensielle nytten enn betydningen er omfanget av sensitivitet og spesifisitet eller avledet tiltak som MCC eller sannsynligheten forholdstall, som måler evnen til å korrekt klassifisere pasienter med resultatet sitt.

Til tross for disse skuffende resultater i henhold til ren statistikk kriteriene for diskriminering evne, kan signaturer fortsatt være nyttig i klinisk praksis hvis de gir ekstra risiko lagdeling innenfor kjente undergrupper definert av relevante kliniske variabler. De positive og negative ettertest sannsynligheten for tilbakefall ble beregnet stratifisert ved scenen for å identifisere graden av prognose diskriminering utover scenen. Resultatene for den beste signaturen i stadium II prøver (

YM06

) moderat endret 20% en Priory tilbakefall sannsynlighet til en 28% og 12% for den positive og negative ettertestresultatet, henholdsvis. Denne diskriminerende evne er ikke helt tilfredsstillende i de store falske negative og positive priser som det ville induserer, men kan bidra til identifisering av trinn II pasienter med høy risiko for tilbakefall som fører til en bedre indikasjon på adjuvant kjemoterapi [6]. Den beste signaturen for stadium III pasienter (

AJ08

) resulterte i en større diskriminering av risikogruppene, med en forskjell mellom positive og negative ettertest sannsynlighetene for 38%. Men den lave risiko gruppen viste likevel en forholdsvis stor gjentakelse sannsynlighet på 18%, for høy til å anbefale å unngå adjuvant kjemoterapi som det er antydet i dag.

Mulige forklaringer for disse beskjedne resultater må tas i betraktning. Fra et statistisk synspunkt, tekniske problemer som lav prøvestørrelse, antall gener som inngår i sortereren, oversettelse mellom plattformer eller kullet heterogenitet, blant andre, har blitt rapportert som potensielle forklaringer på mangel på klinisk oversettelse av genomiske klassifiserere ( se referansene [68], [69], [70]). I vårt tilfelle, og for noen signaturer, var bare sammen med prognose rapportert i det opprinnelige verket, og dermed forfatterne implisitt anerkjent dårlig klassifisering evne. I disse profilene som ble rapportert å være svært diskriminerende, kan årsaken være en dårlig kontroll på over sittende i trening metodikk, siden ekstern validering ble bare utført i tre studier og stikkprøvene størrelser var små (

JG08

,

WN10 Hotell og

YM06

, se tabell 1). Behovet for å kartlegge prober til gener for signaturer som ble brukt forskjellige plattformer kan også ha påvirket resultatet, siden det er kjent at til og med flere sonder av det samme genet i den samme plattformen kan vise viktig variabilitet. Vi kunne ikke oppdage, men at plattformen hadde en relevant effekt i MCC estimatene.

lav tilgjengelighet av informasjon og heterogenitet i klinisk data er iboende til bruk av offentlige datasett, og dette er et stort hinder for repeterbarhet og integrering av publiserte microarray studier [71]. Datasett varierer i pasientkarakteristika, inklusjonskriterier og utfallet definisjoner. En nøyaktig og homogen definisjon av utfallet på tvers av datasettene ville være ønskelig for å oppnå en nøyaktig estimering av signaturene prognose evne. Likevel heterogenitet av datasett åpner for en mer pragmatisk analyse og estimatene skal reflektere de forventede resultater når profiler ble brukt i det virkelige praksis, siden sykehus innstillinger er også heterogene. Siden ulike utfall er ment å være sterkt korrelert [72], bestemte vi oss for å prioritere et minimum utvalgsstørrelse tilgjengeligheten for å få mer presise estimater og unngå usikkerhet introdusert av datasett med mindre enn 10 hendelser [60]. Kravet til en tre år minimum følge opp også lov å maksimere størrelsen på utvalget og ble støttet av litteraturen: Det har blitt beskrevet at de fleste av disse tilbakefall oppstår innen 3 år etter operasjonen, og det anbefales å brukes som endepunkt i adjuvant kliniske studier [ ,,,0],73]. Therapy diett etterfulgt av behandlede pasienter ble ikke vurdert, da dette ikke var tilgjengelig for de fleste av de analyserte datasettene.

Pasienter diagnostisert på stadium IV ble inkludert, og anses tilbakevendende hendelser for å vurdere global ytelse. Dette forutsetter implisitt at de molekylære endringer som spiller en driver rolle for sykdom tilbakefall uendret i primærtumor etter tilbakefall har oppstått. Selv om denne underliggende hypotese kan være tvilsom, ble det delt av mange av de opprinnelige studiene analyserte som inkluderte stadium IV, i deres trening og testing datasett (

AJ08

,

BT04

,

EC05

,

HO09

,

JS09 ​​

,

LN07G

,

LN07NZ

,

PL10

,

SC09

,

SL10

,

SM09

,

ST09

,

VL10 Hotell og

YM06

).

Fra et biologisk perspektiv, kan dette moderat prognose evne forklares med heterogenitet i tumor cellepopulasjoner som kan utvanne prognosen molekylære signal. Det er vel kjent at CRC-tumorer er sammensatt ikke bare av tumor epitelceller, men også ved kreft-assosiert stromale fibroblaster (kafeer), endotelceller eller inflammatoriske celler, bl.a. [74]. Videre har disse kreftceller ved invasiv fronten er forskjellig fra de i hovedtumormasse [75]. Problemet med svulsten bulk heterogeniteten kan overvinnes ved isolering av spesifikke cellepopulasjoner ved hjelp av laserteknologi mikrodisseksjon [76]. I denne forbindelse er en av de elleve prøvesettene som brukes i denne undersøkelsen (GSE12945) anvendt denne teknikk for å spesifikt hybridisere RNA fra tumorceller. Kirurgiske prøver fra andre prøvesett ble anmeldt av en patolog for å vurdere et minimum svulst innhold på 80% (GSE5206, GSE18088, E-MEXP-1245). Vi har imidlertid ikke observere signifikante forskjeller i signaturer ytelse om tumorceller berikelse metode som brukes

genet lister er inkludert i denne studien hadde lite overlapping. Av 1.530 gener som er rapportert i de 31 profiler, bare to var deles av fire signaturer; 10 ble delt i tre signaturer og 102 var til stede i to profiler. Dette resultat var ikke uventet, siden det har tidligere blitt rapportert [77], [78]. Mangelen på genet overlapping som vanligvis tolkes som om hver signatur er tilfeldig prøvetaking av en liten undergruppe av gener fra en større signatur som representerer de involverte trasé [79], [80].

tykktarm og endetarm svulster har vært inkludert ukritisk i dette arbeidet siden i en tidligere rapport viste vi at ingen signifikante forskjeller mellom tykktarm og endetarm svulster på transcriptomic nivå [81]. Imidlertid kan denne beslutningen forklare noen av dårlige prestasjoner av signaturene, siden det er kjent at kirurgi kvalitet er en viktig prognostisk faktor i endetarmskreft og mindre viktig i tykktarmen [82]. I de data som brukes i dette arbeidet, ble ingen signifikant sammenheng finnes mellom prognose og svulst plassering (data ikke vist).

Valget av de statistiske verktøy for analyser var en viktig sak. Hensikten med denne analysen var å teste ytelsen til publiserte prognostiske signaturer i uavhengige datasett heller enn å prøve å gjenskape dem ved hjelp av den opprinnelige metoden. I denne sammenheng

Random Forest

oppstår som en effektiv metode som utfører meget godt sammenlignet med andre konkurrenter [49], [83]. Som forventet, underskriftene som ble testet i forbindelse med trening datasettet viste den høyeste nøyaktighet. Videre vi lykkes i å gjengi de validerings resultatene av tre av de fem underskrifter for hvilke data som var tilgjengelig (

SM09

,

VL10 Hotell og

JS09 ​​

). Men sammen med prognosen ble ikke observert for profilen

ST09

i datasettet GSE12945, og det ble bare observert i én av de tre uavhengige validerings datasett som inngår i dette arbeidet for profilen

SL10

selv om gode resultater ble opprinnelig rapportert (se tabell 1, figur 2 og File S5). En grunn kan være at metodikken vi brukte ikke fanger godt prognosen verdien av noen signaturer, som kan ha blitt utviklet med mer utdypet algoritmer for å definere risiko prediksjon i den opprinnelige studien. Fordi dette var en anerkjent begrensning av dette arbeidet, analyser ble slengt hjelp av en alternativ metode (SVM), som ga lignende resultater (Tall S2, S5 og S6, File S7). I

ST09

profil, ble en semi-overvåket tilnærming som brukes når man er i

SL10

en nærmeste-Tyngdepunktet tilnærming ble brukt som ikke var riktig beskrevet i avisen.

SL10

ble utviklet i en Agilent plattform og kartlegging av sondene til ulike validerings plattformer brukes i datasettene kan være et tillegg kilde til avvik.

Selv om noen arbeider rapporterte at enklere metoder for tilsyn

Legg att eit svar