Abstract
Biomarkører for å adressere overbehandling som oppstår for de fleste av prostatakreftpasienter som ikke ville dø av sykdommen, men får radikal behandling. En mulig barriere for å biomarkører kan være polyklonale /multifokal natur prostatakreft samt celletype heterogenitet mellom pasientprøver. Tumor-tilstøtende stroma (svulstens mikromiljø) er mindre påvirket av genetisk endring, og kan derfor gi mer konsistente biomarkører i respons til tumor aggressivitet. For dette formål sammenlignet vi Affymetrix genekspresjonsprofiler i stroma i nærheten av tumoren og identifiseres et sett av 115-probe-sett hvor uttrykket nivåer ble signifikant korrelert med time-to-tilbakefall. Vi har også sammenlignet pasienter som kjemisk tilbakefall kort tid etter prostatektomi ( 1 år), og pasienter som ikke opplever tilbakefall i de fire første årene etter prostatektomi. Vi identifiserte 131 forskjellig uttrykt microarray probe sett mellom disse to kategoriene. 19 probe sett (15 gener overlappet mellom de to genet lister med
p
0,0001). Vi utviklet en PAM-basert klassifiserer ved å trene på prøver som inneholder stroma nær tumor: 9 raske tilbakefall pasientprøver og 9 lat pasientprøver. Vi testet deretter klassifikator på 47 forskjellige prøver, inneholdende 90% eller mer stroma. Klassifisereren spådd risikostatus hos pasienter med en gjennomsnittlig nøyaktighet på 87%. Dette er den første generelle svulstens mikrobasert prognostisk klassifikator. Disse resultatene indikerer at den prostatakreft mikromiljøet oppviser reproduserbare endringer som er nyttige for å forutsi resultater for pasientene
relasjon:. Jia Z, Rahmatpanah FB, Chen X, Lernhardt W, Wang Y, Xia X-Q, et al. (2012) Expression Endringer i Stroma av prostatakreft Tippe senere tilbakefall. PLoS ONE 7 (8): e41371. doi: 10,1371 /journal.pone.0041371
Redaktør: Chad Creighton, Baylor College of Medicine, USA
mottatt: May 11, 2012; Godkjent: 20 juni 2012; Publisert: 01.08.2012
Copyright: © Jia et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av National Institutes of Health strategiske partnere for bedømmelse av kreft Signatures (SPECS) Consortium stipend U01 CA1148102 og National Cancer Institute Early Detection Research Network (EDRN) Consortium tilskuddet U01 CA152738. Dette arbeidet ble også støttet av en University of California i Irvine Fakultet Career Development Award (ZJ), et stipend fra Chao Family Comprehensive Cancer Center ved University of California i Irvine (ZJ og DAM). Dessuten var dette arbeidet støttes delvis av Department of Defense congressionally Directed medisinsk forskning programmer gi W81XWH-08-1-0720, og av en University of California i Irvine Institute for Cancer Research Training Grant Fellowship (T32CA009054 fra National Cancer Institute) ( FR). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser. MM og DM er cofounders og WL er administrerende direktør i Proveri Inc. YW er ansatt i AltheaDx Inc. Dette ikke endrer forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer.
Innledning
Prostatakreft er den hyppigste diagnosen mannlig kreft og den nest største årsaken til kreftdød i menn i USA [1]. Hvert år i USA, er det ca 230 000 nye tilfeller av prostatakreft og ca 195.000 radikale prostatectomies utføres [2]. Imidlertid kan noen pasienter bli frelst ved disse behandlingene fordi bare et mindretall av tilfellene vil dø av sykdommen hvis venstre ubehandlet. Den NNT for å redde ett liv estimert i to studier var 12-15 [3] og opp til 48 [4]. Mange nomogrammer og relaterte prediksjon metoder har blitt opprettet på grunnlag av kliniske variabler på diagnosetidspunktet, men til dags dato, har slike verktøy gitt begrenset råd om hvilke pasienter båtplass aggressiv sykdom som krever radikal behandling muligens etterfulgt av adjuvant terapi og hvilke pasienter som kan være egnet for en mer konservativ aktiv overvåking program [5] -. [9]
det er investert enorme innsats i utvikling av biomarkører for prognose av prostatakreft med vekt på funksjoner av svulsten epitel komponent i retrospektive prøver. Imidlertid har noen aksepterte og klinisk ansatt biomarkører blitt utviklet. En barriere for å biomarkører kan være den celletype heterogenitet og det polyklonale /multifokal arten av de akkumulerte genetiske endringer ved tidspunktet for diagnose [10] – [13]. I kontrast, kan svulsten mikromiljøet utstillinger mye mer begrenset mutasjoner og tap av heterozygositet (LOH) [14], men svare på parakrine signaler fra nærliggende svulst. Det har vist seg at mikromiljøet av utvalgte tilfeller utviser distinkte histologiske forandringer betegnet «reaktiv stroma» med forskjellige ekspresjons-profiler som korrelerer med dårlig resultat [15], [16]. Vi har faktisk vist at tumorassosiert stroma uten hensyn til subtype besitter unike ekspresjonsprofiler sammenlignet med normal stroma. Vi brukte disse genuttrykk endringene for å utvikle en klassifikator som kan diagnostisere tilstedeværelsen av svulst i prostata kreft tilfeller selv om prøvene brukes til analyse ikke inneholder gjenkjennelig svulst [13]. Denne tilnærmingen har klinisk potensial for å løse hundretusener av tvetydige biopsier utført i USA hvert år, noe som vil kraftig forbedre sykdom ledelse og redde liv. Tilsvarende har nyttig diagnostisk informasjon er innhentet fra undersøke metylering status for GSTP1 og APC gener i negative innledende prostatabiopsier [17]. Den differensielle ekspresjonen og epigenetiske profiler i tumor-assosiert stroma i forhold til den normale stroma kan reflektere stromaceller respons på tumor parakrine faktorer samt andre påvirkninger. Hvis kvaliteten og kvantiteten av slike responser korrelerer med klinisk resultat for eksempel lat eller aggressive fenotyper, deretter stroma responsen til nærliggende tumor kan være nyttig for å utlede en generell regel for prognose. Andre forskere har observert slike forskjeller i brystkreft [18]. I denne studien, testet vi denne hypotesen ved å sammenligne genekspresjonsprofiler mellom stromaceller prøver hos pasienter med kjente forskjellige resultater, uavhengig av histologi, og å identifisere 115-probe-sett hvor uttrykket nivået er signifikant korrelert med tid-til-tilbakefall. Vi sammenlignet også uttrykk profiler mellom en undergruppe av stroma prøver fra pasienter som fikk tilbakefall raskt og stroma prøver fra pasienter som ikke hadde fått tilbakefall etter mer enn fire år. Vi identifiserte 131 probe sett som hadde forandret uttrykk. Det var 19 probe sett (15 unike gener) i felles mellom disse to gen lister. Vi deretter utledet en 15-genet klassifikator. Den samlede nøyaktigheten var 87% når sortereren ble testet på 47 uavhengige testprøver. Pathway analyse og Gene Ontologi studier indikerte disse 15 genene er betydelig beriket for gener som er involvert i apoptose-relaterte prosesser. Disse studiene støttet muligheten for at stroma er et praktisk grunnlag for risikovurdering.
Materialer og metoder
Prostate Cancer pasientprøver og Expression analyse
Vårt datasett GSE8218 og GSE17951, som er offentlig tilgjengelig i Gene Expression Omnibus (GEO) database, er basert på post-prostatektomi frosne vevsprøver innhentet av informert samtykke hjelp IRB-godkjent og HIPPA-kompatible protokoller. Alle vev ble samlet ved kirurgi og eskortert til patologi for rask gjennomgang, disseksjon, og smekk fryse i flytende nitrogen. Klinisk oppfølging data ble assimilert av UCI SPECS program og vedlikeholdes i en relasjonsdatabase. RNA-analyse for ekspresjon ble gjort direkte fra frosset vev etter disseksjon av oktober (optimal skjære temperatur forbindelse) blokker fremstilt fra hurtigfrosset prøvene ved hjelp av en kryostat. Stroma fra tumor-bærende prøver ble fremstilt fra OKT-innleiret vev som var montert i en kryostat ved å etse en linje mellom tumor og stroma med en skalpell og deretter fremstilling av frosne snitt som vises som to stykker hvorav det ene er tumor tilstøtende stroma som beskrevet i [13]. Før perfeksjon av denne metoden, ble noen stroma fremstilt ved hånd disseksjon av frossent vev med en skalpell. For å unngå forurensning, kreves hånden metoden etterlater et gap mellom tumor og stroma av 0,5-1,0 mm, og den resulterende stroma er betegnet «nær» stroma.
For ekspresjon analyse 50 mikrogram (10 mikrogram til vevsprøver ) av totale RNA prøver ble behandlet for hybridisering til Affymetrix GeneChips (GSE17951: U133 Plus 2.0 plattform; GSE8218: U133A plattform). For disse to datasettene, fordelingene for de fire hovedcelletyper [tumor epitelceller, stromaceller, epitelceller ved benign prostata hyperplasi (BPH), og epitelceller utvidede cystisk kjertler] ble beregnet ved opp til fire patologer, som har anslag . ble midlet som beskrevet [19], [20]
Datasett GSE25136 (U133A plattform), som består av 79 tumorbærende tilfeller (mer enn 10% tumorceller), uavhengig av hverandre ble utviklet og brukt som en testsett. Den celle-type distribusjon av dette datasettet ble beregnet ved hjelp av CellPred, en
in silico
metode for å bestemme tumor prosentandel av prøvene på grunnlag av uttrykket verdiene for multi-genet signaturer som er invariant med tumor kirurgisk patologi parametere av Gleason og scene (tilgjengelig på https://www.webarraydb.org/webarray/index.html) [20]. Legg merke til at celletype distribusjon av datasett GSE8218 og GSE17951 ble gitt av inntil 4 patologer [19], mens den celletypen distribusjon av datasett GSE25136 ble anslått av
i silico
metoden [20].
statistiske metoder
Normalisering ble utført på tvers av flere datasett ved hjelp av ~22,000 probe sett felles for alle datasett. Først datasett GSE8218 var quantile-normalisert ved hjelp av funksjonen «normalizeQuantiles «av LIMMA rutine [21]. Datasett GSE17951 og GSE25136 var så quantile-normalisert ved å referere til de normaliserte datasettet GSE8218 bruker en modifisert funksjons «REFnormalizeQuantiles» som er tilgjengelig på spesifikasjoner nettsted (https://www.pathology.uci.edu/faculty/mercola/UCISpecsHome. html) [22]. Den LIMMA pakken fra Bioconductor ble brukt til å detektere differensielt uttrykte gener. Prediksjon Analyse for Mikromatriser (PAM [23]), implementert i R, ble brukt til å utvikle et uttrykk basert klassifikator fra treningssett og deretter brukt til testsett uten ytterligere endring.
Resultater
Gene Expression Assosiert med Risk
To metoder ble brukt for å definere gener forskjellig uttrykt i stroma av høy og lav risiko tilfeller. Kort sykdomsfri overlevelse (DFS) tid er et vanlig brukt indikator på aggressivitet [24] – [26]. Først må vi definert aggressiv prostatakreft tilfeller som de pasientene som opplevde sykdommen tilbakefall innen ett år etter prostatektomi, og lat (eller mindre aggressive) tilfeller som de pasientene som enten tilbakefall senere enn 4 år etter operasjonen, eller som ikke tilbakefall og hadde minst 4 års oppfølgingsdata tilgjengelig. Basert på disse kriteriene har vi identifisert 40 raskt tilbakefall pasientprøver som inneholder ren stroma som var nær tumor og 9 pasientprøver med indolent sykdom som inneholder ren stroma som var nær å svulst fra datasettet GSE8218. Av disse arrays vi tilfeldig valgt 8 raske tilbakefall pasientprøver og 7 lat pasientprøver som treningssett og sammenlignet uttrykk profiler av disse to gruppene bruker LIMMA. Gener med
p
verdier 0,05 og fold change 1,6 (enten oppregulert eller nedregulert) ble identifisert og brukt til å utvikle en PAM klassifikator. Den resulterende klassifikator ble deretter testet mot pasientprøvene som ikke hadde blitt brukt til trening (32 raske tilbakefall pasientprøver og 2 lat pasientprøver). Denne prosessen ble gjentatt 1000 ganger og 3,625 probe sett ble valgt minst en gang ut på 1000 ganger basert på kriterier av
p
verdier og 0,05 og fold change 1.6. Den gjennomsnittlige følsomhet og spesifisitet av kryssvalideringsprosessen var 69% og 82%, respektivt. Totalt 131-probe-sett ble selektert ved PAM ikke mindre enn 500 ganger av de 1000 iterasjoner.
For det andre, for å identifisere sondesett er forbundet med en bredere klasse av risikoverdier, datasettet GSE8218 var igjen brukes til å identifisere probe sett som korrelerer med sykdomsfri overlevelse, inkludert pasienter som fikk tilbakefall mellom ett og fire år etter operasjonen. Datasett GSE8218 inkludert 49 rene stroma prøver fra 49 pasienter som gjennomgikk prostatakreft tilbakefall etter operasjonen. Legg merke til at de 49 stroma prøvene brukes til korrelasjonsanalyse er ikke identiske med de 49 stroma tilfeller brukes for raskt tilbakefall
vs.
Lat sammenligning som består av 44 tilbakefall tilfeller (felles med de sakene som brukes for korrelasjonsanalyse) og 5 non-residiverende tilfeller. Vi analyserte 49 stroma prøvene fra tilbakefall tilfelle av en korrelasjonsanalyse og identifisert 115 DFS-assosiert sondesett ved hjelp av Pearsons korrelasjonsanalyse med korrelasjonskoeffisienter 0,46 og tilhørende
p
verdier 0,001). Den Pearsons korrelasjonskoeffisienter for disse 115 probe sett varierer fra -0,46 til -0,61 eller 0,46 til 0,69. Ulike sykdomsprogresjon relevante gener, utover de som finnes i tidlige og sene tilbakefall tilfeller (131 gener ovenfor) ble antatt å bli avdekket i dette genet identifikasjon trinnet fordi median-risiko tilfeller (tilbakefall tid mellom 1 år og 4 år) ble inkludert.
Det var 19 felles probe sett mellom 131 probe sett identifisert ved permutert PAM analyse og 115 probe sett identifisert fra korrelasjonsanalyse. En simulering studie viste at sjansen for å observere 19 overlapping mellom 131 tilfeldig valgte probe sett og 115-probe-sett fra en basis på 22.000 sondesett er 0,0001. Dermed disse 19 overlapp probe sett (et tall som er større enn tilfeldig) representerer betydelig avtale mellom to ikke-identiske sett av saken ved hjelp av ulike metoder for analyse. De 19 vanligste probe sett, som representerer 15 unike gener, oppført i Tabell 1. Eksempel plott av uttrykket av disse sonde sett
vs.
DFS tid er vist i figur S1.
Klassifiserings utvikling og testing med uavhengige datasett.
De 19 overlappende sonde sett ble brukt til å utvikle en klassifikator. Fra 40 raskt tilbakefall cancerprøver fra det første trinn inneholdende stroma i nærheten av svulsten, valgte vi 9 prøver med de korteste DFS ganger, som ble kombinert med alle 9 prøver inneholdende stroma nær lat tumor for å danne et treningssett. Vi brukte 19 probe sett identifisert i forrige trinn som PAM [23] innspill for å utvikle en klassifikator basert på disse 18 opplæring prøver. Den observerte status av trenings tilfeller som aggressiv sak eller lat saken ble spesifisert. Alle 19 probe settene ble beholdt av PAM optimalisere prosessen med en avsluttende opplæringen nøyaktighet på 88,9% (tabell 2).
En varme kartet (Figur S2) viser at de 194 genene (kombinasjonen av 131 probe sett identifisert av PAM analyse og 115 probe sett identifisert fra korrelasjonsanalyse) hadde tydelige profiler mellom raske tilbakefall saker og lat tilfeller i de 18 trenings stroma prøver. En vulkan plott (figur S3) viser at noen av sonde sett har store fold endringer og lave p-verdier. De 115 probe sett har 19 probe sett (15 unike gener) til felles med de 131 probe sett identifisert fra permutert PAM analyse. Vulkanen plottet i Figur S3 viser at disse 19 probe sett er blant de mest lovende probe sett som har de største fold endringer og laveste p-verdier.
For å kunne gi en objektiv test av prognostisk klassifikator, 47 uavhengige testprøver inkludert 36 prøver fra datasett GSE8218 og 11 prøver fra datasettet GSE17951 (som ikke brukes i opplæring) ble ansatt for testing. Det ble observert en sensitivitet på 88,1% og en spesifisitet på 80% som gir gjennomsnittlig nøyaktighet ble 87% (tabell 2,
Test
). Den samlede positiv prediktiv verdi (PPV) og negativ prediktiv verdi (NPV) av test basert på de 47 uavhengige prøvene var 97,9% og 44,4%, henholdsvis.
For å teste ytterligere hvorvidt 15-genet prognostisk klassifikator gjelder generelt for hele spekteret av resultater og er ikke begrenset til den spesifikke valgt survivor valgt for opplæring i det første trinnet, testet vi 19 prøver (ikke inkludert i trening) fra pasienter som enten led tilbakefall mellom år 1 og år 4 etter operasjonen eller ikke tilbakefall, men hadde mindre enn 4 års oppfølgingsdata. Disse 19 prøver inkludert 9 stromaceller prøver fra i nærheten av tumoren og 10 tumor-bærende tumorprøver ( 10%). Kaplan-Meier analyse indikerte at 15-genet prognostisk klassifikator dikotomisert disse tvetydige prøvene inn i to grupper med betydelig distinkte risiko (
p
= 0,02). Disse observasjoner indikerte at kombinasjonen av et treningsmetode basert på utvalgte overlevelses i kombinasjon med en korrelasjonsmetode som utnyttes fullt tilgjengelige området av sykdomsfri overlevelse ganger ga en klassifikator med nøyaktige resultater når den brukes til et uavhengig test kohort. En Kaplan-Meier-representasjon av testresultatene for de 47 testprøvene i kombinasjon med testresultatene for disse 19 median-risiko stromaceller prøvene er oppsummert i figur 1. Disse resultater ga en sannsynlighet for sjanse separasjon av de forutsagte klassifikasjoner med en
p
= 0,0018.
for å måle betydningen av 19 probe setter klassifikator, vi gjorde et eksperiment basert på sett av gener valgt tilfeldig. Vi tilfeldig valgt 19 probe-sett fra blant alle 22,283 probe-sett og reran trening og testing, som beskrevet ovenfor. Denne tilfeldige prosessen ble gjentatt 1000 ganger. Gjennomsnitt av den operasjonelle egenskaper er gitt i tabell 2. Kun 7% av de 1000 tilfeldige classifiers hadde lik eller bedre ytelse enn den prognostiske klassifikator.
Vi har også sjekket om inkludert klinisk informasjon, som Gleason score, tumor trinn og preoperativ PSA tilsatt prognostisk verdi til klassifisereren. Vi brukte disse tre variablene i kombinasjon med de 19 probe setter som PAM innspill og la PAM velge de beste prediktive egenskaper. Ingen av disse tre variablene ble plukket av PAM. I tillegg har vi analysert 65 tilfeller (18 opplæringssaker og 47 testtilfeller i tabell 2) ved hjelp av en multivariat Cox regresjon, der alder, Gleason sum, TNM og pre-op PSA er i forhold til prediksjon laget av vår klassifikator. Bare klassifikator prediksjon (
p
= 0,0005) og TNM (
p
= 0,0383) var signifikant assosiert med overlevelse. Resultatet viste at genet signatur har bedre prediktiv verdi og legger prediktiv verdi til kjente kliniske og patologiske variabler.
Test på Stroma Prøver Langt fra svulsten og tumorprøver med lave mengder Stroma
19 sondesett (15 gener) danner en prognostisk signatur spesifikt for stroma i nærheten av tumoren. For å undersøke om 15-genet klassifikator utvidet til stroma som er langt fra primærtumor, vi testet klassifikator på 9 lat stroma prøvene 8 av disse er
langt
fra den primære svulsten, tatt fra en sone kontralateral til svulst nettstedet. Nøyaktigheten eller spesifisiteten var bare 11,1% (data ikke vist). Når således stroma blir testet fra fjerntliggende posisjoner med en lav sannsynlighet for å bli påvirket av tumor parakrine faktorer, en stroma reaksjon representert ved uttrykket endringer i disse 15 gener ble ikke påvist i motsetning til slike endringer detekterbare i stroma i nærheten av tumoren. For å sjekke om 15-genet klassifikator var ufølsom for store mengder forurensende svulst, vi testet den på 117 tumorbærende prøver ( 10% tumorceller med gjennomsnitt på 48,5% av tumor komponent) i tre datasett (GSE8218, GSE17951 og GSE25136) med en total nøyaktighet på 41%. Imidlertid, når klassifikator ble testet på 9 prøver som inneholder 10% tumorceller, den nøyaktighet var 89% (tabell 2). Således for den planlagte kliniske anvendelse av analysen, vil det være viktig å prøve stroma som er tilstøtende til, men uten tumorceller.
Funksjonsanalyse for sorter Genes
Vi analyserte 19 sonde sett (15 gener) med David bioinformatikk verktøy [27] den. De 15 gener er betydelig anriket med gener assosiert med apoptose og med celledød (p 0,001 og Benjamin ballen 0,05) (tabell 1, i fet skrift og /eller kursiv). Vi har videre analysert 194 gener (kombinasjonen av de 131-probe-sett som er identifisert av PAM-analyse og de 115-probe-sett som er identifisert fra korrelasjonsanalyse) under anvendelse av en reaksjonsvei analyseverktøyet fra MetaCore (GeneGo Inc.). Filtreringen system av MetaCore hjulpet søkje på de genene som har blitt rapportert i bestemte vev, for eksempel, prostatavevet vårt søk. De filtrerte genene ble brukt til å bygge de signalveier. De statistisk signifikante trasé måtte møte FDR 0,05 og multiple gener ( 2) signifikant assosiert med den biologiske reaksjonsveier. For å analysere de 194 genene, brukte vi «glatt muskulatur + sykdom biomarkør» og «prostata svulster transkripsjon «som filtreringsparametere. Resultatene av MetaCore pathway analyse er opplistet i tabell S1.
Diskusjoner
Vi viste tidligere at det finnes hundrevis av betydelige genuttrykk endringer mellom tumor-tilstøtende stroma og normal stroma som ble brukt til å utvikle en stroma-spesifikk høy nøyaktighet Diagnostisk Klassifiserings for påvisning av nærvær-av-tumor, basert på RNA-ekspresjon av stroma alene [13]. Disse stroma-spesifikke uttrykk endringer er sannsynligvis på grunn av reaksjonen av stroma til tumor-avledet parakrine mediatorer, så vel som en mulig «felt-effekt». Her har vi videre en hypotese at det kan være forskjeller mellom ekspresjons stroma av lat og aggressive tumorer, som kan benyttes for kliniske prognosen. For å teste denne hypotesen, sammenlignet vi genekspresjonsprofiler mellom tumor-tilstøtende stromaceller prøver fra pasienter som har opplevd hurtig tilbakefall og tumor-tilstøtende stromaceller prøver fra pasienter som ikke opplever tilbakefall eller hvor tilbakefall tok mange år. 40 stroma prøver fra raskt tilbakefall og 9 stroma prøver fra lat saker ble utsatt for en permutasjon prosess for å identifisere differensielt uttrykte gener. I hver av 1000 iterasjoner /ny prøve, brukte vi 31% av stroma prøver (8 ut 40 raske tilbakefall stroma prøver og 7 av 9 lat stroma prøver) for opplæring og brukt de rester stroma prøver for testing. På grunn av det faktum at vi hadde lite antall prøver for opplæring, valgte vi liten, men tilsvarende tall (8 og 7) for hver iterasjon, for å gi rom for resampling (permutert analyse). Fordelene for denne ordningen er tre ganger. Først var det en balansert analyse i hver ny prøve. For det andre er en slik ordning robust overfor potensielle «dårlige» prøver siden dårlige prøver kan utelukkes i mange resample kombinasjoner. For det tredje, slik ordning kan dramatisk øke deteksjons base (et total på 3625 prober ble identifisert ved 1000 resamples). Men vi bare valgt 131 probe sett som ble identifisert mer enn 500 ganger i 1000 iterasjoner for å redusere sjansen for falske identifikasjoner. Vi identifiserte også 115-probe-sett hvor uttrykket nivåer i tumor-tilstøtende stroma er korrelerte signifikant med sykdomsfrie overlevelsestid for de pasienter som gjennomgikk sykdom tilbakefall. De 19 vanlige sondesett (15 unike gener) av disse to vesentlige gen-lister ble brukt til å utvikle en PAM-baserte klassifiserer, som hadde en gjennomsnittlig nøyaktighet på 87% når det ble testet på 47 uavhengige tumor tilstøtende stromaceller prøver.
Nylig har det blitt rapportert at i brystkreft hvilket som helst sett av 100 gener eller flere valgt tilfeldig har en 90% sjanse for å bli signifikant assosiert med utfall, og de fleste publiserte signaturene ikke signifikant mer forbundet med resultat enn tilfeldige prediktorene [ ,,,0],28]. For å løse dette problemet, genererte vi tilfeldige classifiers basert på
samme
opplæring prøver og 1000 sett av 19 probe sett på tilfeldig valgte og testet disse tilfeldige classifiers med
samme
testprøver som brukes for å teste 19-sonden satt prognostisk Stroma Klassifiserings. Det gjennomsnittlige antall sondesett valgt av PAM i de 1000 tilfeldige sett er 3,7 som er antatt å være en støy. Det er for noen tilfeldig plukket sett av 19 probe sett, et lite antall probe sett skulle korrelere med høy /lav risiko status ved en tilfeldighet, noe som forklarer hvorfor den gjennomsnittlige opplæring nøyaktigheten av tilfeldige klassifikasjonsapparater var ~70%. Men disse tilfeldige classifiers ville ikke fungere for uavhengige testsett. Tvert imot, ble de 19 sondesett identifisert gjennom begge strenge metoder; derfor er de potensielt generelle prognostiske markører som gjelder for andre testsett. Sammenligningen favoriserte vår 15-genet (19 probe sett) klassifiserer over disse classifiers generert gjennom tilfeldige prosesser (tabell 2).
En rekke gener er identifisert her for klassifiserings utvikling har blitt observert i andre studier av RNA uttrykk i stroma av prostatavevet. Vi sammenlignet med totalt 227-probe-sett eller 194 unike gener som er identifisert her med stroma-spesifikk probe-sett som tidligere er identifisert i tre studier som nyttige for diagnose. Det er 2 gener i vanlige (PROM1, GPM6B) med 339 probe sett brukes til å utvikle vår diagnoseklassifiserings [13]; 3 gener (SEL1L3, KRT19, og KRT7) til felles med de 119 genene forskjellig uttrykt gen av Joesting
et al.
[29], og 3 gener (NKX3-1, TPD52, og GALNT3) i felles med de 44 gener som var forskjellig uttrykt mellom tumor-assosiert stroma og nontumor stroma fra 5 pasienter [30]. Disse observasjonene tyder på at prognostiske signaturer i stroma er i stor grad forskjellig fra de diagnostiske signaturer i stroma.
I en fersk undersøkelse, et genom-wide LOH /allel ubalanse (AI) skanning av DNA ble utført for å identifisere LOH /AI varm /kald spots i prostata epitel, eller i prostata stroma, eller både som identifiserte 156 genet assosiert med clinicopathologic fenotyper inkludert tilbakefall [14]. Fire gener (C7, SLPI, HOXB13, PDCD10) deles med våre 194 stroma prognostiske gener med en
p
verdi på 0,08. Dermed kan genuttrykk av noen få gener vi identifisert som potensielle prognostisk verdi endres som følge av genotypiske endringer, og er av spesiell fremtidig interesse, men de fleste genene vi identifisert ennå ikke viser en slik forening.
En delsett av de mer aggressive prøvene i vårt studium vil ha reaktive stroma, som har vist seg å korrelere med dårlig resultat [15]. Således, sammenlignet vi 194 stroma-uttrykte gener som vi har funnet å korrelere med utfallet til 1150 gener som ble differensielt uttrykte mellom de «reaktive stroma» undergruppe av prostatakreft prøver og fjernt stroma fra de samme 17 pasientene [15]. Ti gener (RABEP1, ZNF263, MCCC2, SLC4A4, TP53, KPNA6, PTPRF, CDH1, SCNN1A, og CD24) var felles mellom studiene (
p
verdi = 0,1312, ved en simuleringsbasert test). En annen fersk studie identifisert 36 prognostiske markører også spesielt trukket fra reaktiv stroma [16]. I tillegg testprøvene hadde betydelig tumor til stede, hvilket åpner muligheten for at noen gener ble uttrykt forskjellig mellom tumor epitel høy- og lav-risiko tumor. Til tross for disse forskjellene i eksperimentell design, fire gener (NKX3-1, FOLH1, AGR2, HOXB13) er i likhet med våre 194 stroma prognostiske gener med en
p
verdi på 0,0001, noe som indikerer betydelig avtale. Videre er alle de fire genprodukter godt dokumentert diagnostiske eller prognostiske biomarkører for prostatakreft [31] – [35]. Disse genene vil være av spesiell interesse i fremtidige studier.
Vi analyserte biologiske funksjoner for prognostiske 19 probe sett (15 gener) (Tabell 1) med David og MetaCore programvare. Resultatene indikerte at 7 kjente gener (GADD45B, CDKN1A, NLRP1, ErbB3, YWHAE, TNFSF10 og EIF5A) er knyttet til apoptose og 6 kjente gener (CDKN1A, NLRP1, ErbB3, YWHAE, TNFSF10 og EIF5A) er relatert til celledød, med 6 til felles. Dette er interessant basert på vår spekulasjon i dialogboksen tumor-stroma som favoriserer tumorprogresjon. Kanskje, aggressive svulster parakrine signaler gir en mekanisme for å tvinge den omkringliggende stroma å gjennomgå ombygging og /eller apoptotiske prosesser for å legge til rette for tumorvekst og invasjonen [36] etterfulgt av epithelial-mesenchymale overgang [37], [38]. Bevis fra uavhengige forsøk på molekylært nivå er nødvendig for å støtte denne hypotesen.
Vi videre analysert 194 gener (kombinasjonen av de 131 probe sett identifisert av PAM analyse og de 115 probe sett identifisert fra korrelasjonsanalyse) ved hjelp en vei programvare MetaCore. Resultatet av veien analyse ved å bruke «glatt muskulatur + sykdom biomarkør» som en filtrering parameter indikerte at dette settet med 194 gener er betydelig anriket i gener assosiert med «prostata svulster transkripsjon». De sju gener assosiert med denne beskrivelsen var NCOA3 (TRAM-1), c /EBP (CEBP), NR77 (NR4A1), NK31 (NKX3-1), P53 (TP53), KL5 (KL5), CEBPD. Videre ble 3 gener STAT1, ErbB3, P21 (CDKN1A) funnet å være assosiert med «prostata svulster regulering av progresjon gjennom cellesyklus «og en genet STAT1 er assosiert med» prostata svulster betennelsesreaksjon «. Pathway analyse ved hjelp av «glatt muskel + sykdom» som en filtrerings parameter indikerte at 67 av de 194 genene er kjent for å være signifikant assosiert med prostata- sykdommer, og 66 av disse 194 gener som er kjent for å være signifikant assosiert med prostata neoplasmer (tabell S1) av hvilken 59 er i vanlig blant de to listene. Videre er de fleste av disse genene 194 er også forbundet med andre cancerformer så som bryst kolorektale svulster, neoplasmer og lunge neoplasmer, noe som indikerer disse gener kan være vanlige involvert i kreftrelaterte veier. Den veien analyse viste også at en betydelig andel av disse 194 gener interagere med transkripsjonelle faktorer, slik som P53, SP1, FOXO3A, AR, BCL6, STAT5A, STAT5B, C-Jun, NRF2, myod og STAT1, som spiller viktige roller i cancer utvikling og progresjon. For eksempel er transcriptional faktor SP1 funksjonelt forbundet med 94 gener fra den 194-genet listen (figur S4).